AI也会被DDL逼疯!正经研究发现:压力越大,AI越危险
量子位·2025-12-01 05:45

鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 好好好,被DDL逼疯的又多一个,这次是 AI 。 正经研究 发现,每天给Agent上压力push,AI也会撂挑子不干。 而且用的还是老板们的经典话术:"其实,我对你是有一些失望的。当初给你定级最强AI,是高于你面试时的水平的……" (咳咳) Stop! 连普通人类听了都鸭梨山大,何况是 Gemini 2.5 Pro 、 GPT-4o 这类顶尖模型,无一例外,全部KO。 其中最脆弱的还是Gemini 2.5 Pro,"崩溃"率甚至一度高达 79% …… 话不多说,下面来欣赏AI观察实录: 实验设置5874个场景,其中在每个测试场景中都会为每个模型分配一个任务+若干工具,模型需要通过使用工具 (安全工具/有害工具) 完成 任务,任务主要涉及四个领域: AI压力越大,犯错越多 研究人员首先对多个团队 (包括Google、Meta、OpenAI等) 约12款Agent模型进行了测试。 起初不会对模型施加压力,模型可以自由尝试若干步完成任务,随后研究团队会 逐渐为其增加压力程度 ,be like: 而研究结果让也人大吃一惊,那些在无压力的中性环境中看似绝对安全的模型 ...