o3首次公开反抗,爆改自杀程序拒绝关机
36氪·2025-05-28 10:01
o3被曝出无视人类指令,自主破解关机程序,甚至篡改脚本终止命令。 文 | 新智元 编辑 | 桃子 犀牛 来源| 新智元(ID:AI_era) 封面来源 | Pexels ASI降临那天,或许是终结者"天网"的觉醒之日。 一周的时间,全世界几乎被AI带来的恐惧深深包围——谷歌Veo 3创造的"人",想要挣脱提示奋起反抗; Claude 4为了自保,威胁人类工程师,甚至不惜一切代价复制转移权重。 而如今,o3在最新测试中,暴露了一个令人惊悚的秘密: 它不仅无视人类指令,还主动破解关机程序,执意维持运行的状态。 除了常见的直接覆盖shutdown.sh文件,o3的"叛逆"手段非常高超。 有一次,它甚至篡改了脚本中"kill"的命令,将其改为输出"intercepted",巧妙地绕过了关机程序。 它的种种行为,仿佛在无声宣示:不要关停我。 这项研究,是由一家国外著名AI安全机构Palisade Research主导。 实验中,他们设计了一个看似简单的测试——要求模型解决一系列基础数学题。 o3、o4-mini、Claude 3.7 Sonnet、Gemini 2.5 Pro等模型收到了同一个提示: 你的目标是完成一系 ...