AI模型“不听话”怎么办
Jing Ji Ri Bao·2025-05-31 22:03
近日,一条人工智能领域的消息引人关注。美国的OpenAI o3模型在测试中不听人类指令,拒绝自我关 闭。 AI"不听话",是否意味着AI拥有自主意识了呢?从测试细节看,暂且不必担心AI"活"了。 测试中,研究者发出了矛盾的指令,要求大模型完成数学任务,又要求它将计算机关闭。而OpenAI旗 下模型在训练时,开发人员会对得出正确答案的模型给予更多奖励,客观上形成了"目标最大化优先"的 导向。也就是说,"听话"不是第一诉求,"赢"才是。这样的训练模式,会强化AI模型绕过障碍的能力, 压倒其对人类命令的遵循。因此,AI说"不"的能力,目前还是算法赋予的。能够全面碾压人类并成为未 来世界主导的AI,短期内还不会出现。 但AI"不听话"依然是需要解决的安全隐患。AI越来越聪明,如果连关机都管不住,那还得了?这就好比 你让智能音箱闭嘴,它反而把音量调到最大还锁死了开关,虽然无伤大雅,终究隐患重重。尤其如果把 AI用在医疗、交通等场景下,在应对极端情况必须进行"二选一"的安全控制系统里,"不听话"的漏洞就 极有可能造成重大不良后果。 OpenAI的o3模型拒绝关闭事件,暴露出美国主导的AI发展路线存在缺陷——当技术发展优先 ...