Workflow
AI教父:AI模型已出现欺骗、撒谎等危险行为
财富FORTUNE·2025-06-06 13:03

图片来源:GETTY IMAGES "AI教父"之一约书亚·本吉奥正在发起一个旨在构建"诚实"系统的新非营利组织。他警告称,当前的AI 模型正展现出一些危险行为。 约书亚·本吉奥是人工神经网络和深度学习领域的先驱,他一直批评硅谷目前正在进行的AI竞赛是危险 的。 他新发起的非营利组织"LawZero"致力于构建更安全的AI模型,不会屈服于商业压力。迄今为止,该组 织已从多家慈善捐助方[包括生命未来研究所(Future of Life Institute)和开放慈善基金会(Open Philanthropy)]筹集了3,000万美元资金。 在宣布新组织成立的博客文章中,他表示,创立LawZero的初衷是因为"有证据表明,当今的前沿AI模 型正在形成危险的能力和行为,包括欺骗、作弊、撒谎、黑客行为、自我保护,以及更普遍的目标错位 问题。" 他写道:"LawZero的研究将有助于以降低一系列已知风险发生概率的方式释放AI的巨大潜力,这些风 险包括算法偏见、蓄意滥用和人类控制权丧失等。" 该非营利组织正在构建一个名为"科学家AI"(Scientist AI)的系统,旨在为日益强大的AI智能体提供安 全护栏。 该组织创 ...