Workflow
沙普利值
icon
Search documents
在AI社会抓「内鬼」?上海AI Lab推出首个多智能体极端事件解释框架
机器之心· 2026-03-04 09:15
序言:数字镜像中的极端涌现 这类极端事件的出现并非源于代码漏洞,而是 来自系统演化的自发涌现。 由 上海人工智能实验室联合上海交通大学、复旦大学、中国人民大学、同济大学 开展的一项最新研究,决定拆解这些数字镜像中的「黑天鹅」演化过程,揪出那 个藏在复杂涌现背后、诱发系统崩溃的「内鬼」。 风起于青萍之末、不稳定的害群之马、羊群效应、毒瘤行为...... —— 在数字镜像的背面,这群科学家凝视着 AI 社会的「黑天鹅」时刻。 2023 年,斯坦福「模拟小镇」(Smallville)的爆火出圈,开启了大语言模型(LLM)驱动多智能体系统(MAS)模拟人类社会的元年。 如今,学术界已经构建出了各种高度复杂、垂直领域的 MAS 沙盒 —— 从复现宏观经济运行的社会系统,到模拟股票交易的金融市场,再到推演舆论演化的社交 网络。多智能体系统,正真正成为全方位映射人类社会的数字镜像。 然而,随着系统复杂程度的攀升,一种令人不安却极具研究价值的现象随之浮现:恶性通胀、股市崩盘、群体极化…… 这些现实人类社会的 「黑天鹅」 极端事 件,竟也在这群 AI 身上精准重演了。 论文链接: https://arxiv.org/pdf/2 ...