灵御大模型安全攻防评估平台

Search documents
49款国内外AI大模型安全测试结果:我国大多处于中游水平
Nan Fang Du Shi Bao· 2025-06-06 15:45
曾毅现场带来的一组研究数据进一步印证了大模型安全性提升的必要性。据他介绍,新研发的灵御大模型安全攻防评估平台可对 越狱攻击进行系统性评估。 他表示,通过该平台对49款不同类型大模型进行安全测试后得出结论——无论是国内还是国际大模型,人工智能能力的提升跃迁 并未带动其安全风险防范水平提高。我国人工智能大模型的安全性大多处在中游水平,攻击成功率约为5%-6%,部分国外顶尖模 型攻击成功率仅0.7%,我国还有较大提升空间。 曾毅认为,除了解决问题能力以外,安全与治理也是人工智能的核心能力,将加速人工智能稳健发展与应用。安全与性能之间不 会相互掣肘,"没有安全治理框架的人工智能不仅是没有刹车,更是没有方向盘。" 专家普遍认为,人工智能为网络安全产业发展带来机遇的同时还有巨大挑战,南都记者注意到,多位专家在给出应对建议时都提 到"体系"一词,即重视网络安全体系建设。 "单点的防御时代我认为已经结束了。"中国国家互联网信息办公室总工程师孙蔚敏以2022年冬奥会网络防护"零事故"的成功经历 为例,强调了建立联合防御体系的重要性。 6月5日,2025全球数字经济大会数字安全主论坛暨2025北京网络安全大会在北京召开。北京前瞻 ...