Workflow
前瞻灵度AI伦理评估平台
icon
Search documents
前瞻人工智能安全评估体系与基座平台入列北京人工智能前沿成果
Xin Jing Bao· 2026-01-05 04:37
前瞻院通过测试发现了一个关键问题:近年来的大模型在安全性方面并未明显提升,部分新近模型的攻 击成功率甚至更高。但同时前瞻院也验证了一个重要结论:人工智能模型防御并不必然需要重新训练模 型,在在线推理阶段通过部署安全护栏,就能显著提升模型安全水平。针对前瞻安全基准中的各类风 险,前瞻院打造了"前瞻灵御"AI安全攻防平台,可为企业提供标准化评估流程、全面系统的安全分析, 帮助企业准确识别模型安全水平,并提供针对性的防御方案与加固建议。 此外,前瞻院还构建了"前瞻灵度"AI伦理评估平台,专注于AI伦理的智能评估与价值校准。平台能够对 上百个大模型进行实时动态监控与并行测试,评估其在六大维度、90个细分类别的伦理合乎度。其集成 了以中国价值观为核心的大规模中文价值语料库,覆盖3个层面、12个核心价值、50个衍生价值,累计 25万余条规则;收录了全球200余项伦理原则与规范,以及40余项中英文法律法规与国际公约,提供精 准的合规指引。可以对人工智能、数据安全、神经科学、脑机接口、医疗健康、生物安全、危险化学物 质、核物质、自动驾驶等领域进行自动化伦理评估辅助。 前瞻院认为,人工智能安全应成为"第一性原理",是不可删除、 ...