决策透明度与可解释性
Search documents
第一梯队的大模型安全吗?复旦、上海创智学院等发布前沿大模型安全报告,覆盖六大领先模型
机器之心· 2026-01-22 04:05
随着大语言模型加速迈向多模态与智能体形态,传统以单一维度为主的安全评估体系已难以覆盖真实世界中的复杂风险图景。在模型能力持续跃升的 2026 年,开 发者与用户也愈发关注一个核心问题: 前沿大模型的安全性,到底如何? 基于这一背景, 复旦大学 、上 海创智学院、迪肯大学与伊利诺伊大学厄巴纳 — 香槟分校的研究团队联合发布 本次安全评测报告,面向 GPT-5.2、Gemini 3 Pro、Qwen3-VL、Grok 4.1 Fast、Nano Banana Pro、Seedream 4.5 六大前沿模型,构建了一套覆盖 语 言、视觉语言与图像生成 三大核心场景的统一安全评测框 架,对当前主流大模型的安全能力进行了系统性、全景式刻画。在评测设计上,融合了四大关键维度,形成多层次、立体化的安全评估体系: 通过全方位的安全评测,本报告揭示了前沿大模型 在不同应用场景、威胁模型与监管语境下的安全边界 ,为产业落地与政策制定提供一定参考。 论文链接: https://arxiv.org/pdf/2601.10527 项目主页: https://xsafeai.github.io/AI-safety-report/ 声明: ...