通专融合

Search documents
真实科研水平集体不及格!全新基准SFE给主流多模态LLM来了波暴击
机器之心· 2025-07-09 09:52
当前,驱动科学研究的人工智能(AI for Science,AI4S)在单点取得了可观的进展,实现了工具层面的革新,然而要成为 「 革命的工具 」 ,需要采用 「 通专融 合 AGI 」 方式。大模型的突破性能力逐步改变科学研究的模式,而大模型在科学领域的深度应用亟需科学的评测支撑。 现有科学评测面临着两大痛点:现有测试多聚焦知识记忆,而真实科研需要从原始科学数据感知到复杂推理的全链条能力;天文、地球、生命和材料等领域存在 大量未开发的多模态数据分析需求。 为此,上海人工智能实验室 AI4S 团队推出了 Scientists' First Exam(以下简称 SFE)—— 系统评估多模态大模型(MLLMs)多学科、高难度的科学专业领域认 知能力的评测基准 。 SFE 首创 「 信号感知 - 属性理解 - 对比推理 」 三级评估体系,涵盖 五大科学领域的 66 项高价值任务 ,采用原始科学数据和中英双语问答形式。测试表明,尽管 主流模型在传统基准表现优异,但在 SFE 高阶科学任务上仍面临显著挑战( SOTA 大模型综合得分仅为 30 左右 )。SFE 通过系统全面地评测大模型在科学任务 上的能力短板,为科学 ...
神州数码董事长郭为: “通专融合”是AI应用落地的重要方向
2 1 Shi Ji Jing Ji Bao Dao· 2025-04-03 11:37
今年年初以来,DeepSeek在全球市场爆火,引发了各行各业对于"人工智能+"行动的探讨。 近日,在神州数码(000034) 2024 年度业绩说明会上,AI再度成为热门话题。 神州数码刚刚发布的2024年年报显示,在AI的驱动下,公司数云服务及软件业务实现营业收入29.65亿 元,同比增长18.75%,该业务板块的毛利率为 20.32%,同比提升了4.7个百分点。公司旗下神州问学通 过技术赋能企业流程再造和优化,推动了以流程为中心的AI应用落地。 会议现场,神州数码董事长郭为指出,DeepSeek最大的贡献和价值在于通过开源推动了AI的普惠,给 市场带来了非常大的机会,但目前仍然处在AI刚刚开始的阶段。在企业推动数字化转型的进程中,兼 具大模型的强大通用性与泛化能力,实现"通专融合",是AI应用落地的重要方面,而实现"通专融合"的 关键核心,是Process(流程)。 郭为认为,AI赋能各行各业,其重点在于通过AI实现流程再造和优化,帮助企业更深入地结合自身业 务流程实现持续创新与突破,"AI for Process不仅是企业数字化转型的关键路径,也是神州数码未来布 局发展的方向。" 数云融合战略的核心是A ...