Workflow
钉钉AI实现国际顶级基准、实际应用落地的双重突破
Zhong Guo Xin Wen Wang·2025-11-12 17:28

近日,由钉钉团队研发的深度研究系统"Dingtalk-DeepResearch"在国际权威评测中取得突破性成绩,在 DeepResearch Bench测试中以48.49分位列全球第二、国内第一,超越OpenAI、Claude等主流系统。 为应对企业场景的动态变化,该框架区别于传统静态架构,通过熵引导、记忆感知的在线学习机制使智 能体能够持续演进,就像员工可通过反复实践提升技能,而无需人工干预。该机制保障系统能自动从历 史交互中归纳经验,逐步适应不同企业的业务流程与用户操作风格。 例如,当用户多次修改AI输出的报告格式后,系统会自主学习并记忆用户对格式、风格及关键点的偏 好,在后续生成中主动对齐用户需求。在钉钉企业级AI平台中,这种经个性化调优的偏好可以作为一 种能力沉淀并共享给团队乃至整个公司,实现组织知识的复用与增效。 闭环评估与优化系统,保障企业级 AI输出质量 据悉,该系统已成功应用于制造业、供应链等复杂场景,能够在复杂异构表格、多阶段推理与多模态生 成任务中保持行业领先的准确性和稳健性,帮助企业高效处理多模态数据,实现智能升级。 钉钉深度研究系统的这项进展,首次实现了国际顶级基准与实际生产落地的双重 ...