Workflow
通义法睿
icon
Search documents
通义DeepResearch重磅开源
目前,通义DeepResearch的模型、框架和方案均已全面开源,用户可在Github、Hugging Face和魔搭社 区下载模型和代码。 模型训练 通义团队构建了一套以合成数据驱动、贯穿预训练与后训练的完整训练链路。模型能力基于一种多阶段 数据策略,旨在创建海量高质量的代理训练数据,而无需依赖昂贵的人工标注。 同时,该链路以Qwen3-30B-A3B模型为基座进行优化,为了确保训练的高效性与模型的鲁棒性,团队 创新性地设计了覆盖真实环境与虚拟环境的RL算法验证与真实训练模块,并结合高效异步强化学习算 法及自动化数据策展(Data Curation)流程,显著提升了模型的迭代速度和泛化能力。 在推理阶段,团队设计了ReAct和基于自研的IterResearch的Heavy两种模式,前者用于精准考察模型的 基础内在能力,后者则通过test-time scaling策略,充分挖掘并展现了模型所能达到的性能上限,即使在 长任务中,也能实现高质量的推理。 模型性能 在Humanity's Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-DeepSearch、 ...
开源Agent模型榜第一名,现在是阿里通义DeepResearch
量子位· 2025-09-18 04:20
通义DeepResearch团队 投稿 量子位 | 公众号 QbitAI 阿里开源旗下首个深度研究Agent模型 通义DeepResearch ! 相比于基于基础模型的ReAct Agent和闭源Deep Research Agent,这个 30B-A3B轻量级 模型Tongyi DeepResearch在HLE、 BrowseComp-zh、GAIA等多个权威评测集上取得SOTA成绩,超越了OpenAI Deep Research、DeepSeek-V3.1等Agent模型。 目前,通义DeepResearch的模型、框架和方案均已全面开源,感兴趣的朋友可以在Github、Hugging Face和魔搭社区社区下载模型和代码 ~ 下面来看模型具体情况。 数据策略:基于全合成数据的增量预训练和后训练 模型能力的提升,主要得益于团队设计的一套多阶段数据策略。 这个策略的核心目标是, 不依赖昂贵的人工标注,也能大规模地生成高质量的训练数据 。 增量预训练数据 团队引入了Agentic CPT(增量预训练)来为模型打下坚实的Agent基础。 为此,开发了一个系统化、可扩展的数据合成方案。它能利用后续训练流程产生的数 ...
通义DeepResearch震撼发布!性能比肩OpenAI,模型、框架、方案完全开源
机器之心· 2025-09-18 01:01
机器之心发布 机器之心编辑部 1 数据策略:基于全合成数据的增量预训练和后训练 通义 DeepResearch 重磅发布,让 AI 从 "能聊天" 跃迁到 "会做研究"。在多项权威 Deep Research benchmark 上取得 SOTA,综合能力对标并跑赢海外旗舰模型,同 时实现 模型、框架、方案 全面开源,把深度研究的生产力真正带到每个人手里。 相比于海外的旗舰模型昂贵和限制的调用, 通义 DeepResearch 团队 做到了完全开源! 开源模型,开源框架,开源方案 !在 Humanity's Last Exam、 BrowseComp、BrowseComp-ZH、GAIA、 xbench-DeepSearch , WebWalkerQA 以及 FRAMES 等多个 Benchmark 上,相比于基于基础模型的 ReAct Agent 和闭源 Deep Research Agent,其 30B-A3B 轻量级 tongyi DeepResearch,达到了 SOTA 效果。 通义 DeepResearch 团队也在 Blog 和 Github 完整分享了一套可落地的 DeepResearch A ...