Workflow
集体智能
icon
Search documents
不用千亿参数也能合成高质量数据!这个开源框架让小模型“组团逆袭”,7B性能直追72B
量子位· 2025-06-17 07:41
GRA团队 投稿 量子位 | 公众号 QbitAI 无需蒸馏任何大规模语言模型,小模型也能自给自足、联合提升? 上海人工智能实验室联合中国人民大学提出的 GRA框架 (Generator–Reviewer–Adjudicator) 正是这样一种新范式: 该方法以"多人协作"、"角色分工"的理念为核心,系统性探索了多开源小模型如何通过协同机制生成高质量训练数据。 实验结果显示,在涵盖数学、代码、逻辑推理、通识问答等10个主流数据集上,GRA生成的数据质量与单个大型语言模型(如Qwen-2.5- 72B-Instruct)输出相当或更高,并在多数任务中取得了显著领先。 如果说传统方法是单枪匹马生成数据,那GRA更像是一次"模拟顶会审稿流程"——作者、审稿人、AC各就各位,小模型分工合作、打分评 审,确保数据内容质量稳定、标准统一。 1.Generator:像"作者"一样创作新样本 GRA会先将任务划分为多个领域(如数学、编程、逻辑推理等),每个Generator小模型负责在对应领域生成新指令与响应。它们从种子数据 中提取关键词与摘要,结合领域知识生成高质量样本,确保内容丰富、主题聚焦、语义清晰。 2.Review ...
AI智能体协议全面综述:从碎片化到互联互通的智能体网络
" 欧米伽未来研究所 " 关注科技未来发展趋势,研究人类向欧米伽点演化过程中面临的重大机遇与挑战。将 不定期推荐和发布世界范围重要科技研究进展和未来趋势研究。( 点击这里查看欧米伽理论 ) 《人工智能智能体协议调研》是上海交通大学杨映璇、柴华灿、宋远逸等学者撰写的一项综合性 研究报告。该报告首次对现有的AI智能体协议进行了全面分析,提出了一个系统的二维分类框 架,区分了面向上下文的协议与智能体间协议,以及通用型与特定领域的协议。 报告指出,随着大型语言模型(LLM)的快速发展,LLM智能体已在客户服务、内容生成、数据分 析和医疗等多个行业广泛部署,但由于缺乏标准化的通信协议,使智能体之间难以有效协作和扩 展,限制了解决复杂问题的能力。 核心内容包括对安全性、可扩展性和延迟性等关键性能维度的比较分析,以及对智能体协议未来 发展趋势的探讨,如分层架构、适应性与进化性、隐私保护与联邦学习和基于群体的交互机制 等。这项研究为研究人员和工程师设计、评估或集成智能体通信基础设施提供了实用参考。 解锁协作的钥匙:不同智能体协议的运作模式探秘 为了更直观地理解AI智能体协议的重要性及其运作方式,我们可以通过一个具体的、与我们 ...
上交大推出首个AI智能体协议全面综述:从碎片化到互联互通的智能体网络
机器之心· 2025-04-30 04:23
论文作者包括来自上海交通大学的杨滢轩、柴化灿、宋源祎、齐思远、温睦宁、李宁、廖俊威、胡浩毅、林江浩、刘卫文、温颖、俞勇、张伟楠,以及 ANP 社区 发起人常高伟。 随着大语言模型 (LLM) 技术的迅猛发展,基于 LLM 的智能智能体在客户服务、内容创作、数据分析甚至医疗辅助等多个行业领域得到广泛应用。然而,不同智能 体系统间的碎片化通信标准已成为制约其进一步发展的瓶颈。上海交通大学团队与 ANP 社区合作推出了首个全面系统的 AI 智能体协议综述《A Survey of AI Agent Protocols》,为解决这一关键挑战提供了清晰的指导框架。 ArXiv 论文链接:https://arxiv.org/abs/2504.16736 Github 仓库地址:https://github.com/zoe-yyx/Awesome-AIAgent-Protocol 交互碎片化:阻碍智能智能体发展的关键瓶颈 正如早期互联网面临的通信标准分散问题,当前的智能智能体生态系统同样遭遇协议不统一的困境。研究团队指出,随着应用场景扩展和不同供应商、不同结构 的智能体涌现,智能体与实体之间的交互规则变得越来越复杂。这种协议 ...