思维链

Search documents
一文看懂多模态思维链
量子位· 2025-03-25 00:59
MCoT团队 投稿 量子位 | 公众号 QbitAI 多模态思维链 (MCoT) 系统综述来了! 不仅阐释了与该领域相关的基本概念和定义,还包括详细的分类法、对不同应用中现有方法的分析、对当前挑战的洞察以及促进多模态推理发 展的未来研究方向。 当下,传统思维链 (CoT) 已经让AI在文字推理上变得更聪明,比如一步步推导数学题的答案。但现实世界远比单一文字复杂得多——我们 看图说话、听声辨情、摸物识形。 MCoT的出现就像给AI装上了"多感官大脑",它 能同时处理图像、视频、音频、3D模型、表格等多种信息 。比如,输入一张CT影像和患者的 病史,AI就能输出诊断报告,还能标注出病灶位置。 这种跨越模态的推理能力,让AI更接近人类的思考方式。 然而,尽管取得了这些进展,该领域仍缺乏全面综述。为了填补这一空白,来自新加坡国立大学、香港中文大学、新加坡南洋理工大学、罗切 斯特大学的研究人员联合完成这项新工作。 以下是更多细节。 MCoT核心方法论 多模态思维链 (MCoT) 的成功依赖于其系统化的方法论体系,以下是对其六大技术支柱的重新表述与润色,旨在提升学术表达的精确性与 流畅性: 1、推理构建视角 基于提示 ( ...
OpenAI加码写作赛道?阿里最新大模型通用写作能力基准WritingBench,揭秘深度思考能否增进文学表达
量子位· 2025-03-20 10:56
通义智文团队 投稿 量子位 | 公众号 QbitAI 全面评估大模型 生成式写作能力 的基准来了! 就在最近,OpenAI CEO奥特曼还爆料他们已经训练了一款在创作领域表现卓越的新模型,并为其生成的故事所深深触动。 为此,阿里研究团队联合中国人民大学和上海交通大学共同开源了 WritingBench ——该评估基准覆盖6大领域、100个细分场景,共包含 1000+条评测数据,以期为生成式写作提供全面的评估。 团队进一步发现,凭借思维链技术和动态评估体系的加持, 基于Qwen开发的32B创作模型在创意型任务上表现接近顶尖模型R1 ,为高效能 创作开辟了新路径。 WritingBench:最懂行业的写作评估基准 目前行业在评估大模型写作能力时,面临两大难题: 1、考生文思泉涌,考官身陷囹圄 更早之前,Deepseek-R1的文学创作能力也惊艳了整个科技圈,并由此引发了一场大模型创作的军备竞赛。 但一个根本性问题亟待解决—— 究竟什么才是真正的「高质量写作」? 主流基准通常使用标准化输入材料,导致真实场景中模型表现不尽如人意,例如结合财报数据的商业分析写作和招投标书撰写仍是大模型写作 的低分场景。 如下图所示,不 ...
速递|微软“去OpenAI化”计划浮出水面,自研AI模型MAI来了
Z Finance· 2025-03-08 09:44
图片来源 : Unsplash 据消息报道,微软正自主研发人工智能推理模型,以抗衡 OpenAI 并可能向开发者出售这些模型。 报道进一步透露,苏莱曼团队已在 Copilot 系统中开展技术替代实验,使用参数规模远超此前自研 Phi 系列模型的 MAI 模型,逐步替换现有的 OpenAI 模型。 据内部规划,微软拟于今年晚些时候以应用程序接口( API )形式开放 MAI 模型,这将使外部开发 者能够将这些先进模型集成至自有应用程序中。 这场技术自主化战略的推进,恰逢微软通过早期投资 OpenAI 在 AI 军备竞赛中占据先发优势之际。 行业观察人士指出,科技巨头在保持生态合作的同时构建自主技术护城河,已成为当前 AI 产业发展 的新常态。 参考资料 作为 OpenAI 的主要支持者,微软已开始在 Copilot 智能助手产品中测试由马斯克旗下 xAI 、 Meta 及 DeepSeek 开发的模型,作为 OpenAI 技术的潜在替代方案。 此举标志着,微软在持续深化与这家 ChatGPT 开发商的战略合作同时,正通过技术多元化策略降低 对其核心依赖。 路透社曾在去年 12 月独家披露,微软正通过整合内部及第 ...
晚点独家丨月之暗面探索 o1,跟字节抢来华为刘征瀛
晚点LatePost· 2024-11-28 14:57
编辑丨程曼祺 本月初经历仲裁风波后,月之暗面在 11 月 16 日发布新的 数学模型 k0-math ,当时月之暗面创始人杨植 麟反复提到 "o1":他将 k0-math 的测评评分与 o1 比较,称其思路与 o1 类似——都采用了强化学习和思 维链技术。 o1 是 OpenAI 在今年 9 月发布的新模型,它有更强推理和数学能力。杨植麟曾在 o1 发布后不久的一场演 讲中说,o1 的出现意味着大模型的范式转换:从预测下一个 token 的规模扩展( Next-Token Predictio Scaling)到强化学习的规模扩展(Reinforcement Learning Scaling)。 11 月发布 k0-math 时,杨植麟提了 23 次强化学习,17 次推理,7 次 o1。 文丨王与桐 从成立至今,月之暗面长期被认为是中国大模型创业公司中,技术人才密度颇高的一家。月之暗面现在仍只 有 100 多人,但汇集了杨植麟和周昕宇两位技术背景创始人,杨植麟发表过两篇大语言模型领域重要论文 [1],周昕宇在旷视期间与现在加入另一家大模型独角兽阶跃星辰的张祥雨,一起发表过单篇引用超 9000 次 的卷积神经网络 ...
晚点播客丨OpenAI o1 如何延续 Scaling Law,与硅基流动袁进辉聊 o1 新范式
晚点LatePost· 2024-09-20 15:22
"如果每天和开发者打交道,你不会感觉这个行业停滞或变冷。" 文丨程曼祺 贺乾明 扫描图中右下角二维码,可收听播客。* 这是《晚点聊 LateTalk 的第 80 期节目,欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。 《晚点聊 LateTalk》是《晚点 LatePost》 推出的播客节目,在文字报道之外,用音频访谈形式捕捉商业世界变化的潮流和不变的逻辑,与这 其中的人和故事。 OpenAI 发布新模型 o1 后的第二天,我们邀请了硅基流动创始人袁进辉与我们分享了 o1 的技术意义,也讨论了今年 1 月至今,袁进辉观察 到的 AI 开发者社区变化。 o1 的一个重要变化就是增加了分配给推理(inference,即大模型的使用)阶段的算力,推理阶段计算(test-time compute)重要性提升。 而袁进辉今年初创立的硅基流动(SiliconFlow)就是一家做推理加速优化的 AI Infra(中间层软件)公司。他是一位连续创业者,曾在 2017 年创立一流科技(OneFlow),在 2023 年加入王慧文组建的大模型创业公司光年之外,成为联合创始人。(袁进辉的上两段创业故事,可 听 ...
OpenAI 再次给大模型 “泡沫” 续命
晚点LatePost· 2024-09-13 15:58
从大语言模型到推理模型。 文丨 贺乾明 但 OpenAI CEO 山姆·阿尔特曼(Sam Altman)的好心情很快就被打断。在他宣布 o1 全量上线的推文下, 排在第一的评论是:"到底什么时候能用上新的语音功能??" 他立刻反击:"能不能先花几个星期感谢感 谢这魔法般的智能,然后再要新玩具?" 这位用户追着阿尔特曼要的不是什么新玩具,是 OpenAI 在今年 5 月就允诺即将到来的 GPT-4o 端到端语 音功能。在当时的现场演示中,这个新的 AI 声音自然、反应极快,还知道什么时候插话,让旁人难辨真 假。按官方时间表,上千万 ChatGPT 付费用户本将在几周内用上这功能,但一直被跳票到现在。 过去一年里,OpenAI 的产品都是类似的 "期货":GPT-4 已上线一年多,OpenAI 的下一代模型 GPT-5 依 然没有发布迹象。OpenAI 今年初发布的视频模型 Sora 也没有大规模开放,到现在都只有少数被他们挑选 的行业人士实际用过。 行业第一的跳票一次次磨损着资本市场对 AI 大模型的耐心。一些中国科技巨头和大模型公司今年年中暂 缓训练基础模型,把更多资源投到应用开发,或把 GPU 算力租给外部 ...