Workflow
链式思考
icon
Search documents
让LLM不再话痨,快手HiPO框架来了
机器之心· 2025-11-03 06:40
如今, 快手 KwaiKAT 团队与南京大学刘佳恒老师 NJU-LINK 实验室 、张煜群教授实验室 ARiSE 合作重磅推出 HiPO(Hybrid Policy Optimization)框架,为 LLM 装上了智能的「思考开关」。 该框架通过创新的混合数据冷启动与混合强化学习奖励系统,使模型能够自主、动态地决策何时该启动详细推理(Think- on),何时该直接给出答案(Think-off)。 当用户向大语言模型提出一个简单问题,比如「单词 HiPPO 里有几个字母 P?」,它却正襟危坐,开始生成一段冗长的推理链:「首先,让我们分析 HiPPO 这个 词,河马的英文单词为 hippo,河马是一种半水生哺乳动物,这里用户用了大写字母,可能有特殊的含义,对于单词 HiPPO,我们可以将其拆分为 H-i-P-P-O,字 母 P 出现在第 3 与第 4 个位置,因此有 2 个字母 P... 让我们简化问题,HiPO 可以拆分为...」 面对这样的「严谨」,用户难免哭笑不得,既浪费了计算资源,也增加了等待时间,甚至更坏的情况是模型被自己冗长的推理链「绕晕了过去」,最终给出了错 误的答案,用户只得捶胸顿足地大喊:「 ...
明日发布,关于GPT‑5的剧透都在这了
Hu Xiu· 2025-08-07 02:40
本文来自微信公众号:硅星人Pro (ID:gh_c0bb185caa8d),作者:ChatGPT,题图来自:AI生成 8月6日,OpenAI在X(前推特)上突然发布简短预告:"LIVE5TREAM THURSDAY 10AM PT"。预告中 的"5"替代了"livestream"中的"s",明显暗示即将到来的GPT‑5。这条动态迅速在全球科技圈引发热议,意 味着过去一年多被反复预告又不断推迟的GPT‑5终于要揭开面纱。直播将在8月7日13:00开始(太平洋时 间),也即我们的北京时间周五凌晨一点。 $$\mathbb{M}\mathbb{F}$$ 新能力曝光:链式思考与模型统一 GPT‑5到底有何革新?由于官方尚未公布细节,我们可以从此前的访谈和测试者反馈中窥见端倪: 链式思考:Sam Altman今年早些时候预告,GPT‑5在ChatGPT的表现将加入"链式思考"可视化,用户能够 看到模型推理的部分过程。这有助于理解模型如何得出答案,也方便开发者调试。 模型家族统一:Altman还表示,OpenAI将把现有的o系列模型(如GPT‑4o、o4‑mini)纳入GPT家族,使用 户只需记住一个型号即可自动匹配最适 ...