Workflow
斯坦福大模型推理课免费了,谷歌推理团队创始人主讲
量子位·2025-07-25 07:59

闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 干货来了! 如何理解大模型推理能力?现在有来自谷歌DeepMind推理负责人 Denny Zhou 的分享了。 就是那位和清华姚班马腾宇等人证明了 只要思维链足够长,Transformer就能解决任何问题 的Google Brain推理团队创建者。 Denny Zhou围绕大模型推理过程和方法,在斯坦福大学CS25上讲了一堂"LLM推理"课。 让我们也来跟着大神学习一下。 有推理过程的答案会让模型更自信 首先,什么是大模型推理呢? 其实 就是大语言模型在给出最终答案前的中间思考步骤 。 比如问 "artificial intelligence"每个单词的最后一个字母连起来是什么? 有推理过程的回答会先分别找出"artificial"的最后一个字母是"l","intelligence"的最后一个字母是"e",再把它们拼接成"le";而没有推理的就 直接给出"le"这个结果。 这种推理过程和人类的思维过程无关,而关键在于生成了大量的中间内容。 简单来说,对于能用布尔电路解决的问题,假设电路规模是T,哪怕是固定大小的Transformer模型,生成O(T)个中间 ...