Workflow
DeepSeek
icon
Search documents
林俊旸离职后首次发声,复盘千问的弯路,指出AI的新路
36氪· 2026-03-27 11:12
他没有回应离职风波或宣告去向,而是发长文探讨 从"推理模型时代的思考"到"智能体时代的思考"的转变。 整篇文章谈的是技术和AI的未来方向,但字里行间对千问技术路线的反思藏不住。 他在文中 坦白承认"我们没有全做对"(We did not get everything right), 林俊旸,离职阿里千问后首次发声。 文 | 梦晨 来源| 量子位(ID: QbitAI) 封面来源 | pexels 林俊旸,离职阿里千问后首次发声。 千问团队曾有一个雄心勃勃的构想:把thinking和instruct两种模式合并到一个模型里。 Qwen3就是这个方向上"最清晰的公开尝试之一",它引入了混合思维模式。 但在今天的林俊旸仍不够满意,他觉得最终thinking变得啰嗦且犹豫不决,instruct变得不够干脆、不够可靠,还更贵了。 在他看来,真正成功的合并,不是把两种人格硬塞进一个checkpoint,而是让模型拥有一个连续的推理努力光谱。 | 面对未来,他还给出这样的判断:过去两年Reasoning Thinking时代的使命已经完成了。 | | | | | --- | --- | --- | --- | | Open ...
林俊旸离职后首次发声:复盘千问的弯路,指出AI的新路
创业邦· 2026-03-27 07:18
来源丨 量子位(ID:QbitAI) 作者丨 梦晨 林俊旸 ,离职阿里千问后首次发声。 他没有回应离职风波或宣告去向,而是发长文探讨从"推理模型时代的思考"到"智能体时代的思考"的转变。 整篇文章谈的是技术和AI的未来方向,但字里行间对千问技术路线的反思藏不住。 他在文中坦白承认"我们没有全做对"(We did not get everything right), 千问团队曾有一个雄心勃勃的构想:把thinking和instruct两种模式合并到一个模型里。 Qwen3就是这个方向上"最清晰的公开尝试之一",它引入了混合思维模式。 但在今天的林俊旸仍不够满意,他觉得最终thinking变得啰嗦且犹豫不决,instruct变得不够干脆、不够可靠,还更贵了。 在他看来,真正成功的合并,不是把两种人格硬塞进一个checkpoint,而是让模型拥有一个连续的推理努力光谱。 面对未来,他还给出这样的判断:过去两年Reasoning Thinking时代的使命已经完成了。 OpenAI的o1和DeepSeek-R1证明了推理能力可以被训练和复现,这教会了整个行业一个关键认知: 要在语言模型上做强化学习,需要确定性强、可规 ...
堆推理链全错了!林俊旸离职首曝:曾在阿里 Qwen 踩中一个“致命”技术误区
AI前线· 2026-03-27 03:45
在外界围绕"Harness Engineer"讨论得热火朝天之际,阿里千问技术负责人林俊旸在离职后首次公开发声。 昨天深夜,他发布了一篇长文 《From "Reasoning" Thinking to "Agentic" Thinking》 (从"推理"思维到"智 能体思维"),对 AI 下一波能力跃迁作出了一次系统性的判断:大模型的未来,不是继续把推理链拉得更长,而 是转向一种为了行动而思考、在环境中思考、并通过反馈闭环持续修正的 "智能体思维" 。 在这篇文章中,林俊旸罕见复盘了 Qwen 在训练过程中的一次关键尝试 ,以及他为何最终改变了判断。 他在文中提到,2025 年初,团队曾试图挑战一件事: 把 thinking 和 Instruct 模式合并到同一个模型中。 在他 的理想设定里,一个真正先进的模型,不应只有"会不会思考"这一个开关,而应该能够根据提示词和上下文,自 动判断该投入多少推理计算:什么问题可以直接回答,什么问题需要多想一会儿,什么问题又值得显著增加计算 量。 Qwen3 正是这一方向的一次大胆尝试, 它首次引入了混合思维模式 。但在林俊旸看来,结果并不理想。 合并之后, thinkin ...
林俊旸离职后首次发声!复盘千问的弯路,指出AI的新路
量子位· 2026-03-26 16:01
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 林俊旸 ,离职阿里千问后首次发声。 千问团队曾有一个雄心勃勃的构想:把thinking和instruct两种模式合并到一个模型里。 Qwen3就是这个方向上"最清晰的公开尝试之一",它引入了混合思维模式。 但在今天的林俊旸仍不够满意,他觉得最终thinking变得啰嗦且犹豫不决,instruct变得不够干脆、不够可靠,还更贵了。 在他看来,真正成功的合并,不是把两种人格硬塞进一个checkpoint,而是让模型拥有一个连续的推理努力光谱。 他没有回应离职风波或宣告去向,而是发长文探讨 从"推理模型时代的思考"到"智能体时代的思考"的转变 。 整篇文章谈的是技术和AI的未来方向,但字里行间对千问技术路线的反思藏不住。 他在文中坦白承 认 "我们没有全做对" (We did not get everything right), 面对未来,他还给出这样的判断:过去两年Reasoning Thinking时代的使命已经完成了。 OpenAI的o1和DeepSeek-R1证明了推理能力可以被训练和复现,这教会了整个行业一个关键认知: 要在语言模型上做强化学习,需要确 ...
月之暗面被曝考虑赴港上市,公司估值已达180亿美元
硬AI· 2026-03-26 14:33
作者 | 杨 宸 编辑 | 硬 AI 据媒体报道,月之暗面已就潜在IPO事宜与中金公司及高盛集团接触洽谈,此次上市时间窗口尚不确定,相关讨论仍在进行中,最终未必会促成上市。同时,月之暗面正寻求在私募 市场完成新一轮最高10亿美元的融资,对应公司估值约为180亿美元。 硬·AI 北京人工智能初创公司月之暗面正处于赴港上市的早期考量阶段,此举旨在借助投资者对AI概念股的高涨热情融资。 据彭博援引知情人士透露,月之暗面已就潜在IPO事宜与中金公司及高盛集团接触洽谈。知情人士表示,此次上市时间窗口尚不确定,相关讨论仍在进行中,最 终未必会促成上市。 与此同时,月之暗面正寻求在私募市场完成新一轮最高10亿美元的融资,据彭博此前报道,该轮融资对应公司估值约为180亿美元。 今年1月,公司对旗舰产品Kimi AI模型完成升级,推出K2.5版本,支持在单一提示下同步处理文本、图像与视频,并搭载AI智能体产品Kimi Claw。 AI企业赴港上市热潮升温 据彭博援引知情人士透露,月之暗面已与中金公司和高盛就承销事宜进行接触。 港股市场正吸引越来越多的中国AI企业关注。智谱和MiniMax今年1月先后完成港股上市,此后股价均大幅 ...
A Google AI breakthrough is pressuring memory chip stocks from Samsung to Micron
CNBC· 2026-03-26 10:58
Signage outside the Google headquarters in Mountain View, California, US, on Tuesday, Feb. 3, 2026.Google's latest research which claims to make AI models more efficient is putting pressure on memory stocks, with investors concerned the breakthrough could see a slowdown in chip demand.On Thursday, shares of the world's two biggest memory chipmakers, SK Hynix and Samsung, fell 6% and nearly 5%, respectively in South Korea. Japanese flash memory company Kioxia dropped nearly 6%. These moves followed falls in ...
Nvidia-Backed AI Start-Up Chases Big Valuation. It's Taking On China's DeepSeek.
Barrons· 2026-03-26 10:51
Nvidia is funding an ecosystem of U.S. artificial-intelligence models to counter Chinese AI companies like DeepSeek. ...
DeepSeek急招Agent方向!一口气放17个岗位,重度Vibe Coding用户优先
量子位· 2026-03-25 04:58
仔细阅读每个岗位的要求,发现两个有意思的细节: 多个岗位在"加分项"或"岗位要求"中明确提到: 重度使用Claude Code、Cursor、Copilot等AI编程工具的优先。 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek,一口气开放17个招聘岗位。 最核心研发岗 聚焦Agent ,覆盖算法研究、数据评测、基础设施全链条。 在全栈开发工程师的岗位职责中,也出现了一条不太常见的描述: 作为Vibe Coding重度用户 ,持续探索模型能力在产品中的创新应用。 DeepSeek需要什么样的Agent人才? 从岗位要求来看,DeepSeek的Agent布局已经从研究落地到具体能力建设阶段: Agent深度学习算法研究员 核心任务包括探索提升模型能力的新方法与新范式,参与强化学习在大模型对齐与能力提升中的应用研究,覆盖RLHF/RLAIF、过程奖励、偏 好学习等方向。 Agent数据评测专家 聚焦于构建评测数据集,精准区分不同模型的能力边界,针对Agent的规划、工具调用、多轮交互、长期记忆等核心能力设计测试用例。 Agent基础设施工程师 负责搭建Agent运行的底层基座,包括集成外部工 ...
为什么大厂必须抢郭达雅?
36氪· 2026-03-23 13:42
以下文章来源于字母AI ,作者苗正 字母AI . 聚焦前沿科技,抢先看到未来。 DeepSeek正在经历一场严峻的考验。 文 | 苗正 编辑 | 王靖 来源| 字母AI(ID:faceaibang) 封面来源 | Unsplash 有这样一则消息在AI圈悄然流传:DeepSeek研究员郭达雅已经离职。 大家第一时间的反应普遍是"谁?谁是郭达雅?" 郭达雅不一样,他是代码智能和数学方向的,他刚好 可以补强 字节在Vibe Coding以及AGI这两大板块。 如果是去百度,那也说得通。文心快码在3月份刚刚完成了4.0版本迭代,推出了多agent协同全链路开发的功能。 但是你知道文心快码3.0是什么时候发布的吗?是2024年11月。两个大版本中间相隔了一年多,这在以周为单位的AI圈是不太常见的。 这不难理解,因为郭达雅的知名度远不如创始人梁文锋以及"天才AI少女"罗福莉。 但是在学术研究以及对DeepSeek大模型的贡献上,郭达雅要比后两者高许多。 截止至发稿,郭达雅发表的论文已经被引用超过37000次,远远超过了同龄的研究者。 郭达雅的h指数为37,i-10指数为46,说明他不仅学术产出非常稳定,而且他还发表了多 ...
未知机构:多家AI模型厂商已上调其API定价-20260323
未知机构· 2026-03-23 02:15
Summary of Conference Call Records Industry Overview - Multiple AI model vendors have raised their API pricing, reflecting high and rising costs of computing, memory, and electricity, alongside rapidly growing inference demand driven by agents like OpenClaw [1][2] - In the U.S., API pricing remains approximately six times higher than in China, indicating a tight supply of computing resources and previously unsustainable low pricing levels in China [1][2] Key Points and Arguments - The increase in API pricing is driven by expensive and tight supply of computing and memory resources, with many U.S. and Chinese AI vendors adjusting their model API pricing due to soaring costs [1][2] - The average API price in the U.S. has been raised by 17% to 67% by companies like Anthropic, Google, and OpenAI, while memory prices have surged by 3 to 5 times, and next-generation AI servers and GPUs are becoming more costly and power-hungry [2] - Despite the growth in inference demand, the rapid increase in API pricing may help control this demand, as most AI vendors face pressure to raise their API prices [2] Company-Specific Insights - In China, independent AI model vendors may face greater margin pressure, with five AI vendors raising their model API pricing and two lowering it, including Grok and Alibaba [3] - MiniMax plans to reduce the price of its M2.7 model by 50% by October 2025, making it the second cheapest AI model after DeepSeek [3] - Alibaba Cloud has increased its pricing for third-party computing/storage by 5% to 34% while reducing its model API pricing by 42%, likely to enhance competitiveness but indicating potential margin pressure for independent AI vendors renting computing/storage from Alibaba Cloud [3] Investment Risks and Opportunities - The value of AI is primarily flowing to upstream hardware manufacturers, presenting investment return risks [4] - AI model vendors must invest heavily in computing to enhance model performance and support growing inference demand, suggesting that current investment opportunities are mainly concentrated in upstream hardware suppliers such as CPU/GPU, memory, optical communication, and data centers [4] - The potential for investment returns remains a significant risk in the global AI development landscape [4]