Workflow
DeepSeek
icon
Search documents
林俊旸离职后首次发声,复盘千问的弯路,指出AI的新路
36氪· 2026-03-27 11:12
他没有回应离职风波或宣告去向,而是发长文探讨 从"推理模型时代的思考"到"智能体时代的思考"的转变。 整篇文章谈的是技术和AI的未来方向,但字里行间对千问技术路线的反思藏不住。 他在文中 坦白承认"我们没有全做对"(We did not get everything right), 林俊旸,离职阿里千问后首次发声。 文 | 梦晨 来源| 量子位(ID: QbitAI) 封面来源 | pexels 林俊旸,离职阿里千问后首次发声。 千问团队曾有一个雄心勃勃的构想:把thinking和instruct两种模式合并到一个模型里。 Qwen3就是这个方向上"最清晰的公开尝试之一",它引入了混合思维模式。 但在今天的林俊旸仍不够满意,他觉得最终thinking变得啰嗦且犹豫不决,instruct变得不够干脆、不够可靠,还更贵了。 在他看来,真正成功的合并,不是把两种人格硬塞进一个checkpoint,而是让模型拥有一个连续的推理努力光谱。 | 面对未来,他还给出这样的判断:过去两年Reasoning Thinking时代的使命已经完成了。 | | | | | --- | --- | --- | --- | | Open ...
林俊旸离职后首次发声:复盘千问的弯路,指出AI的新路
创业邦· 2026-03-27 07:18
来源丨 量子位(ID:QbitAI) 作者丨 梦晨 林俊旸 ,离职阿里千问后首次发声。 他没有回应离职风波或宣告去向,而是发长文探讨从"推理模型时代的思考"到"智能体时代的思考"的转变。 整篇文章谈的是技术和AI的未来方向,但字里行间对千问技术路线的反思藏不住。 他在文中坦白承认"我们没有全做对"(We did not get everything right), 千问团队曾有一个雄心勃勃的构想:把thinking和instruct两种模式合并到一个模型里。 Qwen3就是这个方向上"最清晰的公开尝试之一",它引入了混合思维模式。 但在今天的林俊旸仍不够满意,他觉得最终thinking变得啰嗦且犹豫不决,instruct变得不够干脆、不够可靠,还更贵了。 在他看来,真正成功的合并,不是把两种人格硬塞进一个checkpoint,而是让模型拥有一个连续的推理努力光谱。 面对未来,他还给出这样的判断:过去两年Reasoning Thinking时代的使命已经完成了。 OpenAI的o1和DeepSeek-R1证明了推理能力可以被训练和复现,这教会了整个行业一个关键认知: 要在语言模型上做强化学习,需要确定性强、可规 ...
堆推理链全错了!林俊旸离职首曝:曾在阿里 Qwen 踩中一个“致命”技术误区
AI前线· 2026-03-27 03:45
在外界围绕"Harness Engineer"讨论得热火朝天之际,阿里千问技术负责人林俊旸在离职后首次公开发声。 昨天深夜,他发布了一篇长文 《From "Reasoning" Thinking to "Agentic" Thinking》 (从"推理"思维到"智 能体思维"),对 AI 下一波能力跃迁作出了一次系统性的判断:大模型的未来,不是继续把推理链拉得更长,而 是转向一种为了行动而思考、在环境中思考、并通过反馈闭环持续修正的 "智能体思维" 。 在这篇文章中,林俊旸罕见复盘了 Qwen 在训练过程中的一次关键尝试 ,以及他为何最终改变了判断。 他在文中提到,2025 年初,团队曾试图挑战一件事: 把 thinking 和 Instruct 模式合并到同一个模型中。 在他 的理想设定里,一个真正先进的模型,不应只有"会不会思考"这一个开关,而应该能够根据提示词和上下文,自 动判断该投入多少推理计算:什么问题可以直接回答,什么问题需要多想一会儿,什么问题又值得显著增加计算 量。 Qwen3 正是这一方向的一次大胆尝试, 它首次引入了混合思维模式 。但在林俊旸看来,结果并不理想。 合并之后, thinkin ...
林俊旸离职后首次发声!复盘千问的弯路,指出AI的新路
量子位· 2026-03-26 16:01
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 林俊旸 ,离职阿里千问后首次发声。 千问团队曾有一个雄心勃勃的构想:把thinking和instruct两种模式合并到一个模型里。 Qwen3就是这个方向上"最清晰的公开尝试之一",它引入了混合思维模式。 但在今天的林俊旸仍不够满意,他觉得最终thinking变得啰嗦且犹豫不决,instruct变得不够干脆、不够可靠,还更贵了。 在他看来,真正成功的合并,不是把两种人格硬塞进一个checkpoint,而是让模型拥有一个连续的推理努力光谱。 他没有回应离职风波或宣告去向,而是发长文探讨 从"推理模型时代的思考"到"智能体时代的思考"的转变 。 整篇文章谈的是技术和AI的未来方向,但字里行间对千问技术路线的反思藏不住。 他在文中坦白承 认 "我们没有全做对" (We did not get everything right), 面对未来,他还给出这样的判断:过去两年Reasoning Thinking时代的使命已经完成了。 OpenAI的o1和DeepSeek-R1证明了推理能力可以被训练和复现,这教会了整个行业一个关键认知: 要在语言模型上做强化学习,需要确 ...
月之暗面被曝考虑赴港上市,公司估值已达180亿美元
硬AI· 2026-03-26 14:33
作者 | 杨 宸 编辑 | 硬 AI 据媒体报道,月之暗面已就潜在IPO事宜与中金公司及高盛集团接触洽谈,此次上市时间窗口尚不确定,相关讨论仍在进行中,最终未必会促成上市。同时,月之暗面正寻求在私募 市场完成新一轮最高10亿美元的融资,对应公司估值约为180亿美元。 硬·AI 北京人工智能初创公司月之暗面正处于赴港上市的早期考量阶段,此举旨在借助投资者对AI概念股的高涨热情融资。 据彭博援引知情人士透露,月之暗面已就潜在IPO事宜与中金公司及高盛集团接触洽谈。知情人士表示,此次上市时间窗口尚不确定,相关讨论仍在进行中,最 终未必会促成上市。 与此同时,月之暗面正寻求在私募市场完成新一轮最高10亿美元的融资,据彭博此前报道,该轮融资对应公司估值约为180亿美元。 今年1月,公司对旗舰产品Kimi AI模型完成升级,推出K2.5版本,支持在单一提示下同步处理文本、图像与视频,并搭载AI智能体产品Kimi Claw。 AI企业赴港上市热潮升温 据彭博援引知情人士透露,月之暗面已与中金公司和高盛就承销事宜进行接触。 港股市场正吸引越来越多的中国AI企业关注。智谱和MiniMax今年1月先后完成港股上市,此后股价均大幅 ...
A Google AI breakthrough is pressuring memory chip stocks from Samsung to Micron
CNBC· 2026-03-26 10:58
Signage outside the Google headquarters in Mountain View, California, US, on Tuesday, Feb. 3, 2026.Google's latest research which claims to make AI models more efficient is putting pressure on memory stocks, with investors concerned the breakthrough could see a slowdown in chip demand.On Thursday, shares of the world's two biggest memory chipmakers, SK Hynix and Samsung, fell 6% and nearly 5%, respectively in South Korea. Japanese flash memory company Kioxia dropped nearly 6%. These moves followed falls in ...
Nvidia-Backed AI Start-Up Chases Big Valuation. It's Taking On China's DeepSeek.
Barrons· 2026-03-26 10:51
Nvidia is funding an ecosystem of U.S. artificial-intelligence models to counter Chinese AI companies like DeepSeek. ...
DeepSeek急招Agent方向!一口气放17个岗位,重度Vibe Coding用户优先
量子位· 2026-03-25 04:58
仔细阅读每个岗位的要求,发现两个有意思的细节: 多个岗位在"加分项"或"岗位要求"中明确提到: 重度使用Claude Code、Cursor、Copilot等AI编程工具的优先。 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek,一口气开放17个招聘岗位。 最核心研发岗 聚焦Agent ,覆盖算法研究、数据评测、基础设施全链条。 在全栈开发工程师的岗位职责中,也出现了一条不太常见的描述: 作为Vibe Coding重度用户 ,持续探索模型能力在产品中的创新应用。 DeepSeek需要什么样的Agent人才? 从岗位要求来看,DeepSeek的Agent布局已经从研究落地到具体能力建设阶段: Agent深度学习算法研究员 核心任务包括探索提升模型能力的新方法与新范式,参与强化学习在大模型对齐与能力提升中的应用研究,覆盖RLHF/RLAIF、过程奖励、偏 好学习等方向。 Agent数据评测专家 聚焦于构建评测数据集,精准区分不同模型的能力边界,针对Agent的规划、工具调用、多轮交互、长期记忆等核心能力设计测试用例。 Agent基础设施工程师 负责搭建Agent运行的底层基座,包括集成外部工 ...
腾讯需要一场“叙事重启”
投中网· 2026-03-24 08:14
以下文章来源于锦缎 ,作者牧之 锦缎 . 上市公司研究平台,专注价值发现、创造与传播 将投中网设为"星标⭐",第一时间收获最新推送 股东们集体陷入了认知断层。 作者丨 牧之 来源丨 锦缎 3月19日,腾讯控股公布了2024年第四季度及全年财报。营收同比增长8%,净利润同比大增30%以上,游戏、广告、金融科技三大核心板块均超预 期,现金流充沛,账上躺着数千亿人民币的净现金。 按理说,这是一份足以让市场欢呼的"超预期"成绩单,但事实并非如此: 财报发布当天,腾讯股价盘中一度暴跌近6%,收盘仍跌超4%。全天蒸发市值超过1500亿港元。 为什么? 因为叙事不一致,股东们集体陷入了认知断层。 资本市场从来不是只看数字的机器,它更像一台精密的叙事发动机。投资者买入的从来不是一家公司的"当下业绩",而是它对"未来故事"的可信承诺。 一旦叙事出现裂痕,哪怕财报再亮眼,也会瞬间引发信任崩盘。 腾讯这次,正是把过去五年精心构建的"旧叙事"亲手撕开了一个口子。 腾讯旧叙事的核心:金融工程+护城河 过去几年,腾讯管理层反复向市场传递的是一套极具说服力的"护城河+金融工程"逻辑: 第一,游戏和社交是永恒的现金奶牛。微信、QQ、王者荣耀 ...
为什么大厂必须抢郭达雅?
36氪· 2026-03-23 13:42
以下文章来源于字母AI ,作者苗正 字母AI . 聚焦前沿科技,抢先看到未来。 DeepSeek正在经历一场严峻的考验。 文 | 苗正 编辑 | 王靖 来源| 字母AI(ID:faceaibang) 封面来源 | Unsplash 有这样一则消息在AI圈悄然流传:DeepSeek研究员郭达雅已经离职。 大家第一时间的反应普遍是"谁?谁是郭达雅?" 郭达雅不一样,他是代码智能和数学方向的,他刚好 可以补强 字节在Vibe Coding以及AGI这两大板块。 如果是去百度,那也说得通。文心快码在3月份刚刚完成了4.0版本迭代,推出了多agent协同全链路开发的功能。 但是你知道文心快码3.0是什么时候发布的吗?是2024年11月。两个大版本中间相隔了一年多,这在以周为单位的AI圈是不太常见的。 这不难理解,因为郭达雅的知名度远不如创始人梁文锋以及"天才AI少女"罗福莉。 但是在学术研究以及对DeepSeek大模型的贡献上,郭达雅要比后两者高许多。 截止至发稿,郭达雅发表的论文已经被引用超过37000次,远远超过了同龄的研究者。 郭达雅的h指数为37,i-10指数为46,说明他不仅学术产出非常稳定,而且他还发表了多 ...