Workflow
晚点LatePost
icon
Search documents
孵化 DeepSeek 的量化交易:一个数据驱动的隐秘世界
晚点LatePost· 2025-03-10 14:02
这一年,D.E. Shaw 为计算机行业做了两个贡献。一个副总裁带队,做出了当时罕见的免费电子邮件产 品 Juno,成功上市;另一个副总裁离职,带着自己和老板讨论产生的好点子开车去了西雅图,做出了全 世界的电商鼻祖、市值超过 20000 亿美元的亚马逊。 30 年后,又有一家量化公司的 "副业" 影响整个计算机行业:管理数百亿元的中国头部量化公司幻方, 推出大语言模型 DeepSeek R1,没花一分钱营销就震撼全球,用户涌来的速度甚至快过早年的抖音。 贝索斯创办亚马逊,或者梁文锋造出 DeepSeek 的主要原因自然不是因为他们做过量化,而是因为他们 骨子里都是创业者。但量化投资这个极度追求人才密度且极度保密的行业文化,确实提供了适合大模型 研发的环境。 招来一群聪明人不必然导致创新,叠加一个简单的环境才够。量化公司证明了这一点,DeepSeek 则证明 这也适用于大模型研发。 剥离主观因素,在数据里挖掘规律 从十万次交易到千亿参数的 AI 进化。 文 丨 孙海宁 编辑 丨 黄俊杰 1994 年,量化公司是当时最神秘最热门的技术公司,他们雇用数学家和物理学家,成批买来高性能计算 机做交易。这个行业里的标杆公 ...
3700 次预训练寻找 “线性注意力” 非共识,MiniMax-01 开发者讲述 4 年探索
晚点LatePost· 2025-03-09 12:00
"我们跑的是下半场,赌的就是未来的长文本需求。" MiniMax 在今年 1 月发布了参数为 4560 亿的开源大模型 MiniMax-01,该模型就用到了他们开发的线 性注意力机制 "Lightning Attention"。 我们邀请了这个项目的负责人,MiniMax 高级研究总监钟怡然,来与我们一起聊线性注意力的研发过 程。钟怡然在 MiniMax 负责大模型网络架构设计,目前正开发多模态深度推理模型。 钟怡然曾担任上海人工智能实验室青年科学家,是新架构探索组的 PI(项目负责人);他在澳洲国立大 学获得博士学位,师从李宏东教授和 Richard Hartley 院士。他和他的团队已在一些国际顶级学术会议和 期刊上发表了 20 余篇关于模型新架构的论文,覆盖了当前多类非 Transformer 架构,如线性注意力机制 (线性注意力)、长卷积(Long Convolution)和线性循环网络(Linear RNN)。 在 2021 年,线性注意力还是一个 "看起来很美好的泡泡",怡然和团队就开始探索线性架构的实现。 嘉宾 丨 钟怡然 整理 丨 刘倩 程曼祺 上期播客中, 我们与清华的两位博士生,肖朝军和傅 ...
从危机中赚钱的人,相信全球金融系统是个纸牌屋丨晚点周末
晚点LatePost· 2025-03-09 12:00
斯皮茨纳格尔不是孤例。对冲基金潘兴广场资本管理(Pershing Square Capital Management)的创始人 比尔·阿克曼(Bill Ackman),在这场灾难中赚得更多。他下注 2600 万美元,最终获得 36 亿美元的收 益,回报达 138 倍。《巴伦周刊》评价说,"这是有史以来最伟大的交易之一"。 这两件事激发了帕特森的兴趣,老记者的敏锐和直觉让他觉得金融投资可能已经出现新的变化。此前, 他捕捉到了量化金融的崛起,写了著作《宽客》(The Quants),里面的人物包括文艺复兴科技的创始 人詹姆斯·西蒙斯(James Simons)等。在另一本书《暗池》(Dark Pools)中,他较早地揭露了高频交 易和 AI 可能给金融市场带来的风险。 经过 3 年的调查研究和采访写作后,帕特森在 2023 年出版著作 Chaos Kings: How Wall Street Traders Make Billions In The New Age Of Crisis。中文版最近推出,书名译为《逆风翻盘:危机时代的亿万赢 家》。书的主角是阿克曼、斯皮茨纳格尔、纳西姆·尼古拉斯·塔勒布(Nassim ...
特朗普或将延长TikTok出售期限;贝壳将被调入港股通;拉里·佩奇成立人工智能初创公司丨百亿美元公司动向
晚点LatePost· 2025-03-08 12:17
特朗普或将延长 TikTok 出售期限。 制造业长期依赖很难被数字世界的技术改造和重塑,比如在互联网时代就有一批创业者和大公司下 场尝试,但多以失败告终;但 AI 或许带来了新的机会,毕竟十年前就提到的 "超级大脑" 现在终于 有技术路径实现了。 宝马或因不符合 USMCA 条款被征收高额加墨关税。 特朗普本周对遵守美墨加协定(USMCA)的汽车厂商给予一个月的关税缓征期,市场预期特朗普 或将削弱对加墨两国的关税,包括福特汽车、通用汽车、Stellantis 在内的部分汽车厂商股价出现反 弹。大众汽车于周四表示,其在北美生产的汽车符合 USMCA 的要求,或避免受到新关税政策的 影响;马自达也表示,未来 30 天内,其在墨西哥生产的 Mazda3 和 CX-30 也不会受到关税影响, 但正在等待政府的最终明确指导。 本周四,美国总统特朗普在白宫回应有关 TikTok 的问题时表示,如果 4 月 5 日前无法达成协议, 他可能会延长 TikTok 的出售期限。 不过,宝马的情况并不乐观。宝马的一位发言人对媒体表示,宝马反对加征关税,其在美国和墨西 哥生产的汽车不符合 USMCA 的规定,可能会被征收高额关税。据 ...
3 位连续创业者打造 Manus,应用潮里有更多 “underdog” 的机会(文末附 Manus、Open Manus 实测)
晚点LatePost· 2025-03-08 12:17
编辑 丨 程曼祺 3 月 6 日,AI 产品 Manus 引发关注。开发 Manus 的三位关键人物是:创始人、CEO 肖弘(小红);联 合创始人、首席科学家季逸超(Peak);以及产品合伙人张涛(hidecloud)——两位 90 后连续创业者 和一位 15 年换了 10 家公司的 85 后产品老兵。 一个边缘地带的 "underdog" 小团队 ,以车库创业的开发方式,出乎意料地搅起了一场小风暴。 "硬科技创业者基本都是名门正派,光谱另一端的消费级产品创始人则几乎都是畎亩之中。" 真格基金投 资人刘元说。他也是 Manus 的天使投资人。 毕业于华中科技大学的肖弘是江西吉安人,创业起点在武汉,曾开发过两款微信生态的插件:微信公众 号排版工具壹伴和企业微信客户关系管理工具微伴,卖给一家独角兽公司。 高中阶段就开始创业的季逸超是北京人,他在苹果 App Store 上线不久,就开发出猛犸浏览器,后来做 了 Magi 知识搜索引擎。季逸超曾告诉我们,那时有投资人 "诱惑" 他:我给你一笔钱,敢不敢做个 Google?他拒绝了,不是觉得做不到,而是他觉得只有 "抛开利益" 才有可能。 重庆人张涛则先后在烽火国际、 ...
GPT-5 有了雏形;OpenAI 和 Manus 研发 Agent 的经验;中国大公司扩大算力投资丨 AI 月报
晚点LatePost· 2025-03-08 12:17
2025 年 2 月的全球 AI 重要趋势。 文 丨 贺乾明 2025 年 2 月的 AI 月报,你会看到: 硅谷巨头的新共识:推理能力是大模型的一部分 OpenAI 和 Manus 的 Agent 开发经验 DeepSeek 推动中国大公司加大算力投入,阿里、字节两家加起来,今年就超过 2000 亿 3 家售价过亿的 AI 公司和 23 家获得超过 5000 万美元融资的 AI 公司 OpenAI 时薪 100 美元招专家生产数据提高模型能力 这一期月报中,我们开始邀请研究者、创业者和投资人提供一手视角的对每月 AI 趋势和标志性事件的评述和 洞察。 晚点 AI 月报,每月选取最值得你知道的 AI 信号。 以下是我们第 4 期 AI 月报,欢迎大家在留言区补充我们没有提到的重要趋势。 技术丨GPT-5 雏形出现,行业新共识诞生 DeepSeek 带来的冲击波继续扩散,全球大模型公司陷入混战:不论是马斯克用超过 10 万张 GPU 训练 的 Grok 3,还是 OpenAI 可能投入 10 亿美元训练的 GPT-4.5,或是 Anthropic 融合推理(reasoning) 能力的最新模型 Claude 3 ...
茶饮有尽头,古茗想成为一家 “卖新鲜” 的便利店
晚点LatePost· 2025-03-06 10:48
很多人对于古茗扩张方式不解,是因为没按照便利店打法理解它。 文 丨 徐煜萌 编辑 丨 钱杨 20 多岁的王云安关于自己的未来有一个预言。那时他刚创业,在浙江温岭的大溪镇开奶茶店。他看了一 个纪录片叫《食品技术》,讲怎么做果汁、怎么做汉堡,"当时就被震撼了"。下一个想法是——我的能 力干这个够,不过需要花十多年实现。 10 多年后的 2025 年,他创立的茶饮品牌古茗达到一万家店,在香港上市,计划在未来扩张到三四万 家。 上市之前,王云安回答《晚点 LatePost》关于未来古茗要成为谁的问题。"成为雀巢这样技术驱动的公司 让我更兴奋。" 他举例子,"(茶饮品牌)大家都叫 'XX 餐饮管理有限公司',只有我们后面挂了个 '科 技',我们是 '古茗科技有限公司'。" 蜜雪冰城是可怕的对手。在 2022 年意识到茶饮和咖啡是一个赛道后,瑞幸自然也是可怕的对手。但基 于自己核心能力推演,王云安觉得真正的对手不是它们,而是瓶装饮料。 "我能把这种新鲜的东西成本控制得接近常温。" 王云安说。这是古茗在 15 年中建立的核心能力。目前 古茗菜单上,超过三成的产品是用现切果肉制成的水果茶、果蔬茶。剩下含牛奶的产品,用的是需要 ...
极兔中国经调整后盈利;昂跑净利润增长两倍;特斯拉美国重启免息贷款丨百亿美元公司动向
晚点LatePost· 2025-03-06 10:48
极兔中国全年经调整 EBIT 首次转正。 2024 年,极兔营收同比增长 16% 至 103 亿美元,中国市场贡献超六成。 2020 年进入中国后,极兔以高额亏损为代价,依靠低价与补贴迅速占领市场,在中国快递行业的 红海中挤入前五。四年后,极兔中国全年经调整 EBIT(息税前利润)首次转正,为 1.5 亿美元。 快递是低利润的精细生意,需要依靠规模与成本管理确立优势。2024 年,极兔在中国的单票成本 下降 12% 至 0.3 美元。中国市场扭亏,带动公司整体净利润从上一年的 -11.6 亿美元来到 1.1 亿美 元。 在大本营东南亚,极兔市占率继续保持第一,占据近三成的市场份额,盈利能力进一步增强。2024 年,极兔在该地区的经调整 EBIT 同比增长 49% 至 3 亿美元。 昂跑 2019 年在上海开出中国第一家店。我们了解到,昂跑目前在中国有约 60 店,一半为直营店。 我们曾经写过 ,昂跑诞生在 2010 年,是金融危机后的低迷期,跑步开始复兴。疫情后,人们又开 始需要跑步,昂跑、Hoka One One 于是兴起。昂跑拿着和耐克一样的营销剧本,讲跑者文化,也 正拿去耐克、阿迪达斯的市场份额。 特斯 ...
晚点独家丨美团内部沟通会:食杂零售、国际化、AI 是王兴关注的 “新” 方向
晚点LatePost· 2025-03-05 01:05
文 丨 沈方伟 在全新的市场,扎根当地、快速反应比一切都重要。 编辑 丨 管艺雯 我们了解到,2 月的最后一天,美团 CEO 王兴召开总监级别以上的内部沟通会,美团最高决策层 S-team 的每 一位成员都有发言。 上一次美团召开此级别的沟通已是五年多之前。2019 年底,正值美团即将 10 周年,王兴通过美团内网发起名 为 "更好的十年" 的全员大讨论,当时聚焦讨论的是三个比较宏大的主题:组织人才建设、科技趋势和社会价 值。 那一年,美团首次盈利,与饿了么的竞争告一段落,市值仅次于阿里、腾讯之后。公司的核心方向是以外卖 和团购为主的 "Food",不管是做深产业链,还是试点自营生鲜、打车等业务,美团都有充分的精力、资源和 意愿探索边界。 此次是美团的 15 周年,除了核心本地商业,王兴提出在第二个十年他作为 CEO 会更多关注的三个 "新" 方 向 —— 食杂零售、国际化和科技: 从开会到业务方向,美团都在进一步学习亚马逊。王兴在沟通会上说,"预测未来最好的方式是创造它。" 美团当下的处境要复杂得多。消费者谨慎花钱,骑手成为更多人的就业选项,餐饮商家经营艰难,而美团的 利润创下新高,社会各界比过去都更关注这 ...
比亚迪融资435亿港元;Anthropic估值冲到615亿美元;台积电至少在美国新增千亿美元投资丨百亿美元公司动向
晚点LatePost· 2025-03-04 15:33
比亚迪在港交所发布公告称,将新增发行 1.298 亿 股新 H 股,配售价为 335.2 港元 / 股,共计可融 资约 435.09 亿港元,扣除佣金和估计费用后,所得净额预计约为 433.83 亿港元,融资所得拟用作 集团研发投入、海外业务发展、补充营运资金以及一般企业用途。 比亚迪表示,这是过去十年全球汽车行业最大的股权再融资项目,阿联酋 Al-Futtaim 家族办公室以 战略投资者身份参与本次配售。Al-Futtaim 在中东和东南亚等地区拥有汽车、金融服务、房地产、 零售和医疗保健等产业。比亚迪这次股票发售也是 2021 年以来港交所同类售股中规模最大的一 次。 OpenAI 老对手 Anthropic 估值冲到 615 亿美元。 Anthropic 上周刚发完全球首个混合推理模型 Claude 3.7 Sonnet,这周就宣布完成 35 亿美元的 E 轮 融资,投后估值达到 615 亿美元;马斯克的 xAI 在去年 12 月 的估值介于 350 亿至 450 亿美元之 间。 Anthropic 是 OpenAI 前核心员工创立,2021 年时因对 OpenAI 在 AI 未来走向、安全风险以及商业 ...