Artificial Intelligence
Search documents
“DeepSeek-V3基于我们的架构打造”,欧版OpenAI CEO逆天发言被喷了
3 6 Ke· 2026-01-26 07:44
"DeepSeek-V3是在Mistral提出的架构上构建的。" 欧洲版OpenAI CEO此言一出,炸了锅了。 网友们的反应be like: 还没吃上瓜的家人们别着急,咱们从头捋一捋这事儿: 在最近一次访谈中,当被问到如何看待中国开源AI的强势发展时,Mistral联合创始人、CEO Arthur Mensch这样回应: 中国在AI领域实力强劲。我们是最早发布开源模型的公司之一,而他们发现这是一个很好的策略。 开源不是真正的竞争,大家在彼此的基础上不断进步。 比如我们在2024年初发布了首个稀疏混合专家模型(MoE),DeepSeek-V3以及之后的版本都是在此基础上构建的。它们采用的是相同的架 构,而我们把重建这种架构所需的一切都公开了。 这还是温和派,还有更直接的吐槽:Mistral在胡说八道些什么…… Arthur Mensch很自信,但网友们听完表示:桥豆麻袋,这不对劲。 且不说DeepSeek MoE论文的发布时间和Arthur Mensch提到的Mixtral论文相差仅3天: 认真细扒起来,两种架构实际上思路也并不相同。 并且此前,Mistral 3 Large还曾被扒出基本上照搬了DeepSe ...
DeepSeek最新论文解读:mHC如何用更少的钱训练出更强的模型?——投资笔记第243期
3 6 Ke· 2026-01-26 07:38
在残差连接之前,神经网络的深度长期被限制在20~30层以内。当信号在几十、上百层网络中反复相乘传递时,梯度会指数级衰减,最终弱到模型几乎无 法学习有效特征,这就是梯度消失。受限于此,经典模型如AlexNet,也只能有 8 层深度。 DeepSeek发布了关于mHC(Manifold-Constrained Hyper-Connections) 的论文,扔出了一个重磅炸弹。这篇论文关注的并不是模型参数规模、数据量或算 力,而是一个更基础、更底层的问题:大模型中,信息究竟是如何在超深网络里稳定流动的? 要理解mHC的价值,必须回到残差连接(Residual Connection)这个算法基石。这最早由何恺明团队在2015年提出(ResNet),是人工智能发展的一个里 程碑。其核心形式简单来说就是:每一层的输出 = 这一层学到的东西 + 上一层的输入,用公式表示为:x_{l+1} = x_l + F(x_l) 这个创新为什么重要?因为在这个算法之前,由于梯度消失原理,AI的模型深度训不高。而残差连接的出现,解决了当时深度学习中这一根本性难题。 残差连接的关键突破,在于为信号引入了一条"快车道"。无论中间层学到了什么 ...
AI招聘逆天研究:看照片预测一生职业成就
3 6 Ke· 2026-01-26 07:32
硅谷大厂HR标配的AI招聘系统,搞得天怒人怨。 微软、拜耳、PayPal都在用的AI招聘Eightfold AI,被两名求职者告上了法庭。 这家主打"用AI帮企业更高效选人"的公司,被指控其算法在实际招聘过程中造成了歧视。 除了经济赔偿外,这俩打工人还喊话法院,必须管管黑箱算法,提高招聘筛选过程的透明度。 这事儿在持续发酵的同时,另一个离谱的研究也冒了出来—— AI居然能根据一张人脸照片,预测你的职业走向…… 何意味?赛博相面? AI怎么就成了"面相大师" 虽然听上去像AI算命2.0,但这项研究竟然是由多所美国顶级高校的研究者完成的。 从学术角度来看,它用的数据规模和研究方法还挺扎实。 研究团队收集了近10万名MBA毕业生的数据,涵盖美国排名前110的商学院; 这些数据包括教育背景和完整的职业轨迹,还有领英人脸头像以及院校相册里的照片。 研究的核心做法是先用1.2万多人的自拍+性格问卷训练AI,让它能把人脸转换成数字信号,并据此预测个体的五大人格特质。 五大人格是心理学界公认的性格测评标准,包括外向性、尽责性、开放性、宜人性(好相处)和神经质。 随后,他们将这些由AI预测出的人格特征,与现实世界中的结果进行对 ...
阶跃星辰完成超50亿元B+轮融资创纪录,38岁清华“姚班”天才印奇出任董事长
Sou Hu Cai Jing· 2026-01-26 07:20
瑞财经 吴文婷大模型赛道再现天量融资。 公开资料显示,印奇,1988年1月出生,中国国籍,清华大学计算机科学实验班(姚班)计算机科学学士 学位,哥伦比亚大学计算机科学(智能传感)硕士学位。2011年其创立中国人工智能公司北京旷视科技有 限公司,现任重庆千里科技股份有限公司董事、董事长。 1月26日,据媒体报道,上海大模型创业公司阶跃星辰(StepFun)完成超50亿人民币B+轮融资,一举 刷新过去12个月中国大模型赛道单笔最高融资纪录。 参与机构包括上国投先导基金、国寿股权、浦东创投、徐汇资本、无锡梁溪基金、厦门国贸、华勤技术 等产业投资人,腾讯、启明、五源等老股东进一步跟投。本轮融资将用于基础模型研发,打造全球顶尖 基座模型,加速AI+终端战略落地。 同日,阶跃星辰宣布,印奇正式出任公司董事长,负责整体战略节奏与技术方向的制定。 印奇将与CEO姜大昕、首席科学家张祥雨、CTO朱亦博组成核心管理团队。印奇同时还担任千里科技董 事长,在人工智能与汽车场景结合上有丰富实践。阶跃星辰和千里科技将深化合作,共同推进"AI+终 端"战略落地。 2025年9月28日,千里科技举办品牌发布会。"我当时在全国寻找聪明人,偶然 ...
Z Event|OpenAI、Anthropic和DeepMind核心贡献者线下活动齐聚,AI下一步走向何处?
Z Potentials· 2026-01-26 07:11
2 026 年春, AI+ Renaissance Summit 2026 在旧金山拉开序幕,这场由 AI+ 社区主办、汇聚全球 AI 核心力量的旗舰级峰会,提出了一个宏大的命题: AI 是否正在进入一个全新的「Renaissance」(新时代)? Z Potentials 很荣幸成为 AI+ Renaissance Summit 2026 的合作伙伴(Partner), 并将持续参与并记录这 一 AI 时代关键节点的思想与创新 。 本次大会已确认 40 位重量级 Speakers ,阵容横跨 AI 创业、前沿研究与产业落地的核心一线 。 演讲嘉宾包括: 大会将汇聚 2000 位 Founders、Builders 与 Investors ,围绕下一代 AI 的关键方向展开深度交流与碰撞。 扫码加入 Renaissance 2026 交流群,与 AI 研究者们持续交流! -----------END----------- 来自 Replit、Cognition、Parallel Web System、Tavus 等 AI Unicorn 公司的创始人 来自 OpenAI、xAI、Anthropic、DeepM ...
速递|五大厂前员工联手创业“AI微信”,4800万美元种子轮押注“社交智能”新基础模型架构
Z Potentials· 2026-01-26 07:11
图片来源: Humans& AI 聊天机器人在回答问题、总结文档和求解数学方程方面越来越强,但它们大多仍像是为单一用户服务的助手。 它们并非为处理真实协作中更复 杂的任务而生:比如协调目标各异的成员、追踪长期决策过程、以及维持团队持续同心同力。 Humans& 是一家由 Anthropic 、 Meta 、 OpenAI 、 xAI 和 Google DeepMind 前员工共同创立的新创公司,他们认为缩小这一差距是基础模型的下 一个主要前沿领域。该公司本周筹集了 4800 万美元的种子轮融资 ,旨在为 " 人类 +AI" 经济构建一个 " 中枢神经系统 " 。 这家初创公司早期报道中强调的 " 赋能人类的 AI" 框架占据主导,但其实际愿景更具新意:构建专为社交智能设计的新基础模型架构,而不仅限 于信息检索或代码生成。 " 感觉我们正在结束规模化第一阶段,即问答模型被训练得在某些垂直领域非常擅长,现在正进入我们认为是第二波应用浪潮,普通消费者或用户 正在努力弄清楚如何运用所有这些技术, "Humans& 联合创始人、前 Anthropic 员工 Andi Peng 向 TechCrunch 表示。 Huma ...
深度|印奇与阶跃的全景:一支战队,一条窄路,一个物理世界
Z Potentials· 2026-01-26 07:11
引言 2026年初,中国大模型公司走向聚光灯下。智谱AI与MiniMax冲刺IPO的消息点燃了市场热情。此 时,长期低调,甚至有些神秘的阶跃星辰用另一种方式宣告存在。它完成了一笔B+轮超50亿人民币 融资,这笔交易不仅刷新了过去12个月中国大模型赛道的单笔融资记录,其金额甚至超过了前述两家 友商IPO的计划募资额。 不仅如此,阶跃官宣了一位关键人物——曾缔造AI 1.0时代独角兽的实战派操盘手印奇,出任阶跃星 辰董事长。 这笔注资是市场对阶跃星辰过去两年潜心布局的认可。它将阶跃选定的独特道路展现在聚光灯下。一 条难走,但可能护城河最高的道路。理解这一选择,需要剖析三个层面。资本,团队,战略。 01 一笔逆势的巨额融资,资本在投什么 阶跃星辰此轮融资金额,刷新了过去一年中国大模型赛道的单笔融资记录。体量甚至超过了同期智谱 AI与MiniMax的IPO募资金额。这笔融资的"含金量"不仅在于金额。 大模型的投融资环境已从狂热到理性。投资人愈发看重三个核心要素。 技术壁垒,清晰的商业化路 径,能够穿越周期的完整团队。 阶跃星辰获得巨额融资。这意味资本市场对其核心团队、技术实力和「AI+终端」商业战略的高度认 可。也证 ...
500亿美元估值AI明星初创内讧,创始团队分裂,上演“回归OpenAI”大戏
Sou Hu Cai Jing· 2026-01-26 06:52
174 TD S (2) IT A 图片来源:unsplash 预期估值高达500亿美元的人工智能初创公司Thinking Machines Lab陷入动荡。 这家由包括OpenAI前CTO米拉·穆拉蒂(Mira Murati)在内的多名OpenAI前员工创立的公司,被曝出创始人团队已经决裂,多名高管已集体出走。 综合《华尔街日报》《纽约时报》等媒体报道,就在去年夏天推进号称硅谷史上最大种子轮融资之际,该公司领导层已出现裂痕,主要原因与担任CEO的穆 拉蒂和同为联合创始人、担任CTO的巴雷特·佐夫(Barret Zoph)以及其他核心成员对公司发展方向的分歧,以及佐夫本人的办公室恋情有关。 据悉,当时穆拉蒂开始怀疑佐夫与一位OpenAI前同事存在未公开的婚外情,而正是他将该名员工挖来了Thinking Machines Lab。 虽然佐夫最初对穆拉蒂否认了相关事实的存在,但在去年6月,佐夫和这名女子最终都向穆拉蒂进行了坦白。此后,该名员工离开了Thinking Machines Lab 重返OpenAI,佐夫则开始休假,7月下旬返岗时,很多行政和管理职责已被剥离,变成了个人技术贡献者。 当时,Thinking ...
AI招聘逆天研究:看照片预测一生职业成就
量子位· 2026-01-26 06:51
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 硅谷大厂HR标配的AI招聘系统,搞得天怒人怨。 微软、拜耳、PayPal都在用的AI招聘 Eightfold AI ,被两名求职者告上了法庭。 这家主打"用AI帮企业更高效选人"的公司,被指控其算法在实际招聘过程中造成了歧视。 除了经济赔偿外,这俩打工人还喊话法院,必须管管黑箱算法, 提高招聘筛选过程的透明度 。 这事儿在持续发酵的同时,另一个离谱的研究也冒了出来—— AI居然能根据一张人脸照片,预测你的职业走向…… 何意味?赛博相面? AI怎么就成了"面相大师" 虽然听上去像AI算命2.0,但这项研究竟然是由多所美国顶级高校的研究者完成的。 从学术角度来看,它用的数据规模和研究方法还挺扎实。 研究团队收集了近10万名MBA毕业生的数据,涵盖美国排名前110的商学院; 这些数据包括教育背景和完整的职业轨迹,还有领英人脸头像以及院校相册里的照片。 研究的核心做法是先用1.2万多人的自拍+性格问卷训练AI,让它能把人脸转换成数字信号,并据此预测个体的五大人格特质。 五大人格是心理学界公认的性格测评标准,包括外向性、尽责性、开放性、宜人性(好相处)和神经质。 随 ...
探访南京建邺高新区OPC社区 ——抢滩布局,竞逐人工智能新赛道
Xin Lang Cai Jing· 2026-01-26 06:39
OPC(One Person Company,单人公司)引领开启"单人+AI即公司"的创新模式,旨在通过人工智能赋 能个体创业,充分发挥企业、人才的创新主体作用,以良好生态竞逐人工智能新赛道。 OPC模式乘风而来,南京建邺高新区的多个OPC社区已悄然形成快速生长、同步发力的蓬勃态势。近 日,记者实地走访了建邺高新区多个OPC社区,包括位于南京国家广告产业园的建邺数字消费集聚区极 客码头、南京数智城C片区"模法学院"等,探寻"一人公司"如何在这里成为AI产业的创新支点。 走在前列:为"超级个体"提供全要素支持 模法学院作为建邺高新区与建邺国资数智城公司合力打造的OPC社区,开放式办公空间坐满了专注的年 轻人,代码在电脑屏幕上跃动。年仅23岁的吴洋是这里的代表之一,作为在校大学生和连续创业者,他 创立的梦当然科技专注于AI教育出版方案研发。 "从公寓到工位,步行只需五分钟。"吴洋笑着描述他的创业日常,"这种'零距离'通勤,让我能把所有精 力都投入到产品迭代中。"更让他受益的是社区营造的创新生态,"在最近一次沙龙中,我与几位AI创业 者碰撞出了新的火花,这种跨界灵感在独自工作时难以获得。" 吴洋的感受反映了OPC模 ...