大模型去中心化
Search documents
前阿里、字节大模型带头人杨红霞创业:大模型预训练,不是少数顶尖玩家的算力竞赛|智能涌现独家
Sou Hu Cai Jing· 2025-10-30 08:35
采访|周鑫雨 邓咏仪 文|周鑫雨 编辑|苏建勋 在阿里、字节接连做了近7年大模型的杨红霞,身上有一种鲜明的挑战精神。 在阿里早期,她从内部的业务阿里搜索推荐系统,投身于初期并不被看好的大模型研究之路。 后来,她带领林俊旸(现通义千问负责人)、周畅(前通义千问大模型负责人)等这一轮中国大模型的核心人才,在达摩院磕出了通义千问的前身,M6 大模型。 2024年7月,杨红霞从字节离职创业后,被曝出仍要做模型相关技术的消息。 "阿里、字节大模型核心人物"的光环,没有盖住彼时市场上悲观的声音:入局太晚,创业公司怎么和大厂争? 时隔一年零三个月,杨红霞带着她的新 AI 公司 InfiX.ai,杀回了大模型赛道。 10月初,《智能涌现》与身在香港的杨红霞,在线上交流了她的创业近况。 然而,杨红霞对我们强调:"模型知识的注入只发生在预训练阶段,后训练提供的是规则。"就好比,预训练一段是 8 年制的医学博士生涯,后训练则是临 床实习的过程。 这就导致,基于企业数据后训练的模型,在实际业务中仍然会出现不少"幻觉"。 "中心化"模型的研发经历,让杨红霞形成了创业的两个原始判断: 但仅从技术中,就能窥见 InfiX.ai 的宏大版图 ...