Seek .(SKLTY)
Search documents
“天才少女”罗福莉首秀:小米MiMo大模型,比DeepSeek更便宜、推理速度快三倍
Tai Mei Ti A P P· 2025-12-17 07:15
12月17日,在2025小米"人车家全生态合作伙伴大会"上,有"天才少女"之称的罗福莉,完成了加入小米 之后的首次公开演讲,并详述了小米在大模型领域的最新进展。 公开资料显示,罗福莉是一位95后AI研究者,硕士期间曾在国际顶级会议ACL上发表多篇论文,毕业 后加入阿里巴巴达摩院,主导开发了多语言预训练模型VECO。之后,罗福莉转战DeepSeek,是MoE大 模型DeepSeek-V2的关键开发者之一。2024年年底,有报道称,罗福莉被小米集团创始人雷军以千万年 薪挖走,或将担任小米AI实验室的大模型团队负责人。 "大模型通过语言的爆发,通过Scaling(扩展)算力和数据,从而理解了人类的思维和对世界的理解。" 此次公开演讲中,罗福莉以小米MiMo大模型负责人亮相。她表示,小米从语言出发,构建了全新一代 面向Agent(智能体)的基座模型——MiMo-V2-Flash。 目前,MiMo-V2-Flash已经开源了所有模型权重,并同步了技术报告细节,提供了API供开发者接入 Web Coding IDE。 "虽然现在的大模型能聊天、能写代码,但我相信大家还是不放心把身边复杂的任务交给它。我认为真 正的下一代智 ...
罗福莉首秀前,小米突然发布,代码全球最强,总体媲美DeepSeek-V3.2【附实测】
3 6 Ke· 2025-12-17 02:51
智东西12月17日报道,今天,小米发布并开源了最新MoE大模型MiMo-V2-Flash,总参数309B,激活参数15B。今日上午,小米2025小米人车家全生态合 作伙伴大会上,Xiaomi MiMO大模型负责人罗福莉将首秀并发布主题演讲。 该模型专为推理、编码和Agent场景构建,支持混合思维模式,允许用户切换模型是"思考"还是即时回答。它能一键生成功能齐全的HTML网页,并与 Claude Code、Cursor和Cline等氛围编码框架协同。该模型提供256k上下文窗口,能够完成数百轮Agent交互和工具调用的任务。 基准测试结果显示,MiMo-V2-Flash的性能基本与DeepSeek-V3.2相当,仅在不使用任何工具辅助的"人类最后一场考试"和创意文本生成评估ARENA- HARD中略逊色于DeepSeek-V3.2,但时延更小。 在多个Agent测评基准上,MiMo-V2-Flash位列全球开源模型Top 2;代码能力测评超过所有开源模型,比肩标杆闭源模型Claude 4.5 Sonnet,但推理价格 仅为其2.5%且生成速度提升至2倍。 MiMo-V2-Flash能以每秒150个token的速 ...
梁文锋的“左右互搏”:宕机的DeepSeek与闷声发财的幻方
Xin Lang Cai Jing· 2025-12-16 00:42
深夜23点,北京国贸写字楼的灯光只剩零星几点。程序员小林盯着屏幕上刺眼的"服务器繁忙"提示,第 三次尝试调用DeepSeek API失败。 就在他为瘫痪的程序焦头烂额时,千里之外的杭州,幻方量化的交易系统正自动完成一笔高频交易,其 旗下基金今年收益率已悄然逼近55%。 这两个看似无关的场景,却由同一个名字连接——"极客"梁文锋。他左手打造的DeepSeek从AI顶流沦为 争议焦点,右手培育的幻方量化却成为量化领域的隐形冠军。 这场冰与火的强烈反差,不仅是一家公司的战略分野,更撕开了AI行业的遮羞布——当概念炒作的潮 水退去,技术的真正价值到底藏在哪里? 01DeepSeek的180天坠落 2025年初的DeepSeek,曾是现象级的存在。 每天2400万人挤爆官网,单日APP下载量突破540万次,社交媒体上充斥着"AI改变世界"的狂热讨论。 上线次月,其月活用户就飙升至1.8亿,力压豆包、腾讯元宝登顶行业第一,估值被外媒疯炒至1500亿 美元,创始人梁文锋的身家也一度跃居亚洲科技大亨前列。 然而,这场狂欢的褪去速度,比任何人预想的都要快。 6月AI产品榜发布,DeepSeek排名从榜首滑落至第五,月活用户骤降 ...
估值1.05万亿!DeepSeek双登《自然》封神,中国AI如何做到颠覆?
Sou Hu Cai Jing· 2025-12-15 22:07
2025年末,一位中国创业者再度引爆科技圈。 国际顶级期刊《自然》新鲜出炉的年度十大科学人物榜单上,DeepSeek创始人梁文锋赫然在列。 要知道,该榜单每年仅甄选十位真正推动科学进步的领军者。梁文锋的入选,源自其带领团队研发的 DeepSeek大模型对全球AI格局的颠覆性重塑。 而这并非他与《自然》的首次邂逅——今年9月,他作为DeepSeek-R1论文核心作者已登上期刊封面, 短短三月内再次上榜,实力毋庸置疑。 正如《自然》赋予他的"Tech disruptor"评语,这位40岁的创业者已是公认的AI领域革命者。 接连的高光时刻,让梁文锋的崛起之路格外耀眼。他与估值1.05万亿的DeepSeek所缔造的传奇,究竟是 时运眷顾还是实力使然? 一、破局者之路,从10万到万亿的逆袭 长期以来,海外科技巨头始终认定中国AI难触核心技术,只能在产业链下游挣扎。然而,一位年轻企 业家的实践路径,正在系统性地扭转这一认知。 2013年,职业生涯起步阶段的梁文锋带着有限资本,进入变幻莫测的金融市场。当时他对人工智能的理 解尚处于探索阶段,却已展现出敢于挑战常规的勇气与远见。 两年后,他创立幻方科技,专注于量化投资这一专业 ...
PriceSeek重点提醒:铝锭现货价格全面下跌
Xin Lang Cai Jing· 2025-12-15 13:33
生意社12月15日讯 中国铝业股份有限公司2025年12月15日铝锭(AL99.70)现货价格各地区价格下跌,具体如下: 华东市场对外报价21710元/吨,华南市场对外报价21590元/吨,西南市场对外报价21650元/吨,中原市 场对外报价21650元/吨;较上一交易日分别下跌340元/吨、350元/吨、340元/吨、330元/吨。 PriceSeek评析 铝,多空评分:-1.5 生意社12月15日讯 中国铝业股份有限公司2025年12月15日铝锭(AL99.70)现货价格各地区价格下跌,具体如下: 华东市场对外报价21710元/吨,华南市场对外报价21590元/吨,西南市场对外报价21650元/吨,中原市 场对外报价21650元/吨;较上一交易日分别下跌340元/吨、350元/吨、340元/吨、330元/吨。 中国铝业2025年12月15日铝锭(AL99.70)现货价格在华东、华南、西南、中原市场均出现下跌,跌幅 分别为340元/吨、350元/吨、340元/吨、330元/吨。此次全面下跌表明市场需求疲软或供应过剩,短期 可能引发市场看跌情绪,对铝现货价格构成显著下行压力。评分为-1.5(介于一般利空和重大 ...
DeepSeek倒逼vLLM升级,芯片内卷、MoE横扫千模,vLLM核心维护者独家回应:如何凭PyTorch坐稳推理“铁王座”
3 6 Ke· 2025-12-15 00:36
vLLM 的故事始于加州大学伯克利分校 Sky Computing Lab 里一群充满热情的学生与研究员。2023 年,他们开源了核心的 PagedAttention 技术,vLLM 在 短短一年多内 GitHub Star 数突破 4 万,并迅速增长至如今的 6.5 万,如今已成为全球科技公司首选的推理引擎。 在这一成功背后,Neural Magic 扮演了关键角色。这家由 MIT 研究员创立的企业,在巨头林立的 AI 优化领域中,以独特的"免费平台 + 开源工具"策略脱 颖而出。通过深入贡献 vLLM,Neural Magic 不仅构建了成熟的企业级推理堆栈,还持续推动模型优化研究,维护着可直接与 vLLM 集成的预优化模型 库。 正是其在 vLLM 开源社区的深厚积累与工程实力,吸引了红帽的注意。2024 年 11 月,红帽正式收购 Neural Magic,并将包括 vLLM 核心维护者 Michael Goin 在内的核心团队纳入旗下。Michael 在优化推理性能、最大化 CPU/GPU 效能方面拥有超过十年的经验。在 vLLM 社区,他专注于内核调优、模型压 缩及系统优化等工作。 红帽成为重要参 ...
智见丨产业“DeepSeek时刻”的破局与重塑:创新药投资新框架
Sou Hu Cai Jing· 2025-12-12 06:45
作者简介 制药行业创新趋势:我们正处在新一轮创新周期之中 纵观过去百年的制药行业发展历程,技术创新是驱动并贯穿行业发展的永恒主题。从二战时期抗生素的 发现和磺胺类药物的问世,到20世纪60—80年代高血压等慢病治疗药物的出现,再到21世纪后肿瘤靶向 药物的诞生、单抗等生物制药产业的成熟,现代制药工业的历史虽不长,科技进步的步伐却从未停滞, 甚至越来越快。 当前,随着药物生产及开发技术不断迭代,制药行业过去以小分子化学药为主的创新,逐渐转向单克隆 抗体(单抗)、抗体偶联(ADC)药物、小核酸(siRNA等)基因药物、细胞治疗(CAR-T)药物,靶 谭冬寒,工银瑞信研究部研究总监、基金经理 ·14年证券从业经验,9年投资管理经验 ·清华大学北京协和医学院临床医学博士 ·深谙医疗服务体系、药品和器械产品及相关临床应用 ·相信长期的力量,重视基本面研究 点更精准、联合更多样,不可治疾病变为可治、仅短期治疗变为长期维持。此外,短效药物长效化、静 脉给药皮下化、皮下给药口服化等,可明显提高用药依从性,也是当前创新药的研发方向。 当前结合实际需求和在研管线数据梳理,我们总结了全球制药行业的五个创新方向。 1.根据世界卫生组 ...
AI 价值链-Google Gemini 3 Pro、Claude Opus 4.5、Grok 4.1 与 DeepSeek 3.2…… 谁才是真正的领导者?这意味着什么
2025-12-12 02:19
8 December 2025 U.S. Semiconductors & U.S. Internet AI Value Chain: Google Gemini 3 Pro, Claude Opus 4.5, Grok 4.1 and DeepSeek 3.2... who is the real leader and what does it mean? Stacy A. Rasgon, Ph.D. +1 213 559 5917 stacy.rasgon@bernsteinsg.com Daniel Zhu +1 917 344 8309 daniel.zhu@bernsteinsg.com Mark Shmulik +1 917 344 8508 mark.shmulik@bernsteinsg.com Arpad von Nemes +1 917 344 8461 arpad.vonnemes@bernsteinsg.com Alrick Shaw +1 917 344 8454 alrick.shaw@bernsteinsg.com Lavnik Balyan +1 917 344 8563 la ...
连姥姥都在问DeepSeek!一位AI六小龙掌门的反思与进击
Di Yi Cai Jing· 2025-12-11 12:18
明年大模型公司或许会更少,中国做AI最大的优势是人才。 AI六小龙之一的MiniMax创始人闫俊杰在创业初期遇到过很多挑战,其中包括硅谷银行破产,"所有的 钱都在那个银行里,那个时候已经没法发工资了。" 但或许更大的挑战来自DeepSeek,连他的姥姥都在问"你知道 DeepSeek吗?" 他在近日做客罗永浩的播客节目中提到,团队反思过"为什么没有做得那么好"。很多问题是自己作为掌 舵者的认知不够,行业里有很多像梁文锋这样厉害的人,他也提到和梁文锋在DeepSeek 成立前就认 识,每年会交流几次。 "连姥姥都问我,你知道DeepSeek吗?" DeepSeek的出现给MiniMax在内的大模型公司带来了很多变化。 闫俊杰提到,今年春节回老家时,发现所有人都在关注DeepSeek,"就连我姥姥都问我,你知道 DeepSeek吗?" 对于是否坚持技术驱动,模型还是产品优先,闫俊杰表示,MiniMax经历过大约半年时间的迷茫和纠 结。摇摆的点在于,他们认为,MiniMax不应该靠纯烧钱来增长,即便是为了AGI,也必须得用可商业 化的方式来实现。因为AGI需要足够长的时间,成本也会比传统互联网公司要高得多。 在访谈 ...
2025人工智能破壁时刻|DeepSeek火爆一年间
Xin Hua Wang· 2025-12-11 12:02
Core Insights - The article highlights the significant advancements in China's artificial intelligence (AI) sector in 2025, marked by the emergence of DeepSeek, which has transformed the global perception of Chinese tech companies and their valuation logic [1][3][9] - DeepSeek's open-source approach has democratized access to AI technology, allowing smaller enterprises to engage in AI development without the burden of high costs associated with traditional models [4][10] - The rise of DeepSeek signifies a shift from merely competing in AI models to focusing on practical applications, emphasizing the importance of adaptability and integration of AI across various industries [7][8][11] Group 1: DeepSeek's Impact - DeepSeek achieved 22.15 million daily active users within 21 days of launch, showcasing its rapid adoption and the efficiency revolution it has sparked [1] - The company has broken the traditional reliance on high computational power, achieving results comparable to leading AI models with significantly lower resource requirements [3][9] - The open-source model of DeepSeek has led to increased participation from major tech firms and various industries, enhancing its influence and reach [4][10] Group 2: Industry Transformation - The AI landscape is shifting towards a focus on application and integration, with companies needing to adapt their strategies and processes to leverage AI effectively [7][8] - The Chinese government has signaled strong support for AI development through policies aimed at integrating AI into key sectors by 2027, further driving industry growth [8] - DeepSeek's success reflects a broader trend of innovation in China's tech sector, moving from a follower to a leader in technology development [9][11] Group 3: Future Outlook - The ongoing evolution of AI technology is expected to continue reshaping industries, with DeepSeek serving as a catalyst for innovation and collaboration across the tech ecosystem [10][12] - The recognition of China's innovation capabilities on a global scale, as indicated by its ranking in the Global Innovation Index, underscores the potential for further advancements in AI [9] - The article concludes that the future of AI lies in continuous innovation and a commitment to serving societal needs, positioning DeepSeek as a key player in this transformative journey [12]