Workflow
推理工程化
icon
Search documents
国产大模型密集发布
第一财经· 2026-01-28 10:08
2026.01. 28 本文字数:3884,阅读时长大约7分钟 作者 | 第一财 经 吕倩 刘晓洁 封图 | AI生成 近日,多家国产模型厂商更新模型进展,包括DeepSeek开源新的OCR 2模型、Kimi发布并开源Kimi K2.5 模型、阿里发布千问旗舰推理模型Qwen3-Max-Thinking,头部模型的密集更新使中国模型在当日霸榜海外 社交平台X的热点前三位。据一位行业人士透露,下周也有多款国产模型产品将更新发布。 2025年春节DeepSeek凭R1的出色表现引发破圈传播,使得这一节点成为综合流量窗口、商业竞争、技术 节奏等多方面因素的集中展现,也让大众对2026年春节国产模型竞赛翘首以盼。2026年春晚更是因字节跳 动火山引擎与豆包大模型、腾讯元宝、百度的提前卡位锁定热度。 多位行业人士对第一财经表示,节前大模型行业的密集动作,是行业开始迈向工程化成熟期的关键信号,包 括模型从参数竞赛转向工程优化,产品交付从实验室Demo走向规模化服务,生态协同从单点突破走向系统 协同。 聚焦多模态与推理方向 1月27日,DeepSeek与Kimi再次同日发布模型,此前已有数次模型与论文发布"撞车",足见行业 ...
国产大模型密集发布,“春节AI竞赛”提前开幕
Di Yi Cai Jing· 2026-01-28 09:07
模型的盲目竞争阶段结束,进入以推理能力为主导的时代。 1月27日,DeepSeek与Kimi再次同日发布模型,此前已有数次模型与论文发布"撞车",足见行业关注度争夺之激烈。 Kimi官方将K2.5定义为公司迄今为止最智能的模型,包括Agent、代码、图像、视频及一系列通用智能任务表现;同时,这也是Kimi迄今最全能的模型,包 括原生多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与 Agent任务。 同日发布的DeepSeek-OCR2模型是去年10月官方推出的DeepSeek-OCR模型的迭代版本,团队采用了创新的DeepEncoder V2方法,让AI能够根据图像的含义 动态重排图像的各个部分,而不再只是机械地从左到右扫描,这种方式模拟了人类在观看场景时所遵循的逻辑流程。 近日,多家国产模型厂商更新模型进展,包括DeepSeek开源新的OCR 2模型、Kimi发布并开源Kimi K2.5模型、阿里发布千问旗舰推理模型Qwen3-Max- Thinking,头部模型的密集更新使中国模型在当日霸榜海外社交平台X的热点前三位。据一位行业人士透露,下周也有多款国产模型产品将更新发布。 2025年春节 ...