Workflow
全模态融合
icon
Search documents
MiniMax稀宇科技薛子钊:AI大模型不是"砸钱游戏",国内大模型被严重低估|Alpha峰会
Hua Er Jie Jian Wen· 2025-12-22 07:55
精彩观点: 全球仅四家公司在三模态均达到领先水平:MiniMax是全球仅有的四家在语言、视频、声音三个模态都达到全球领先水平的公司之一,另 外三家是OpenAI、谷歌和字节跳动。公司将80%以上资源投入模型层和基础设施,模型本身才是核心产品,应用只是展示窗口。未来竞争 将是全模态融合,单模态公司将失去竞争力。 高效的研发组织和持续创新的能力才是关键:尽管市场以惊人的月度双位数速度增长,但真正能在模型层持续发布全球领先产品的核心玩 家数量在不断减少。资源(算力、资金、人才)并非成功的唯一保证,高效的研发组织和持续创新的能力才是真正的壁垒。 M2模型成为AI编程领域最大国产模型:今年10月MiniMax发布的M2语言模型是全球开源模型中真实token用量最大的AI编程模型,成为首 个真正切入该领域的国产模型,用量相当于其他所有国产模型总和。 每一块钱买到更多智能:MiniMax从创立第一天就是全球化公司,所有产品均服务全球用户,目前大部分商业化收入来自海外。核心战略 是与所有人共创智能,用更少资源做出更领先的模型和创新,提供更高的"per dollar intelligence"(每块钱的智能水平)。 Agent ...
AI产业速递:从DeepSeek V3
2025-12-03 02:12
AI 产业速递:从 DeepSeek V3.2 看强化学习的新变化 20251202 摘要 Deepseek V3.2 通过 DSA 机制优化推理效率,减少冗余计算,尤其在 复杂任务中表现突出,取代了之前的 MLA 机制。 Deepseek V3.2 的 C9 版本在后训练阶段通过投入 10%的预训练计算 量,显著提升了模型在复杂任务(如代码调试)中的强化学习能力,达 到全球领先水平。 V3.2 采用高效的上下文管理策略,智能处理用户频繁开启新任务、多轮 对话及模糊输入,有效降低推理成本。 V3.2 使用大量人类专家编写并增量训练生成的高难度合成数据,比例较 之前增加一倍以上,对后续强化学习阶段至关重要,并消耗了大量算力。 Deepseek 在后训练阶段的创新,包括开源后训练结果和支持 Agent 调 用能力,使得开源模型在功能上可与闭源模型媲美,可能引领开源项目 的新趋势。 DeepMind 的新框架结合 Rubik's 规则提示机制,提高了强化学习效率, 促使大型科技公司加速探索多模态视频和图像领域的应用,推动 2025 年相关模型的发展。 稀疏化技术降低了训练算力要求,并提升了训练上限,预计到 2026 ...