字节跳动豆包大模型2.0发布,多数基准达SOTA水平
Sou Hu Cai Jing·2026-02-14 15:57

豆包 2.0 全面升级了多模态能力,在各类视觉理解任务上均达到世界顶尖水平,视觉推理、感知能力、空间推理与长上下文理解能力表现尤为突出,豆包 2.0 Pro 在大多数相关基准测试中取得最高分。 面对动态场景,豆包 2.0 强化了对时间序列与运动感知的理解能力,在TVBench等关键测评中处于领先位置,且在 EgoTempo 基准上超过了人类分数,表 明它对"变化、动作、节奏"这类信息的捕捉更为稳定,在工程侧可用性更高。 长视频场景中,豆包 2.0 在大多评测上超越了其他顶尖模型,且在多个流式实时问答视频基准测试中表现优异,能作为 AI 助手完成实时视频流分析、环 境感知、主动纠错与情感陪伴,实现从被动问答到主动指导的交互升级,可应用于健身、穿搭等陪伴场景。 LLM与 Agent 表现大幅强化,长程任务执行能力提升 IT之家 2 月 14 日消息,字节跳动宣布,今天,豆包大模型正式进入 2.0 阶段。豆包 2.0(Doubao-Seed-2.0)围绕大规模生产环境下的使用需求做了系统性 优化,依托高效推理、多模态理解与复杂指令执行能力,更好地完成真实世界复杂任务。 IT之家注意到,豆包 2.0 系列包含 Pro ...