布局AI生态 字节系大模型“实用至上”
Shang Hai Zheng Quan Bao·2025-05-13 18:45
◎记者 罗茂林 火山引擎发布的另一款大模型——豆包1.5·视觉深度思考模型也遵循了"实用至上"的思路。 数据显示,豆包1.5·视觉深度思考模型(Doubao-1.5-thinking-vision-pro),激活参数仅20B,但具备强 大的多模态理解和推理能力,在60个公开评测基准中,有38个取得业内最佳表现,在视频理解、视觉推 理、GUI Agent能力等方面均处于第一梯队。 值得一提的是,该模型新增GUI Agent能力。基于强大的GUI定位性能,可在PC端、手机端等不同环境 中完成复杂交互任务。例如,可对新开发的App功能进行自动化检测。 5月13日,字节跳动旗下火山引擎开启上海站的大模型巡展活动,一批新的大模型产品亮相。与此前大 幅跃迁的产品更迭不同,小而专、聚焦实用,甚至是推出大模型工具,成为此次发布会产品的特点。 实用至上,火山引擎这场发布会可视为如今行业巨头布局的一个缩影。"字节在大模型产品迭代上的思 路越来越清晰,要能有可靠的商业场景,能被客户用起来,这很重要。"一位接近字节跳动的相关人士 告诉记者,相比执着于"一鸣惊人"的大招,今年以来,"小步快跑""多线程并进"成为字节发展的思路。 更小更 ...