Workflow
智能终端Agent
icon
Search documents
图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」
量子位· 2025-04-28 03:43
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 全球AI大模型智能涌现,现在正在进入"多模态时间"。 一方面,全球业内各式各样的技术进展,都围绕多模态如火如荼展开。 另一方面,AI应用和落地的需求中,多模态也是最重要的能力。没有多模态技术,何谈应用和落地? 实际上,多模态的先锋共识和趋势,把代表性玩家的进展连点成线,也能看出来…… 看看行业公认的多模态卷王,阶跃星辰—— 刚刚过去的一个月,陆续上新的3款模型,全是多模态 ,有图生视频开源模型,有多模态推理模型,还有图像编辑开源模型。 模态丰富,上新频繁,性能出色。 之所以把阶跃的这些发布连点成线解读,也是因为阶跃从一开始的强落地和强应用属性。 目前,阶跃已发布的模型里,七成都是多模态。鉴于多模态是Agent的必备要素,今年阶跃化身「落地型玩家」的态势愈发明显: 发力智能 终端Agent 。 过去一个月,卷王卷出了些啥? 据量子位整理回顾,过去一个月,阶跃星辰接连上新了3款模型: 它们覆盖了当前多模态模型的几大刚需方向,并且其中Step1X-Edit和Step-Video-TI2V已面向开发者开源。 怎么说呢,这很阶跃,也很符合技术流和行业玩家们对"多模态 ...