Workflow
拍照问夸克
icon
Search documents
多模态和Agent成为大厂AI的新赛点
创业邦· 2025-05-01 02:54
以下文章来源于窄播 ,作者窄播 窄播 . 关注消费、互联网、AI,聚焦公司、产业、案例,提供信息、趋势、洞察。 来 源丨窄播(exact-interaction) 作者丨李威 图源丨midjourney 大模型落地C端场景的核心,就是让大模型的能力越来越接近人。沿着这个主旋律,可以划分出两个进化 方向:一个是持续降低用户与大模型进行有效沟通的难度;另一个则是让大模型具备执行更复杂任务的 能力。前者的实现,需要给到大模型多模态能力;后者则需要依托于Agent产品生态的不断成熟。 相比国内,海外巨头会更倾向于打造服务于单一场景的Agent。Notion推出了AI驱动的电子邮件服务 Notion Mail,帮助用户组织电子邮件、起草回复、搜索消息等。OpenAI此前推出的Operator和Deep Research也分别聚焦在操作浏览器和研究领域。X AI则增加了Grok Studio,用来协助用户生成文档、代 码、报告和小游戏。 从目前能够体验到的产品来看,多模态能力和代理执行能力的提升,确实为用户带来了更低门槛、更高 效率的AI使用体验。套用微软CEO纳德拉夸赞自家Copilot体验的话,具备执行能力的通用Ag ...
多模态和Agent成为大厂AI的新赛点
3 6 Ke· 2025-04-29 23:29
未来入口的两个支柱。 这是《窄播Weekly》的第52期,本期我们关注的商业动态是:当大厂的AI竞争策略开始倾斜向应用场景,多模态能力和代理执行成为两个焦点。 大模型落地C端场景的核心,就是让大模型的能力越来越接近人。沿着这个主旋律,可以划分出两个进化方向:一个是持续降低用户与大模型进行有效沟 通的难度;另一个则是让大模型具备执行更复杂任务的能力。前者的实现,需要给到大模型多模态能力;后者则需要依托于Agent产品生态的不断成熟。 多模态方面,字节、百度、谷歌、OpenAI都在近期推出了多模态能力更强的基础大模型产品,为相应的应用创新带来了可能。阿里旗下的AI to C产品夸 克,就在本周上线了基于「通义推理及多模态大模型+后训练」实现的「拍照问夸克」功能。 代理执行层面,在Manus指出方向之后,类似的通用Agent产品也在近期纷纷上线。其中就包括了字节旗下的扣子空间、百度的心响App、360的纳米AI、 前百度高管的Genspark等。这些产品都主打一站式完成用户通过自然语言布置的复杂任务,并且都具有编写代码和连接第三方数据、工具的能力。 相比国内,海外巨头会更倾向于打造服务于单一场景的Agent。Not ...