Workflow
“AI,你帮我挑个木瓜?”实测豆包视频通话功能 一场AI“视觉交互”争夺战已打响
Mei Ri Jing Ji Xin Wen·2025-05-27 23:49

每经记者|李宇彤 杨昕怡 每经编辑|文多 国内AI(人工智能)视频交互赛道再添重磅玩家。 近日,字节跳动旗下AI智能助手"豆包"的App上线视频通话功能,支持视频聊天问答。据官方介绍,本 次升级基于视觉推理模型,支持联网搜索。 《每日经济新闻》记者实测发现,豆包的视频通话功能用处不少,包括识别水果成熟度这样的日常用 途。此外,在识别物品时,豆包更展现出持续记忆和逻辑推理能力。 5月27日,一位大模型算法工程师接受《每日经济新闻》记者微信采访时表示,豆包在视频通话中展现 出的视频理解与语音交互能力,在中文语境中处于第一梯队。 继文生视频大模型后,字节在AI多模态领域又迈出关键一步。 能打视频电话的豆包,效果如何? "视觉是人类了解这个世界最重要的方式,对于大模型来说也是如此。"在去年12月举行的"2024火山引 擎FORCE原动力大会·冬"上,火山引擎总裁谭待发布了豆包视觉理解模型,称该模型具备更出色的内容 识别、理解、推理、视觉描述和创作等能力。 5个月后,这一新模型的能力让所有豆包用户"眼见为实"了。 和豆包打个视频电话,是否真的能解决上述这些生活问题呢?百闻不如一见,《每日经济新闻》记者近 日以挑选水果、 ...