豆包1.5·视觉深度思考模型

Search documents
全球AI周报:AI推动腾讯阿里业绩增长,GoogleI/O2025预计推出AI眼镜-20250519
Tianfeng Securities· 2025-05-19 15:30
证券研究报告 2025年05月19日 海外行业报告:行业动态研究 AI推动腾讯阿里业绩增长,Google I/O 2025预计推出AI眼镜 作者: 分析师 孔蓉 SAC执业证书编号:S1110521020002 分析师 李泽宇 SAC执业证书编号:S1110520110002 分析师 樊程安吉 SAC执业证书编号:S1110524080001 分析师 杨雨辰 SAC执业证书编号:S1110521110001 分析师 刘诗雨 SAC执业证书编号:S1110524120001 请务必阅读正文之后的信息披露和免责申明 1 全球AI周报 摘要 ◼ 重点公司财报AI进展 ◼ 全球AI动态: ◼ 投资建议: ➢ 海外AI: 请务必阅读正文之后的信息披露和免责申明 2 ➢ 腾讯:一季度腾讯季度资本支出达到274.8亿元人民币,同比增长91%,占营收的15%。腾讯的广告收入同比增长20%至319亿元人民币,实现了连续十个季度的两位数增长。公司通过提升生成式AI能力,升级广告技术平台,包括辅助广 告制作、数字人直播、加深商品与用户兴趣理解以提升推荐效果。 ➢ 阿里巴巴:云业务增速依旧维持高位,Capex环比下降系季节性影响。云 ...
国泰海通|计算机:发展Agent已成各大厂共识,新规激发并购重组市场活力
国泰海通证券研究· 2025-05-19 14:20
报告导读: 字节谷歌再发相关新品,AI Agent规模化商业落地元年加速到来。 投资建议: AIAgent 发展与落地仍在稳步发展,不断佐证我们的判断: 2025 年将会成为 AI Agent 规模 化商业落地的元年。证监会的新规则有望加速计算机板块数字化转型需求推动的细分领域整合。我们维持 计算机板块"增持"评级。 字节多款模型升级,发布全场景智能体 DataAgent 。 5 月 13 日,字节跳动火山引擎发布豆包·视频生 成模型 Seedance 1.0 lite ,支持文生视频、图生视频,视频生成时长支持 5s 、 10s ,分辨率提供 480P 、 720P ;豆包 1.5 ·视觉深度思考模型,激活参数仅 20B ,但具备强大的多模态理解和推理能 力,在视频理解、视觉推理、 GUI Agent 能力等方面均处于第一梯队。此外字节还升级了豆包·音乐模 型。同时, Data Agent 正式亮相、 Trae 接入豆包深度思考模型并全新升级。火山引擎正在以更强大的 模型矩阵、更丰富的智能体工具,帮助企业打通从业务到智能体的应用链路。我们认为, AI 技术迭代和 Agent 落地仍然在各大厂中稳步推进当中, ...
AI早报 | 软银对OpenAI的投资或降至200亿美元;月之暗面回应涉足AI医疗
Sou Hu Cai Jing· 2025-05-14 00:21
软银对OpenAI的投资或缩减至200亿美元 5月13日消息,软银首席财务官表示,软银对OpenAI的投资可能为200亿美元。 今年3月底,OpenAI宣布将从软银集团等机构融资400亿美元,协议规定若OpenAI在2025年内没有转型 为一家PBC(公益公司),软银可将其总投资减半至200亿美元。 5月6日,OpenAI CEO奥特曼宣布,公司取消从非营利性组织转为营利企业的计划,未来将继续由非营 利组织监督和控股,这可能进一步导致软银的投资规模缩减。 火山引擎发布豆包视频生成模型Seedance 1 lite 5月13日消息,今日在FORCE LINK AI创新巡展·上海站,火山引擎发布豆包·视频生成模型Seedance 1 lite、豆包1.5·视觉深度思考模型,并升级豆包·音乐模型。 官方表示,此次全新发布的豆包视频生成模型Seedance 1 lite,支持文生视频、图生视频,视频生成时 长支持5s、10s,分辨率提供480P、720P。企业用户可在火山方舟平台使用该模型API,个人用户也可 在豆包APP、即梦体验。 月之暗面回应布局AI医疗 有媒体报道称,月之暗面近期对AI医疗产品进行了布局,用于 ...
苹果发布FastVLM模型,可在iPhone上运行的极速视觉语言模型;昆仑万维宣布开源Matrix-Game大模型丨AIGC日报
创业邦· 2025-05-13 23:52
1.【昆仑万维宣布正式开源Matrix-Game大模型】5月13日,据昆仑万维消息,昆仑万维正式开源 (17B+)Matrix-Game大模型,即Matrix-Zero世界模型中的可交互视频生成大模型。Matrix-Game是Matrix系 列在交互式世界生成方向的正式落地,也是工业界首个开源的10B+空间智能大模型,它是一个面向游戏 世界建模的交互式世界基础模型,专为开放式环境中的高质量生成与精确控制而设计。(第一财经) 2.【百型智能推出国内首个外贸行业垂类Agent】百型智能推出国内首个外贸行业垂类Agent——AI外贸员 Zoe。据了解,Zoe可以根据企业目标拆解任务,独立完成从市场分析、寻找客户、精准筛选,到开发触 达、转化跟进的外贸开发拓客全链路,转化率高出传统人工方式10倍以上。(财联社) 3.【火山引擎发布豆包视频生成模型Seedance 1.0 lite】火山引擎发布豆包·视频生成模型Seedance 1.0 lite、 豆包1.5·视觉深度思考模型,并升级豆包·音乐模型,以更全面的模型矩阵、更丰富的智能体工具,帮助企 业打通从业务到智能体的应用链路。官方表示,此次全新发布的豆包视频生成模型 ...
布局AI生态 字节系大模型“实用至上”
Shang Hai Zheng Quan Bao· 2025-05-13 18:45
◎记者 罗茂林 火山引擎发布的另一款大模型——豆包1.5·视觉深度思考模型也遵循了"实用至上"的思路。 数据显示,豆包1.5·视觉深度思考模型(Doubao-1.5-thinking-vision-pro),激活参数仅20B,但具备强 大的多模态理解和推理能力,在60个公开评测基准中,有38个取得业内最佳表现,在视频理解、视觉推 理、GUI Agent能力等方面均处于第一梯队。 值得一提的是,该模型新增GUI Agent能力。基于强大的GUI定位性能,可在PC端、手机端等不同环境 中完成复杂交互任务。例如,可对新开发的App功能进行自动化检测。 5月13日,字节跳动旗下火山引擎开启上海站的大模型巡展活动,一批新的大模型产品亮相。与此前大 幅跃迁的产品更迭不同,小而专、聚焦实用,甚至是推出大模型工具,成为此次发布会产品的特点。 实用至上,火山引擎这场发布会可视为如今行业巨头布局的一个缩影。"字节在大模型产品迭代上的思 路越来越清晰,要能有可靠的商业场景,能被客户用起来,这很重要。"一位接近字节跳动的相关人士 告诉记者,相比执着于"一鸣惊人"的大招,今年以来,"小步快跑""多线程并进"成为字节发展的思路。 更小更 ...