Workflow
豆包·视觉理解模型
icon
Search documents
豆包可以跟你打视频了,陪我看《甄嬛传》还挺懂!难倒一众AI的“看时钟”也没难倒它
量子位· 2025-05-26 08:18
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 几乎让大模型全军覆没的新难题—— 看时钟 ,被国产AI给拿下了。 要知道,之前单单是一张时钟的图表,几乎所有大模型都答不对时间。 但现在,国产AI却可以直接 开视频 ,实时报准时间! 可以看到,这个国产AI先是准确地报出了 "4点14分" ,而在等了一分钟后,它也是可以再次准确报时 "4点15分" 。 那么这到底是何许AI也? 不卖关子,它就是豆包发布的新功能—— 视频通话 。 主打一个让AI 边看边聊天 。 而且啊,它还是接入了 联网搜索 的功能,所以回答的准确性和时效性这块也是拿捏到位了。 例如我们对着微博热搜的话题提个问题: 这个热搜第一的是什么新闻呀? 可以看到,联网的豆包在视频通话的过程中,就可以直接把当下的新闻热点给你总结出来。 不得不说,这种跟AI的互动,不论是趣味性还是可靠性,都大大地增强了。 除此之外,这次的新功能还增加了 "字幕" 的选项,点击之后就可以看到之前对话的具体内容啦~ 既然这个功能如此有趣,那我们必须安排一波深度实测。 来,走起~ 跟豆包一块看《甄嬛传》 我们先来简单介绍一下视频通话的操作方式。 打开豆包App之后,依次点击 ...
AI应用催化不断,重点提示机会
Jianghai Securities· 2025-04-18 07:26
证券研究报告·行业点评报告 2025 年 4 月 18 日 江海证券研究发展部 近十二个月行业表现 % 1 个月 3 个月 12 个月 相对收益 -6.58 1.3 8.21 绝对收益 -12.42 0.56 15.65 数据来源:聚源 注:相对收益与沪深 300 相比 1. 江海证券-行业点评报告-传媒行业:智 谱发布 AutoGLM 沉思,集深度研究和操 作能力于一体 – 2025.04.01 2. 江海证券-行业点评报告-传媒行业:智 元启元大模型 GO-1 发布,具身智能再上 新台阶 – 2025.03.11 3. 江海证券-行业点评报告-传媒行业:AI 应用发展迅猛,提示投资机会 – 2025.03.07 包大模型团队提出全新超稀疏架构,推理 成本大幅下降 – 2025.02.13 执业证书编号:S1410525010001 联系人:吴雁宇 执业证书编号:S1410124010015 行业评级:增持(维持) 5. 江海证券-行业点评报告-传媒行业:AI agent 产业进展不断,提示相关投资机会 – 2025.02.10 分析师:张婧 AI 应用催化不断,重点提示机会 事件: 2025 年 4 月 ...
AI动态跟踪系列(六):OpenAIo3、豆包新品首发,关注原生Agent与多模态推理
Ping An Securities· 2025-04-17 13:10
Investment Rating - The industry investment rating is "Outperform the Market" [1][38]. Core Insights - OpenAI's latest models, o3 and o4-mini, introduce significant advancements in image reasoning and agent capabilities, enhancing the AI programming ecosystem [3][4]. - The competition in the global large model field remains intense, with a strong emphasis on native agent capabilities and multimodal reasoning [34]. - The domestic AI computing power market is expected to see increased acceptance and market share for Chinese AI computing solutions due to ongoing global trade tensions [34]. Summary by Sections OpenAI's New Models - OpenAI released o3 and o4-mini, which are touted as the most intelligent models to date, featuring breakthroughs in image reasoning and agent capabilities [3][4]. - The o3 model has set new state-of-the-art benchmarks in coding, mathematics, and visual perception tasks, outperforming its predecessor o1 by 20% in error rates on complex tasks [5][7]. - The o4-mini model is optimized for fast and cost-effective reasoning, excelling in non-STEM tasks and data science [5]. Doubao 1.5 Model - Doubao 1.5 has reached or is close to the top tier globally in reasoning tasks across mathematics, coding, and science, with enhanced visual understanding capabilities [17][21]. - The Doubao APP, based on the Doubao 1.5 model, can perform "thinking while searching," providing detailed recommendations based on user needs [24][27]. - Doubao's daily token usage has surged to over 12.7 trillion, indicating significant growth and market penetration [18]. Investment Recommendations - The report suggests focusing on AI applications in enterprise services, programming, and office automation, as well as on domestic AI computing power companies [34]. - Recommended stocks in AI applications include companies like Fanwei Network and Kingdee International, while AI computing power recommendations include companies like Haiguang Information and Inspur Information [34].
豆包1.5深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1
3 6 Ke· 2025-04-17 08:54
智东西4月17日报道,今天,火山引擎正式发布了豆包1.5·深度思考模型,采用MoE架构,总参数量为200B,激活参数仅20B,在多项基准测试 中达到或接近全球第一梯队水平。 在数学、编程、科学领域,豆包1.5·深度思考模型的测试表现超过DeepSeek-R1、QwQ-32B等国产推理模型,与OpenAI o1、o3-mini-high等模 型能力相仿。在高难度通用人工智能测试ARC-AGI上,其得分更是超过了OpenAI o1和o3-mini-high。 豆包1.5·深度思考模型具有"边想边搜"、"视觉理解"等实用能力,即日起,企业用户可以在火山方舟平台使用豆包1.5·深度思考模型。火山引擎 还升级了豆包·文生图模型3.0、豆包·视觉理解模型。 数据显示,截至2025年3月底,豆包大模型日均tokens调用量已超过12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。IDC报告显 示,2024年中国公有云大模型调用量激增,火山引擎以46.4%的市场份额位居中国市场第一。 01.高并发场景延迟仅20毫秒,可边想边搜、视觉理解 豆包1.5·深度思考模型较小的参数量和激活参数量,使其具备更低的训练和 ...