Workflow
多模态模型
icon
Search documents
一文读懂Google I/O 2025 开发者大会:开启 “模型即平台” 的 AI 生态新时代
华尔街见闻· 2025-05-21 10:38
继微软之后,谷歌也全面拥抱人工智能(AI)智能体(Agent)。在开发者大会上,谷歌宣布要让智能体全面进驻谷歌的主打业务搜索以及AI助手Gemini,并 通过Gemini与搜索结合,推出全新的AI模式搜索。 美东时间5月20日周二,谷歌2025年度I/O开发者大会的主题演讲展示了在AI、多模态模型、跨设备整合与开发者工具方面的最新成果。从升级后的 Gemini 2.5 Pro 模型到智能眼镜的 XR 应用,再到 AI 驱动的搜索与网页浏览体验。谷歌展现的不仅是模型的性能提升,更是AI从"信息工具"进化为"通用智能体" 的进步。 Google I/O 2025 展示了 Gemini 2.5 作为跨平台 AI 引擎的全面实力。从"Stitch"到"Casey",从语音助手到机器人生成,从 Android 到 Web 到 Cloud,每 一项更新都紧扣"降低门槛、加速创造"的核心目标。核心发布 包括, Gemini 2.5 与 Flash 模型、AI Studio 全新开发体验 、Android 与 Gemini Nano 深度 整合 、 多模态工具 Stitches和实时部署能力。 本次发布内容主要包括: 1. ...
一文读懂Google I/O 2025 开发者大会:“降低门槛、加速创造”,谷歌开启 “模型即平台” 的 AI 生态新时代
硬AI· 2025-05-21 03:29
图 点击 上方 硬AI 关注我们 Google I/O 2025 展示了 Gemini 2.5 作为跨平台 AI 引擎的全面实力。从"Stitch"到"Casey",从语音助手到机器人生 成,从 Android 到 Web 到 Cloud,每一项更新都紧扣"降低门槛、加速创造"的核心目标。核心发布包括,Gemini 2.5 与 Flash 模型、AI Studio 全新开发体验 、Android 与 Gemini Nano 深度整合 、 多模态工具 Stitches和实时部署能力。 新实验项目 Stitch:通过文本提示自动生成 App UI 设计,并即时转为代码。 设计不仅是静态图,而是可以编辑的真实界面;可导出至 Figma 或 IDE 中继续开发。 硬·AI 作者 | 李 丹 编辑 | 硬 AI 继微软之后,谷歌也全面拥抱人工智能(AI)智能体(Agent)。在开发者大会上,谷歌宣布要让智能体 全面进驻谷歌的主打业务搜索以及AI助手Gemini,并通过Gemini与搜索结合,推出全新的AI模式搜索。 美东时间5月20日周二,谷歌2025年度I/O开发者大会的主题演讲展示了在AI、多模态模型、跨设备整合与 ...
国产多模态模型持续加速迭代
Tai Ping Yang· 2025-05-19 00:45
[Table_Message] 2025-05-18 行业周报 看好/维持 传媒互联网 [Table_Title] 传媒互联网 国产多模态模型持续加速迭代 (2025.05.12-05.18) ◼ 走势对比 ◼ 子行业评级 ◼ 相关研究报告 《即梦 3.0 文生图开启灰度测试,VAST 开源两大 3D 生成模型》 《OpenAI 发布 GPT-4o 生图功能,DeepS eek-V3 完成版本升级》 E-MAIL:lilh@tpyzq.com 执业资格证书编码:S1190123120023 [Table_Summary] 报告摘要 ➢ 图像:腾讯发布混元图像 2.0,Manus 上线生图功能 腾讯发布混元图像 2.0 模型,该模型显著提升生图速度,实现输入 即输出的毫秒级响应。同时,基于实时生图的优势,模型推出实时绘 画板功能,可根据创作者的绘图要求,实时生成预览效果,有效提升 图像生成交互体验。此外,Manus 上线图像生成功能。不同于文生图 模型,Manus 生图功能将生图过程嵌入 Agent 工作流,具备理解用户 意图、制定解决方案、并调用包括生图在内的各种工具完成任务的能 力。从测评结果来看,因引入思 ...
首都在线20250511
2025-05-12 01:48
首都在线 20250511 首都在线在云计算领域的发展历程和现状如何? 首都在线成立于 2015 年,是国内较早的云网一体化云计算服务商,致力于全 球提供计算类云服务、通信网络、IT 及综合服务解决方案。公司拥有全球化布 局,在北京、马来西亚、美国等地区都有资源,并不断扩展。首都在线的发展 分为三个阶段:2005-2010 年主营 IT 转售业务,奠定轻资产运营基础; • 公司在全球化布局方面具有显著优势,已经在东南亚、北美等地进行了深 度布局。同时,公司具备软件能力的综合厂商优势,在 PaaS 和 Maxim 平 台上进行了深入布局。 • 公司在轻资产运营方面具有显著优势,与通信服务提供商合作租用普通厂 商进行拓展,使其经营灵活性较高,并且整体运营优势较强,可以与资源 合作伙伴一起拓展市场。 2011-2022 年逐渐向云计算转型并挂牌新三板;2023 年至今,公司明确了一 基两翼的云计算战略,全面向智算转型。 首都在线在全球化布局方面有哪些优势? 摘要 • 首都在线作为云网一体化云计算服务商,正经历从 IT 转售到云计算再到智 算的转型。其"一基两翼"战略和全球化布局,尤其是在数据资源稀缺地 区的优势,为 ...
早融合 VS 晚融合,Natvie 多模态大模型的 Scaling Law 有所不同吗?
机器之心· 2025-05-10 13:10
本期通讯总计 21681 字,可免费试读至 6% 消耗 99 微信豆即可兑换完整本期解读(约合人民币 9.9 元) 机器之心PRO · 会员通讯 Week 19 --- 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 --- 1. 早融合 VS 晚融合,Natvie 多模态大模型的 Scaling Law 有所不同吗? 什么是Native多模态模型?相较目前流行的「晚融合」方案,「早融合」的Native多模态模型的训练过程有何不同?苹果公司 近期发布的「NNM」技术报告中,有哪些反直觉的新发现?近期业内有哪些获得较好表现的多模态模型?「早融合」是否正在 成为主流?... 2. Agent产品,快者为王?Anthropic 和 Databrick CEO 对话解读 Dario Amodei 为什么说「AI 的未来是 Agents」?数据的「Scaling Law」依然乐观?围绕 Agents 进行数据创新?MCP和 A2A范式下,企业怎样维护数据系统安全?Agents产品迭代的关键缺口如何突破?人类如何把握 AI 技术的双刃剑?... 本期完整版通讯含 2 项专题解读 + 29 项 AI ...
全国首个文旅MaaS平台推出 MiniMax大模型助推文旅产业转型
其中,与新奥集团携手打造旅游智伴,为游客提供一个全方位个性化互动式的旅行辅助平台;与小红书 携手创建站内搜索Agent,为用户提供旅游建议并提前规划。今年3月,MiniMax以视频模型技术支 持"牡丹花都"洛阳全球AI创作者大赛,展现前沿科技对传统文化的全新诠释。 "现在强大的多模态模型能够快速生成文本、图像、语音、视频等多种形式的内容,为文旅产业的内容 创新注入了全新动力,AIGC将成为未来文旅行业的新的增长点。"MiniMax AI艺术总监郑晓东表示,此 前文旅内容的创作高度依赖专业创作者的灵感激发与深厚积累,而多模态大模型将极大赋能文旅行业。 (文章来源:中国经营报) 5月8日下午,全国首个文旅行业MaaS服务平台在上海徐汇模速空间发布,该平台通过调用包括 MiniMax、上海人工智能实验室等大模型和计算资源,整合文旅资源、优化服务供给,着力打造覆盖上 海市全域、满足多元需求的文旅公共服务MaaS平台。 通过多模态AI技术,MiniMax已积累丰富的旅游出行、影视广告、文化场馆等诸多文旅产业场景赋能经 验,为多地线上大屏小屏、线下景区场馆等提供全方位的AIGC解决方案。 据悉,作为上海本土AI科技企业, ...
阶跃星辰姜大昕:多模态目前还没有出现GPT-4时刻
Hu Xiu· 2025-05-08 11:50
5月8日,在海淀大恒科技中心的阶跃星辰北京办公地,阶跃星辰创始人、CEO姜大昕身着深色西服、蓝 色衬衫出现在阶跃星辰北京办公地的会议室里。他保持了一贯的风格,如二十一年前在新加坡南洋理工 教书时,像老师一样在屏幕前平静地讲述自己对于多模态模型行业的判断。这里距离姜大昕上一个东家 微软的中国办公地微软大厦仅有504米,在2023年创立阶跃星辰前,姜大昕是微软全球副总裁。 "多模态模型领域目前还没有出现GPT-4时刻。卡点是整个行业缺少多模态领域的理解生成一体化架 构。有了这个架构,才能基于此通过海量的图片视频去做预训练+指令跟随,最终演变为世界模 型。"姜大昕说。 "理解生成一体化架构"不只是姜大昕的技术判断,也正在影响这家公司的走向。 虎嗅独家获悉,近期阶跃星辰内部,进行了算法小组内的微调:原本阶跃星辰内部团队分为生成小组和 理解小组,而这两个小组已经整合为新的"生成理解"团队。 姜大昕向虎嗅表示,这一调整,确实是基于"理解生成一体化架构至关重要"这个判断。 虎嗅获悉,目前阶跃星辰的运转以三个男人为核心: 姜大昕 阶跃星辰创始人、CEO 负责公司整体战略、技术研发 张祥雨 阶跃星辰首席科学家 负责公司技术研发 ...
沃尔玛态度转变:恢复中国供应商出货,美国客户承担关税成本;传饿了么加入外卖大战;因未按时公示年报,引望公司被列为经营异常
雷峰网· 2025-04-30 00:30
1. 网传中国半导体设备厂将大规模重组:200多家半导体设备公司或整合为10家大型企业 2.沃尔玛态度转变:恢复中国供应商出货,美国客户承担关税成本 3. 腾讯TEG架构调整:成立大语言和多模态模型部 4.传英伟达将在中国成立合资公司、为DeepSeek定制芯片,官方辟谣 5. 网传饿了么加入外卖大战: 正打印百亿补贴横幅 6.长城要做超跑?长城CTO吴会肖回应:5年前就在做,没想到大家这么关注 7.曝iPhone 2700个零部件:仅30家供应商完全在中国境外 8.OpenAI涉足电商领域!用户可通过ChatGPT购买商品 今日头条 HEADLINE NEWS 网传中国半导体设备厂将大规模重组:200多家半导体设备公司或整合为10家大型企业 据媒体报道,传中国正在推动一项政策,计划将200多家半导体设备公司整合为10家大型企业。这项政策 旨在提升中国半导体设备产业的竞争力,以应对美国的制裁压力。中国半导体自给率目前约为23%,在美 国政府的高压施压下,中国似乎计划采取资源集中策略,扶持具有潜力的企业。 今年3月,中国半导体设备龙头企业北方华创就有类似的动作,该公司以16.9亿元收购涂胶显影设备厂芯 源微9. ...
百度的后DeepSeek时代,一切为了应用
Bei Jing Shang Bao· 2025-04-27 09:50
"基础设施的成本一定是持续下降的,这样创新的应用和产品才有可能出现,移动互联网已经证明了这 一点。"比达分析师李锦清向北京商报记者表示,"科技大厂有多重身份,本身是AI基础设施服务商,也 是应用开发商,同时提供开发工具,可以说跟开发商是竞合的关系,他们对自己的模型能力更熟悉,推 出的应用有样本作用。" "模型有很多,但统治这个世界的是应用",百度创始人李彦宏更直白地表达了对应用的重视。近日召开 的Create2025百度AI开发者大会上,百度一口气发布了从模型到应用、生态的"九件套",包括性能提升 价格下降的两款模型、数字人、智能体等,目的是降低模型成本提高能力,并提供开发工具和平台,让 开发者踏实做应用。DeepSeek爆火前,李彦宏就在不断强调大模型的终局是应用。阿里先打出的MCP (大模型上下文协议)招牌和腾讯元宝的迅速反应,本质上都是在给自己和开发者、生态伙伴提供开发 应用的锤子并"打样"。 2024年四季度有49个大模型发布,2025年一季度一周内行业共发布了8个模型,这是李彦宏在现场分享 的一组统计数据。模型迭代太快,应用价值会否被快速覆盖?他的答案是:只要找对场景、选对基础模 型、会调模型,做出 ...
GPU租赁价格调研
是说芯语· 2025-04-27 06:54
以下文章来源于傅里叶的猫 ,作者CC 傅里叶的猫 . 芯片EDA大厂资深工程师,曾在中科院造卫星,代码还在天上飞。 半导体高质量发展创新成果征集 文章内容来自国盛证券的研报,里面分析了目前GPU云的行业趋势、各个大厂的竞争格局以及目前的 GPU租赁市场行情。 行业趋势总览 当前AI与云计算产业的协同发展已形成紧密的飞轮效应,其核心逻辑在于技术迭代、应用扩展和算力 需求三者的正反馈循环。AI大模型能力的快速提升(如Qwen3、Llama4的多模态升级与逻辑推理优化) 正推动AI从辅助工具向核心生产力渗透,这一过程高度依赖云服务商在算力、存储和运维等底层能力 的持续升级。 以阿里云为例,其第九代ECS实例算力提升20%而价格下降5%,通过硬件性能优化和规模效应摊薄成 本,为企业降低AI开发门槛,进而刺激更多应用场景的落地,例如谷歌Gemini 2.5 Pro在复杂推理任务 中超越人类的表现,以及阿里Qwen2.5-Omni以轻量化模型实现手机端全模态交互,均显示出AI应用正 向企业级和消费级市场双向渗透。 与此同时,模型效率提升(如GPT-4o响应速度优化)虽降低单次推理的算力消耗,但用户规模与调用 频次的指数级 ...