Workflow
Alphabet(GOOG)
icon
Search documents
AI视频生成告别默剧时代!谷歌Veo 3一步生成高质量音画大片,rap、电影、动画片都拿捏
量子位· 2025-05-21 06:31
不仅可以拿捏各种影视风格—— 请看VCR (花式演绎"We can talk!") 。 一水 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌最强视频生成模型Veo 3鲨疯了! 这一次,从画面到对白,全都由AI原生直接生成。 还能搞定大段rap—— 视频中的Flow只需简单一句话就能搞定,比如"让老人谈论宇宙"。 从画面到口型再到音频,完全以假乱真了。 还在发布会现场,谷歌DeepMind CEO哈萨比斯就激动宣布: 我们终于走出了无声视频生成的时代。现在用户能用自然语言直接描述角色、场景,还能指定对白和语气。 而通过官方demo,我们也看到了Veo 3电影级的音视频能力: 目前Veo 3已在Gemini应用程序中面向Google AI Ultra订阅用户开放,企业用户可以在Vertex AI平台调用。 虽然距离发布会结束才几小时,但一大波网友试玩已新鲜出炉—— 说唱、洗脑神曲、烹饪节目花式整活 一上来,脑洞大开的网友们就开始搞起了抽象…… 提示词:a video with dialogue of two muffins while baking in an over, the first muffin ...
谷歌搜索“AI模式”来了,Perplexity慌不慌?
Hu Xiu· 2025-05-21 05:48
又是一年谷歌I/O开发者大会,不出所料地,主题演讲又是一场AI交响乐。去年,"AI"一词在谷歌I/O大会上被提及120 次,今年依然是主角,被提及92次。 其中最受关注的,是谷歌将AI更深入地植入搜索及Chrome浏览器: 谷歌搜索将不满足于在生成结果中显示"谷歌摘要",而是直接会在结果分类中新增"AI模式"标签,展示效果类似独立 AI搜索应用。 Chrome浏览器中将加入Gemini AI助手,未来将能够"跨多个标签页工作,并代表用户浏览网站。 这是谷歌对近期争议的直接回应。一方面,谷歌搜索被唱衰。苹果高管声称谷歌搜索受到Perplexity、ChatGPT等竞品 的挑战,Safari浏览器的搜索量(默认引擎是谷歌搜索)出现2022年以来首次下降。 另一方面,AI初创公司开始对浏览器虎视眈眈,Chrome也在被重新审视。Perplexity即将发布浏览器,名字都起好了。 而OpenAI也有类似传言,并直言有兴趣收购Chrome。 谷歌对搜索和浏览器的进一步升级,在表明其"继续伟大"的决心。 当然,本次谷歌I/O大会主题演讲的亮点不止于此,还有安卓XR平台最新进展、3D视频聊天项目升级、文生图工具 Image ...
谷歌重磅!AI颠覆传统搜索
21世纪经济报道记者 董静怡 上海报道 谷歌正在对搜索进行彻底重塑。Gemini模型正在助力Google搜索变得更智能、更主动、更个性化。 早期测试显示,用户在此模式下的查询长度是传统搜索的2-3倍,且能通过多轮对话深入探索。谷歌宣布,AI Mode 将从5月20日开始在美国向所有用户推 出。从本周开始,Gemini 2.5也将登陆美国地区的搜索。 过去一段时间里,谷歌搜索面临着不小的挑战。市场调研机构statcounter数据显示,谷歌在全球搜索引擎市场的份额在过去六个月大部分时间都处于90%以 下,这是至少十年来从未出现过的情况,其长期近乎垄断的地位正面临挑战。 这一趋势表明,用户行为正在悄然变化,Bing等竞品和第三方聊天机器人,尤其是Chatgpt,正在逐步侵蚀谷歌的传统优势。根据OpenAI的数据,截至上个 月,每周有大约4亿人使用ChatGPT。 谷歌也做出了AI搜索的尝试。去年,谷歌推出了AI Overviews,在传统搜索结果顶部提供AI生成的摘要,帮助用户快速获取答案,而无需点击多个链接。谷 歌介绍,自去年推出以来,AI Overviews已覆盖超过15亿用户,目前已在200个国家和地区推出 ...
硅谷大地震,超40万人被裁员
创业邦· 2025-05-21 04:46
以下文章来源于格隆 ,作者城北徐公 格隆 . 一个游走于资本市场与佛祖之间的浪子。我可以生,可以死,我大笑,由天决定! 来源丨 格隆(ID:guru-lama) 作者丨 城北徐公 图源丨Midjourney 5月 11 日 ,黄仁勋在米尔肯 研究所会议上谈及当下的劳动力市场:你失去工作不是因为 AI ,而是因 为那些使用 AI 的人 。 这句话乍听起来非常有道理,但稍微琢磨一下 ……这味儿怎么那么熟悉? 是不是很像那句过期的毒鸡汤: 你之所以穷,是因为你不够努力! 万众瞩目的大人物,在点评芸芸众生时,总带着那么一些 "何不食肉糜"的味道。 勤劳与富裕并不存在因果关系;同样,会不会使用 AI 工具,也与你是否被取代没有必然联系。 …… 最近,微软刚刚交出亮眼的财报:上季度净利润 258 亿美元,同比增长 18% 。 但是,即便赚再多钱,那也是属于这家企业的辉煌。 作为螺丝钉的员工,不仅没有资格分享荣耀,还得面临被踢出局的风险: 微软宣布裁员 6000 人,占 全球员工的 3% 。 裁员理由写得无懈可击:通过减少管理者精简层级,提升组织敏捷性。 当营销团队利用 AI 广告节省了 70% 的时间, GitHubCo ...
Gemini接管搜索、全家桶秒变通用Agent ,以及Google Glass is so back!
创业邦· 2025-05-21 04:46
以下文章来源于硅星人Pro ,作者王兆洋 硅星人Pro . 硅(Si)是创造未来的基础,欢迎来到这个星球。 来源丨 硅星人Pro(ID:Si-Planet) 作者丨王兆洋、Jessica、周一笑 谁也没想到,Google I/O现场的最高潮来自"复活"的Google Glass有些翻车了的实时demo。 2025年5月20日,Google的年度开发者大会Google I/O在加州山景城举办。 与去年在举办之前一天被OpenAI"狙击"不同,今年的Google I/O,剑拔弩张的氛围让位给了派对的氛围,在ChatGPT带来的狼 狈之后,Google已经回到了自己的节奏。 是的,它回到了饱和式发布的节奏。当天Google一口气发布了至少十多个AI相关的更新,而其中大多数和Gemini有关。 简单说,Google主要做了四件事:展示Gemini在多模态上的遥遥领先;给Gemini AI助手做全方位的更新;让Gemini彻底接管 搜索,并让全家桶变成通用Agent;以及令人兴奋的AI+AR眼镜。 这些发布个个重要,但因为AI模型层面本身的进展在过去几年已经吊足了大家胃口,以及Google在此次大会之前已经发布了 Ge ...
策略学习助力LLM推理效率:MIT与谷歌团队提出异步并行生成新范式
机器之心· 2025-05-21 04:00
金天, 麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)博士五年级学生,师从 Michael Carbin 和 Jonathan Ragan-Kelley。他主要研究 机器学习与编程系统的结合。此前曾在 IBM Research 主导实现深度神经网络在 IBM 主机上的推理部署。本科毕业于 Haverford College,获计算机科学 与数学双学位。 鄭鈺熹, 麻省理工学院 CSAIL 博士三年级学生,师从 Michael Carbin。她的研究方向为编程语言与机器学习的交叉领域。 大语言模型(LLM)的生成范式正在从传统的「单人书写」向「分身协作」转变。传统自回归解码按顺序生成内容,而新兴的异步生成范式通过识别语义独 立的内容块,实现并行生成。 如图所示,传统方法(下)按顺序生成所有内容,而异步生成(上)同时处理多个互不依赖的内容块。对比顺序生成,异步生成在 AlpacaEval 长度控制评 测中实现 1.21-1.93× 的几何平均提速 ,对应生成质量变化(胜率)为 +2.2% 至 -7.1%。 MIT 与谷歌研究团队在最新研究 PASTA(PArallel STructure Anno ...
谷歌I/O 2025:Gemini 2.5系列更新,Veo 3支持生成有声视频,还有250刀的AI会员
Founder Park· 2025-05-21 03:40
本篇文章转载自「 新智元」 今天凌晨, 谷歌I/O 2025大会正式开启。 在发布会上,谷歌一口气发了多个AI模型、产品及相关服务。此次发布的重点是 Gemini 2.5系列模型的更新,包括: · Gemini 2.5 Pro(新) :再次刷榜LMArena,ELO拿下1448分,所有类别第一,碾压o3,原生文本到音频生成 · Gemini 2.5 Pro(Deep Think) :刷榜数学、编码、多模态榜单, · Gemini 2.5 Flash(新) :排名仅次Gemini 2.5 Pro,ELO得分1424,原生文本到音频生成 左右滑动查看 除了 Gemini 2.5系列模型的更新外,谷歌还推出了Imagen 4、Veo 3 两款多模态模型。其中,Imagen 4生图细节逼真,生 成速度比Imagen 3快10倍;Veo 3首次支持原生音频输出,能生成对白、背景音等,实现音视频融合。 同时,谷歌还推出了全新文本扩散模型Gemini Diffusion、AI搜索AI Mode、全新Flow创意平台等。 于此同时,谷歌推出了订阅服务——Google AI Ultra,订阅费用高达250美元(比ChatGPT ...
一文读懂Google I/O 2025 开发者大会:“降低门槛、加速创造”,谷歌开启 “模型即平台” 的 AI 生态新时代
硬AI· 2025-05-21 03:29
图 点击 上方 硬AI 关注我们 Google I/O 2025 展示了 Gemini 2.5 作为跨平台 AI 引擎的全面实力。从"Stitch"到"Casey",从语音助手到机器人生 成,从 Android 到 Web 到 Cloud,每一项更新都紧扣"降低门槛、加速创造"的核心目标。核心发布包括,Gemini 2.5 与 Flash 模型、AI Studio 全新开发体验 、Android 与 Gemini Nano 深度整合 、 多模态工具 Stitches和实时部署能力。 新实验项目 Stitch:通过文本提示自动生成 App UI 设计,并即时转为代码。 设计不仅是静态图,而是可以编辑的真实界面;可导出至 Figma 或 IDE 中继续开发。 硬·AI 作者 | 李 丹 编辑 | 硬 AI 继微软之后,谷歌也全面拥抱人工智能(AI)智能体(Agent)。在开发者大会上,谷歌宣布要让智能体 全面进驻谷歌的主打业务搜索以及AI助手Gemini,并通过Gemini与搜索结合,推出全新的AI模式搜索。 美东时间5月20日周二,谷歌2025年度I/O开发者大会的主题演讲展示了在AI、多模态模型、跨设备整合与 ...
四点速读2025谷歌开发者大会
第一财经· 2025-05-21 03:22
谷歌推出的Veo 3视频生成模型支持原生音频生成,不仅能够生成高清视频,还可为视频添加背景音乐、 音效甚至对白,解决了以往AI视频生成中"有影无声"的问题,极大提升了AI视频的质量和真实感。 2025.05. 21 本文字数:977,阅读时长大约2分钟 作者 | 一财科技 北京时间5月21日,谷歌开发者大会(Google I/O)上公布了在AI技术上的最新进展,从基础模型升级到 生成式内容工具推出,再到硬件更新,标志着谷歌将AI技术融入其生态系统的进程又迈出重要一步。 一、Gemini模型升级,多模态能力显著提升 核心亮点仍是Gemini模型。Gemini 2.5 Pro 和 Flash 模型全面支持视听输入和原生音频输出对话,开发 者可通过Live API 预览版构建和微调对话体验的音调、口音和说话风格等。Gemini还可作为Chatbot登 录Chrome浏览器,帮助用户快速理解页面上下文并完成任务。其中,Deep Think模式引入增强型推理机 制,在处理数学、编程和多模态任务时,能够在回答前充分考虑多种可能性,显著提升了模型的推理能 力。 二、生成式内容工具 再升级 针对各项AI升级功能,谷歌推出了每 ...
谷歌ToC助手炸场,飞书ToB“知识问答”跟牌 | 智能涌现独家
3 6 Ke· 2025-05-21 03:18
作者 | 邓咏仪 编辑 | 苏建勋 北京时间5月21日凌晨,谷歌在每年一度的I/O大会上再度炸场——谷歌搜索的AI模式正式上线。其中,最受瞩目的一个功能是Personal Context(个人上下 文)。 简单来说,这是一个记忆功能。在得到用户授权后,谷歌大模型助手Gemini就能得知你的搜索历史、邮箱、收藏、网盘等等资料,从而提供更懂用户的问 答,如获取邮件中特定日程的时间和地点,结合天气、用户对地点的偏好给出更符合用户个性的建议。 但不必等谷歌,国内马上就能用上企业版本的Context(上下文)。 《智能涌现》独家获悉,飞书即将上线一个新的AI产品——飞书知识问答。 《智能涌现》了解到,目前,这个产品已经完成了数万名用户的内测,网页端(ask.feishu.cn)也已经正式上线。用户在飞书中搜索"知识问答",或直接访 问网址,即可申请试用。 从网页端来看,飞书知识问答的形态类似有长期知识记忆的GPT和豆包。用户可以上传个人版的资料,上传完毕后,能够调用 DeepSeek 或豆包进行提问, 网页版同样支持联网搜索,也知识库搜索等多种方式。 简单来说,在使用体验上,它更像一个"可以记得住事"的实习生——当用户 ...