Workflow
Lyria 2
icon
Search documents
试图干翻所有 AI 公司,谷歌全家桶到底有多硬核?
3 6 Ke· 2025-06-02 06:39
刚过去不久的 Google I/O 2025 开发者大会,不出所料,"AI" 依然是绝对主角。 去年,"AI" 一词在大会上被提及 120 次,今年也毫不逊色,被提及 92 次。 其中,"Gemini" 一词贯穿全场,高调亮相 95 次,频率还反超了 "AI",俨然成了谷歌新一代 AI 的代名词。 2025 年,AI 越卷越狠,各家大模型你追我赶。进入 Gemini 时代的谷歌,在自家产品上的应用更是全面开花。 这次大会更新,让老狐眼前一亮,再次刷新了对 AI 潜力的认知:这才像谷歌,有老大哥的气魄。 作为谷歌主力的语言模型,Gemini 2.5 Pro 和 Gemini 2.5 Flash 自三月推出以来就保持高热度。 尤其 2.5 Pro,在 WebDev Arena 和 LMArena 等多个评测平台上,各个子任务几乎全线领先,属于实打实的"榜单霸主"。 不过,谷歌并不满足于"够用",而是进一步强化 Buff:这次更新加入了全新的 Deep Think 模式。 当模型遇到更复杂的问题,Gemini 可以切换到 Deep Think 模式:它会"多想一会儿",牺牲一些响应时间,换取更准确的推理与回答。 这 ...
5月全球人工智能领域新看点
Xin Hua She· 2025-06-02 03:37
新华社北京6月2日电 综述|5月全球人工智能领域新看点 新华社记者 尽管当前AI应用已相当广泛,但不少缺陷还是会影响其实用性。研究人员正努力分析导致这些缺陷的 原因并寻求新的解决方法,从而改善AI的性能。 一个比较明显的问题是,AI生成内容虽然已非常流畅,但提供的信息很多时候还是不准确。5月,日本 研究人员在德国《先进科学》杂志发表的一项研究成果中指出,这一问题与人类的语言障碍——失语症 类似。 据研究人员介绍,大模型在出现严重错误时仍表达流畅,这与感觉性失语症的症状有相似之处,即说话 流利却总说不出什么意思。这并不意味着AI聊天机器人有"脑损伤",但它们可能被锁定在一种僵化的内 部模式中,限制其灵活运用所储存知识,就像患了感觉性失语症。未来研究人员可以针对相关问题,找 到改善措施。 业界也确实在努力从不同角度去寻求优化大模型的解决方案。中国科学院自动化研究所联合鹏城实验室 提出了一种高效推理策略AutoThink,可让大模型实现自主切换思考模式,避免"过度思考"。 据研究人员介绍,AutoThink提供了一种简单而有效的推理新范式——通过省略号提示配合三阶段强化 学习,引导大模型不再"逢题必深思熟虑",而是 ...
谷歌发布最强 AI“全家桶”、一句话就让AI拍大片!这一夜,谷歌Gemini贯穿始终,网友:果然Android“靠边站”了
AI科技大本营· 2025-05-21 01:06
整理 | 郑丽媛 回顾 上一次 I/O 大会至今,Sundar Pichai 表示 谷歌已发布了十多个新模型和研究突破,并推出了 20 多个重 大 AI 产品与新功能。 他解释道, " 我 们的目标很简单:让最优秀的模型和产品尽快触达用户, 因此 我们正以前所未有的速度推进发布节奏。 " 他指出 ,相比第一代 Gemini 1.0 Pro, 如今的 Gemini 2.5 Pro 几乎 发生了 "跃迁式"变化: 在 LMArena 榜单上横扫各大类别 、 在多项基准测试中 刷新 纪录; 在代码领域也取得 巨大进展, 登顶 WebArena 榜首。 出品 | CSDN(ID:CSDNnews) 昨天, 微软在 Build 大会上刚刚甩出"Windows 子系统"和"Copilot 开源"的重磅炸弹 ,整个开发者圈还没从热议中缓过劲来,转眼今天凌晨,谷歌就 在 I/O 大会上掏出了自己的"王炸"牌——一场 AI 盛宴,正式上演! 从凌晨 1 点开始,这场 持续了 2 小时的发布会彻底印证了网友的预测: 曾经占据谷歌 I/O 大会中心的 Android 系统正在"靠边站",C 位已经留给了 更具革命性的 AI。 无论 ...
谷歌(GOOG.US,GOOGL.US)发布Veo 3 AI视频生成器 对标OpenAI Sora
智通财经网· 2025-05-20 22:16
Core Insights - Google has officially launched its latest AI video generation tool, Veo 3, which competes strongly with OpenAI's Sora by generating videos with synchronized sound effects [1] - Veo 3 can create high-quality videos based on text and image prompts while automatically adding sound effects like dialogue and animal noises for a more realistic audiovisual experience [1] - The tool is available to U.S. users through a new Ultra subscription plan priced at $249.99 per month, targeting heavy AI enthusiasts [1] Group 1 - Google has introduced several new generative AI products alongside Veo 3, including Imagen 4, an upgraded image generation model, and Flow, a movie-making assistant tool [1][2] - The launch of these products comes as generative AI applications in image and video creation are becoming increasingly popular [2] - Google has faced challenges in the AI image generation space, notably with the Imagen 3 model, which generated historically inaccurate images, leading to criticism and a subsequent re-release [2] Group 2 - Google has also updated Veo 2 to include a feature that allows users to add or remove objects in videos based on text prompts [2] - The company has made its AI music generation model, Lyria 2, available for YouTube Shorts creators and Vertex AI enterprise clients [2] - As of the latest market close, Google's stock fell over 1.5%, closing at $163.98 [3]
Google launches Veo 3, an AI video generator that incorporates audio
CNBC· 2025-05-20 17:45
Core Insights - Google has launched Veo 3, an AI video generator that distinguishes itself by incorporating audio, including character dialogue and animal sounds, setting it apart from competitors like OpenAI's Sora [1][2] - The tool is available to U.S. subscribers of Google's new $249.99 per month Ultra subscription plan, aimed at AI enthusiasts, and will also be accessible through Google's Vertex AI enterprise platform [2] - Alongside Veo 3, Google introduced Imagen 4 for higher-quality image generation and Flow, a filmmaking tool for creating cinematic videos based on user descriptions [3] Industry Context - The recent launches reflect the growing popularity of imagery and video as use cases for generative AI, highlighted by OpenAI's ChatGPT image generator causing significant demand [4] - Google has faced challenges with its AI image generators, notably relaunching Imagen 3 after receiving criticism for historically inaccurate results, which was attributed to insufficient testing [5] - The company has also updated its Veo 2 video generator to allow users to manipulate video content through text prompts and expanded its Lyria 2 music-generation model for creators on YouTube Shorts and businesses using Vertex AI [5]