Workflow
Lyria
icon
Search documents
The Great Voyage
Google DeepMind· 2025-07-16 14:23
Watch a short 3-minute film made with our AI models by our in-house creative team, inspired by the age of Victorian silent cinema. Here's more detail on how it was made: Inspiration & Fine-Tuning: The team found a batch of 1800s photos at a thrift store that was then used to LoRA fine-tune our image generation model Imagen to generate new images in the same vintage style. If you want to try this yourself, you can also use "Style Ingredients" in our filmmaking tool Flow. This allows you to directly fine-tune ...
计算机周观点第5期:网证管理办法发布,AI关注点持续向“落地”转移-20250617
[Table_Industry] 计算机 行 业 跟 踪 报 计算机周观点第 5 期:网证管理办法发 布,AI 关注点持续向"落地"转移 评级: 增持 本报告导读: 网证管理办法发布,网证网号增长空间已经打开,相关板块有望直接受益,此外 AI 落地稳步推进,长期发展值得期待。 投资要点: 风险提示:AI 商业落地不及预期,政策落地不及预期。 券 研 究 报 告 请务必阅读正文之后的免责条款部分 股 票 研 究 告 证 股票研究 /[Table_Date] 2025.05.27 [Table_Invest] [table_Authors] 杨林(分析师) 杨昊翊(分析师) 杨蒙(分析师) 021-38676666 021-38676666 021-38676666 登记编号 S0880525040027 S0880525040126 S0880525040072 2025-06-17 [Table_Summary] 投资建议:网证管理办法的发布,其鼓励使用网号网证的积极态度, 有望打开整个网号网证市场的空间,仅以线下为例,网证就可带来 包括芯片、模组、整机在内的身份核验设备的巨大替换需求。此外, AI 的发展也 ...
「人类飞机上吵架看呆袋鼠」刷屏全网,7000万人被AI耍了
机器之心· 2025-06-16 09:10
机器之心报道 编辑:杨文 假作真时真亦假,无为有处有还无。 200 多年前,曹雪芹在《红楼梦》中写下这样一句话:假作真时真亦假,无为有处有还无。翻译成大白话就是,当虚假被当作真实时,真实也会被视为虚假;当虚 无被强行视为存在时,存在也会消解为虚无。万万没想到,放在今天的 AI 语境下,这句古话竟精准地映照了现实。 最近在 X 上冲浪,刷到了一段「人类在飞机上吵架看呆袋鼠」的视频。视频中,一只紧握登机牌、站得直挺挺的袋鼠,正满脸无辜地看着自己的主人和一名空乘人 员在登机口 battle。 视频来自: https://www.instagram.com/infiniteunreality/ 由于袋鼠的举止表情「比小朋友还乖」,引发不少网友点赞转发。其中 X 账号 @DramaAlert 就在短时间内获得了 7460 万次观看,Instagram 上这段视频光点赞量就 有 110.4 万次。 不过很快有细心的网友发现了不对劲。袋鼠手中的「登机牌」上全是难以辨认的文字乱码,而这往往是 AI 生成视频的最大「罪证」。 视频中的人类说着并不存在的语言,空乘人员佩戴的胸牌上也没有名字。 此外,乘客的左手无名指一开始并没有任 ...
Google's SynthID is the latest tool for catching AI-made content. what is AI 'watermarking,' and does it work?
TechXplore· 2025-06-03 13:43
Core Viewpoint - Google has introduced SynthID Detector, a tool designed to identify AI-generated content across various media formats, but it is currently limited to early testers and specific Google AI services [1][2]. Group 1: Tool Functionality - SynthID primarily detects content generated by Google AI services like Gemini, Veo, Imagen, and Lyria, and does not work with outputs from other AI models like ChatGPT [2][3]. - The tool identifies a "watermark" embedded in the content by Google's AI products, rather than detecting AI-generated content directly [3][5]. - Watermarks are machine-readable elements that help trace the origin and authorship of content, addressing misinformation challenges [4][5]. Group 2: Industry Landscape - Multiple AI companies, including Meta, have developed their own watermarking and detection tools, leading to a fragmented landscape where users must manage various tools for verification [5][6]. - There is a lack of a unified AI detection system, despite calls from researchers for a more cohesive approach [6]. Group 3: Effectiveness of Detection Tools - The effectiveness of AI detection tools varies significantly; they perform better on entirely AI-generated content compared to content that has been edited or transformed by AI [10]. - Many detection tools do not provide clear explanations for their decisions, which can lead to confusion and ethical concerns, especially in academic settings [11]. Group 4: Use Cases - AI detection tools have various applications, including verifying insurance claims, assisting journalists and fact-checkers, and ensuring authenticity in recruitment and online dating scenarios [12][13]. - The need for real-time detection tools is increasing, as static watermarking may not suffice for addressing authenticity challenges [14]. Group 5: Future Directions - Understanding the limitations of AI detection tools is crucial, and combining these tools with contextual knowledge will remain essential for accurate assessments [15].
国泰海通:网证管理办法发布 AI关注点持续向“落地”转移
智通财经网· 2025-05-27 07:06
Claude 4模型发布,能够执行长期任务 根据腾讯科技官微,5月22日,Anthropic发布了两款Claude 4模型——Claude Opus 4和Claude Sonnet 4。 Claude 4系列模型具备分析大型数据集、执行长期任务和采取复杂行动的能力。这两款模型都针对编程 任务进行了优化,非常适合编写和编辑代码。在测试中,旗舰模型Claude Opus 4在测试中保持了近7个 小时对复杂开源重构项目的专注能力。这项突破性进展标志着,AI从快速响应工具转变为能处理全天 候项目的真正协作伙伴。这项技术突破意义深远:AI系统已具备承接从概念设计到完整落地的复杂软 件工程项目能力,可在整个工作周期内保持上下文连贯性和专注度。该行认为,Claude 4的发布,进一 步拓宽了AI的应用范围,AI离"个人助手"这一目标愈发接近。 谷歌发布多款AI新品,将Gemini融入"日常" 根据网易科技官微,5月20日,2025 Google I/O上,谷歌发布了升级后的Gemini2.5系列模型、全新图像 与视频生成模型Veo3和Imagen4、音乐模型Lyria2,AI电影制作工具Flow、Android XR、AI ...
一文读懂Google I/O 2025 开发者大会:开启 “模型即平台” 的 AI 生态新时代
华尔街见闻· 2025-05-21 10:38
继微软之后,谷歌也全面拥抱人工智能(AI)智能体(Agent)。在开发者大会上,谷歌宣布要让智能体全面进驻谷歌的主打业务搜索以及AI助手Gemini,并 通过Gemini与搜索结合,推出全新的AI模式搜索。 美东时间5月20日周二,谷歌2025年度I/O开发者大会的主题演讲展示了在AI、多模态模型、跨设备整合与开发者工具方面的最新成果。从升级后的 Gemini 2.5 Pro 模型到智能眼镜的 XR 应用,再到 AI 驱动的搜索与网页浏览体验。谷歌展现的不仅是模型的性能提升,更是AI从"信息工具"进化为"通用智能体" 的进步。 Google I/O 2025 展示了 Gemini 2.5 作为跨平台 AI 引擎的全面实力。从"Stitch"到"Casey",从语音助手到机器人生成,从 Android 到 Web 到 Cloud,每 一项更新都紧扣"降低门槛、加速创造"的核心目标。核心发布 包括, Gemini 2.5 与 Flash 模型、AI Studio 全新开发体验 、Android 与 Gemini Nano 深度 整合 、 多模态工具 Stitches和实时部署能力。 本次发布内容主要包括: 1. ...
2025谷歌开发者大会有哪些值得关注的内容?
Jin Shi Shu Ju· 2025-05-21 04:06
Core Insights - Google held its annual developer conference, Google I/O 2025, showcasing updates across its product lines, including Android, Chrome, Google Search, YouTube, and AI chatbot Gemini [1] Group 1: Gemini Ultra and Features - Gemini Ultra, available only in the U.S., offers the highest level of access to Google AI applications and services for a monthly fee of $249.99, including features like the Veo 3 video generator and the upcoming Gemini 2.5 Pro's Deep Think mode [1] - Subscribers of Gemini Ultra will receive enhanced quotas for NotebookLM and Whisk, along with 30TB of storage across Google services [2] Group 2: AI Enhancements - The Deep Think mode in Gemini 2.5 Pro is an enhanced reasoning mode that improves model performance by synthesizing multiple answers, similar to OpenAI's models [3] - Veo 3, a video generation AI, can create sound effects and voiceovers, and will be available exclusively to Gemini Ultra subscribers [4] - Imagen 4, a faster image generation AI, supports high-resolution outputs and detailed textures, enhancing video creation tools like Flow [5] Group 3: Gemini Application Updates - The Gemini series applications have surpassed 400 million monthly active users [6] - Gemini Live will soon allow all iOS and Android users to share their screens and engage in near real-time voice interactions with AI [7] Group 4: New AI Tools and Projects - Stitch is a new AI tool for designing web and mobile app front-ends, allowing users to generate UI elements and code from simple prompts [8] - Project Mariner, an experimental AI agent, can now handle multiple tasks simultaneously, enabling users to complete online shopping through AI interactions [9] - Project Astra, a low-latency multimodal AI project, is being developed in collaboration with companies like Samsung [10] Group 5: AI Mode and Search Enhancements - AI Mode, an experimental search feature, allows users to pose complex multi-part questions and will support visual search queries later this summer [11] Group 6: Video Conferencing and Communication - Beam, a 3D video conferencing tool, uses multiple cameras to create lifelike remote meetings and will integrate with Google Meet for real-time translation [12] Group 7: Integration and Updates - Gemini will be integrated into Chrome as a new AI browsing assistant, enhancing user experience across various Google applications [14] - Wear OS 6 introduces a unified font and improved interface consistency, while Google Play adds new tools for Android developers [15][16] - Android Studio will incorporate new AI features to assist in app development and quality insights [17]
一文读懂Google I/O 2025 开发者大会:“降低门槛、加速创造”,谷歌开启 “模型即平台” 的 AI 生态新时代
硬AI· 2025-05-21 03:29
图 点击 上方 硬AI 关注我们 Google I/O 2025 展示了 Gemini 2.5 作为跨平台 AI 引擎的全面实力。从"Stitch"到"Casey",从语音助手到机器人生 成,从 Android 到 Web 到 Cloud,每一项更新都紧扣"降低门槛、加速创造"的核心目标。核心发布包括,Gemini 2.5 与 Flash 模型、AI Studio 全新开发体验 、Android 与 Gemini Nano 深度整合 、 多模态工具 Stitches和实时部署能力。 新实验项目 Stitch:通过文本提示自动生成 App UI 设计,并即时转为代码。 设计不仅是静态图,而是可以编辑的真实界面;可导出至 Figma 或 IDE 中继续开发。 硬·AI 作者 | 李 丹 编辑 | 硬 AI 继微软之后,谷歌也全面拥抱人工智能(AI)智能体(Agent)。在开发者大会上,谷歌宣布要让智能体 全面进驻谷歌的主打业务搜索以及AI助手Gemini,并通过Gemini与搜索结合,推出全新的AI模式搜索。 美东时间5月20日周二,谷歌2025年度I/O开发者大会的主题演讲展示了在AI、多模态模型、跨设备整合与 ...
直击谷歌I/O 2025:谷歌AI眼镜剑指主流市场,未来拍电影全靠“打字”?
Tai Mei Ti A P P· 2025-05-21 00:35
文 | 大模型之家 AI能生成分镜,"拍"电影还会远吗? 北京时间5月21日凌晨,在2025年Google I/O开发者大会的主题演讲中,谷歌CEO桑达尔·皮查伊以一句 轻松的"双子座季节"开场白,揭开了这场科技盛宴的序幕。他直言,在谷歌的"Gemini时代",技术突破 不再受传统发布周期束缚,谷歌正以史无前例的速度将最前沿的AI模型推向全球用户。 皮查伊强调:"我们打破了'性能与价格不可兼得'的行业魔咒。"Gemini 2.5 Pro在性能飙升的同时,实现 了成本的大幅优化。数据显示,Gemini模型每秒生成输出令牌数已跻身全球前三,而单位计算成本较前 代下降40%。这一突破得益于谷歌第七代TPU芯片的赋能——这款专为大规模推理设计的芯片,性能较 前代提升10倍,单计算仓算力达42.5 ExaFLOPS,成为支撑谷歌AI基础设施的"超级引擎"。 技术突破正转化为触手可及的产品体验。皮查伊公布了一组数据:过去一年间,谷歌每月通过产品和 API处理的AI Token数量从9.7万亿激增至480万亿,增幅超50倍;开发者生态同样迎来爆发式增长,超 过700万开发者通过Gemini API、Google AI St ...
谷歌(GOOG.US,GOOGL.US)发布Veo 3 AI视频生成器 对标OpenAI Sora
智通财经网· 2025-05-20 22:16
智通财经APP获悉,谷歌(GOOG.US,GOOGL.US)周二正式发布其最新人工智能视频生成工具Veo 3,具 备生成视频的同时同步嵌入音效的能力,成为对标OpenAI Sora的有力竞争者。 谷歌表示,Veo 3不仅可以基于文本和图像提示生成高质量的视频,还能自动加入包括人物对白、动物 叫声等音效,实现更逼真的视听体验。 谷歌DeepMind产品副总裁Eli Collins表示:"从文字和图像提示,到真实世界物理效果与精准的唇形同 步,Veo 3的表现都非常出色。" 除了Veo 3外,谷歌还发布了多个与生成式AI相关的新产品,包括Imagen 4,升级版图像生成模型,能 够根据用户提示生成更高质量、更真实的图片,以及Flow,一款电影制作辅助工具,用户只需描述场 景、镜头和风格偏好,便可生成具有电影感的视频作品。该工具可通过Gemini、Whisk、Vertex AI及 Workspace访问。 这款工具目前已向美国用户开放,订阅谷歌全新Ultra会员计划(每月收费249.99美元)即可使用,该订阅 计划主要面向AI重度爱好者。此外,Veo 3也将纳入谷歌面向企业客户的Vertex AI平台。 不过,谷歌 ...