Veo 2

Search documents
人工智能分析2025年第一季度AI现状
傅里叶的猫· 2025-06-05 12:25
今天大家都在谈MS的这篇DeepSeek R2分析的报告,提前曝光了R2的性能和参数,我们简单总结一 下这个报告的核心内容: DeepSeek R2 使用了多达 1.2 万亿个参数,采用了新颖的架构,实现了运行成本的显著降低。其采用 混合专家混合(MoE)架构,有 780 亿个活跃参数。 并且R2 使用华为的 Ascend 910B 芯片进行训练,而非 NVIDIA 的芯片。 R2 增强了多语言覆盖能 力,能流畅处理非英语语言;扩展了强化学习,利用更大的数据集,使模型能够进行更具逻辑性和 更像人类的推理;增加了多模态功能,能够处理文本、图像、语音和视频数据;实现了推理时的缩 放,通过采用通用奖励模型(GRM),在推理过程中增加计算资源,从而提高了输出质量。 R2 具有高成本效益,输入成本为每百万代币 0.07 美元,输出成本为每百万代币 0.27 美元,而 R1 的 输入成本为 0.15-0.16 美元,输出成本为 2.19 美元。 由于这篇报告讲的人已经很多了,我们就不赘述了,而且报告也放到了星球中,有兴趣的朋友可以 到星球中看原文。 今天这篇文章来看另一篇AI的分析,Artificial Analysis ...
人工智能分析2025年第一季度AI现状
傅里叶的猫· 2025-06-05 12:25
Core Insights - The report on DeepSeek R2 highlights its significant advancements in performance and cost efficiency, utilizing a novel architecture with 1.2 trillion parameters and a mixture of experts (MoE) framework [1] - The report from Artificial Analysis outlines six major trends in the AI sector expected by early 2025, focusing on advancements in intelligence, efficiency, and multimodal capabilities [2] Group 1: AI Progress - The AI industry continues to make strides in model intelligence, cost efficiency, and speed, with leading labs like OpenAI, Google, and xAI at the forefront [3] - OpenAI's o4-mini and o3 models lead in intelligence, followed by Google's Gemini 2.5 Pro and xAI's Grok 3, indicating a competitive landscape with rapid innovation [3] - OpenAI and Google maintain a competitive edge through vertical integration in the AI value chain, while smaller players focus on specific modalities [3] Group 2: Rise of Chinese AI - Chinese AI labs, such as DeepSeek and Alibaba, have made significant progress in open-weight models, narrowing the gap with U.S. labs and enhancing China's influence in the open AI ecosystem [4] Group 3: Reasoning Models - Reasoning models that generate intermediate tokens before answering have significantly improved intelligence levels, outperforming non-reasoning models in various assessments [5] - Google’s Gemini 2.5 Pro exemplifies this advancement by correctly answering complex problems, while non-reasoning models prioritize speed and cost [5] Group 4: AI Agents - AI systems are increasingly capable of autonomously completing end-to-end tasks by chaining requests from multiple large language models (LLMs), enhancing their practicality [6] Group 5: Efficiency and MoE - The report emphasizes that advancements in small model intelligence, reasoning efficiency, and next-generation hardware have led to a significant reduction in inference costs [7] - MoE models activate only a portion of parameters during inference, contributing to improved efficiency and accessibility of high-performance AI [7] Group 6: Multimodal AI - Multimodal AI has made substantial progress, with advancements in image generation, video generation, and speech processing [8][9] - OpenAI's GPT-40 sets a new standard in image generation quality, while Google’s Veo 2 surpasses OpenAI's Sora in video generation [8] - Speech-to-text and text-to-speech models have also improved, with OpenAI and ElevenLabs leading in accuracy [9] Group 7: Open-Weight Models and Competitive Landscape - Open-weight models from Alibaba, DeepSeek, Meta, and NVIDIA have significantly closed the intelligence gap with proprietary models, although OpenAI's o4-mini and Google's Gemini 2.5 Pro still hold slight advantages [14] - The AI landscape is becoming increasingly crowded, with competition among U.S. labs and companies like NVIDIA, DeepSeek, and Alibaba intensifying [14]
谷歌I/O超全总结:AI搜索大变样,AR眼镜复活,大模型全家桶升级,史上最贵订阅费1800元
3 6 Ke· 2025-05-21 00:48
智东西5月21日报道,今日凌晨,在一年一度的谷歌I/O开发者大会上,谷歌的AI大戏连番上演! 时长不到2小时的主题演讲上,谷歌CEO桑达尔·皮查伊携一众谷歌高管总共提到95次"Gemini"、92次"AI"。 模型升级方面:Gemini 2.5 Pro新支持原生音频输出、Project Mariner的计算机使用功能、深度思考、高安全防护;视频模型Veo 2新增原生音频生成功 能、Gemini 2.5 Flash在推理、编程和长上下文等关键指标上升级。全新发布模型包括:扩散语言模型Gemini Diffusion、视频生成模型Veo 3、图像生成模 型Imagen 4。 谷歌还推出全新Gemini订阅计划:AI Pro用户月付19.99美元(折合人民币约144元),可使用Veo 2、Gemini 2.5 Pro等入门级产品;AI Ultra用户月付249.99 美元(折合人民币约1804元),可拥有Veo 3的无限访问权限、使用Gemini 2.5 Pro深度思考模式等。 这都指向一个目标:构建通用AI助手。谷歌DeepMind创始人兼CEO戴密斯·哈萨比斯(Demis Hassabis)称,他们将Gemin ...
每月1800元,谷歌发布AI全家桶;马斯克称仍致力于执掌特斯拉丨全球科技早参
Mei Ri Jing Ji Xin Wen· 2025-05-21 00:03
每经记者|宋欣悦 每经编辑|高涵 |2025年5月21日星期三| NO.1 每月1800元,谷歌发布AI全家桶Google AI Ultra 当地时间5月20日,谷歌在"I/O 2025"全球开发者大会上发布了AI全家桶——Google AI Ultra。Google AI Ultra整合了目前谷歌最好的模型、各种高级功能以及30T的云存储。有如此强的功能,收费方面每月 249.99美元(约合人民币1809元)。通过AI Ultra,用户能体验到最高版本的Gemini应用,该应用在深 度研究领域设置了最高使用权限,支持使用Veo 2进行视频生成,还能让用户提前使用突破性的Veo 3模 型。此外,在未来几周内,AI Ultra订阅用户将能够使用Deep Think 2.5 Pro这一全新增强推理模式。 点评:Google AI Ultra的发布,是谷歌在人工智能领域持续发力的重要体现,有望为不同行业的专业人 士提供更为强大、高效的AI解决方案,在竞争激烈的AI市场中抢占更多份额。 NO.2 马斯克称仍致力于执掌特斯拉 据央视新闻,当地时间5月20日,美国企业家埃隆·马斯克称仍致力于在五年内担任特斯拉首席执行官, ...
每月1800元 谷歌发布AI全家桶—Google AI Ultra
news flash· 2025-05-20 20:53
每月1800元 谷歌发布AI全家桶—Google AI Ultra 金十数据5月21日讯,今天凌晨,谷歌在"I/O 2025"全球开发者大会上发布了AI全家桶——Google AI Ultra。Google AI Ultra整合了目前谷歌最好的模型、各种高级功能以及30T的云存储,以帮助影视、金 融、医疗等人员通过AI提升工作效率节省时间。有如此强的功能,收费方面每月249.99 美元(大约 1809元),这比ChatGPT Pro还贵50美元。通过AI Ultra,用户能体验到最高版本的Gemini应用,该应用 在深度研究领域设置了最高使用限制,支持借助Veo 2进行视频生成。还能让用户提前使用突破性的Veo 3模型,非常适合编程、学术研究和复杂的创意工作,并且在未来几周Ultra订阅用户能使用Deep Think 2.5 Pro这一全新增强推理模式。 (AIGC开放社区) ...
2025年哪款模型最受欢迎?Poe最新报告:DeepSeek降温、可灵成黑马
Founder Park· 2025-05-15 11:34
AI 工具聚合平台 Poe 发布了其最新一期的人工智能模型使用趋势报告。这次的报告分析汇总了从 2025 年 1 月至 2025 年 5 月期间,Poe 用户在文本、推 理、图像、视频和音频领域的每周使用数据。 在各种能力测评榜单之下,模型在真实场景下的能力如何?哪些模型更好用?Poe 的报告数据,反映了用户使用大模型时的一些真实需求和使用模式。 报告得出的几个核心观察点: Founder Park 正在搭建「 AI 产品市集」社群,邀请从业者、开发人员和创业者,扫码加群: 进群后,你有机会得到: 01 模型新版本推出速度太快, 市场份额消长明显 随着时间的发展,DeepSeek 模型的「爆红期」已经过去,同时其他定价合理、支持长上下文的推理模型也陆续发布, DeepSeek R1 的消息份额从 2 月中旬的 7% 峰值下降到 4 月底的 3%。 同一提供商发布的新一代旗舰模型往往会抢占其上一代模型/产品的市场份额。在此趋势下,Poe 订阅用户会迅速地转向使用新一代模型; 在 Poe 中,用户发给推理模型的文本消息总份额从约 2%上升到了约 10%,在 DeepSeek 热度高峰期达到顶峰。具备混合推理能力的 ...
AI全球速递:从谷歌FY25Q1财报看AI产业趋势变化
Changjiang Securities· 2025-05-08 11:11
丨证券研究报告丨 行业研究丨点评报告丨软件与服务 [Table_Title] AI 全球速递:从谷歌 FY25Q1 财报看 AI 产业趋 势变化 报告要点 [Table_Summary] 美东时间 4 月 24 日盘后,谷歌发布 2025 财年 Q1 财报,报告期内,谷歌实现营收 902.34 亿 美元,同比增长 12.0%;净利润 345.4 亿美元,同比增长 46.0%,两项指标均高于彭博一致预 期,FY25Q1 公司每股摊薄收益为 2.81 美元,同比增长 48.7%,高于彭博一致预期的 2.05 美 元。公司股价在盘后大幅上涨 5%,主因一季度营收业绩超预期。公司对二季度的指引偏向谨 慎乐观。 分析师及联系人 [Table_Author] 宗建树 SAC:S0490520030004 SFC:BUX668 请阅读最后评级说明和重要声明 %% %% %% %% research.95579.com 1 软件与服务 cjzqdt11111 [Table_Title AI 全球速递:从谷歌 2] FY25Q1 财报看 AI 产业 趋势变化 [Table_Summary2] 事件描述 美东时间 4 月 24 ...
虚假宣传自动驾驶,或面临2年以下刑期;大模型六小龙,第一个IPO要来了;华强北市场热门芯片“封库存”丨AI周报
创业邦· 2025-04-20 03:06
以下文章来源于快鲤鱼 ,作者巴里 快鲤鱼 . 创业邦旗下AGI矩阵号,寻找海内外创新性的AGI高成长公司,记录AGI商业领袖的成长轨迹。 全球AI产业周报 为你精选过去一周(4.12-4.18)最值得关注的AI新闻和 国内外热门AI投融资事件 ,帮助大家及时了解全球AI市场动向。 本周AI热点资讯 国内大事 华强北市场多款热门芯片"封库存",分销商称有客户转向国产 记者于4月14日走访深圳华强北市场了解到,目前多家档口针对CPU、显卡等热门芯片的报价已经暂停,且多家档口关门歇业。"现在都在观望,封库存 了,大家担心价格会暴涨暴跌。"谈及美国关税调整后的影响,一名档口老板告诉记者。此外,记者从多家国产芯片厂商处获悉,关税变化后客户咨询变 多。"涉及到美国原产地的产品,已经有下游客户开始跟我们沟通(国产)替代的可行性了。"一名上市分销企业高管告诉记者。(财联社) 公安部道研中心:虚假宣传自动驾驶,或面临2年以下刑期 4 月 17 日,公安部道路交通安全研究中心官方公众号「交通言究社」发表《智慧领航,安全护航——智能网联汽车辅助驾驶功能使用须谨慎》一文,提到 近期因驾驶人错误使用辅助驾驶导致的交通事故,并揭示其原因 ...
AI视频进入「真4K时代」?近期AI新鲜事还有这些……
红杉汇· 2025-04-16 14:19
视频创作新巅峰! 谷歌DeepMind推出Veo 2 在AI视频生成的战场上,谷歌终于亮出了底牌:4月16日,Veo 2正式登陆Gemini Advanced。 Veo 2生成:一只戴着超大眼镜的小老鼠在舒适的森林巢穴里,在蘑菇的灯光下看书的动画镜头。 Veo 2可以最高生成8秒720P电影级视频 (理论上可生成4K分辨率视频,但受限于当前工具链,实际输出暂为 720p,谷歌计划年内开放4K长视频生成) ,在运镜、文本语义还原、物理模拟、动作一致性等方面非常优 秀,同时支持图片转视频功能——这是谷歌迈向多模态生成系统的重要一步。 Veo 2生成:太平洋海岸线宁静的美丽景致。 作为谷歌DeepMind团队的最新力作,Veo 2在原有基础上实现了大升级: 首先是 电影级创作工具 :Veo 2能 自动移除视频中的干扰元素 ,并利用Outpainting功能扩展画面,生成与 原视频无缝衔接的新片段。此外, 内置"无人机视角""延时摄影""镜头平移"等电影级拍摄参数 ,用户只需 输入文字描述,即可生成符合好莱坞叙事逻辑的分镜。再加上 静态图转视频 技术,这让AI视频创作更加便 捷。 其次是 多模态协同与数字水印保护 。 ...
新鲜早科技丨刘强东要求京东外卖利润率不高于5%;敦煌网APP在苹果美区下载排名升至第二;小米延后推出其最新电动车及消费电子商品
2 1 Shi Ji Jing Ji Bao Dao· 2025-04-16 03:00
21世纪经济报道新质生产力研究院综合报道 早上好,新的一天又开始了。在过去的24小时内,科技行业发生了哪些有意思的事情?来跟21tech一起 看看吧。 【巨头风向标】 刘强东内部讲话曝光:要求京东外卖利润率不高于5%。4月15日下午消息,近日,一段京东创始人、董 事会主席刘强东2024年内部讲话的线上会议视频流出。刘强东谈道:"我给京东外卖定一条规矩,京东 外卖永远赚的净利润不允许超过5%。超过5%,我要处分人的。我们一定要在行业里面,按照三毛五的 理论,来约束自己的赚钱能力、赚钱欲望。"此外,刘强东还要求给全职骑手上五险一金、给兼职骑手 提供意外险和健康医疗险,要让骑手更有保障。只做品质堂食外卖,不靠算法压榨外卖骑手和商家,要 让用户能放心吃。 敦煌网APP在苹果美区应用商店下载排名升至第二,仅次于ChatGPT。4月15日,中国跨境电商应用敦 煌网(DHgate)在美区App Store免费总榜中排名升至第2,仅次于ChatGPT,前一日,敦煌网APP排名 前三。公开数据显示,4月12日敦煌网在App Store和Google Play的下载量达到了3.54万次,比30天平均 下载量增加了56%。其中,美 ...