Workflow
Gemini 3 Pro
icon
Search documents
倒反天罡,Gemini Flash表现超越Pro,“帕累托前沿已经反转了”
3 6 Ke· 2025-12-22 10:12
倒反天罡! Gemini 3 Flash的表现在SWE-Bench Verified测试中获得了78%的分数,比超大杯Pro还略胜一筹。 | Benchmark | Description | | Gemini | Gemini | Gemini | Gemini | | --- | --- | --- | --- | --- | --- | --- | | | | | 3 Flash | 3 Pro | 2.5 Flash | 2.5 Pro | | | | | Thinking | Thinking | Thinking | Thinking | | | | | | $2.00 | | $1.25 | | Input price | | $/1M tokens | $0.50 | $4.00 > | $0.30 | $2.50 > | | | | | | 200k | | 200% | | | | | | tokens | | tokens | | Output price | | $/IM tokens | $3.00 | $12.00 | $2.50 | $10.00 | | | | | | $18. ...
倒反天罡!Gemini Flash表现超越Pro,“帕累托前沿已经反转了”
量子位· 2025-12-22 08:01
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 倒反天罡! 谷歌解释,这是因为Flash版当中的一些优化技术,还未在Pro里应用。 但用网友的话讲,Flash这样的表现的确提醒我们帕累托前沿已经反转,是时候抛却"旗舰版迷信"了。 Gemini 3 Flash的表现在SWE-Bench Verified测试中获得了78%的分数,比超大杯Pro还略胜一筹。 | Benchmark | Description | | Gemini | Gemini | Gemini | Gemini | | --- | --- | --- | --- | --- | --- | --- | | | | | 3 Flash | 3 Pro | 2.5 Flash | 2.5 Pro | | | | | Thinking | Thinking | Thinking | Thinking | | | | | $0.50 | $2.00 | $0.30 | $1.25 | | Input price | | $/1M tokens | | $4.00 > 200k | | $2.50 > 200k | | | | | | toke ...
我愿将免费的Gemini3 Flash,称为谷歌的无解阳谋
虎嗅APP· 2025-12-21 14:34
以下文章来源于差评X.PIN ,作者江江 差评X.PIN . Debug The World,关注科技、数码、汽车、产经、游戏,传播能改变世界的科技互联网信息。 本文来自微信公众号: 差评X.PIN ,编辑:江江&面线,作者:江江 眼瞅着圣诞节就要到了,整个海外科技圈,空气里都充满了包饺子过大年的喜悦。 结果谷歌这家伙不讲武德,愣是不想让大家过个好洋年。 因为他们昨天在没有任何预热的情况下,直接把Gemini3 Flash端上桌了,这次升级距离Gemini3 Pro 发布才过去一个月,离2.5Pro Flash推出也就半年时间。 Gemini还放出话来,这是他们迄今为止最大的升级。 有一说一嗷,自从Gemini2.5Pro推出后,江江日常状态,就已经变成了:GG一下,你就知道。 Gemini3发布后,咱也是肉眼可见地,享受到了模型升级的红利。 但Gemini此前也的确有体验不佳的地方,比如习惯过度思考,明明很简单的问题,也得琢磨个半 天。 针对这个问题,最好的解决方法就是推出Flash。 而谷歌也确实没让我们失望,3 Flash的水平都被吹爆了。 借用一手国内新能源厂商们爱说的一句话,叫做"入门即旗舰、标配就 ...
【国盛计算机】算力&存力依旧
Xin Lang Cai Jing· 2025-12-21 02:42
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 来源:计算机畅想 核心观点 字节火山引擎大会召开,腾讯AI架构调整,互联网大厂AI竞赛白热化。1)FORCE原动力大会上字节宣 布截至今年12月豆包大模型日均tokens使用量已突破50万亿,居中国第一、全球第三。已有超过100家 企业在火山引擎上累计 Tokens 使用量超过一万亿。此前在5月底豆包大模型日均tokens 使用量超过16.4 万亿。原动力大会还发布了豆包大模型1.8、豆包视频生成模型 Seedance 1.5 pro。2)12月17日,腾讯宣 布升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部。OpenAI前研究员姚顺雨出 任"CEO/总裁办公室"首席AI科学家,向腾讯总裁刘炽平汇报。同时兼任AI Infra部、大语言模型部负责 人,向技术工程事业群总裁卢山汇报。姚顺雨在OpenAI深度参与智能体产品Operator、Deep Research等 项目的核心开发工作。腾讯表示此次大模型研发架构升级,在进一步强化腾讯工程化优势同时,旨在提 升AI大模型研究能力,聚焦公司AI战略布局,提升AI ...
Menlo Venture AI 调研:一年增长 3.2 倍,370 亿美元的企业级 AI 支出流向了哪?
海外独角兽· 2025-12-19 10:06
编译:Haozhen、ChatGPT AI 正在成为企业软件史上扩散速度最快的一次技术浪潮。 过去十年,企业软件的竞争优势往往掌握在传统巨头手中,它们拥有成熟的分发渠道、深厚的数据 积累、稳固的客户关系以及强大的销售网络。但在增长最快的 AI 应用领域,竞争格局正在发生逆 转:AI-native 初创公司凭借更高的执行效率和快速迭代能力,正在实现对传统企业的超越。 这份最新的研究报告是 Menlo Ventures 基于对 495 位美国企业的 AI 决策者(包含 C-level 高管、工 程与产品副总裁等)调研的观点洞察,这些数据直观地展示了企业为何购买 AI,钱都花在了哪 里,哪些公司又从中真正受益,以及 LLM 与 AI infra 的竞争格局会如何演进等关键问题。 • 企业级 AI 的市场规模已在两年内从 17 亿美元跃升至 370 亿美元, 较去年的 115 亿美元增长约 3.2 倍, 增长速度超过历史上任何一个软件品类; • 一旦企业开始评估某项 AI 解决方案,47% 的 AI 交易最终会进入生产环境,而传统 SaaS 的这一 比例仅为 25%; • AI 应用和 infra 在 2025 年分 ...
GPT-5.2 翻车内幕曝光:技术团队没走「歪路」,但用户成了大冤种
3 6 Ke· 2025-12-19 09:30
OpenAI 的十周岁生日,过得不太体面。 在当天发布的 GPT-5.2 交出了一份完美答卷:它横扫许多基准测试的 SOTA,在数学和编程等竞赛场景中的表现堪称亮眼,也被官方描述为 AI「超级大 脑」。 可到了社交网络,迎接它的不是掌声,而是用户的集体骂街。 在 X 和 Reddit 上,愤怒与失望几乎写在每一条评论里。人们又一次怀念起那个曾经的「白月光」GPT-4o:有人说 GPT-5.2 变得平淡、乏味、像被磨平了 棱角;也有人讥讽它成了「把成年人当幼儿园小孩对待」的说教。 当舆论的炮火对准 OpenAI 及其 CEO Sam Altman(山姆·奥特曼),一个尖锐的问题摆在面前:为什么模型更「聪明」了,用户反而更不爱了? 更「聪明」的模型,为什么不讨喜了 The Information 今天凌晨的最新报道,扒出了内幕。 过去一年,OpenAI 内部曾奉行一条铁律:每一次模型的代际飞跃,都会伴随着用户量的爆发式增长,因为「变聪明」带来的体验升级是直观的。但现 在,这条铁律失效了。 当然,模型在智能与科研计算领域的提升依旧显著。研究团队耗费数月打磨推理能力,让它能攻克更复杂的数学与科学难题,但对于大多数普通 ...
谷歌版两门「小钢炮」开源,2.7亿参数干翻SOTA
3 6 Ke· 2025-12-19 06:17
Core Insights - Google has made significant advancements in the field of AI with the release of T5Gemma 2 and FunctionGemma, focusing on small models that can operate efficiently on edge devices [1][3][37] Group 1: T5Gemma 2 Overview - T5Gemma 2 is part of the Gemma 3 family and emphasizes architectural efficiency and multimodal capabilities, distinguishing itself from larger models like Gemini [3][4] - The model is available in three sizes: 270M, 1B, and 4B parameters, showcasing its versatility [5] - T5Gemma 2 outperforms corresponding models in the Gemma 3 series across various benchmarks, particularly in code, reasoning, and multilingual tasks [9][11] Group 2: FunctionGemma Overview - FunctionGemma is designed for function calling optimization, allowing it to run on mobile devices and browsers, making it suitable for applications like voice assistants and home automation [7][40] - The model has 270M parameters and is optimized for specific tasks, demonstrating that smaller models can achieve high performance in targeted areas [44][46] - FunctionGemma aims to transition AI from a conversational interface to an active agent capable of executing tasks and interacting with software interfaces [43][56] Group 3: Architectural Innovations - T5Gemma 2 represents a return to the encoder-decoder architecture, which is seen as a modernized revival of classical Transformer models, contrasting with the dominant decoder-only models like GPT [14][30] - The model's architecture allows for better handling of "hallucination" issues and provides inherent advantages in multimodal tasks [32][34] - Google employs a technique called "model adaptation" to efficiently train T5Gemma 2, leveraging existing models to reduce computational costs [36] Group 4: Strategic Implications - The release of these models reflects Google's strategic positioning in the AI landscape, particularly in mobile computing and edge AI, as it seeks to maintain control over the Android ecosystem [52][64] - FunctionGemma's design philosophy aims to democratize AI capabilities across various applications, making advanced functionalities accessible to developers without significant infrastructure costs [64] - By establishing a standard protocol for AI interactions with applications, Google is enhancing its competitive edge in the mobile AI market [57][58]
我愿将免费的Gemini3 Flash,称为谷歌的无解阳谋
3 6 Ke· 2025-12-19 00:41
眼瞅着圣诞节就要到了,整个海外科技圈,空气里都充满了包饺子过大年的喜悦。 结果谷歌这家伙不讲武德,愣是不想让大家过个好洋年。 因为他们昨天在没有任何预热的情况下,直接把Gemini3 Flash 端上桌了,这次升级距离 Gemini3 Pro 发布才过去一个月,离2.5Pro Flash推出也就半年时 间。 Gemini还放出话来,这是他们迄今为止最大的升级。 有一说一嗷,自从Gemini2.5Pro推出后,江江日常状态,就已经变成了:GG一下,你就知道。 Gemini3发布后,咱也是肉眼可见地,享受到了模型升级的红利。 但Gemini此前也的确有体验不佳的地方,比如习惯过度思考,明明很简单的问题,也得琢磨个半天。 针对这个问题,最好的解决方法就是推出Flash。 而谷歌也确实没让我们失望,3 Flash的水平都被吹爆了。 借用一手国内新能源厂商们爱说的一句话,叫做"入门即旗舰、标配就是别家的满配"。 以前我们对 Flash 系列的印象是啥? 快、便宜,但是脑子不太好使,处理个长文档总结还行,真要让它写复杂代码或者搞逻辑推理,它能给你胡编乱造到怀疑人生。 但这次 Gemini 3 Flash,Google 居 ...
纳指高开1.4%,美光绩后大涨近13%
Ge Long Hui· 2025-12-18 14:44
美国11月核心CPI年率意外回落,同比增长2.6%,为2021年初以来最低增速。利率期货市场预计明年美 联储将降息62个基点。美股三大指数集体高开,纳指涨1.4%,标普500指数涨0.95%,道指涨0.63%。 美光大涨近13%,Q1业绩与指引双双"爆表",CEO称DRAM供应短缺将持续至2026年后。 谷歌涨1.8%,此前发布旗舰模型的低成本版本Gemini 3 Flash,推理能力接近Gemini 3 Pro。 特斯拉涨3.1%,摩根士丹利预期Robotaxi车队2026年有望增至1000辆。 亚马逊涨2.3%,公司重组人工智能部门,云业务高级副总裁Peter DeSantis将任负责人。 (格隆汇) ...
甲骨文股价已下跌超45%谷歌与OpenAI大模型竞争日趋白热化
Xin Lang Cai Jing· 2025-12-18 14:44
【#甲骨文股价已下跌超45%##谷歌与OpenAI大模型竞争日趋白热化#】当地时间17日,美国甲骨文公 司一项100亿美元的数据中心项目遭主要出资方蓝猫头鹰撤资。受此影响,其股价隔夜跌约5.4%,自9 月历史高点以来累计跌幅超45%。这一动态引发市场对AI热潮的谨慎情绪,隔夜美股科技板块承压,英 伟达跌3.8%、谷歌母公司Alphabet跌3.2%、博通跌4.5%。同日,谷歌官宣推出新模型Gemini 3 Flash, 主打高效低成本,不过这距上一模型Gemini 3 Pro发布仅一月,凸显谷歌与OpenAI的大模型竞争日趋白 热化。(央视财经) 来源:@华夏时报微博 ...