Workflow
AI前线
icon
Search documents
豆包 1.8 多模态超越谷歌Gemini 3!字节祭出“推理代工”,要做模型届的英特尔?
AI前线· 2025-12-18 07:24
运行效率方面,豆包 1.8 的 TPM(每分钟处理 Token 数)达到了 5000k,而 RPM(每分钟请求数)为 30k。 谭待表示,这些能力让豆包 1.8 在 AIME 2025 等 Agent 评测集上稳步提升,在通用智能体测评 Benchmark 上取得全球领先成绩;在多模态理解 方面,于视觉判断准确性、空间理解、文档解析、视频运动识别等多项能力上超越 Gemini 3,在其他任务上也都处于全球第一梯队水平。 | | | | | 豆包大模型1.8 | | | | | | --- | --- | --- | --- | --- | --- | --- | --- | --- | | | | | | | | | | Qwen3-235b-a22b- | | | 紹力推度 | 测浮集 | GPT-5 High | Claude-Sonnet-4.5 | Gemini-3-pro | Doubao Seed-1.8 | Doubao Seed-1.6-1015-high | thinking | | | 数学 | AIME-25 | 94.6 | 87.0 | 95.0 | 94.3 | 85.0 | 87 ...
8 个月 50 亿产值,非程序员用秒哒赚疯了?秒哒如何解决后端难、token 贵、屎山烦
AI前线· 2025-12-18 00:40
作者 | 褚杏娟 "行业现在最有价值的一桶金就在 AI Coding。"秒哒产品负责人朱广翔直言。 这款发布仅 8 个月的无代码工具,已在全球范围内被广泛使用,生成的应用累计服务超 1000 万人, 日均近 10 万人用其解决问题,在变现工具、业务软件、AI 应用三大场景中累积创造超 50 亿元产 值。 朱广翔指出,Coding 贯穿研产供销服全链路,是核心生产力环节,能创造全新需求价值。而当前行 业格局清晰:Chatbot 领域已卷至瓶颈,各家差异甚微,但 AI Coding 赛道的技术差距依然显著,正 是破局关键。而秒哒的底气,源于其长期构建的技术体系:需求、代码、UI 三大模型构成的自我进 化数据飞轮,叠加海量优质数据资产,更依托百度智能云的全栈 AI 能力,获得 Agentic 数据库、高 性能沙盒与海量云工具的强力支撑。 从"模糊想法"到"清晰需求" 数据显示,81% 的秒哒用户为非程序员用户,主要集中在职场人群与高校群体。对非技术人员来 说,有时候很难清晰表达自己在构建应用时的复杂需求。对此,秒哒团队进行了专门思考与设计,并 由此形成了与国内外同类 Vibe Coding 产品的显著差异。 不同于 ...
刚刚,谷歌祭出迄今最前沿模型 Gemini 3 Flash!编程能力上反超 Gemini 3 Pro,且更快更便宜
AI前线· 2025-12-17 18:16
作者 | 冬梅 在大模型竞赛进入"效率与规模并重"的新阶段之际,谷歌正再次亮出王牌。 果然,今晚谷歌 Gemini 3 Flash 模型如约而至。 谷歌发布其迄今最快 AI 模型 过去一年,从 Gemini 1.5 到 3.0,谷歌持续强化其在多模态、长上下文和推理能力上的技术纵深,同时也在不断压低模型调用成本,试图在企业级应用 和开发者生态中建立更具性价比的护城河。在这一背景下,主打高性能与低延迟的 Flash 系列被视为 Gemini 体系中最贴近真实业务场景的一条产品 线。 随着外界对"更快、更便宜、更易部署"的模型呼声不断升高,谷歌今晚发布的 Gemini Flash 3,也被普遍认为是其在推理效率和规模化落地层面的一次 关键落子。 谷歌称,从今天起,Gemini 3 Flash 将面向全球数百万用户推出: 那么,这款模型性能到底怎样呢? 刚刚,谷歌发布最新模型 Gemini 3 Flash,据介绍,它拥有前沿智能,专为速度而生,可以帮助每个人更快地学习、构建和规划任何事物。 早在模型发布前,Google AI Studio 开发者平台 和 Gemini API 产品负责人 Logan Kilpatr ...
分享个好消息!| 极客时间
AI前线· 2025-12-17 18:16
前几天,今年软考考试出成绩了,我报的「系统架构设计师」成绩还不错~ 话说回来,现在报名软考的程序员越来越多了,为此政策都发生了重大调整:程序员爱报考的 「系统分析师」和「系统架构设计师」由一年考一次 改成一年考两次;系分跟系规都发生了重大 改版 。 | 考试日期 | 级别 资格名称 考务要求 | | --- | --- | | | 系统分析师 | | | 系统架构设计师 高级 | | | 系分辨和时要构 E 31 | | | 在春亚洲球队或在两次 | | 考试日期 | 级别 | 资格名称 | 考务要求 | | --- | --- | --- | --- | | | | 系统分析师 | | | | | 系统架构设计师 | | | | 高级 | | | | | | 网络规划设计师 | | 软考全称计算机技术与软件专业技术资格(水平)考试,是计算机领域唯一一个国家级证书,私 企、企事业单位都非常认可,招聘时是大大的加分项。 并且,证书不限制报名门槛,一经考取,永久有效,全国范围内通用。 然而,想考取软考证书,可没有那么容易。官方教材上千页,怎么看?教材已改版,哪里搞最新 重难点?真题年年有,答题有没有套路…… 正好 ...
模力工场 024 周 AI 应用榜:从“能力秀场”到“角色战场”,AI 价值锚点已迁移
AI前线· 2025-12-17 08:00
Core Insights - The article highlights the evolution of AI applications from showcasing capabilities to becoming integral roles in daily life and work, emphasizing the shift towards practical utility and reliability [4][10]. Event Announcements - An important AI ecosystem event titled "AI Shining in China" will take place on December 28, 2025, in Xiamen, where the annual "AI Application Ecosystem Research" results will be revealed [1]. - The first AI hardware exhibition of the year will be held from January 8 to 11, 2026, in Shenzhen, featuring over 76 categories, 200 exhibitors, and 1000 cutting-edge products [3]. AI Application Trends - The latest AI application rankings reveal three main trends: the specialization of productivity tools, the industrial leap in design tools, and the rise of AI in everyday life and education [4][10]. - AI applications are increasingly focusing on delivering specific outcomes rather than emphasizing technical specifications, with tools becoming more integrated into existing workflows [10]. Featured Applications - Notable applications include Youdao Translation AI Writing, which integrates translation and writing processes, and a gamified homework assistant for children that transforms assignments into engaging activities [6][7][8]. - Other applications mentioned are SocialEcho for managing multiple overseas social media accounts, and tools like Chuangkit and Gaoding AI that focus on design and content production [7]. Application Ranking Mechanism - The ranking of AI applications is based on community feedback, with core metrics including comment counts, collections, and recommendations from registered users [10][11].
罗福莉执掌小米大模型首秀!定调下一代模型,全新MiMo-V2开源还横扫Agent第一梯队
AI前线· 2025-12-17 08:00
作者 | 木子 MiMo-V2-Flash,是小米在今天凌晨发的 新一代 MiMo 模型,而且还给开源了 。 今天上午,在 2025 小米人车家全生态合作伙伴大会上, 罗福莉首次公开亮相 ,Title 是 Xiaomi MiMo 大模型负责人 。 罗福莉还在会上发表演讲,解读了小米的全新大模型 MiMo-V2-Flash 以及背后团队的故事。 这里简单回顾下 MiMo 模型是什么:它是小米自研的大语言模型(LLM)系列;而 MiMo-V2-Flash 不仅 在通用基准测试中和 DeepSeek-V3.2 相当 , 同时 还拉爆性价比,对 Agent 场景友好。 "这只是我们在 AGI 路线图上的第二步。" MiMo-V2-Flash 采用了当前很流行但工程难度也很高的 MoE(混合专家)架构 ,其 总参数规模达 3090 亿 ,但在每次推理时, 真正被"点亮"的只有约 150 亿参数。 此外,它还搭载了 多词元预测(MTP)技术 ,专为高速推理和 Agent 工作流程而设计。与很多追求"参数越大越好"的模型不同,MiMo-V2-Flash 的设 计目标可谓是:"要跑得快、跑得久、被高频调用也跑得起"。 不过在 ...
政企研联手发力!N 个实战案例!企业数智化转型的石景山企业专属方案重磅登场 | Q推荐
AI前线· 2025-12-17 01:39
编辑 | 王玮 当人工智能从概念走向实践,企业最关心的问题正在发生变化。不再只是"要不要用 AI",而是"如何 真正用起来""如何在组织中持续发挥价值"。在这一背景下,城市、产业与平台如何协同发力,成为推 动 AI 规模化落地的重要一环。 为深入贯彻落实国家数字经济发展战略,加快推动企业数智化转型与人工智能技术深度融合, 全球 人工智能开发与应用大会暨石景山数智化转型峰会(AICon 北京站)将于 2025 年 12 月 19 日至 20 日在北京石景山万达嘉华酒店举行。 本次大会由北京市石景山区经济和信息化局指导,北京石景山 产业发展有限公司主办,飞书与极客邦联合承办,围绕企业数智化转型与 AI 实战落地展开系统呈 现。 大会将围绕"企业数智化转型"与"AI 落地实践"两大核心方向,在两天内集中呈现 1 场项目启动会、1 场全国性 AI 数字化论坛和 1 场人工智能行业峰会,形成从政策发布、趋势研判到实战路径的完整闭 环,全面服务企业管理者与技术决策者的现实需求。 政策直达,项目启动释放明确信号 通过来自一线企业和平台的案例分享,峰会将呈现 AI 在业务流程、项目管理、组织协同等方面的实 际应用方式,帮助企 ...
国产GPU赛道又跑出一个 2700 亿独角兽!“中国AMD”沐曦股份完成IPO,开盘大涨超 500%
AI前线· 2025-12-17 01:39
作者|冬梅 继摩尔线程 2025 年 12 月 5 日登陆科创板,并在首日经历股价暴涨之后,国产 GPU 行业迎来第二位重量级选手——沐曦集成电路(上海)股份有限公 司(以下简称"沐曦")。 刚刚,沐曦正式登陆科创板,股票代码688802,截至发稿前,沐曦股价达到679元/股,估值破 2700 亿元。 | | | N沐慶-UO | | | | ■ 电脑版 U | | | --- | --- | --- | --- | --- | --- | --- | --- | | | | 688802 科创板 融 注 成 | | | | | | | 679.00 | 今开 | 700.00 最高 | | | 700.00 最低 | | 650.00 | | 548.77% | 574 34 125 | 16.60% 总手 | | | 3.01万 金额 | | 20.50亿 | | 总值 | 2716.68亿 流值 | 123.16亿 市盈 | 动 | C | -589.72 | | 重多 | | 关时 | 王日 | 日K | 周K | | 月K | 分钟 ▲ | | | 700.00 | | | 568.83% | 菱5 ...
Codex负责人打脸Cursor CEO“规范驱动开发论”!18天造Sora爆款,靠智能体24小时不停跑,曝OpenAI狂飙内幕
AI前线· 2025-12-16 09:40
自 8 月 GPT-5 发布以来, Codex 展现出惊人的爆发力, 用户增长 20 倍 ,每周处理数万亿 tokens,成为了 Open AI 最受欢 迎的编程智能体。 "Codex 能快速实现 20 倍 的增长,不只是因为模型变强了,还因为我们理解了,真正的智能体不是一个模型,而是模型、 API 和框架共同努力的结果。" 在最新播客中,OpenAI 的编程智能体 Codex 产品负责人 Alexander Embiricos 揭露背后的秘 密。 比如,Codex 在长时任务能力上的突破。为了让它能够连续工作十几个小时甚至数天,团队设计了名为"压缩"的机制——模型 负责提炼关键信息,API 承接任务链路,框架负责稳定运行。三层像齿轮般咬合,使 Codex 能够完成传统大模型难以支撑的 长时编程任务。 正是这样的底层逻辑,让 Codex 在业务实战中有惊人表现。 作者 | 高允毅 Andrej Karpathy 曾公开分享,他被一个 bug 困住数小时,最终交给 Codex 处理,一小时内就完成了修复。 Sora 团队更是依靠 Codex,在短短 28 天时间,从 0 到 1 完成 Android 应用的上线 ...
别吹了,智能体Demo能跑通和能上线,是两码事!| 极客时间
AI前线· 2025-12-16 09:40
然而,下一波真正的浪潮已经涌现:智能体(Agent)时代。这里的"智能体",不是简单的聊天机器 人。它指的是 以大型语言模型为认知引擎,具备自主决策、目标导向和环境交互能力的 AI 系统。 从 ChatGPT 到 Claude,从文心一言到 DeepSeek,我们已习惯与各种 Copilot 协作。它们能力惊 人,但本质仍是 被动响应 的工具——我们发出指令,它们返回结果。 "我看到很多开发者卡在'只会调 API'的层面,这非常可惜。AI 智能体的底层,是一套精密的 系统工程。掌握它,意味着你能从'工具的使用者'转变为'智能系统的创造者'。这不仅是技能 的提升,更是思维模式的跃迁。" 想象一下: 这就是 Agentic AI ——未来最炙手可热的技术方向,也是拉开下一代 AI 应用差距的关键。 热潮之下,开发者真正的 挑战是什么? 智能体开发就像一座冰山。水面之上,是大家熟悉的"调 API、写 Prompt";水面之下,才是真正的 复杂性所在: 这些,才是考验开发者能否将炫酷概念转化为真实价值的核心能力。面对这片充满机遇但略显复杂的 海域,一位资深的技术"引路人"—— 王延飞老师 ,分享了他的观察。 作为一位 ...