Workflow
Seed Prover 1.5
icon
Search documents
字节Seed发布最强数学模型:一招“打草稿”,IMO银牌变金牌
量子位· 2025-12-25 06:08
鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 字节最新数学推理专用模型,刚刚刷新战绩:拿下IMO金牌成绩。 Scaling Law 加持下,这个名为 Seed Prover 1.5 的模型,在16.5小时内,顺利解决IMO 2025的前5道题目,在仅失一题的情况下拿到35 分,达到今年IMO的金牌线。 这一成绩与7月官方认证的IMO金牌"选手"谷歌Gemini打平。而字节自己的前代模型,当时的成绩是3天完成了6道题目中的4道,以及一道题 的部分证明,达到银牌成绩。 同时,Seed Prover 1.5也在北美本科级别数学竞赛Putnam这一基准上,大幅刷新了SOTA成绩。 模型尚未开源,但技术报告已经公开。 值得关注的是,Seed Prover 1.5强调了大规模强化学习给数学模型带来的性能提升,也证明,在推理阶段增加计算资源,可以显著提高解题 率。 即,验证了测试时Scaling和强化学习训练时的Scaling的有效性。 Seed Prover 1.5为了平衡两种方法的优缺点,提出了一种全新的Agentic Prover架构: 模型将Lean语言视为一种工具,且在证明过程中可以自主地调用其他多种工具 ...
8点1氪:官方回应吸毒记录封存相关问题;强生爽身粉致癌案判赔女子约110亿元;俞敏洪敲定东方甄选接班人
36氪· 2025-12-25 00:26
法工委有关负责人从五个方面就"治安管理处罚法第136条规定"相关问题作出了说明和回应。 整理 |爆浆豆腐 点击上方【36氪随声听】,一键收听大公司热门新闻。听完音频记得添加进入 【我的小程序】 中哟! 官方回应"吸毒 记录封存""哪位少爷吸了"等相关问题 修订后的治安管理处罚法将于2026年1月1日起施行。近期,一些网络媒体、网友等对治安管理处罚法第136条规定比较关注,提出了一些疑问。就 此,记者联系全国人大常委会法制工作委员会发言人办公室,希望法工委对网络舆情反映的一些关切和问题给予必要说明。法工委有关负责人从以 下五个方面作出了说明和回应。 一、关于治安管理处罚法修订草案审议和第136条规定形成的有关情况 2023年8月,十四届全国人大常委会第五次会议对治安管理处罚法修订草案进行初次审 议。2024年6月,十四届全国人大常委会第十次会议对治安管理处罚法修订草案进行第二 次审议。两次将修订草案通过中国人大网向社会公开征求公众意见。在二审稿中,关于治 安违法记录封存的规定适用于未成年人,包括未成年人各类治安违法行为。 2025年6月,十四届全国人大常委会第十六次会议对治安管理处罚法修订草案进行第三次 影石十 ...
字节推出形式化数学推理专用模型Seed Prover 1.5;雷军介绍小米开源推理模型MiMo-V2-Flash丨AIGC日报
创业邦· 2025-12-25 00:12
1.【全球首款具备视觉感知能力的主动式AI耳机发布】12月24日消息,光帆科技推出全球首款具备视 觉感知能力的主动式AI耳机。据悉,光帆Lightwear AI全感穿戴设备由开放式耳挂AI耳机与智能手 表协同构成,希望成为AI时代的"个人助理",实现日程管理、机酒预定、打车出行、餐厅推荐等工作 生活场景中高频任务的自主处理。该设备将于明年第一季度正式上市,目前已开放预约,并计划于1 月中旬启动用户公测计划。光帆科技成立于2024年10月,已经连续完成多轮融资,投资方包括韶 音、歌尔、联想、宁德、兆易创新等。(科创板日报) 2.【雷军介绍小米开源推理模型MiMo-V2-Flash】12月24日上午,小米创办人、董事长兼CEO@雷 军在微博援引@小米技术的文章,介绍小米自研开源模型,雷军表示:"MiMo-V2-Flash是小米专为 极致推理效率自研的总参数309B(激活15B) MoE模型,通过引入Hybrid注意力架构创新及多层 MTP推理加速,在多个Agent测评基准上排在全球开源模型前二。"(新浪财经) 扫码可订阅产业日报 欢迎加入 睿兽分析会员 ,解锁 AI、汽车、智能制造 等相关 行业日报、图谱和报告 ...
俞敏洪确定东方甄选接班人,19年老将孙进担任;英伟达放风春节前向中国客户交付H200;造谣“B站全面付费观看”之人被行拘丨邦早报
创业邦· 2025-12-25 00:12
完整早报音频,请点击标题下方小耳机收听 【消息称俞敏洪选定东方甄选接班人,官方回应:情况属实】 据媒体消息,东方甄选迎来新任掌舵人,新东方教育 科技集团副总裁、广州学校校长孙进将担任执行总裁,预计近期将发布公告。对此消息,东方甄选官方回应称,情 况属实。公开信息显示,孙进是新东方教育科技集团副总裁、广州学校校长, 2006 年加入新东方,深耕出国考试 培训与学校管理,教学与运营经验丰富。(新浪科技) 【中兴通讯相关人士:目前已收到部分大模型厂合作邀约】 近期,搭载深度 AI 功能的"豆包手机"引发市场关注。 谈及选择与字节跳动合作 AI 手机的原因,中兴通讯相关人士表示,双方均将 AI 手机视为确定的未来趋势,并共同 认同"开放是促成创新的关键"。在当前行业创新节奏放缓的背景下,中兴希望携手顶尖 AI 厂商,实现" 1+1>2 "的 协同效应,加速推出具有变革意义的产品。被问及是否接触其他大模型厂商时,中兴通讯相关人士表示,公司秉 持"开放即创新"的理念,这也是其" AIforAll "战略的核心。目前已收到部分合作邀约,相关沟通正在推进。这意味 着与字节跳动的合作可能只是一个开端,中兴正逐步构建更加开放的 ...
8点1氪|官方回应吸毒记录封存相关问题;强生爽身粉致癌案判赔女子约110亿元;俞敏洪敲定东方甄选接班人
3 6 Ke· 2025-12-24 23:57
今日热点导览 TOP3大新闻 官方回应"吸毒记录封存""哪位少爷吸了"等相关问题 修订后的治安管理处罚法将于2026年1月1日起施行。近期,一些网络媒体、网友等对治安管理处罚法第 136条规定比较关注,提出了一些疑问。就此,记者联系全国人大常委会法制工作委员会发言人办公 室,希望法工委对网络舆情反映的一些关切和问题给予必要说明。法工委有关负责人从以下五个方面作 出了说明和回应。 一、关于治安管理处罚法修订草案审议和第136条规定形成的有关情况 2023年8月,十四届全国人大常委会第五次会议对治安管理处罚法修订草案进行初次审议。2024年6月, 十四届全国人大常委会第十次会议对治安管理处罚法修订草案进行第二次审议。两次将修订草案通过中 国人大网向社会公开征求公众意见。在二审稿中,关于治安违法记录封存的规定适用于未成年人,包括 未成年人各类治安违法行为。 治安管理处罚法适用的各类违法行为,均属于不构成犯罪、应予治安管理处罚的行为,治安管理处罚法 第3条对此作出了基本规定。凡属于构成犯罪的行为,一律依照刑法规定追究行为人刑事责任。在执法 司法活动中,如果将构成犯罪、应予追究刑事责任的行为作为治安违法行为,适用治安管 ...
腾讯研究院AI速递 20251225
腾讯研究院· 2025-12-24 16:01
Group 1: Generative AI Developments - Anthropic has officially open-sourced the Skills project on GitHub, which includes 16 production-grade skill libraries covering document processing, creative design, and development technologies [1] - The Skills project features a skill-creator meta-skill that helps users create new skills, significantly lowering the customization barrier [1] - ByteDance's Seed team launched Seed Prover 1.5, achieving a score of 35/42 in the IMO 2025 top problems within 16.5 hours, utilizing a new Agentic Prover architecture [2] Group 2: Voice Interaction Models - Tongyi Bailing has open-sourced the Fun-Audio-Chat-8B voice interaction model, achieving state-of-the-art results in multiple authoritative benchmarks [3] - The model employs an innovative dual-resolution end-to-end design, reducing audio frame rates to the industry's lowest at 5Hz, saving nearly 50% GPU computation [3] - Fun-Audio-Chat-8B demonstrates excellent empathetic dialogue capabilities, automatically sensing user emotions without the need for emotional labels [3] Group 3: AI in Social Interaction - Second Me 1.1 has transformed the dialogue framework, allowing AI to proactively deliver content based on context and emotional temperature [4] - The platform utilizes a unique identity modeling approach, enabling users to leverage real identity information for content creation [4] - The upgrade from "social graph" to "context graph" enhances privacy through strict memory boundary delineation [4] Group 4: Robotics and AI Integration - Vbot's super-powered robotic dog achieved over 1,000 orders within 52 minutes of its launch, setting a record for high-end intelligent products [5][6] - The robot features 128 TOPS edge AI computing power, which is more than three times that of mainstream competitors, and supports 240W fast charging [6] - Priced at 9,988 yuan, Vbot aims to redefine consumer-grade embodied intelligence standards [6] Group 5: AI Perspectives and Future Trends - Turing Award winner Bengio argues that cognitive jobs are more susceptible to AI replacement, emphasizing the need for AI safety investments [7] - Google’s annual summary, led by Jeff Dean and Hassabis, predicts 2025 as a pivotal year for AI agents and scientific discovery, with Gemini 3 Pro leading benchmark tests [8] - Notion's CEO envisions AI as a transformative force in the knowledge economy, enhancing productivity significantly [9] Group 6: AI Growth and Market Insights - Epoch AI's year-end report indicates a significant acceleration in AI capabilities since April 2024, with reasoning models and reinforcement learning gaining prominence [10] - Key insights include a tenfold decrease in LLM reasoning costs and a rapid doubling of Nvidia chip computing power every ten months [10][11] - The report suggests that the greatest value of AI may come from widespread automation in economic systems rather than accelerated research [11]
字节跳动推出新一代形式化数学推理专用模型 Seed Prover 1.5
Bei Jing Shang Bao· 2025-12-24 08:20
北京商报讯(记者 陶凤 王天逸)12月24日,字节跳动 Seed 团队宣布,近日推出新一代形式化数学推理 专用模型 Seed Prover 1.5 ,通过大规模的 Agentic RL 训练,其推理能力和推理效率取得显著进步。 相比上一代模型,Seed Prover 1.5 在 16.5 小时内,针对 IMO 2025 的前 5 道题目生成了完整可编译验证 的 Lean 证明代码,换算成绩为 35/42,达到此前 IMO 评分标准的金牌分数线。 ...
字节跳动Seed团队推出形式化数学推理专用模型Seed Prover 1.5
智通财经网· 2025-12-24 06:16
针对北美本科级别数学竞赛Putnam,Seed Prover 1.5用时9小时,对12道Putnam 2025赛题中的11道生成 了可编译验证的Lean代码。 智通财经APP获悉,12月24日,字节跳动Seed团队宣布推出形式化数学推理专用模型Seed Prover 1.5。 通过大规模的Agentic RL训练,其推理能力和推理效率宣称取得显著进步。 据介绍,相比上一代模型,Seed Prover 1.5在16.5小时内,针对IMO 2025的前5道题目生成了完整可编译 验证的Lean证明代码,换算成绩为35/42,达到此前IMO评分标准的金牌分数线。 更系统的评估中,Seed Prover 1.5在完整的Putnam历史评估集上解决了88%的问题,在代表硕士数学难 度的Fate-H和代表博士生数学难度的Fate-X评估集上,分别解决了80%和33%的问题,刷新了形式化数 学推理模型在这几个评测集上的SOTA表现。 Seed Prover 1.5的技术报告已对外公开,后续将开放API,邀请感兴趣的数学和AI研究者体验该模型。 ...
字节推出形式化数学推理专用模型Seed Prover 1.5,AI人工智能ETF(512930)红盘向上
Xin Lang Cai Jing· 2025-12-24 05:26
截至2025年12月24日 13:01,中证人工智能主题指数(930713)上涨0.03%,成分股北京君正(300223)上涨 11.33%,深桑达A(000032)上涨6.38%,德赛西威(002920)上涨2.84%,浪潮信息(000977)上涨2.45%,中 科星图(688568)上涨2.31%。AI人工智能ETF(512930)上涨0.09%, 冲击4连涨。最新价报2.16元。 消息面上,字节跳动Seed团队宣布推出形式化数学推理专用模型Seed Prover 1.5。据介绍,相比上一代 模型,Seed Prover 1.5在16.5小时内,针对IMO 2025的前5道题目生成了完整可编译验证的Lean证明代 码,换算成绩为35/42,达到此前IMO评分标准的金牌分数线。Seed Prover 1.5的技术报告已对外公开, 后续将开放API,邀请感兴趣的数学和AI研究者体验该模型。 AI大模型商业化进程持续推进,降本成为关键路径。长江证券认为,谷歌发布Gemini 3.0 Flash版本,旨 在以更低的成本提供前沿智能水平,反映出当前AI行业已从技术验证转向商业化落地阶段,而成本控 制成为影响用户采纳 ...
达到金牌分数线:字节跳动推出新一代数学推理专用模型Seed Prover 1.5
Feng Huang Wang· 2025-12-24 04:34
凤凰网科技讯 12月24日,字节跳动Seed团队近日推出新一代形式化数学推理模型Seed Prover 1.5。该模 型基于大规模智能体强化学习训练,在数学竞赛题的形式化证明能力上有所提升。 团队表示,当前模型仍主要面向"规则清晰、背景封闭"的竞赛题目,与前沿数学研究所需的长链条、文 献依赖推理尚有距离。技术报告已公开,后续将开放API供研究者体验。 据官方信息,该模型在IMO 2025的前5道题目上,于16.5小时内生成了完整可编译验证的Lean证明代 码,换算成绩达到此前金牌分数线。在Putnam 2025的12道赛题中,其用时9小时对其中11道生成了可验 证代码。在Putnam历史评估集上,该模型解决了88%的问题。 ...