AI递归自我改进
Search documents
腾讯研究院AI速递 20251217
腾讯研究院· 2025-12-16 16:32
生成式AI 一、苹果首款AI服务器芯片曝光!2027年落地,主攻推理 1. 苹果正开发首款代号"Baltra"的AI服务器芯片,与博通合作开发网络技术,采用台积电3nm工艺,预计2027年部 署; 2. 苹果已放弃自建大模型转而每年支付约10亿美元使用谷歌定制的1.2万亿参数Gemini模型,Baltra主要用于满足庞 大的AI推理需求; 3. 芯片架构将注重时延与吞吐量优化,采用INT8等低精度运算,可能采用64颗芯片互连配合大容量LPDDR内存的方 案。 https://mp.weixin.qq.com/s/7AD8gV0-pWW2tGPNFiyNZQ 二、英伟达推出 Nemotron 3 系列开源模型,推理效率升4倍 1. 英伟达推出Nemotron 3系列开放模型,包含Nano、Super和Ultra三种规模,采用突破性异构混合专家架构; 2. Nemotron 3 Nano吞吐量比上一代高4倍,在大规模多智能体系统中实现领先的每秒生成token数,推理效率显著 提升; 3. 模型通过先进强化学习技术和大规模并行多环境后训练实现卓越准确率,并提供完整的训练数据集和强化学习库。 https://mp.w ...