海外AI专家大模型近况更新

更多资料加入知识星球:水木调研纪要关注公众号:水木纪要海外 AI 专家大模型近况更新 E报数据加V：shuinu9870 # 报 # ] : shuinu9870 # 1 播要强化学习正缩小开源与闭源模型差距,因其起步较晚,追赶速度更快。预 �� 等开源模型与 OpenAI 仍有差距,但强化学习领域差距仅一两个月,未来竞 8 7 争将聚焦算力和研发能力。预训练环节增加算力堆叠仍能提升性能,但强化学习投入回报更高。预训练花费一亿美元不如强化学习花费五百万美元。Meta 和 Google 持续改进预训练技术,但提升幅度减缓,促使资源更多投向强化学习应用开发。 • 强化学习前景广阔,推理芯片需求将显著增长,因推理采样可使用自研芯片、ASIC 芯片或 TPU 等专用卡,降低对 GPU 的需求。英伟达也在开发新型推理卡，全球一致认为强化学习市场空间巨大。头部大厂愿为性能微小提升投入巨资进行预训练,即使成本显著增加。中小型模型参数增加虽推理成本差距不大,但效果提升显著。这些改进可用于合成数据或内部蒸馏,进一步 ...