海外AI专家大模型近况更新
2025-02-12 08:30

更多资料加入知识星球:水木调研纪要 关注公众号:水木纪要 海外 AI 专家大模型近况更新 E报数据加V:shuinu9870 # 报 # ] : shuinu9870 # 1 播要 强化学习正缩小开源与闭源模型差距,因其起步较晚,追赶速度更快。预 ������������������������������������������������ 等开源模型与 OpenAI 仍有差距,但强化学习领域差距仅一两个月,未来竞 8 7 争将聚焦算力和研发能力。 预训练环节增加算力堆叠仍能提升性能,但强化学习投入回报更高。预训 练花费一亿美元不如强化学习花费五百万美元。Meta 和 Google 持续改进 预训练技术,但提升幅度减缓,促使资源更多投向强化学习应用开发。 • 强化学习前景广阔,推理芯片需求将显著增长,因推理采样可使用自研芯 片、ASIC 芯片或 TPU 等专用卡,降低对 GPU 的需求。英伟达也在开发新型 推理卡,全球一致认为强化学习市场空间巨大。 头部大厂愿为性能微小提升投入巨资进行预训练,即使成本显著增加。中 小型模型参数增加虽推理成本差距不大,但效果提升显著。这些改进可用 于合成数据或内部蒸馏,进一步 ...