Workflow
全球闲置算力训个模型,性能媲美R1,老黄天塌了!Karpathy曾投资它
量子位·2025-05-13 04:45

白交 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 一夜之间,老黄天塌了(doge)。 全球首个分布式RL训练模型 INTELLECT-2 发布,它仅通过整合全球闲置或分散的计算资源,就完成了模型的强化学习训练,训练成本大大 降低。 其模型性能与DeepSeek-R1媲美! 一旦范式成立,这也就意味RL训练摆脱了对集中式算力的依赖,世界上任何一个人都可以参与到模型训练当中,大公司垄断算力时代可能就 此终结。 Just like this~算力来算力来,算力从四面八方来。 此模型版本有19个人/机构提供了算力资源支持(源自模型回答,还包括它自己) 除了贡献算力,还有不少大佬愿意投钱,包括不限于Karpathy大神、FlashAttention作者Tri Dao大神、HuggingFace联创兼CEO Clem Delangue等等。 据团队成员介绍,他们从编写模型强化学习框架 prime-rl ,到今天发布大概 只用了两个月时间 。 目前基础设施已到位,并且经过验证,超过那些先进实验室只是时间问题。 (比如OpenAI?) 有人已经开始断言:未来的顶级开源模型将以分布式方式进行训练。 INTELLEC ...