打造全球首个强化学习云平台,九章云极是如何做到的?
机器之心·2025-07-16 04:21
机器之心报道 编辑:Panda 然而,相比于预训练大模型,目前通常用于后训练大模型的强化学习存在自己独有的困难:不仅需要高频的数据交互和环境反馈,还要求大规模算力集群具备稳 定、弹性的调度能力。而传统的云计算平台,大多仍以静态推理负载为主,难以适配强化学习训练中动态多阶段、资源高耦合的运行特性。 这一背景下,谁能率先打造出真正适配强化学习的大规模智能计算平台,谁就有机会在新一轮的 AI 基础设施竞争中占据高地。2025 年 6 月,九章云极正式发布 业界首个工业级强化学习云平台 AgentiCTRL ,这也是 全球首个支持万卡级异构算力调度的强化学习基础设施平台 。 AgentiCTRL 基于混合专家(MoE)架构,仅需极少代码即可完成 AI 智能体的训推流程,从而显著增强大模型推理能力。相比于传统强化学习方案,AgentiCTRL 可将端到端训练效率提升 500%,综合成本下降 60%。 在这个云服务纷纷向「 AI 云原生 」转型的时代,九章云极率先跑通了强化学习大规模云化的全链路路径,可以说是为更进一步的「 智能体原生云 」树立了行业 新范式。 为什么是九章云极? 领先源自系统级重构 本质上讲, 强化学习 ...