ROCK
Search documents
3A大作!阿里ROLL团队从基建->算法->机理,推动RL4LLM全栈协同优化
机器之心· 2025-11-10 04:40
开源地址: https://github.com/alibaba/ROLL 接下来详细了解一下「3A」协同优化框架是如何推动(RL4LLM)迈向新范式的。 机器之心发布 机器之心编辑部 近期, 阿里巴巴 ROLL 团队(淘天未来生活实验室与阿里巴巴智能引擎团队)联合上海交通大学、香港科技大学推出「3A」协同优化框架 ——Async 架构 (Asynchronous Training)、Asymmetric PPO(AsyPPO)与 Attention 机制(Attention-based Reasoning Rhythm),「3A」彼此间并非孤立的技术堆砌,而是深度耦 合,致力于共同推动「强化学习用于大语言模型(RL4LLM)」迈向高效、精细与可解释的新范式。 具体来看, ROLL Flash 以解耦为核心,通过「细粒度并行」与「采样 - 训练解耦」两大原则, 将生成、环境交互、奖励计算与模型训练彻底流水线化,实现全 链路异步执行,显著提升 GPU 利用率,同时通过「异步比」机制保障训练稳定性,集成主流 Off-policy 算法等,使得异步训练效果能与同步训练相媲美。 算法架构层面, AsyPPO 首次系统 ...
X @mert | helius.dev
mert | helius.dev· 2025-10-31 17:51
Cryptocurrency Bridge - A second ZEC to SOL bridge has launched on the Solana blockchain [1] - The bridge aims to provide incentives, airdrops, and Solana DeFi composability [1] Token & Platform - ZEC is the asset being bridged, and Solana serves as the infrastructure [1] - Zenrock and Orca are bringing Zcash to Solana with zenZEC, a decentralized wrapped Zcash [1] Incentives & Rewards - Users can deposit ZEC, mint 1:1 zenZEC on Solana, and earn $ROCK & $ORCA rewards [1]
X @Starknet
Starknet 🐺🐱· 2025-09-03 07:11
Project Overview - StarkRocks 项目鼓励用户持有 ROCK 代币,并在 Fibrous 平台上进行交易 [1] - 该项目在 Starknet 上运行,提供 0% 的服务费 [1] User Engagement - 鼓励用户通过参与 StarkRocks 项目提升在 Starknet 上的排名 [1]