Model-Computing Power Collaboration
Search documents
阶跃星辰发布开源基座模型Step 3.5 Flash,多家头部芯片厂商完成适配
Feng Huang Wang· 2026-02-02 06:32
凤凰网科技讯2月2日,阶跃星辰发布新一代开源Agent基座模型Step3.5Flash。该模型面向实时Agent工 作流场景,采用稀疏MoE架构,总参数量为1960亿,每个token激活约110亿参数,旨在兼顾推理速度与 使用成本。 据官方介绍,在单请求代码类任务中,Step3.5Flash的推理速度最高可达每秒350个token。目前,包括华 为昇腾、沐曦股份、壁仞科技、燧原科技等在内的多家芯片厂商已完成对该模型的适配。 阶跃星辰曾于2025年7月联合多家芯片及基础设施厂商发起"模芯生态创新联盟",旨在通过联合优化提 升算力效率,推动大模型在应用场景中的落地。此次模型发布被视为其在模型与算力协同方向的进一步 实践。 ...
阶跃星辰发布开源基座模型 Step 3.5 Flash 多家头部芯片厂商完成适配
Xin Lang Cai Jing· 2026-02-02 02:44
公开信息显示,阶跃星辰于2025年7月联合近10 家芯片及基础设施厂商发起"模芯生态创新联盟",旨在 打通芯片、模型与平台之间的技术壁垒,通过联合优化提升算力利用效率,加速大模型在各行业场景中 的应用落地。业内认为,随着推理模型成为主流,模型与算力的深度协同将成为推动大模型规模化应用 的重要路径。 责任编辑:宋雅芳 新浪科技讯 2月2日上午消息,阶跃星辰发布新一代开源 Agent 基座模型 Step 3.5 Flash。据介绍,该模 型面向实时 Agent 工作流场景打造,兼顾推理速度、智能水平与使用成本,在单请求代码类任务上, Step 3.5 Flash 最高推理速度可达每秒350个 token。 新浪科技讯 2月2日上午消息,阶跃星辰发布新一代开源 Agent 基座模型 Step 3.5 Flash。据介绍,该模 型面向实时 Agent 工作流场景打造,兼顾推理速度、智能水平与使用成本,在单请求代码类任务上, Step 3.5 Flash 最高推理速度可达每秒350个 token。 此外,Step 3.5 Flash 采用稀疏MoE架构,每个 token 仅激活约110 亿个参数(总计1960 亿参数) ...