模型与算力协同
Search documents
阶跃星辰发布开源基座模型 Step 3.5 Flash
Zheng Quan Ri Bao Wang· 2026-02-02 08:11
本报讯 (记者袁传玺)2月2日,上海阶跃星辰智能科技有限公司(以下简称"阶跃星辰")发布新一代 开源Agent基座模型Step3.5Flash。该模型面向实时Agent工作流场景打造,兼顾推理速度、智能水平与 使用成本,在单请求代码类任务上,Step3.5Flash最高推理速度可达每秒350个token。Step3.5Flash提供 了一个"更快更强更稳"的Agent底层模型选项,希望能够成为受大家喜爱的"Agent搭子"。 公开信息显示,阶跃星辰于2025年7月联合近10家芯片及基础设施厂商发起"模芯生态创新联盟",旨在 打通芯片、模型与平台之间的技术壁垒,通过联合优化提升算力利用效率,加速大模型在各行业场景中 的应用落地。业内认为,随着推理模型成为主流,模型与算力的深度协同将成为推动大模型规模化应用 的重要路径。 Step3.5Flash采用稀疏MoE架构,每个token仅激活约110亿个参数(总计1960亿参数),在保证模型能力 的同时显著提升推理效率,为Agent类应用提供更高效、可负担的底层模型选择。包括华为昇腾、沐曦 股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已率先完成对S ...