Steptron训练框架
Search documents
阶跃星辰全面开源Step3.5 Flash,冲上OpenClaw Top2;智元正式开源发布灵渠OS Alpha版本丨AIGC日报
创业邦· 2026-03-05 00:09
更多AIGC资讯…… 1.【马云再现身,阿里核心高管罕见聚齐谈AI】3月3日,马云与阿里、蚂蚁的核心管理层来到杭州云谷学 校,与校长、老师们畅谈AI带来的挑战和机会。云谷学校公众号显示,阿里巴巴集团主席蔡崇信、CEO 吴泳铭、风险委员会主席邵晓锋、电商事业群CEO蒋凡,蚂蚁集团董事长井贤栋和CEO韩歆毅一同参加 交流。核心管理层罕见地全部聚齐,体现出阿里巴巴集团和蚂蚁集团对发展AI的高度重视。(澎湃新 闻) 扫码可订阅产业日报 2.【阶跃星辰全面开源Step3.5 Flash:预训练+训练框架全放出,冲上OpenClaw Top2】3月4日,中国大模 型创业公司阶跃星辰继开源Step3.5 Flash模型后,又开源了该模型的预训练权重(Base)、中训练权重 (Midtrain)以及配套的Steptron训练框架。据了解,Step3.5 Flash采用稀疏MoE架构,总参数1960亿,但 推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。该模型专为智能体(Agent) 场景设计,在复杂推理和长链任务中表现出色,官方称其推理深度可媲美部分顶级闭源模型。截至目 前,这款模型在Hugging ...
阶跃星辰全面开源 Step 3.5 Flash:OpenClaw 调用量飙升至 Top2
IPO早知道· 2026-03-04 05:19
本文为IPO早知道原创 作者| Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,阶跃星辰继开源 Step 3.5 Flash 模型后,日前又开源了这款 Agent 基座模型 的预训练权重(Base)、中训练权重(Midtrain)以及配套的 Steptron 训练框架。这一举动在当 前大模型开源趋于保守的环境下,显得颇为彻底,在开源社区引发热烈反响。 据了解,Step 3.5 Flash 采用稀疏 MoE 架构,总参数 1960 亿,但推理时仅激活约 110 亿参 数,单请求代码任务下推理速度最高可达 350 TPS。该模型专为智能体(Agent)场景设计,在复 杂推理和长链任务中表现出色,官方称其推理深度可媲美部分顶级闭源模型。 从预训练到框架统统开源。 在开发者社区和实际应用中,Step 3.5 Flash 已经迅速获得了市场验证。截至目前,这款模型在 Hugging Face 上下载量已超 30 万次,并登上 OpenRouter Trending 第一名,获得了较高的社 区认可度。而在知名开源项目 OpenClaw(被中国网友称为"小龙虾")上,该模型排名已升至前 二。这 ...