Workflow
又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱
量子位·2025-08-01 00:46

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 又一个SOTA基础模型开源,而且依然是国产。 刚刚,阶跃星辰兑现了WAIC上的承诺,将最新多模态推理模型 Step-3正式开源 ! 在MMMU等多个多模态榜单上,它一现身就取得了开源多模态推理模型新SOTA的成绩。 并且速度飞快,在Hopper GPU上每秒可以解码4039个Token (4K上下文、FP8、无MTP) ,是 DeepSeek-V3的174% 。 这一表现,也 给大模型解码设定了新的帕累托前沿 (资源分配的一种理想状态) 。 另外,Step-3采用了模型-Infra一体化设计,因此性价比也极高。 它有321B参数,但可以运行在8块48GB的GPU上,处理多达80万个token。 如果直观比较,Step-3在H20上的解码成本仅有DeepSeek-V3的30%。 Huggingface工程师评价,这种模型-Infra共同设计的理念,代表了一种前进方向。 百万Token解码成本不到4毛 Step-3是一款MoE模型,包含48个专家,总参数量321B,其中316B为语言模型,5B为视觉编码器,激活参数量则为38B(3个专家)。 | | Step ...