野生DeepSeek火了,速度碾压官方版,权重开源
机器之心·2025-07-04 08:59
机器之心报道 编辑:杜伟、泽南 没等来 DeepSeek 官方的 R2,却迎来了一个速度更快、性能不弱于 R1 的「野生」变体! 这两天,一个名为「 DeepSeek R1T2 」的模型火了! 这个模型的速度 比 R1-0528 快 200%,比 R1 快 20% 。除了速度上的显著优势,它在 GPQA Diamond(专家级推理能力问答基准)和 AIME 24(数学推理基准) 上的表现均优于 R1,但未达到 R1-0528 的水平。 在技术层面,采用了 专家组合(Assembly of Experts,AoE)技术 开发,并融合了 DeepSeek 官方的 V3、R1 和 R1-0528 三大模型。 当然,这个模型也是开源的,遵循 MIT 协议,并在 Hugging Face 上开放了权重。 Hugging Face 地址:https://huggingface.co/tngtech/DeepSeek-TNG-R1T2-Chimera 经过进一步了解,我们发现:DeepSeek R1T2 是德国一家 AI 咨询公司「TNG」推出的,模型全称为「DeepSeek-TNG R1T2 Chimera」(以下简称 ...