Workflow
LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯
Meta PlatformsMeta Platforms(US:META) 量子位·2025-04-06 02:33

白交 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI AI不过周末,硅谷也是如此。 大周日的,Llama家族上新,一群LIama 4就这么突然发布了。 这是Meta首个基于MoE架构模型系列,目前共有三个款: Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。 最后一个尚未推出,只是预告,但Meta已经毫不避讳地称前两者是 "我们迄今为止最先进的型号,也是同类产品中最好的多模态型号" 。 与此同时,大模型竞技场排名迎来一轮更新。 此次发布的Llama 4 Maverick,在困难提示、编码、数学、创意写作方面并列第一;得分1417,不仅大大超越了此前Meta自家的Llama-3- 405B (提升了149分) ,还成为史上第4个突破1400分的模型;。 详细来看一些关键词—— Llama 4 Scout ,16位专家的170亿激活参数的多模态模型, 单个H100 GPU可运行 , 同类SOTA,并拥有10M上下文窗口 Llama 4 Maverick ,128位专家的170亿激活参数多模态模型,击败GPT-4o和Gemini 2.0 Flash,与DeepS ...