Meta发布Llama 3,高管:最智能开源大模型,最强版还在路上
4月19日消息,美国时间周四,Facebook的母公司Meta发布了其开源大语言模型的最新版本——Llama 3。凸显了目前硅谷人工智能之战日益激烈。 Meta此次推出了两个版本的Llama 3模型:一个版本拥有80亿参数,另一个则有700亿参数。参数数量是衡量人工智能系统模型大小和性能的关键指标,它直接反映了模型的复杂性和计算能力。Meta指出,即使是参数较少的Llama 3版本,其性能也足以与去年发布的拥有700亿参数的Llama 2的最大版本相匹敌。 Meta CEO马克·扎克伯格(Mark Zuckerberg)透露,即将推出的Llama 3的大型版本将拥有超过4000亿参数,远超之前的版本。Llama 2在训练过程中使用了2万亿个token,而Llama 3的大型版本使用的token超过了15万亿,这表明其具有更广泛的数据处理能力。尽管OpenAI尚未公开确认GPT-4的参数或token数量,业界估计其参数可能达到1.5万亿。Meta首席产品官克里斯·考克斯(Chris Cox)表示,这款大型模型待训练完成后将正式发布。他补充道:“根据我们目前看到的基准测试结果,Llama 3无疑是市场上目前免费提 ...