新版DeepSeek-V3登顶非推理模型榜单!每经记者实测编程能力,R2模型也要来了?
新版DeepSeek-V3登顶非推理模型榜单!每经记者实测编程能力,R2模型也要 来了? 每经记者 岳楚鹏 每经编辑 兰素英 北京时间3月24日晚间,DeepSeek悄然将DeepSeek-V3模型的最新版本上传到了开源平台HuggingFace。 新模型的版本号为DeepSeek-V3-0324,参数为6850亿,较初代V3版本的6710亿有小幅增长。 尽管DeepSeek十分低调,但还是有不少人在第一时间就注意到了这一更新,并对其进行了测试。 根据社区测试反馈,DeepSeek-V3-0324最明显的变化是编程能力得到了极大的提升。众多开发者基于对新模型的综合体验判断,新模型的编程能力已经接近 目前最强编程模型Claude 3.7 Sonnet。 3月25日,专业AI模型评测机构Artificial Analysis发布的最新排名显示,新版V3在基准测试中较老版V3跃升了7位,排名所有非推理模型中的第一名。 《每日经济新闻》记者实测后发现,DeepSeek-V3-0324的编程能力确实强大,但仍会出现幻觉问题。 有外媒推测:"V3新版本的推出时机和特点强烈表明,它将成为DeepSeek-R2的基础,后者是 ...