腾讯研究院AI速递 20250618
腾讯研究院·2025-06-17 15:40
生成式AI 一、 LMArena 新 榜 , DeepSeek-R1网页编程超Claude Opus 4 1. DeepSeek-R1(0528)在LMArena榜单表现优异,文本基准测试整体排名第6、开源模 型第一,编程测试排名第2; 2. 在WebDev Arena网页编程竞赛中,DeepSeek-R1与Claude Opus 4并列第一,分数超 过Claude Opus 4; 3. 该模型在MIT开源协议下提供领先性能,标志着开源AI在编程领域达到与顶级闭源模型相 当水平的里程碑。 2. 采用Lightning Attention混合架构和CISPO强化学习算法,解决传统Transformer平方级 复杂度问题,训练效率提升2倍; 3. 多项基准测试表现可比或超越DeepSeek-R1、Qwen3等开源模型,在工具使用和软件工 程任务上甚至超越OpenAI o3和Claude 4 Opus。 https://mp.weixin.qq.com/s/FHis_2BmwtfA7yOe45Rdxg 三、 Kimi发布新 代码模型Kimi-Dev,仅仅72B,发布即开源 1. Kimi发布开源代码模型Kimi-D ...