Workflow
新版DeepSeek-V3接入每经大模型平台!小编亲测:敲代码、写报告、撰长文样样在行
SKLTYSeek .(SKLTY) 每日经济新闻·2025-03-28 08:59

每经记者 宋欣悦 每经编辑 兰素英 3月24日,DeepSeek悄悄上线了新版V3开源大模型——DeepSeek-V3-0324。 专业AI模型评测机构Artificial Analysis最新排名显示,新版DeepSeek-V3在基准测试中较老版V3跃升了7位,登顶非推理模型排行榜。 3月25日晚,DeepSeek官方放出了新版DeepSeek-V3的跑分结果。 新版V3模型的百科知识(MMLU-Pro,GPQA)、数学(MATH-500,AIME 2024)和代码任务(LiveCodeBench)表现均有提升。 划重点—— 全面超越Claude 3.7 Sonnet 在数学、代码类相关评测集上超过GPT-4.5 作为一个没有思维链的非推理模型,新版DeepSeek-V3在推理类任务上的表现可圈可点。 新版DeepSeek-V3借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上超过了 GPT-4.5。 在中文写作任务方面,新版DeepSeek-V3模型基于R1的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。 此外, ...