4B Qwen3逆袭671B DeepSeek!字节DAPO微调方法这么猛的吗
量子位·2025-06-16 06:59
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 4B 小模型极限在哪里? 最新模型 Jan-nano 引起热议,它 在智能体任务上超过671B的最新版DeepSeek-V3 0528 ,在SimpleQA基准上获得 80.7分 。 先来看一下它的实际表现,包括两个任务: 总结一下,Jan-nano的能力包括: 再来看一下官方评估结果,与它同台竞技的不是闭源方案就是DeepSeek-v3这样的671B大型MoE模型。 目前Jan-nano取得最高分80.7%,并且作者透露下一个版本的目标是85%。 对研究某公司目前的扩张情况,该公司的扩张正威胁着另一家公司的市场份额,并撰写一份可能影响金融公司尽职调查流程的MBA水 平报告。 汇总今日财经突发新闻,聚焦令人震惊的消息。 在正确的提示词下,可以进行深度研究 从搜索结果中有效地获取相关信息 针对MCP协议优化,可无缝集成各种MCP服务器调用工具 不过研究团队Menlo Research特别提醒大家,Jan-Nano只是在这一个指标上优于Deepseek-671B,并且在测试中使用了基于MCP的方法。 我们完全理解4B模型有其局限性,但看看它能走到多远总是很有趣 ...