经济图灵测试

Search documents
深度|Anthropic创始人:当机器通过经济图灵测试,就可以称之为变革性AI;MCP是一种民主化力量
Z Potentials· 2025-07-02 04:28
图片来源: No Priors Ben : 谢谢邀请。 Claude 4 的发布与亮点:更具智能体性质、更长时间的任务被解锁 Sarah : 首 先祝贺 Claude 4 的发布。也许我们可以从这个问题开始:如今你们是如何决定什么算得上一次版本发布的? Ben : 这更多的是一门艺术,而不是一门科学。我们在内部就版本号应该是什么进行了很多热烈的辩论。在我们甚至拥有一个潜在模型之前,我们会制定 一个路线图,尝试根据我们能获得的芯片数量来估算,理论上我们何时能够将模型训练到 Pareto 效率计算前沿?所以这一切都基于规模法则。然后,一旦 我们拿到了芯片,我们就尝试开始训练。但不可避免的是,结果通常没有达到我们理想中的最佳状态,因为训练这些大模型确实非常困难。所以发布的日 期可能会稍微调整。然后到某个时候,它大致完成,我们就像是在临近最后的阶段切下一些小块,试图判断这个 " 蛋糕 " 出来时会是什么样的。不过正如 Dario 所说,在完全完成之前,你无法真正确定结果。你可以得到一个大致的方向性指示。如果它感觉像是一次重大变化,我们就会给它一个大版本号的更 新。但是我们肯定还在不断学习和迭代这个过程。 Sarah ...