性能持平价格大降80%，Anthropic 新模型杀疯了

然而在多项基准测试中，Sonnet 4.6接近甚至超越了价格高出五倍的Opus 4.6。 Anthropic表示，便宜不一定就没有好货。当然了，在一些关键的测试里，仍然还是Opus 4.6领先。具体表现如何呢？ 01 Sonnet 4.6究竟有多惊艳？距离ClaudeOpus 4.6的发布仅过去12天，Anthropic就发布了新的中档模型Claude Sonnet 4.6。这次发布的核心不在于技术突破本身，而在于它以低得多的价格，达到了与竞品齐平的性能。。 Sonnet 4.6的定价保持在每百万token输入3美元、输出15美元，与前代 Sonnet 4.5相同。在SWE-bench Verified这个衡量真实软件编码能力的基准测试中，Sonnet 4.6得分79.6%，几乎追平Opus 4.6的 80.8%，同时略微领先于OpenAI的GPT-5.2。在代理式金融分析任务中，Sonnet 4.6以63.3%的成绩领先所有竞争对手，包括Opus 4.6的60.1%和GPT-5.2的59.0%。在办公任务的GDPval-AA Elo评分中，Sonnet 4.6达到 1633 分，超过Opus ...