性能持平价格大降80%,Anthropic 新模型杀疯了
3 6 Ke·2026-02-18 05:52
然而在多项基准测试中,Sonnet 4.6接近甚至超越了价格高出五倍的Opus 4.6。 Anthropic表示,便宜不一定就没有好货。 当然了,在一些关键的测试里,仍然还是Opus 4.6领先。 具体表现如何呢? 01 Sonnet 4.6究竟有多惊艳? 距离ClaudeOpus 4.6的发布仅过去12天,Anthropic就发布了新的中档模型Claude Sonnet 4.6。 这次发布的核心不在于技术突破本身,而在于它以低得多的价格,达到了与竞品齐平的性能。。 Sonnet 4.6的定价保持在每百万token输入3美元、输出15美元,与前代 Sonnet 4.5相同。 在SWE-bench Verified这个衡量真实软件编码能力的基准测试中,Sonnet 4.6得分79.6%,几乎追平Opus 4.6的 80.8%,同时略微领先于OpenAI的GPT-5.2。 在代理式金融分析任务中,Sonnet 4.6以63.3%的成绩领先所有竞争对手,包括Opus 4.6的60.1%和GPT-5.2的59.0%。 在办公任务的GDPval-AA Elo评分中,Sonnet 4.6达到 1633 分,超过Opus ...