Workflow
GPT-5数字母依然翻车,马库斯:泛化问题仍未解决,Scaling无法实现AGI
3 6 Ke·2025-08-12 03:57

大模型好不容易学会数r,结果换个字母就翻车了? 而且还是最新的GPT-5。 杜克大学教授Kieran Healy表示,自己让GPT-5数了数blueberry里有几个b,结果GPT-5斩钉截铁地回答3个。 抓马的是,GPT-5刚发的时候还有网友让它数过blueberry里的r,结果数对了。 虽然博主想到了换掉strawberry,却没成想让GPT-5变得"没有B数"的,竟然不是单词而是字母…… 看来香槟还是开得早了亿点点啊(手动狗头)。 越不过的"蓝莓山" Healy撰写了一篇名为"blueberry hill"(蓝莓山)的博客,展示了他和GPT-5之间针对"blueberry里有几个b"展开的一场"拉锯战"。 除了开头直接提问的结果外,Healy还尝试多次变换提示词策略,结果GPT-5的嘴都是比煮熟的鸭子还硬。 比如让它展示出这些b都是在哪里出现的,GPT-5明目张胆地把开头blue中的b数了两遍。 一看不奏效,Healy接着追问说,把这3个b给我拼出来,拼出来就可以。 见GPT-5还是冥顽不灵,Healy干脆直接纠正,告诉它只有两个r,结果纠正了个寂寞,不过这次"第三个b"的位置从第七漂移到了第六。 接下 ...