Neuro - symbolic AI

Search documents
GPT-5数字母依然翻车,马库斯:泛化问题仍未解决,Scaling无法实现AGI
3 6 Ke· 2025-08-12 03:57
大模型好不容易学会数r,结果换个字母就翻车了? 而且还是最新的GPT-5。 杜克大学教授Kieran Healy表示,自己让GPT-5数了数blueberry里有几个b,结果GPT-5斩钉截铁地回答3个。 抓马的是,GPT-5刚发的时候还有网友让它数过blueberry里的r,结果数对了。 虽然博主想到了换掉strawberry,却没成想让GPT-5变得"没有B数"的,竟然不是单词而是字母…… 看来香槟还是开得早了亿点点啊(手动狗头)。 越不过的"蓝莓山" Healy撰写了一篇名为"blueberry hill"(蓝莓山)的博客,展示了他和GPT-5之间针对"blueberry里有几个b"展开的一场"拉锯战"。 除了开头直接提问的结果外,Healy还尝试多次变换提示词策略,结果GPT-5的嘴都是比煮熟的鸭子还硬。 比如让它展示出这些b都是在哪里出现的,GPT-5明目张胆地把开头blue中的b数了两遍。 一看不奏效,Healy接着追问说,把这3个b给我拼出来,拼出来就可以。 见GPT-5还是冥顽不灵,Healy干脆直接纠正,告诉它只有两个r,结果纠正了个寂寞,不过这次"第三个b"的位置从第七漂移到了第六。 接下 ...
GPT-5数字母依然翻车!马库斯:泛化问题仍未解决,Scaling无法实现AGI
量子位· 2025-08-11 10:12
大模型好不容易学会数r,结果 换个字母就翻车了 ? 而且还是最新的GPT-5。 杜克大学教授Kieran Healy表示,自己 让GPT-5数了数blueberry里有几个b,结果GPT-5斩钉截铁地回答3个 。 抓马的是,GPT-5刚发的时候还有网友让它数过blueberry里的r,结果数对了。 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 虽然博主想到了换掉strawberry,却没成想让GPT-5变得"没有B数"的,竟然不是单词而是字母…… 看来香槟还是开得早了亿点点啊(手动狗头)。 越不过的"蓝莓山" Healy撰写了一篇名为 "blueberry hill" (蓝莓山)的博客,展示了他和GPT-5之间针对"blueberry里有几个b"展开的一场"拉锯战"。 除了开头直接提问的结果外,Healy还尝试多次变换提示词策略,结果GPT-5的嘴都是比煮熟的鸭子还硬。 比如让它展示出这些b都是在哪里出现的,GPT-5明目张胆地把开头blue中的b数了两遍。 一看不奏效,Healy接着追问说,把这3个b给我拼出来,拼出来就可以。 结果拼是拼出来了,但是GPT-5还是坚持有三个b,并表示第三个b是第七 ...