零成本、无需微调:提示词加几个字让能大模型创造力暴涨 2 倍
(译注:原文 jokes on "mug" 双关意为"马克杯"和"抢劫") 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:AI 越来越无聊,真凶竟是人类自己?斯坦福最新研究发现,无需重新训练,仅需 几个字的简单指令,就能打破"安全对齐"的封印,让大模型被压 抑的创造力暴涨 2 倍。文章来自编译。 ChatGPT 总是给你同样无聊的回答?这项新技术能激发任何 AI 模型 2 倍以上的创造力——而且无需训练。原理如下。 我让 ChatGPT 给我讲一个关于咖啡的笑话,试了五次。 同样的笑话。每一次。绝无例外。 "为什么咖啡去报了警?因为它被'抢'了(mugged)!" 我试过调整温度参数。换各种措辞。用有创意的系统提示词。全都没用。 我心想:就这样了吗? AI 创造力的天花板就到了吗? 事实证明,是我问错了问题。 那一天一切都改变了 三周前,一篇研究论文发布了,它彻底颠覆了我们对 AI 对齐的认知。 不需要耗资数十亿的重新训练。不需要复杂的微调。仅仅八个词,就解锁了我们以为永远丢失的创造力。 这篇论文来自斯坦福大学、东北大学和西弗吉尼亚大学。这项 ...