Workflow
告别复杂提示词!蚂蚁新方式让AI自动理解你的个性化需求
Sou Hu Cai Jing·2025-08-03 09:44

AntResearchNLP团队 投稿 量子位 | 公众号 QbitAI 相信大家都有这样一个体验。 跟AI无论什么对话,感觉都是说空话套话。 有时候为了让AI懂自己,许多用户甚至不得不学习复杂的"提示词技巧",手动编写长长的指令,像是在给AI做"岗前培训"。 那么如何实现高情商AI?蚂蚁通用人工智能研究中心自然语言处理实验室提出了一个叫AlignXplore的方法—— 通过强化学习,AlignXplore能够通过深度思考从用户行为中归纳出他/她的偏好,并且这种对人类偏好的洞察可以随着用户行为的变化而动态更新。 更有趣的是,当把归纳好的偏好描述迁移到一个下游对齐模型时,能够让这个模型的个性化对齐能力得到显著提升。 △"千人一面"的对齐方式无法满足用户多样的个性化需求,红字蓝字是对应用户的偏好描述 事实上,AI早已对演绎推理(Deductive Reasoning)驾轻就熟,具备令人惊叹的数学解题和代码编写能力。 你给它一个确定的前提(如"求解二次方程 ax²+bx+c=0")和一套不变的规则(求根公式),它就能通过一步步严密的逻辑推演,给出一个唯一、可验证 的正确答案。这是一个典型的"自上而下"(Top-Do ...