UserBench - filings, earnings calls, financial reports, news - Reportify

UserBench

Search documents

从「知题」到「知人」：UserRL让智能体学会「以人为本」

机器之心· 2025-10-05 06:42

"知人者智，自知者明。"——《道德经》古人早已洞见：真正的人类智慧，不仅仅在于公式推演、掌握技艺，更是能理解他人、洞察人心。今天的大语言模型已能在代码、数学与工具使用上出色地完成任务，然而距离成为真正的用户伙伴，它们依旧缺少那份 "知人" 的能力。这主要源于现实交互远比解题更加复杂：这正是智能体面临的下一个时代课题：从 "会解题" 迈向 "懂用户" 。而要真正回答这一课题，我们需要全新的动态评测框架与训练机制：不仅能测量模型在交互中的表现，还能驱动其学会在用户不确定与多目标的世界里，问之有道，断之有衡，答之有据。为此，来自 UIUC 与 Salesforce 的研究团队提出了一套系统化方案：二者相辅相成，把 "以用户为中心" 从理念落地为可复现的流程、接口与评测指标。 UserBench 论文链接：https://arxiv.org/pdf/2507.22034 UserBench 代码仓库：https://github.com/SalesforceAIResearch/UserBench 现实交互中，用户目标常常未在最初完全成形（underspecification）、而是 ...

大语言模型

大语言模型