基于人类反馈的强化学习

Search documents
盘一盘,2017年Transformer之后,LLM领域的重要论文
机器之心· 2025-06-29 04:23
机器之心报道 机器之心编辑部 这两天 Andrej Karpathy 的最新演讲 在 AI 社区引发了热烈讨论,他提出了「软件 3.0」的概念,自然语言正在成为新的编程接口,而 AI 模型负责执行具 体任务。 Karpathy 深入探讨了这一变革对开发者、用户以及软件设计理念的深远影响。他认为,我们不只是在使用新工具,更是在构建一种全新的计算范式。 回顾 LLM 的发展历程:自 2017 年 Transformer 架构问世以来,我们见证了 GPT 系列的一路高歌猛进,以及多模态能力和端侧应用的全面开花。整个 领域正以前所未有的速度演进。 要深入理解这场变革的本质,我们需要回到技术的源头。那些奠定今天 AI 能力的关键论文,不仅记录着算法的演进轨迹,更揭示了从传统编程到自然语言 交互这一范式转变的内在逻辑。 此前我们通过 50 个核心问题回顾了 LLM 的基础概念 。今天,我们将梳理自 2017 年以来 LLM 领域的重要论文。本文从 X 用户 Pramod Goyal 的论文 盘点中精选了 22 篇进行详细介绍,其余论文将在文末列出供读者参考。 奠基理论 Attention Is All You Need ...
大模型从“胡说八道”升级为“超级舔狗”,网友:再进化就该上班了
AI前线· 2025-05-01 03:04
一日为谄媚者, 终身为谄媚者 作者|冬梅、核子可乐 近日,OpenAI 在其官网发文称已回滚上周 ChatGPT 中的 GPT-4o 更新,目前用户使用的是行为更加平衡的早期版本。Altam 也在 X 上发帖说明了这一 调整。 为什会做这样的调整?因为最近不少用户发现 ChatGPT 越来越"谄媚"。 随着用户对于 ChatGPT "谄媚"行为的讨论越来越多,前微软高管、现 Spotify 首席技术官 Mikhail Parakhin 也发表了他对此事的看法。 Parakhin 认为,ChatGPT 并非一开始就以奉承用户为默认风格,不过由于用户对直接的人格反馈表现出强烈反感,OpenAI 决定调整聊天机器人,让其 更讨好用户。 Parakhin 表示:"ChatGPT 的记忆功能首次推出时,初衷是让用户查看和编辑 AI 生成的个人资料。然而,即使是像"有自恋倾向"这样相对中性的表述, 也常常引发强烈反应。" "很快就发现人们敏感得可笑:'有自恋倾向'——'不,我没有!',不得不隐藏它。因此才有了这批极度谄媚的 RLHF,"Parakhin 说道。 RLHF(基于人类反馈的强化学习)用于根据人们偏好的回应方式 ...
2030年AGI到来?谷歌DeepMind写了份“人类自保指南”
虎嗅APP· 2025-04-07 23:59
以下文章来源于极客公园 ,作者芯芯 DeepMind认为这个时间线可能非常短,发布报告的目的是说清一个问题:如果AI有问题,最坏的情况会是什么?我们现在能如何准备? 一、DeepMind的AI安全保险 极客公园 . 用极客视角,追踪你最不可错过的科技圈。欢迎同步关注极客公园视频号 本文来自微信公众号: 极客公园 (ID:geekpark) ,作者:芯芯,编辑:靖宇,题图来自:AI生成 对于所谓的通用人工智能AGI,人们通常抱着"怕它不来,又怕它乱来"的矛盾心理。而这个困惑,对于正在AI军备竞赛中的硅谷巨头来说,就不仅仅 是一个"梗"能概括的了。 4月初,谷歌DeepMind发布了一份长达145页的报告文件,系统阐述了其对AGI安全的态度,DeepMind联合创始人Shane Legg的署名也在其中。 文件中最醒目的预测,是AGI的可能出现时间: 2030年 。 当然,Google也补充说,这具有不确定性。他们定义的AGI是"卓越级AGI (Exceptional AGI) "—— 即系统在非物理任务上达到或超越99%人类成年 人的能力,包括学习新技能等元认知任务 。 这份报告中反复出现的一个词是"严重伤害 ( ...
UCL强化学习派:汪军与他的学生们
雷峰网· 2025-02-27 10:15
2006 年暑假的一个午后,汪军踏上了从荷兰小城代尔夫特开往首都阿姆斯特丹的火车,他将在阿姆斯特丹换 乘飞机,飞往美国西雅图参加第 29 届国际计算机协会信息检索大会(ACM SIGIR)。 " 他们构成中国强化学习研究的半壁江山。 " 作者丨赖文昕 编辑丨陈彩娴 作为一支在 AI 领域历经数十年的研究分支,强化学习仍在历久弥新。 01 从推荐系统到强化学习 此时的信息检索领域如日中天,加上微软、雅虎和谷歌三巨头最核心的业务也是搜索,ACM SIGIR 每年都能 汇集学术界与工业界的最高人才,来开一场信息检索界的"年会"。 在华盛顿大学的会场里,汪军在一片掌声中获得了最佳博士联盟奖,于博士毕业的前一年拿下了信息检索领域 博士的最高荣誉。 这位意气风发的青年此刻并未想到,自己将会在 15 年后再获得时间检验奖的荣誉提名——2021 年的汪军已 转向强化学习(RL)数年,作为发起人之一成立了华人强化学习社区RL China,为国内强化学习研究培养了 一批优秀的青年人才,成为领域的"一代宗师"。 汪军 汪军出生于江苏南京,1993 年从金陵中学毕业后开始在东南大学攻读电子工程专业。本科毕业后,他先在工 业界工作三年 ...