基于人类反馈的强化学习RLHF

Search documents
2030年AGI到来?谷歌DeepMind写了份“人类自保指南”
虎嗅APP· 2025-04-07 23:59
以下文章来源于极客公园 ,作者芯芯 DeepMind认为这个时间线可能非常短,发布报告的目的是说清一个问题:如果AI有问题,最坏的情况会是什么?我们现在能如何准备? 一、DeepMind的AI安全保险 极客公园 . 用极客视角,追踪你最不可错过的科技圈。欢迎同步关注极客公园视频号 本文来自微信公众号: 极客公园 (ID:geekpark) ,作者:芯芯,编辑:靖宇,题图来自:AI生成 对于所谓的通用人工智能AGI,人们通常抱着"怕它不来,又怕它乱来"的矛盾心理。而这个困惑,对于正在AI军备竞赛中的硅谷巨头来说,就不仅仅 是一个"梗"能概括的了。 4月初,谷歌DeepMind发布了一份长达145页的报告文件,系统阐述了其对AGI安全的态度,DeepMind联合创始人Shane Legg的署名也在其中。 文件中最醒目的预测,是AGI的可能出现时间: 2030年 。 当然,Google也补充说,这具有不确定性。他们定义的AGI是"卓越级AGI (Exceptional AGI) "—— 即系统在非物理任务上达到或超越99%人类成年 人的能力,包括学习新技能等元认知任务 。 这份报告中反复出现的一个词是"严重伤害 ( ...