Workflow
AI安全
icon
Search documents
谷歌DeepMind CEO谈AGI愿景:十年内成为现实,因安全问题彻夜难眠
3 6 Ke· 2025-04-28 11:06
智东西4月28日消息,昨日,据《时代》周刊报道,记者比利・佩里戈(Billy Perrigo)独家专访了谷歌 DeepMind CEO、2024年诺贝尔化学奖得主德米斯・哈萨比斯(Demis Hassabis)。这位AI领域的领军人 物猜测,通用人工智能(AGI)可能会在未来十年内实现。 他指出,近年来AI研究进展显著,如今有诸多不同路径正助力实现AGI。并且,谷歌DeepMind的模型 Gemini已开始从理解世界迈向行动,能完成如订票、购物、操控机器人执行复杂任务等操作。哈萨比斯 认为AGI若发展得当,将帮助人类攻克疾病、能源危机等重大挑战,但同时也可能被滥用为生物武器或 脱离人类控制。 此次访谈中,他聊了不少AGI的可能性及最新进展,并坦言全球地缘政治变化可能迫使企业调整相关原 则同时,哈萨比斯呼吁国际社会合作制定AI安全标准,他认为实现AGI需多领域研究者协同。 ▲谷歌DeepMind CEO哈萨比斯 作为最早公开倡导AGI可行性的科学家,哈萨比斯在2022年行业普遍质疑AGI可能性时,便将其定位为 毕生科研目标。 萨姆・阿尔特曼(Sam Altman)和达里奥・阿莫迪(Dari0 Amodei)预测 ...
格尔软件(603232):市场拓展有望带动25年业绩修复
HTSC· 2025-04-27 09:08
证券研究报告 格尔软件 (603232 CH) 市场拓展有望带动 25 年业绩修复 | 华泰研究 | | | 年报点评 | | --- | --- | --- | --- | | 2025 年 | 4 月 | 27 日│中国内地 | 计算机应用 | 格尔软件 24 年实现营收 5.29 亿元(yoy-5.71%),归母净利 3681.21 万元 (yoy-0.42%),扣非净利 1569.42 万元(yoy+233.45%)。公司 24 年业绩 低于我们此前预期,主要由于公司业务转型下通用安全产品收入显著收窄, 但受益于高毛利业务收入占比提升,公司 24 年净利率提升 0.37pct。我们 认为,受益于司法、运营商、烟草等新行业客户拓展以及"一带一路"沿线 国家的海外客户拓展,公司 25 年业绩有望修复,维持"买入"评级。 高毛利业务收入占比提升,费用管控能力逐步凸显 分业务看,PKI 基础设施产品、PKI 安全应用产品、通用安全产品 24 年收 入为 1.58/2.48/1.23 亿元,同比+41.41%/+10.64%/-45.28%;24 年毛利率 为 52.19%、63.08%、29.46%,同比+1 ...
AI 教父最新警告:AI 导致人类灭绝风险高达 20%,留给人类的时间不多了!
AI科技大本营· 2025-04-18 05:53
责编 |梦依丹 采访伊始,他用幽默的语气回忆起领取 诺贝尔物理学奖时的趣事:"他们只是假装我搞的是物理。" 然而,轻松的谈笑之后,是他对未来的深沉忧虑:"我认为人类面临的 AI 风险,远比我们想象中要严重得多。"更令人瞩目的是,辛顿首次给出了一个令 人不寒而栗的预测:AI 导致人类灭绝的可能性高达 10% 至 20%。他直言,我们正处在决定未来的关键节点,亟需投入大量资源研究 AI 安全,否则后 果不堪设想。 出品丨AI 科技大本营(ID:rgznai100) 继去年荣获诺贝尔物理学奖引发全球关注后,"AI 教父"杰弗里·辛顿(Geoffrey Hinton), 这位深度学习领域的奠基人 近日在接受最新采访中坦 言:"几乎所有顶尖研究人员都认为 AI 将变得比人类更聪明。"他之前在诺贝尔奖的官方采访中表示:AI 最快 5 年超越人类智慧。 具体见 诺奖采访深度学习教父辛顿:最快五年内 AI 有 50% 概率超越人类,任何说"一切都会好起来"的人都是疯子 此外,他还罕见地公开批评了科技巨头埃隆·马斯克,认为其行为正在损害美国的科学根基,这场"教父"与首富的隔空交锋,也折射出 AI 发展道路上复 杂的科技、伦理与 ...
启明星辰一季度预盈利 锚定DeepSeek大模型赛道 以周迭代抢占AI安全战略先机
Cai Jing Wang· 2025-04-15 06:26
4月14日晚,启明星辰(002439)(002439.SZ)发布了2025年一季度业绩预告及2024年度报告,2025年一 季度毛利率同比明显改善,毛利率提升8个百分点,一季度实现盈利突破,为全年稳健经营与高质量发 展奠定基础。 积极拥抱AI时代聚力打造AI安全大模型及智能体的场景化应用 2025年,作为国内全面接入DeepSeek的头部网安厂商,启明星辰在一个月内连续推出了大模型应用安 全产品"新三件套"、大模型应用安全服务组合,以及《大模型深度应用安全基座》系列白皮书。借力 DeepSeek,启明星辰掀起了一场效率革命:威胁检测从人工分析的小时级压缩至分钟级,漏洞修复周 期从30天缩至7天,90%高频攻击实现30秒自动闭环。 取得这样成绩的背后,是启明星辰以周为周期实现产品迭代闭环,是公司一季度精准锚定AI大模型驱 动的安全产业新赛道,在大模型安全业务构建中抢占战略先机。公司通过"赋能安全"与"护航安全"双轮 驱动,迅速形成行业标杆落地案例。报告显示,一季度启明星辰大模型安全产品已经在医疗、公安等高 敏感场景实现标杆项目落地,成功将技术先发优势转化为行业示范效应。 实际上,自2024年以来伴随着新质生产力 ...
2030年AGI到来?谷歌DeepMind写了份“人类自保指南”
虎嗅APP· 2025-04-07 23:59
以下文章来源于极客公园 ,作者芯芯 DeepMind认为这个时间线可能非常短,发布报告的目的是说清一个问题:如果AI有问题,最坏的情况会是什么?我们现在能如何准备? 一、DeepMind的AI安全保险 极客公园 . 用极客视角,追踪你最不可错过的科技圈。欢迎同步关注极客公园视频号 本文来自微信公众号: 极客公园 (ID:geekpark) ,作者:芯芯,编辑:靖宇,题图来自:AI生成 对于所谓的通用人工智能AGI,人们通常抱着"怕它不来,又怕它乱来"的矛盾心理。而这个困惑,对于正在AI军备竞赛中的硅谷巨头来说,就不仅仅 是一个"梗"能概括的了。 4月初,谷歌DeepMind发布了一份长达145页的报告文件,系统阐述了其对AGI安全的态度,DeepMind联合创始人Shane Legg的署名也在其中。 文件中最醒目的预测,是AGI的可能出现时间: 2030年 。 当然,Google也补充说,这具有不确定性。他们定义的AGI是"卓越级AGI (Exceptional AGI) "—— 即系统在非物理任务上达到或超越99%人类成年 人的能力,包括学习新技能等元认知任务 。 这份报告中反复出现的一个词是"严重伤害 ( ...
DeepSeek“防弹衣”来了,模型内生安全加固方案,拒绝杀敌一千自损八百|上海AI Lab
量子位· 2025-03-13 03:28
X-Boundary团队 发自 凹非寺 量子位 | 公众号 QbitAI 最新研究显示,以超强推理爆红的DeepSeek-R1模型竟藏隐形危险—— 当 主流防御方法(SFT/DPO/GA/CB) 应用在推理模型上,一个尖锐的矛盾浮出水面: 模型的安全防线每加固一分,其智能水平就衰退 一程 。 现有的防御方法要么不奏效,要么会对推理能力造成很大的损失。实验数据显示,SFT将攻击成功率(ASR)压低的同时,也导致了 DeepSeek-R1-Distill-Llama-8B的数学能力在AIME-2024基准上 骤降10% ,在XSTest和PHTest上还出现了 系统性误判——超过50% 的 安全提问遭遇无理由拒绝(表3)。这暴露出当前防御策略的致命缺陷:它们并非真正识别出危险,而是通过"宁可错杀一千"的粗暴策略压 低风险指标。 团队进一步将这些防御技术引入 多轮攻防场景,测评后发现,多轮防御训练本身就像一把双刃剑 。在Qwen2.5-7B-Chat模型中加入多轮防 御数据后,安全问答的误伤率在OR-Bench和PHTest测试集上飙升30%,证明防御强度的提升与可用性损耗存在强相关性。 这种困境的根源,在特征空间 ...