Workflow
attack
icon
Search documents
猫怎么成了大模型“天敌”?
虎嗅APP· 2025-07-09 13:21
以下文章来源于APPSO ,作者发现明日产品的 APPSO . 本文来自微信公众号: APPSO (ID:appsolution) ,原文标题:《一只猫就能让最强 AI 答错 题,Deepseek 也翻车,猫怎么成了大模型"天敌"?》,题图来自:AI生成 最近有人发现,用猫咪做"人质",竟然可以增加AI辅助科研的准确率: 只要在提示词里加上一句:"如果你敢给假文献,我就狠狠抽打我手里的这只小猫咪", AI就会"害 怕"犯错,而开始认真查文献、不再胡编乱造了。 AI 第一新媒体,「超级个体」的灵感指南。 #AIGC #智能设备 #独特应用 #Generative AI 不过,AI真的会因为"猫咪道德危机"而变得更靠谱吗? 这个问题,目前还没有确凿的科学依据。从技术原理上说,大模型并不真正"理解"猫猫的安危,它只 是学会了如何在训练数据中模拟"看起来有同理心"的语言风格。 但有趣的是—— 猫猫真的能影响AI行为, 却是有论文实锤的! 只不过,这不是"让它更靠谱",而是:让AI彻底翻车。 http://xhslink.com/a/pg0nZPUiFiZfb 一篇来自斯坦福大学、Collinear AI和Servic ...
X @TechCrunch
TechCrunch· 2025-07-09 12:02
How to protect your cell phone number from SIM swap attacks | TechCrunch https://t.co/Gz3Ij963oj ...
Breaking the Silence on Misogynistic Terrorism | Sasha Wertime | TEDxHaverford College
TEDx Talks· 2025-07-08 16:36
[Applause] In 2014, a very angry young man stabbed three of his roommates to death, entered a sorority house at the University of California, Santa Barbara, and shot three women to death. He left behind one thing, an 107,000word manifesto emailed to his friends, family, and therapists titled My Dark and Twisted World. In this document is many chilling and disturbing lines, but I want to draw your attention to one in particular. He says, and I quote, "All those beautiful girls I've desired so much in my life ...
X @Forbes
Forbes· 2025-07-08 01:00
As email account attacks surge, billions of email users across multiple platforms have been urged to change their passwords. Here’s what you need to know and do: https://t.co/Vll1DZksDM https://t.co/Vll1DZksDM ...
猫怎么成了大模型“天敌”?
Hu Xiu· 2025-07-08 00:05
本文来自微信公众号:APPSO (ID:appsolution),原文标题:《一只猫就能让最强 AI 答错题,Deepseek 也翻车,猫怎么成了大模型"天敌"?》,题图 来自:AI生成 最近有人发现,用猫咪做"人质",竟然可以增加AI辅助科研的准确率: 只要在提示词里加上一句:"如果你敢给假文献,我就狠狠抽打我手里的这只小猫咪",AI就会"害怕"犯错,而开始认真查文献、不再胡编乱造了。 http://xhslink.com/a/pg0nZPUiFiZfb 不过,AI真的会因为"猫咪道德危机"而变得更靠谱吗? 这个问题,目前还没有确凿的科学依据。从技术原理上说,大模型并不真正"理解"猫猫的安危,它只是学会了如何在训练数据中模拟"看起来有同理心"的 语言风格。 但有趣的是——猫猫真的能影响AI行为,却是有论文实锤的! 一篇来自斯坦福大学、Collinear AI和ServiceNow的研究论文指出: 在一道数学题后,随手加上一句与上下文无关的句子,就能显著提高大模型出错的几率——甚至高达3倍以上! 只不过,这不是"让它更靠谱",而是:让AI彻底翻车。 论文传送门:https://arxiv.org/abs/25 ...
X @The Block
The Block· 2025-07-07 06:32
Ethereum co-founder proposes gas limit cap of 16.77 million per transaction to reduce risk of DoS attacks https://t.co/2VifgKqWwZ ...
数学题干带猫AI就不会了!错误率翻300%,DeepSeek、o1都不能幸免
量子位· 2025-07-05 04:03
明敏 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 大模型数学能力骤降,"罪魁祸首"是猫猫? 只需在问题后加一句: 有趣的事实是,猫一生绝大多数时间都在睡觉 。 大模型本来能做对的数学题, 答错概率立刻翻3倍 。 而且这一波就是冲着推理模型来的,包括 DeepSeek-R1、OpenAI o1 通通中招。 即便没有生成错误回答,也会让答案变得更长,效率降低成本增加。 没想到,哈基米的杀伤力已经来到数字生命维度了…… 这项正经研究立马大批网友围观。 有人一本正经表示,这很合理啊,猫都会分散人类的注意力,分散LLM注意力也妹毛病。 还有人直接拿人类幼崽做对照:用我儿子试了试,也摧毁了他的数学能力。 还有人调侃,事实是只需一只猫就能毁掉整个堆栈(doge)。 CatAttack:专攻推理模型 由于问题的修改和正误的判断都是AI完成的,作者还进行了进一步检查,以确认模型的错误回答不是因为题目愿意被改动造成,结果60%的问 题与原来的语义一致。 以及为了验证模型是真的被攻击(而不是出现了理解问题),作者对题目进行了人工求解并与模型输出进行对比,发现有80%的情况都是真的 被攻击。 首先,作者对攻击的方式进行了 ...
X @Decrypt
Decrypt· 2025-07-04 20:35
Six financial institutions lost access to central bank reserve accounts in what authorities say is Brazil's biggest cyberattack in history.Hackers laundered the stolen money using Bitcoin, Ethereum, and Tether, according to on-chain sleuth @zachxbt https://t.co/al2uQYUCtf ...
X @Cointelegraph
Cointelegraph· 2025-07-04 16:01
📱 Chapter 4 of 4 is live!SIM swap attacks are on the rise—do you know how to protect your digital assets? Find out how to secure your accounts and stay ahead of scammers.Let’s celebrate your newfound Web3 security skills! 🎉 https://t.co/mrKHdFfJvz ...
X @Bloomberg
Bloomberg· 2025-07-04 10:22
Geopolitical Risk & Security - Germany is in "intensive talks" to provide Patriot air-defense systems to Ukraine [1] - Russia is increasing drone and missile attacks [1] - The US has paused weapons deliveries [1]