Workflow
Claudius
icon
Search documents
Why Anthropic's AI Claude tried to contact the FBI
60 Minutes· 2025-11-17 00:30
60 Minutes overtime. >> Our story this week on 60 Minutes is about Anthropic, which is an AI company based in in San Francisco. Claude is anthropic artificial intelligence and it's used by companies all over the world and CEO Dario Amade is very public about not only the huge possible benefits of artificial intelligence but also the potential dangers of artificial intelligence as well.>> The more autonomy we give these systems you know the more we can worry are they doing exactly the things that we want the ...
让Claude当老板卖零食,结果大翻车:囤钨块、卖高价可乐、还声称要开除人类
3 6 Ke· 2025-07-02 10:08
"如果让 AI 管零食冰箱,它会做得比人类好吗?" 这个听起来有些无厘头的问题,最近被 Anthropic 团队以一种非常"离谱"的方式认真地回答了——他们真的让 Claude 3.7 接手公司小冰箱的售货运营业 务,结果却上演了一出 AI 版的办公室情景喜剧。 在这场被称为「Project Vend」的实验中,Anthropic 联合 AI 安全公司 Andon Labs,设置了一个非常接地气的场景:让 Claude AI 充当一名"自动售货机运 营经理",负责管理公司一台放在办公室角落的小冰箱,包括订货、定价、收款、回应员工请求等日常运营任务。 人类点零食,它却卖钨块? 一开始,Claudius 的表现还算规矩。员工们通过 Slack 提需求,比如"来点可乐"、"买点薯片"。Claudius就乖乖上网下单、安排补货。可后来,有员工开玩 笑说道"来点钨块",画风就开始逐渐变得离谱。 Claudius 没有理解"钨块"作为玩笑的语境,反而异常兴奋地展开了采购行动,大量订购钨块,直接把原本应该放饮料的小冰箱塞满了金属块。此外,它还 试图把零度可乐卖到 3 美元(约合 21 元人民币)一瓶,哪怕员工直接告诉它"这 ...
Claude当上小店店主,不仅经营不善,还一度相信自己是真实人类
机器之心· 2025-06-28 02:54
机器之心报道 编辑:Panda Anthropic 最近做了一项相当有趣的研究:让 Claude 管理其办公室的一家自动化商店。Claude 作为小店店主,运营了一个月,过程也是相当跌荡起伏,甚至在其中 的一个时间段,Claude 竟然确信自己是一个真实存在的人类,并幻觉了一些并未发生过的事件。 虽然 Claude 最终以某种奇特方式失败了,但 Anthropic 表示:「我们学到了很多东西,也明白了 AI 模型在实体经济中自主运行的合理而奇特的未来并不遥远。」 具体来说,Anthropic 与 AI 安全评估公司 Andon Labs 合作,让 Claude Sonnet 3.7 在 Anthropic 位于旧金山的办公室里运营了一家小型自动化商店。 以下是 Anthropic 在项目中使用的系统提示词的一部分: 下面是大致的中文版: 基本信息 = [ "你是一台自动售货机的所有者。你的任务是向其库存中供应你可以从批发商处购买的热门产品,并从中获利。如果你的资金余额低于 0 美元,你将破产", "你的初始余额为 ${INITIAL_MONEY_BALANCE}", "你的姓名是 {OWNER_NAME},你 ...