谷歌是如何思考智能体安全问题的？

2025年，AI正式进入大规模商业落地的关键时刻。当AI不再是实验室里的新奇玩具，而是要真正融入企业的核心业务流程时，整个科技界达成了前所未有的共识： AI安全不再是可有可无的"加分项"，而是落地的必要一环。谷歌发布了一份《AI智能体安全方法白皮书》，聚焦了当前AI落地的最前沿领域——AI智能体（AI Agent）面临两大的核心风险： • 失控行为风险：当AI智能体被赋予发送邮件、修改文件、进行交易等实际操作权限后，一旦被恶意"提示注入"攻击，或因误解指令而失控，可能造成不可挽回的损失。 • 敏感数据泄露：智能体在处理企业内部数据时，可能被诱导将机密信息通过各种隐蔽方式（如编码在URL参数中）泄露给攻击者。面对这些挑战，文章提出了系统性的解决方案—— "混合式纵深防御"体系，巧妙融合了传统的确定性安全措施与基于AI的动态防御，在保留智能体效用的同时构建多层安全屏障。文章认为，传统的安全范式在AI时代已经失效。为传统软件设计的访问控制过于僵化，会扼杀智能体的效用，而完全依赖AI自我约束同样不可靠，因为当前的LLM仍易受提示注入等攻击手段操纵。这种"效用与安全"的根本性矛盾，催生谷歌提出了" ...