安全与治理

OpenAI发布Lockdown Mode锁定模式，专门防御提示词注入攻击

发布时间：2026年06月08日 13:00:00

OpenAI正式推出Lockdown Mode锁定模式，专门保护敏感数据免受提示词注入攻击。这是AI安全领域的重要防线建设，可限制模型被恶意指令操控，防止数据泄露和越狱攻击。

6月8日，OpenAI正式推出"锁定模式"（Lockdown Mode），这是一项专门针对提示词注入攻击的安全防御机制，旨在保护企业和开发者的敏感数据免受恶意攻击。

随着AI Agent的广泛应用，提示词注入攻击已成为AI安全领域最严峻的威胁之一。攻击者可以通过精心构造的输入，诱导模型执行非预期的操作，包括：

输入隔离：严格区分系统指令和用户输入，防止用户输入中的恶意指令污染系统层。

敏感数据保护：对模型可访问的数据范围进行精细化控制，确保敏感信息不会通过推理路径泄露。

行为约束：为Agent的工具调用设置严格的安全边界，限制模型可执行的操作范围和权限等级。

审计日志：记录所有提示词交互和模型行为，便于安全审计和事后追溯。

Lockdown Mode的发布标志着AI安全从被动防御走向主动防护的新阶段。随着越来越多的企业将AI Agent集成到核心业务流程中，安全能力已成为AI平台的竞争壁垒之一。分析人士认为，AI安全将成为一个快速增长的市场，预计在未来几年内达到数百亿美元规模。