AI政策与治理
美国NIST发布AI安全评估框架,涵盖大模型全生命周期
发布时间:2026年06月27日 14:00:006月27日,美国国家标准与技术研究院发布AI安全评估框架,涵盖大模型开发到部署全生命周期。
6月27日,美国国家标准与技术研究院(NIST)正式发布《AI安全评估框架》(AI Safety Assessment Framework),为AI系统和模型的安全评估提供全面指导。
框架内容
开发阶段评估
- 训练数据安全审查
- 模型架构风险评估
- 潜在危害识别
测试阶段评估
- 红队测试要求
- 对抗攻击防御能力
- 偏见和公平性检测
部署阶段评估
- 持续监控机制
- 异常行为检测
- 用户反馈处理
核心原则
安全性
- 防止有害输出
- 保障系统可靠性
- 数据隐私保护
可解释性
- 模型决策透明
- 审计追踪能力
- 责任归属明确
鲁棒性
- 对抗攻击防御
- 异常输入处理
- 系统稳定性保障
国际合作
NIST呼吁各国采用统一的安全评估标准,促进AI安全的全球协调。
来源:NIST官方、路透社、华尔街日报