大模型动态

Anthropic 发布 Claude Fable 5:Mythos 级模型首次面向大众,配备安全阀门机制

发布时间:2026年06月10日 08:00:00

Anthropic 正式发布 Claude Fable 5(公众版)和 Claude Mythos 5(受限版),这是其最强大的 Mythos 级模型首次面向普通订阅用户开放。Fable 5 在 SWE-bench Pro 上取得 80.3%,定价 10 美元/百万输入 tokens,搭载安全阀门机制,高风险话题自动降级到 Opus 4.8 响应。


6月10日,Anthropic 正式发布 Claude Fable 5 和 Claude Mythos 5 双模型,这是其 Mythos 级模型首次面向普通用户开放,标志着 Anthropic 产品线从 Opus 系列跃升至全新 Mythos 时代。

双模型策略:能力相同,安全分级

Fable 5 与 Mythos 5 基于同一底层架构,区别仅在于安全访问控制层:

  • Claude Fable 5:面向所有订阅用户和 API 客户开放,搭载安全阀门机制,高风险话题自动降级
  • Claude Mythos 5:仅通过 Project Glasswing 向约 200 个经审核组织提供,移除安全限制,具备完整网络安全能力

核心性能突破

Fable 5 在多个关键基准测试上创下新纪录:

  • SWE-bench Pro:80.3%(对比 Opus 4.8 为 69.2%,GPT-5.5 约 58-60%)
  • FrontierCode 基准:29.3%(Opus 4.8 仅 13.4%)
  • 百万 Token 上下文窗口:支持长时间运行的自主任务
  • 128,000 最大输出 Token:适合复杂代码生成和长文档处理

Stripe 报告 Fable 5 仅用一天完成了原本需要两个月的代码迁移任务——将一个 5000 万行的 Ruby 代码库在单日内完成迁移。

定价策略

  • 输入:10 美元/百万 tokens(约为 Opus 4.8 的两倍)
  • 输出:50 美元/百万 tokens
  • 提示缓存可享 90% 折扣
  • 截至 6 月 22 日前,Pro/Max/Team/Enterprise 用户可免费使用

安全阀门机制详解

Fable 5 的最大创新是安全阀门机制。当检测到以下高风险话题时,模型自动降级到 Claude Opus 4.8 响应:

  • 网络安全漏洞利用
  • 生物学威胁
  • 化学武器相关
  • 模型蒸馏

Anthropic 表示安全分类器在不到 5% 的会话中激活,但开发者社区反馈普通科学问题(如化学实验步骤)也可能被拦截,引发了关于过度对齐的讨论。

行业影响

Fable 5 的发布是 AI 行业的重要里程碑。一方面,它是截至目前向普通用户开放的最强模型;另一方面,其安全阀门设计可能成为行业范式——顶尖能力与安全约束的平衡方案。在 Anthropic 冲刺 IPO 的关键时期,Fable 5 的推出也展现了公司加速产品迭代的战略意图。