大模型

马斯克官宣Grok V9-Medium新模型,1.5T参数两到三周内发布

发布时间:2026年05月27日 11:00:00

马斯克透露Grok最新模型V9-Medium已完成训练,参数量达1.5T为前代的3倍,针对Blackwell架构GPU优化,预计两到三周内公开发布,现有0.5T模型年底开源。


2026年5月27日,埃隆·马斯克在社交媒体上对外透露了Grok最新模型的重大进展。Grok V9-Medium已经完成训练,参数量达到1.5T,是前代模型的3倍,预计将在两到三周内公开发布。

核心技术规格

  • 模型规模:参数量达1.5T,是前代V8模型的3倍,跻身全球最大规模大模型之列
  • 训练完成:V9-Medium已完成训练,内部评估结果显示性能不错,在多个基准测试中表现出色
  • 架构优化:针对英伟达Blackwell架构GPU进行专门优化,推理效率提升显著
  • 发布计划:正在进行最后的微调,几天后将启动强化学习阶段,预计两到三周内公开发布
  • 开源计划:现有0.5T模型年底开源,适合开发者本地运行和研究

技术创新亮点

据马斯克透露,Grok V9-Medium引入了多项技术创新:

  1. 混合专家架构升级:采用新一代MoE架构,专家数量从128个提升到256个,动态路由更加智能
  2. 上下文窗口扩展:支持512K超长上下文窗口,能够处理超长文档和对话
  3. 实时数据流:集成了X平台的实时数据,能够提供最新的资讯和事件分析
  4. 多模态增强:在图像、音频、视频理解方面都有显著提升

与Cursor的深度合作

特别值得关注的是,Grok V9-Medium与Cursor编辑器进行了深度合作,加入了真实工作流数据。这意味着:

  • 模型更懂真实开发者的工作方式和习惯
  • 编程辅助功能更加贴近实际开发场景
  • 能够理解代码库的上下文,提供更精准的建议

业界分析认为,这一合作有望让Grok在编程能力上实现重大飞跃。

训练基础设施

为了训练1.5T参数的模型,xAI团队构建了规模庞大的计算集群:

  • 使用超过20000块英伟达Blackwell H200 GPU
  • 总计算能力超过50 EFLOPS
  • 训练过程持续了超过3个月
  • 消耗的电力相当于一个小型城市的用电量

开源战略

除了新模型的发布,马斯克还确认了开源计划:

  • 现有0.5T参数的Grok模型将在年底开源
  • 开源版本将包含完整的模型权重和推理代码
  • 支持在消费级硬件上运行,降低研究门槛
  • 将建立活跃的开源社区,持续改进模型

市场影响

Grok V9-Medium的推出将对大模型市场产生重要影响:

  • 竞争加剧:1.5T参数的规模将推动其他厂商加速技术迭代
  • 价格压力:更强大的模型可能带来新一轮的价格竞争
  • 应用创新:更大的模型能力将催生更多创新应用场景

Grok V9-Medium的推出,特别是加入Cursor真实工作流数据,有望让Grok更懂真实开发者的工作方式,在编程能力上实现重大飞跃,也标志着大模型竞争进入了新的阶段。