行业动态

英伟达正式发布 Cosmos 3 全模态物理 AI 大模型,全面开源推动具身智能

发布时间:2026年06月05日 08:00:00

英伟达在 COMPUTEX 2026 上正式发布 NVIDIA Cosmos 3,这是全球首款完全开放的全模态物理 AI 基础模型,基于混合 Transformer 架构,打通视觉推理、世界生成、动作预测三大核心能力,并宣布全面开源。


6 月 5 日,英伟达在 COMPUTEX 2026 与 GTC Taipei 联动大会收官当日正式官宣 NVIDIA Cosmos 3,定位为"全球首款完全开放的全模态物理 AI 模型",面向机器人、自动驾驶等具身智能领域。

核心技术突破

Cosmos 3 基于全新的混合 Transformer(Mixture-of-Transformers)架构构建,统一打通了视觉推理、世界生成、动作预测三大核心能力。该模型能够同步解析图像、音频、物理动作参数,填补了人形机器人在环境感知方面的关键短板。

  • 全模态理解:支持文本、图像、视频、音频和动作序列的多模态联合处理与生成
  • 世界模型能力:可在统一的框架内进行物理世界仿真和动作生成
  • 开放开源:模型权重免费向全球科研团队开放,可通过 Hugging Face 获取

生态建设

英伟达同时宣布牵头成立"全球物理 AI 开发者协作联盟",并配套推出 Isaac 仿真平台升级版和 Agent Toolkit 工具集,构建完整的物理 AI 开发生态。英伟达创始人兼 CEO 黄仁勋表示:“物理 AI 是下一个 AI 前沿,Cosmos 3 将为全球开发者提供一个开放的基础平台。”

行业影响

Cosmos 3 的开源发布被视为对 OpenAI、Google 等闭源模型路线的重要制衡。分析人士指出,英伟达借助其硬件生态优势,正在从"算力提供商"向"AI 基础平台"战略转型,这将加速全球具身智能和机器人技术的商业化落地进程。