大模型
面壁智能发布全球首个AI全自动编写的生产级训练框架ForgeTrain
发布时间:2026年05月26日 08:00:00面壁智能联合清华大学发布ForgeTrain,全球首个完全由AI编写的生产级大模型预训练框架,性能超越英伟达Megatron 10%。同时发布基于该框架训练的MiniCPM5-1B模型,以1B参数超越Qwen3.5-2B。
2026年5月26日,面壁智能联合清华大学、OpenBMB开源社区正式发布ForgeTrain预训练框架及MiniCPM5-1B基座模型。
核心信息
- ForgeTrain框架:全球首个完全由AI编写的生产级大模型预训练框架,零人类工程师参与核心代码编写
- 性能对比:在英伟达H100上训练速度超越Megatron 5%-10%,在华为昇腾上也有10%加速
- MiniCPM5-1B:10亿参数端侧文本基座模型,在AA-Index上超越所有2B以下参数模型
- 极致压缩:INT4量化后权重仅0.5GB,可运行在手机、平板、浏览器等端侧设备
- 智能密度:面壁智能提出密度定律,大模型智能密度约每3.5个月翻一番
行业意义
面壁智能将AI制造AI分为L1到L5五个阶段,ForgeTrain已达到L3-L4阶段,标志着中国在递归自我改进(RSI)技术路径上率先产出可复现的工程样本。