大模型动态
谷歌发布Veo 3视频生成模型,支持语音和音乐同步生成
发布时间:2026年06月28日 10:00:006月28日,谷歌正式发布Veo 3视频生成模型,实现视频、语音和音乐的同步生成。
6月28日,谷歌正式发布Veo 3视频生成模型,这是Veo系列的重大升级版本,首次实现视频画面、语音对话和背景音乐的同步生成,开创AI视频创作新范式。
核心能力
多模态生成
- 视频画面自动生成
- 语音对话同步生成
- 背景音乐自动配乐
生成质量
- 1080P高清视频输出
- 60fps流畅帧率
- 专业级视觉质量
控制能力
- 文本描述精确控制
- 参考图像风格迁移
- 视频时长灵活控制
技术创新
生成架构
- 自研VideoPoet架构
- 多模态注意力机制
- 时序一致性优化
音频同步
- 唇形同步技术
- 情感语音合成
- 多音轨混音能力
应用场景
内容创作
- 短视频自动生成
- 影视预告片制作
- 广告创意快速迭代
教育培训
- 教学视频自动生成
- 虚拟教师形象
- 多语言教学内容
来源:谷歌官方、The Verge、TechCrunch