大模型

阿里语音大模型Fun-Realtime系列登顶全球三项第一,超越GPT-Realtime-2

发布时间:2026年05月22日 08:00:00

阿里巴巴语音大模型Fun-Realtime-ASR和Fun-Realtime-AudioChat在全球权威AI评测平台Artificial Analysis登顶,在听准、听懂、会聊三项指标上超越GPT-Realtime-2等国际顶尖模型。


2026年5月22日,阿里巴巴语音大模型在人工智能领域取得重大突破。Fun-Realtime-ASR和Fun-Realtime-AudioChat在全球权威AI评测平台Artificial Analysis的评测中登顶。

三项全球第一

  • 听准(词错误率):语音识别准确率指标,以最低的词错误率登顶
  • 听懂(语音推理):语音语义理解能力,超越GPT-Realtime-2等国际顶尖模型
  • 会聊(对话流畅度):多轮语音对话的流畅性和自然度,达到业界最佳水平

行业意义

全球智能语音赛道竞争已进入精准化和场景化深水区。阿里语音大模型在核心指标上超越国际竞品,标志着中国在AI语音技术领域已跻身全球第一梯队,为智能客服、语音助手、实时翻译等应用场景提供了更强的基础能力。