Fun-ASR 1.5 聚焦"听得更全、识别更准、输出更规范"三大核心目标,基于统一的大模型架构,在方言与地方口音识别、多语种支持、输出文本规范化三大维度实现全面升级。
Fun-ASR 1.5 聚焦三大核心目标,实现全方位能力跃升。
基于超数十万小时真实方言语音数据训练,重点优化上海话、客家话等方言,内部评测集中字错误率(CER)显著下降。
单模型原生支持东亚、东南亚、中东、欧洲等地区的 30 种语言,在混合语种对话、跨语言自由切换等复杂场景下表现出卓越鲁棒性。
通过构建高质量中文古诗词真人诵读数据集,实现字符级识别准确率高达 97%,让千年韵律与文言之美被现代语音技术精准"听"懂。
深度优化智能标点预测与增强型文本归一化(ITN),有效解决数字、日期、单位等口语表达的规范化问题,大幅降低后期人工编辑成本。
基于超数十万小时真实方言语音数据训练,覆盖中文七大主要方言与地方口音,实现高精度的方言自动识别与转写。
单模型原生支持东亚、东南亚、中东、欧洲等地区的 30 种语言,在混合语种对话、跨语言自由切换等复杂场景下表现出卓越鲁棒性。
让千年韵律被现代技术"听"懂。通过构建高质量中文古诗词真人诵读数据集,实现字符级识别准确率高达 97%。
在方言识别与多语种转写方面,全面领先行业水平。多语种识别 CER 相比 fun-asr-mtl 降低 12.07%。
Fun-ASR 1.5 已在国内站与国际站(新加坡)同步上线。
关于 Fun-ASR 1.5 升级的常见问题解答。
fun-asr 或者 fun-asr-2025-11-07 即可。