阿里通义百聆推出语音模型新版本:3 秒录音即可“复制”9 种语言、18 种方言
最新 12 月 15 日消息,今天下午,通义大模型通过官方公众号宣布,两款“百聆”语音模型正式开源,两款模型迎来升级。根据介绍,其只需 3 秒录音,就能让你的声音无缝切换语种、方言与情绪 —— 普通话、粤语、日、英、开心、愤怒……9 种通用语言、18 种方言,通通搞定。
升级
Fun-CosyVoice3 模型升级:首包延迟降低 50%,中英混字准确率翻倍,支持 9 语种 18 方言口音、跨语种克隆与情感控制;
Fun-ASR 模型能力增强:噪声场景准确率 93%、支持歌词与说唱识别、31 语种自由混说、方言口音覆盖,并将流式识别模型的首字降低到 160ms。
开源
Fun-CosyVoice3(0.5B)开源:提供 zero-shot 音色克隆能力,支持本地部署与二次开发;
Fun-ASR-Nano(0.8B)开源:Fun-ASR 的轻量化版本,推理成本更低,模型开源,支持本地部署与定制化微调。
最新从官方获悉,本次,Fun-CosyVoice3 大模型完成多项关键升级:
首包延迟降低 50%,支持双向流式合成,真正实现“输入即发声”,适用于语音助手、直播配音、无障碍阅读等实时场景;
中英混说词错误率(WER)相比之前降低 56.4%,不论是含专业术语、大小写混排,还是语码转换的句子,都能精准、自然地发音;
在 zero-shot TTS 评测中,内容一致性与音色相似度全面提升,复杂场景(test-hard)字符错误率(CER)相对降低 26%,接近人类录音水平;
9 种通用语言、18 种中文方言、9 种情感控制,并具备跨语种音色复刻能力 —— 用一段普通话录音,即可生成粤语、日语、英语等语音,音色保持高度一致。
而开源的 Fun-CosyVoice3-0.5B 模型提供了 zero-shot 音色克隆能力,只需要你提供一段 3 秒以上的参考音频,即可复刻其音色并合成新语音,并且支持本地部署和二次开发。
Fun-ASR 号称能让 AI “听得懂”。其基于数千万小时真实语音数据训练,已在钉钉“AI 听记”、视频会议等场景中大规模落地。官方表示,该模型重点优化了嘈杂环境鲁棒性、多语言自由混说、中文方言与口音覆盖、歌词识别、定制化能力,并将流式识别模型的首字降低到 160ms。

Fun-CosyVoice3-0.5B 开源地址:
https://github.com/FunAudioLLM/CosyVoice(GitHub)
https://funaudiollm.github.io/cosyvoice3/(GitHub.io)
https://www.modelscope.cn/studios/FunAudioLLM/Fun-CosyVoice3-0.5B(体验 demo)
https://modelscope.cn/models/FunAudioLLM/Fun-CosyVoice3-0.5B-2512(国内模型仓库)
https://huggingface.co/FunAudioLLM/Fun-CosyVoice3-0.5B-2512(海外模型仓库)
Fun-ASR-Nano-0.8B 开源地址:
https://github.com/FunAudioLLM/Fun-ASR(GitHub)
https://funaudiollm.github.io/funasr/(GitHub.io)
https://modelscope.cn/studios/FunAudioLLM/Fun-ASR-Nano/(国内体验 demo)
https://huggingface.co/spaces/FunAudioLLM/Fun-ASR-Nano(海外体验 demo)
https://modelscope.cn/models/FunAudioLLM/fun-asr-nano-2512(国内模型仓库)
https://huggingface.co/FunAudioLLM/Fun-ASR-Nano-2512(海外模型仓库)
《阿里通义百聆推出语音模型新版本:3 秒录音即可“复制”9 种语言、18 种方言》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
首飞成功!我国彩虹7隐身无人机有多强 央视揭秘:堪称无敌
快科技12月15日消息,中国航天科技集团第十一研究院今日官宣,由该院研制的彩虹-7高空高速隐身无人机近日在西北某机场成功首飞!这标志着我国在高性能、高隐身无人机领域取得重大突破,跻身全... -
警惕!男子持氧气瓶进核磁室 10分钟肿胀毙命
快科技12月15日,据科普中国公众号消息,看似安全的核磁共振检查室,暗藏致命风险。2018年印度,一名健康男子手持氧气瓶踏入核磁共振室,瞬间连人带瓶被吸入仪器,高压氧气灌入口鼻,10分钟后... -
“三全”脑机接口完成首例临床试验:高位截瘫患者能玩游戏了
快科技12月15日消息,中国脑机接口领域诞生了一项里程碑成果!日前,上海脑虎科技宣布,其自主研发的 “三全”脑机接口产品,完成首例临床试验并取得圆满成功。参与临床试验的是一... -
芯片不再“躺平”!美国团队造出首颗单片3D芯片:性能4倍跨越
快科技12月15日消息,近日,一支由斯坦福大学、卡内基梅隆大学、宾夕法尼亚大学和麻省理工学院的工程师组成的研究团队宣布取得重大突破,成功制造出美国首个在商业代工厂生产的单片3D集成电路原... -
SpaceX猎鹰火箭助推器成功回收550次!82%都在船上
快科技12月15日消息,北京时间12月14日13点49分,SpaceX在范登堡太空军基地发射了一枚编号B1093的猎鹰9号火箭,成功将27颗星链V2 Mini卫星送入轨道。已经使用了9次的一级助推器再次顺利完成回...

















