阿里通义发布端到端语音交互模型 Fun-Audio-Chat,能猜出你的心情
最新 12 月 23 日消息,阿里通义大模型今日发布了新一代端到端语音交互模型 Fun-Audio-Chat。

阿里通义本次开源了 Fun-Audio-Chat 8B,该模型在 OpenAudioBench、MMAU、Speech-ACEBench、VStyle 等多个榜单上“同尺寸模型排名第一”,综合性能超 GLM4-Voice、Kimi-Audio、Baichuan-Omni 等。

最新附 Fun-Audio-Chat 技术亮点如下:
端到端 S2S 架构:从语音输入直接生成语音输出,无需 ASR + LLM + TTS 多模块拼接,效率更高、延迟更低。
双分辨率设计:Shared LLM 层以 5Hz 帧率高效处理,SRH 以 25Hz 帧率生成高质量语音,GPU 计算开销降低近 50%。
百万小时多任务数据训练:覆盖音频理解、语音问答、情感识别、工具调用等真实场景,让模型更“接地气”。


阿里通义表示,Fun-Audio-Chat 可以提供“像朋友一样的对话体验”,感知用户的情绪,哪怕用户没直接说情绪,它也能从语气、语速、停顿里猜出心情,然后给出回应。
此外,Fun-Audio-Chat 可完成复杂任务,用户只需用自然语音下达指令,它就能自动调用函数。
最新附 Fun-Audio-Chat 8B 开源地址如下:
GitHub:https://github.com/FunAudioLLM/Fun-Audio-Chat
HuggingFace:https://huggingface.co/FunAudioLLM/Fun-Audio-Chat-8B
ModelScope:https://modelscope.cn/FunAudioLLM/Fun-Audio-Chat-8B
Demo Page:https://funaudiollm.github.io/funaudiochat
《阿里通义发布端到端语音交互模型 Fun-Audio-Chat,能猜出你的心情》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
国产超豪第一车!尊界S800交付突破10000辆
快科技12月23日消息,鸿蒙智行官宣,尊界S800上市202天累计交付突破10000辆!在上周举办的第10000辆量产下线仪式现场,余承东透露交付速度会越来越快,未来将向4000台/月加速,12月31日前锁单... -
9988元!Vbot发布首款无需遥控机器狗“大头BoBo”
快科技12月23日消息,维他动力(Vbot) 正式发布其首款无需遥控的消费级超能机器狗产品“大头BoBo”。大头BoBo的最高时速可达13.3公里/小时(相当于专业马拉松4分30秒的配速),轻松... -
零碳排放!国内首台136吨级氢燃料矿用自卸车成功验收
快科技12月23日消息,“国资小新”发文,中国兵器工业集团北重集团北方股份携手国家电投集团,成功合作开发出国内首台136吨级氢燃料电池与锂电池混合动力矿用自卸车——NTH... -
华大集团CEO晒出蔡磊血样:将会测序组装成“完美”基因组
快科技12月23日消息,昨晚,华大集团CEO尹烨在微博晒出蔡磊的血液样本。他表示:“蔡磊兄的这份样本,将会测序组装成‘完美’基因组,为破冰继续并肩作战。一晃三年了,我们争... -
你坐过没!国产大飞机C919安全载客突破300万人次
快科技12月23日消息,据国内媒体报道称,今天交通运输部副部长李扬公开表示,C919安全载客突破300万人次。“我国交通运输领域新质生产力加快发展,完成约1700公里高速公路、2200余处公路...















