MiniMax 海螺语音 AI 产品上线:支持 17 种语言生成,最长可输入多达 10000 字符
2025-01-22 07:47:20人工智能 IT之家 浩渺
MiniMax 昨日宣布,带来全新升级的 T2A-01 系列语音模型,并全球同步上线海螺语音产品。据介绍,依托于 T2A-01 系列语音模型,用户在海螺 AI 仅需输入文字即可生成自然、流畅的超拟人人声,最长可输入多达 10000 字符。
感谢最新网友 动感超人233、Hi_World、Skyraver、風見暉一 的线索投递!
最新 1 月 21 日消息,MiniMax 昨日宣布,带来全新升级的 T2A-01 系列语音模型,并全球同步上线海螺语音产品。
据介绍,依托于 T2A-01 系列语音模型,用户在海螺 AI 仅需输入文字即可生成自然、流畅的超拟人人声,最长可输入多达 10000 字符。与此同时,用户可以根据需要自由配置输出语音的情绪、语速、音高,甚至调整音色效果,满足复杂场景的精细化需求。
最新注意到,海螺语音支持中文、粤语、英语、日语、韩语、阿拉伯语、葡萄牙语、西班牙语、法语、意大利语、印尼语、荷兰语、俄语、德语、越南语、土耳其语、乌克兰语等 17 种语言生成。
官方称,用和 Seed-TTS 论文相同的评测集和评测工具(WER:合成音频的文本和 asr 识别结果计算词错率;SIM:用说话人识别工具计算合成音频和真实音频的距离,表示复刻相似度)来计算海螺语音的字错率和相似度(加粗数字评分代表更优结果)。结果显示,海螺语音在中文的字错率和相似度最好,英文的字错率、相似度和真实录音「Human」接近。
海螺语音具备情感理解能力,能够智能地识别并重现语音中细微的情感差别,让声音更加鲜活,情绪表达更加精准。同时,还预置不同语种共计 300 + 音色供用户选择,用户可按语言、口音、性别和年龄分类筛选。音色多变,不羁、诙谐、慈祥等风格丰富多样,有声书、ASMR 耳语、新闻播报等场景均可适用。
赞一个! ()
相关文章
- OpenAI 周活跃用户达 4 亿,高管称用户“口口相传”发现
- Figure AI 人形机器人多模态能力升级:“听懂”语音指令
- 李开复 AI 公司零一万物被曝多处变动:计划拆分数字人业
- Spotify 启动 AI 配音有声书服务,29 种语言可供选择
- OpenAI GPT-4.5 有望下周发布,GPT-5 被曝将与 o3 大一
- 英伟达推出 Signs 平台:AI 突破美式手语学习,助力连接无
- 传字节大模型团队架构调整,知情人士称吴永辉和朱文佳都
- 清华系团队 DeepSeek 版多模态生物医药大模型 BioMedG
- DeepSeek 还在发力:官宣下周陆续开源 5 个代码库,毫无保
- 报告称 DeepSeek App 上线一个月下载量破亿:几乎没花钱