国内首个端到端语音同传:星火语音同传大模型发布,达到人类专家译员水平
2025-01-16 06:48:13人工智能 IT之家 汪淼
官方演示了通过翻译机进行语音同声传译,可以看到一些专有词汇也能正常翻译。科大讯飞官方还透露,将在 2025 年发布更多翻译机新品。
最新 1 月 15 日消息,科大讯飞今日发布国内首个具备端到端语音同传能力的大模型 —— 星火语音同传大模型。
最新从科大讯飞官方获悉,针对日常对话、商务交流、行业翻译等国际交流场景中的高难度同传翻译需求,星火语音同传大模型在内容完整度、信息准确度以及语言质量上都处于“行业领先水平”,超过谷歌 Gemini 2.0 和 OpenAI GPT-4o,最快实现 5 秒以内的同传时延,达到人类专家译员的水平。
官方演示了通过翻译机进行语音同声传译,可以看到一些专有词汇也能正常翻译。
此外,讯飞星火翻译机可以记录回溯对话内容,还能够连接耳机、音箱等音频设备。
据了解,星火同传语音大模型支持译文长度反向调控,语音到文本端到端翻译支持流式意群切分、语境理解、信息重组,流式语音合成则支持意群韵律衔接、自适应语速调节。
科大讯飞官方还透露,将在 2025 年发布更多翻译机新品。
赞一个! ()
相关文章
- OpenAI 周活跃用户达 4 亿,高管称用户“口口相传”发现
- Figure AI 人形机器人多模态能力升级:“听懂”语音指令
- 李开复 AI 公司零一万物被曝多处变动:计划拆分数字人业
- Spotify 启动 AI 配音有声书服务,29 种语言可供选择
- OpenAI GPT-4.5 有望下周发布,GPT-5 被曝将与 o3 大一
- 英伟达推出 Signs 平台:AI 突破美式手语学习,助力连接无
- 传字节大模型团队架构调整,知情人士称吴永辉和朱文佳都
- 清华系团队 DeepSeek 版多模态生物医药大模型 BioMedG
- DeepSeek 还在发力:官宣下周陆续开源 5 个代码库,毫无保
- 报告称 DeepSeek App 上线一个月下载量破亿:几乎没花钱