阶跃星辰联合吉利首次开源 Step 系列多模态大模型,包含视频、语音两款模型
最新 2 月 18 日消息,今日阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款 Step 系列多模态大模型向全球开发者开源。其中,包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃 Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃 Step-Audio。
据最新了解,阶跃 Step-Video-T2V 模型的参数量达到 300 亿,可以直接生成 204 帧、540P 分辨率的高质量视频。阶跃星辰称,从其获得的测评结果来看,它是目前全球范围内参数量最大、性能最好的开源视频生成大模型。
阶跃 Step-Audio 是行业内首个产品级的开源语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地高质量对话。模型生成的语音具有超自然、高情商等特征,同时也能实现高质量的音色复刻。用户即日起可在跃问 App 内体验新功能。
阶跃星辰是吉利汽车集团的科技生态战略合作伙伴,在两款大模型的研发过程中,双方展开了深度合作,在算力算法、场景训练等领域优势互补,显著增强了多模态大模型的性能表现。阶跃星辰称,深知 AGI 的实现离不开全球开发者的共同努力,开源的初心,是希望跟大家分享最新的多模态大模型技术成果,为全球开源社区贡献一份来自中国的力量。
阶跃星辰(上海阶跃星辰智能科技有限公司)是一家成立于 2023 年的人工智能大模型公司,总部位于中国上海。该公司由前微软全球副总裁姜大昕创办,专注于 AI 大模型的研发和应用。阶跃星辰于 2024 年 3 月发布了其 Step 系列大模型,此外公司还推出了两款 AI 应用产品:跃问、冒泡鸭。
相关文章
- OpenAI 周活跃用户达 4 亿,高管称用户“口口相传”发现
- Figure AI 人形机器人多模态能力升级:“听懂”语音指令
- 李开复 AI 公司零一万物被曝多处变动:计划拆分数字人业
- Spotify 启动 AI 配音有声书服务,29 种语言可供选择
- OpenAI GPT-4.5 有望下周发布,GPT-5 被曝将与 o3 大一
- 英伟达推出 Signs 平台:AI 突破美式手语学习,助力连接无
- 传字节大模型团队架构调整,知情人士称吴永辉和朱文佳都
- 清华系团队 DeepSeek 版多模态生物医药大模型 BioMedG
- DeepSeek 还在发力:官宣下周陆续开源 5 个代码库,毫无保
- 报告称 DeepSeek App 上线一个月下载量破亿:几乎没花钱