字节跳动豆包大模型 1.5 Pro 发布,综合得分优于 GPT-4o、Claude 3.5 Sonnet
最新 1 月 22 日消息,字节跳动旗下豆包大模型 1.5 Pro 今日正式发布,全新 Doubao-1.5-pro 模型增强了综合能力,在知识、代码、推理、中文等多个测评基准上,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等模型。
目前,Doubao-1.5-pro 已在豆包 App 灰度上线,同时开发者也可在火山引擎直接调用 API 。
据字节跳动官方介绍,豆包大模型 1.5 Pro 使用较小的激活参数进行预训练,采用大规模稀疏 MoE 架构,等效 7 倍激活参数的 Dense 模型性能,远超业内 MoE 架构约 3 倍杠杆的常规效率。
新版豆包视觉理解模型 Doubao-1.5-vision-pro、豆包实时语音模型 Doubao-1.5-realtime-voice-pro 一同发布。
相比上一版本,Doubao-1.5-vision-pro 在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力,并让模型的回复模式变得更加精简、友好。
豆包大模型 1.5 Pro 本次推出了豆包・实时语音模型,并在豆包 App 全量开放(豆包 App 升级至 7.2.0 版本)。作为一款语音理解和生成一体化的模型,豆包实时语音大模型实现了端到端语音对话,具备低时延、对话中可随时打断等特性。火山引擎将在上半年通过方舟平台推出对应 API 服务。
最新从字节跳动官方获悉,豆包大模型 1.5 Pro 宣称“所有模型训练过程中,未使用任何其他模型生成的数据”。豆包大模型 1.5 全产品,包括 Doubao-1.5-pro,Doubao-1.5-lite,Doubao-1.5-vision-pro 等,将继续保持原有模型价格不变,加量不加价。
相关文章
- OpenAI 周活跃用户达 4 亿,高管称用户“口口相传”发现
- Figure AI 人形机器人多模态能力升级:“听懂”语音指令
- 李开复 AI 公司零一万物被曝多处变动:计划拆分数字人业
- Spotify 启动 AI 配音有声书服务,29 种语言可供选择
- OpenAI GPT-4.5 有望下周发布,GPT-5 被曝将与 o3 大一
- 英伟达推出 Signs 平台:AI 突破美式手语学习,助力连接无
- 传字节大模型团队架构调整,知情人士称吴永辉和朱文佳都
- 清华系团队 DeepSeek 版多模态生物医药大模型 BioMedG
- DeepSeek 还在发力:官宣下周陆续开源 5 个代码库,毫无保
- 报告称 DeepSeek App 上线一个月下载量破亿:几乎没花钱