英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化
2025-02-03 08:12:06人工智能 IT之家 浩渺
近日,DeepSeek 发布 Janus Pro 模型,英特尔 Gaudi 2D AI 加速器现已针对该模型进行优化,为 AI 应用的落地和规模化发展提供的支持。
最新 2 月 1 日消息,近日,DeepSeek 发布 Janus Pro 模型,英特尔 Gaudi 2D AI 加速器现已针对该模型进行优化,为 AI 应用的落地和规模化发展提供的支持。
最新获悉,DeepSeek Janus 模型集成了多模态理解和生成功能。该模型首次采用统一的 Transformer 架构,突破了传统 AIGC 模型依赖多路径视觉编码的限制,实现了理解与生成任务的一体化支持。在此基础上,Janus Pro 通过优化训练策略和扩展模型规模,显著提升了文生图等功能的性能与稳定性,并提供了 10 亿参数和 70 亿参数两个版本。
英特尔 Gaudi 2D 凭借 2.45TB / 秒的高带宽和 96GB HBM 大容量内存,为 Janus Pro 模型提供了强大的计算支持,使其在生图批处理任务中,随着批量大小的增加,吞吐性能得到显著提升,大幅缩短任务处理时间。
与此同时,结合英特尔 Optimum-Habana 框架的优化,英特尔 Gaudi 2D 显著提升了文生图任务的吞吐性能和推理效率,仅需约 10 秒即可生成 16 张高质量的图片。而且,开发者仅需调整数行代码,即可实现这一结果,极大降低了开发门槛和迁移成本。此外,DeepSeek 的蒸馏模型在至强和 Gaudi 平台上也得到了支持。
赞一个! ()
相关文章
- OpenAI 周活跃用户达 4 亿,高管称用户“口口相传”发现
- Figure AI 人形机器人多模态能力升级:“听懂”语音指令
- 李开复 AI 公司零一万物被曝多处变动:计划拆分数字人业
- Spotify 启动 AI 配音有声书服务,29 种语言可供选择
- OpenAI GPT-4.5 有望下周发布,GPT-5 被曝将与 o3 大一
- 英伟达推出 Signs 平台:AI 突破美式手语学习,助力连接无
- 传字节大模型团队架构调整,知情人士称吴永辉和朱文佳都
- 清华系团队 DeepSeek 版多模态生物医药大模型 BioMedG
- DeepSeek 还在发力:官宣下周陆续开源 5 个代码库,毫无保
- 报告称 DeepSeek App 上线一个月下载量破亿:几乎没花钱