人工智能

推理效率与国外同类产品架构解决方案相当，国产飞腾 CPU 实现对 DeepSeek 全系列大模型端到端支持

2025-02-10 07:47:59人工智能 IT之家归泷

飞腾信息技术有限公司旗下腾云 S5000C 和腾锐 D3000 成功实现对 DeepSeek 全系列大模型的端到端支持，覆盖数据中心和终端场景。

最新 2 月 9 日消息，飞腾信息技术有限公司昨日晚发文宣布，旗下腾云 S5000C 和腾锐 D3000 成功实现对 DeepSeek 全系列大模型的端到端支持，覆盖数据中心和终端场景，本地部署的推理效率与国外同类产品架构解决方案相当。

据介绍，DeepSeek-V2.5 236B 大模型于 2024 年在飞腾腾云 S5000C 平台实现稳定运行。基于飞腾腾云 S5000C 设备搭配 8 块国产 AI 卡，整体性能可达国外平台性能 80% 左右。DeepSeek-V3 和 R1 版本发布后，飞腾技术团队在腾云 S5000C 平台和腾锐 D3000 上对其进行本地部署验证，形成整体解决方案。

数据中心侧，飞腾腾云 S5000C 服务器可与多款 AI 加速卡配合实现 DeepSeek 蒸馏版和全量版部署。飞腾 AI 实验室在单机 8 卡服务器平台已进行蒸馏版 DeepSeek-R1-Distill-Llama-70B 版本测试，推理速度可达 22tokens / s。完整版 DeepSeek R1 671B 模型采用分布式推理框架，基于四机 32 卡 AI 服务器集群运行可部署成功。

推理效率与国外同类产品架构解决方案相当，国产飞腾 CPU 实现对 DeepSeek 全系列大模型端到端支持