华为数据存储、中科弘云发布 AI 推理加速联合解决方案,适配英伟达、昇腾、寒武纪等算力
最新 12 月 23 日消息,华为数据存储与中科弘云今日发布了 AI 推理加速联合解决方案。
该方案以华为 OceanStor A 系列存储为数据底座,结合中科弘云智算互联网云服务平台 HyperCN 平台,优化长序列推理体验。

该方案深度融合华为 OceanStor A 系列存储、华为 UCM 推理记忆数据管理技术以及中科弘云 HyperCN 平台能力,通过 KV Cache 多级缓存管理、秒级算力调度、分钟级推理大模型部署及全流程 AI 工具链,将智能算力输送至业务一线。该联合方案的核心优势如下:
异构管理:支持平台、计算与存储的协同联动,适配英伟达、华为昇腾、寒武纪等多元 AI 算力,兼容 MindSpore / vLLM/SGLang 等主流框架,并通过 Kubernetes 与华为 OceanStor A 系列存储实现无缝对接。
算力调度:对算力资源进行细粒度切分与池化处理,按需灵活调度,实现资源利用率最大化;具备集群作业调度、运维监控、故障恢复等功能,支持分钟级任务恢复与系统健康监测。
推理加速:依托华为 UCM 技术,将 KV Cache 持久化至华为 OceanStor A 系列存储,实现推理记忆全量保存,减少重复计算;此外,融合 Prefix Cache、GSA 稀疏加速等算法,显著降低首 Token 时延(TTFT),使长序列推理吞吐与体验实现倍数级提升。
端到端 AI 工具链:覆盖数据管理标注、算法开发、大小模型训练推理、智能体开发等全流程,支持传统机器学习与深度学习开发,实现 AI 资产的统一建设与集中管理。
经实测,在智能问答的典型推理场景中,该方案实现首 Token 时延(TTFT)降低 57.5%,且序列长度越长,优化效果越显著;在长文档推理场景中,结合 GSA 稀疏加速算法,当序列长度为 39K 时,并发能力提升 86%,推理吞吐提升 36%,提升推理效率与体验。
最新从合作公告获悉,该联合方案目前已在能源电力、智能制造、国家实验室等关键行业启动试点应用。
《华为数据存储、中科弘云发布 AI 推理加速联合解决方案,适配英伟达、昇腾、寒武纪等算力》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
国产超豪第一车!尊界S800交付突破10000辆
快科技12月23日消息,鸿蒙智行官宣,尊界S800上市202天累计交付突破10000辆!在上周举办的第10000辆量产下线仪式现场,余承东透露交付速度会越来越快,未来将向4000台/月加速,12月31日前锁单... -
9988元!Vbot发布首款无需遥控机器狗“大头BoBo”
快科技12月23日消息,维他动力(Vbot) 正式发布其首款无需遥控的消费级超能机器狗产品“大头BoBo”。大头BoBo的最高时速可达13.3公里/小时(相当于专业马拉松4分30秒的配速),轻松... -
零碳排放!国内首台136吨级氢燃料矿用自卸车成功验收
快科技12月23日消息,“国资小新”发文,中国兵器工业集团北重集团北方股份携手国家电投集团,成功合作开发出国内首台136吨级氢燃料电池与锂电池混合动力矿用自卸车——NTH... -
华大集团CEO晒出蔡磊血样:将会测序组装成“完美”基因组
快科技12月23日消息,昨晚,华大集团CEO尹烨在微博晒出蔡磊的血液样本。他表示:“蔡磊兄的这份样本,将会测序组装成‘完美’基因组,为破冰继续并肩作战。一晃三年了,我们争... -
你坐过没!国产大飞机C919安全载客突破300万人次
快科技12月23日消息,据国内媒体报道称,今天交通运输部副部长李扬公开表示,C919安全载客突破300万人次。“我国交通运输领域新质生产力加快发展,完成约1700公里高速公路、2200余处公路...















