DeepSeek 开年发布新论文:提出全新 mHC 架构,梁文锋现身作者名单
这篇论文的第一作者有三位:Zhenda Xie(解振达)、Yixuan Wei(韦毅轩)、Huanqi Cao。值得一提的是,DeepSeek 创始人兼 CEO 梁文锋也在作者名单之列。...
感谢最新网友 斯文当不了饭吃 的线索投递!
最新 1 月 1 日消息,北京时间今天下午,DeepSeek 公布了一篇新论文,提出名为 mHC (流形约束超连接)的新架构。根据介绍,该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持其显著的性能增益。
这篇论文的第一作者有三位:Zhenda Xie(解振达)、Yixuan Wei(韦毅轩)、Huanqi Cao。值得一提的是,DeepSeek 创始人兼 CEO 梁文锋也在作者名单之列。

最新附摘要部分大意如下:
最近,以超连接(HC)为例的研究通过扩展残差流宽度和多样化连接模式,扩展了过去十年建立的无处不在的残差连接范式。虽然产生了显著的性能提升,但这种多样化从根本上损害了残差连接固有的恒等映射属性,从而导致严重的训练不稳定性和受限的可扩展性,并且还会产生显著的内存访问开销。
为了应对这些挑战,我们提出了流形约束超连接(mHC),这是一个通用框架,可将 HC 的残差连接空间投影到特定的流形上,以恢复恒等映射属性,同时结合严格的基础设施优化以确保效率。
经验实验表明,mHC 对于大规模训练是有效的,可提供切实的性能改进和卓越的可扩展性。我们预计,mHC 作为 HC 的灵活且实用的扩展,将有助于更深入地理解拓扑架构设计,并为基础模型的演进提出有希望的方向。
论文链接
Hugging Face:https://huggingface.co/papers/2512.24880
Arxiv:https://arxiv.org/abs/2512.24880
《DeepSeek 开年发布新论文:提出全新 mHC 架构,梁文锋现身作者名单》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
历史首次!小米汽车12月交付破5万台
快科技1月1日消息,小米汽车连续三个月破4万之后,现在终于破5万了!今天,小米汽车宣布,2025年12月交付量突破5万台!这不但创下品牌成立以来单月交付量新高,也是其历史首次达成单月5万台交... -
吉利2025年销量超302万辆 新能源汽车169万辆创历史新高
快科技1月1日消息,2025年,吉利汽车交出亮眼成绩单:全年累计销量达302.46万辆,同比增长39%,超额完成目标并创历史新高。其中新能源车型销量168.78万辆,同比激增90%,同样刷新纪录。品牌... -
均价近40万坐稳国内第一豪华车 问界12月交付57778台创新高
快科技1月2日消息,在刚刚过去的12月,鸿蒙智行交付89611台创下历史新高,其中问界汽车无疑是销量的中流砥柱。官方数据显示,问界单月交付了57778台同样创下历史新高,今年累计交付422916台,... -
一升油发3.73度电 广汽埃安i60月销量突破10000台
快科技1月2日消息,广汽埃安官宣,旗下紧凑型SUV车型i60在上市首个完整交付月(12月)销量突破10000台,达到10804台。该车于去年11月上市,指导价10.98-13.58万元,限时焕新价10.48-13.08万... -
中国车企在欧洲卖爆了!英国每售十辆新车就有一辆来自中国
快科技1月2日消息,即便头顶高额关税,但中国汽车依旧在欧洲市场畅销非常,属实“卖爆了”。研究机构Dataforce的数据显示,2025年11月,中国品牌在欧洲电动车市场的份额首次达到12....













