Routine国内 · 科技DeepSeek发布mHC(流形约束超连接)论文大模型训练神经网络架构科技创新+21月1日,DeepSeek发布论文《mHC:流形约束超连接》,提出mHC(流形约束超连接)网络架构,旨在缓解超连接等多通道连接在大规模模型训练中带来的不稳定、可扩展性受限及内存访问开销问题。论文合著者包括创始人兼CEO梁文锋,核心贡献者为解振达、韦毅轩、曹焕琪。DeepSeek称该框架在保留性能优势的同时强化信息传递“可控性”,有望降低训练硬件投入、缩短周期,推动更大规模基础模型与多模态等场景落地,并可能为下一代底层架构演进提供方向。-