Routine国内 · 科技DeepSeek发布mHC(流形约束超连接)架构论文DeepSeek人工智能大模型训练+22026年元旦,人工智能公司DeepSeek发布新论文,提出名为mHC(流形约束超连接)的新架构。论文称该设计旨在缓解传统超连接在大规模模型训练中易出现的不稳定问题,同时尽量保留超连接带来的性能增益,以提升训练过程的可靠性与可扩展性。作者名单包括第一作者解振达、韦毅轩、曹焕奇,DeepSeek创始人兼CEO梁文锋亦在列。该论文被视为其在大模型训练架构方向的新进展,可能为相关研究与工程实践提供新的思路与参考。-