Routine国际 · 科技谷歌研究揭示推理模型内部多人格对话机制人工智能推理强化学习海外新闻+2谷歌最新研究称,DeepSeek-R1等顶尖推理模型在解题时其内部表征会自发“分裂”出多种性格的虚拟角色,推理过程更像社交与辩论会,难题下观点冲突更强,呈现“左右脑互搏”,且多角色越“吵”往往越能提升解题表现。研究团队借助稀疏自编码器(SAE)解码模型内部“群聊”,并对比发现推理模型的对话式行为更频繁;强化“哦。”等话语标记可提高推理准确率,强化学习训练也显示对话式思考能更快带来能力进步。该发现被认为呼应“社会脑假说”。论文见arXiv:2601.10825。-