跳到正文
Back to Feed

总结

谷歌最新研究称,DeepSeek-R1等顶尖推理模型在解题时其内部表征会自发“分裂”出多种性格的虚拟角色,推理过程更像社交与辩论会,难题下观点冲突更强,呈现“左右脑互搏”,且多角色越“吵”往往越能提升解题表现。研究团队借助稀疏自编码器(SAE)解码模型内部“群聊”,并对比发现推理模型的对话式行为更频繁;强化“哦。”等话语标记可提高推理准确率,强化学习训练也显示对话式思考能更快带来能力进步。该发现被认为呼应“社会脑假说”。论文见arXiv:2601.10825。

正文

谷歌最新研究表明,DeepSeek-R1 等顶尖推理模型解题时内部会自发「分裂」出不同性格虚拟人格,解题推理过程如同社交、辩论会,且越「吵」越聪明,面对高难度任务内部观点冲突更激烈。模型推理是「左右脑互搏」,内部分裂角色性格迥异、覆盖多解题角度,多角色互动是自发形成。团队借助稀疏自编码器 SAE 解码 AI 脑内群聊。对比发现推理模型对话式行为频率更高,强化「哦。」等话语标记能提升推理准确率,强化学习训练也证明对话式思考能让模型进步更快。这一发现呼应了社会脑假说,即 AI 为变聪明需先会和不同「人格」社交。论文地址:https://arxiv.org/abs/2601.10825 。
发布时间: