site:tech.ifeng.com - Search News

News

45m

DeepSeek-R1“内心世界”首次曝光！AI显微镜破解R1大脑，发现神秘推理机制

通常情况下，注意力汇聚会出现在模型响应的开始阶段。这表明，R1在开始响应之前并没有真正识别出自己进入了「真实的响应」阶段，直到「好吧……」这个前缀出现。研究人员最后囤点，像上面这样的短语在R1训练时的推理轨迹中非常常见，因此模型实际上将其视为提示的一部分。（类似的前缀在R1的推理轨迹中极为常见：超过95%的英语推理轨迹都以「好吧」开头）。

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

News

Trending now