思维链不只在推理：大语言模型CoT的深层原理与局限性

11次阅读

共计 2383 个字符，预计需要花费 6 分钟才能阅读完成。

如果你曾在2025年使用过任何主流大语言模型（LLM），一定遇到过它突然开始“分步思考”的情形——输出一串带有“Step 1: … Step 2: …”的文本，然后给出最终答案。这个被简称为CoT（Chain-of-Thought）的技术，早已从实验室走进千行百业。但作为从业者，我们是否真的理解它背后的机制？为什么同一个CoT提示在温度0.7下可能失效，而在0.0下却稳定得出奇？2025年末至2026年初，几篇关于CoT内部计算路径的逆向工程研究，正在颠覆我们对“推理”的固有认知。

经典论文《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》（Wei et al., 2022）揭示了一个现象：只要在few-shot示例中加入中间步骤，LLM就能在数学、符号推理等任务上大幅提升准确性。但为什么？最直接的猜想是：CoT相当于把一条长路径的推理拆解为多个短步，降低了每一步的预测不确定性。 然而2026年MIT和DeepMind联合团队通过激活值探查（Probing）发现，LLM在生成CoT步骤时，内部并非简单地“逐步计算”，而是在做一种隐式的“图搜索”——模型在高维表征空间中同时探索多条可能的推理路径，然后通过自回归的注意力机制选择一条最连贯的路线输出。

这个发现解释了为什么CoT对温度参数如此敏感：当温度过高时，模型探索的分支太多，可能陷入不连贯的“幻觉链”；而温度过低时，模型可能过度依赖训练数据中常见的表面模式，丢失真正的因果关系。2026年的一项实验表明，在GSM8K数据集上，温度0.0配合CoT的准确率比温度0.7高出约15%，但在需要创新性解题的任务（如数学奥赛题）上，0.7反而表现更好。这意味着CoT并非简单的“逻辑推理”，而是一种介于搜索与记忆之间的混合机制。

CoT虽然提高了推理的可见性，却也引入了新的风险：模型可能生成一条表面上连贯、实则每一步都悄然偏离正确路径的“虚假思维链”。 2025年OpenAI的博客中提到，当用CoT处理长程多跳问答（比如需要结合3个以上事实）时，模型的中期步骤往往包含至少一个“微小偏差”——例如把“2025年3月”错记为“2025年5月”，然后基于这个错误日期继续推理，最终得出错误结论。关键在于，人类很难在这些细微错误出现时立刻察觉，因为CoT的每一步“看起来都合理”。

更隐蔽的是语义漂移（Semantic Drift）：模型在CoT早期步骤中正确提取了实体关系，但随着代数的增加，原本的语义概念在高维空间中被逐渐“拉伸”而偏离原意。比如在解决“A比B高2cm，B比C矮3cm，求A与C身高差”的问题时，模型可能在第二步把“A比B高”的向量表示与“B比C矮”的向量表示做简单加法，但向量空间的线性叠加并不总是保持语义一致性。这种非线性失真在超过5步的推理中显著增加，迫使学术界重新思考CoT的“可解释性”本身是否只是一种错觉。

为了解决上述问题，2026年上半年出现了一种新范式：隐式思维链（Implicit Chain-of-Thought, ICoT）。它不要求模型输出中间步骤，而是通过修改注意力掩码或内部状态，让模型在内部隐层完成多步推理，再直接输出最终答案。这种做法的好处是：避免了对齐问题——模型不需要为了“看起来像在思考”而编造步骤，因此显式幻觉显著减少。同时，ICoT还能结合自验证循环（Self-Verification Loop）：模型在生成答案后，会内部调用一个轻量的“校验网络”去反推前提条件是否一致，如果不一致则重新调整隐层状态。

Benchmark数据显示，ICoT在引入常识矛盾的复杂故事推理任务（如Reddit的“Who is lying?”类问题）上，准确率比传统CoT提高了约23%，而推理时间只增加了5%。但ICoT的代价是可解释性的丧失——我们再也无法直接看到模型的思考轨迹。这引发了AI伦理层面的争论：如果模型的内部推理无法被审计，我们还能信任它做医疗诊断或法律文书吗？ 2026年欧盟AI法案的修正案中，专门增加了对“隐式推理模型”的透明度要求，要求厂商必须提供“可外部观测的推理过程抽象等价表示”。

作为一线技术选型者，我建议遵循以下原则：

需要可解释性的场景（如金融风控、医学辅助诊断）：优先使用标准CoT，但配合中间步骤校验工具（例如人工抽检或专用验证器）来降低虚假链路风险。
需要高精度且步骤可控的数学/代码任务：可以考虑零样本CoT加上思维束搜索（Tree-of-Thought, ToT），2025年下半年开源的ToT库已经能自动剪掉低概率分支，在HumanEval上达到72%的pass@1。
追求速度且任务相对简单（少于3步推理）：直接使用无CoT的输入+谨慎的温度控制（0.1-0.3）往往更稳定，不必为了“显得专业”而硬套思维链。
应对长程推理与因果陷阱：推荐尝试隐式CoT+自验证，但这需要模型支持自定义推理层（如通过LoRA微调），目前仅适用于开源模型如Llama-3.2-90B或Qwen3-Plus。

回顾2022年到2026年的演变，CoT已经从一种提示技巧发展成为理解LLM能力边界的重要窗口。它放大了模型的优势（结构化思考），也放大了缺陷（幻觉、漂移、虚假解释）。下一次当你看到模型输出一连串逻辑分明的步骤时，不妨问自己：这是真实因果的投影，还是语言模型在模仿人类思考的皮影戏？ 答案可能依旧模糊，但正是这些不确定性，推动着整个领域从“让模型能说会道”走向“让模型能真正洞察”。

正文完

发表至：技术杂谈

2026-05-20

0