什么是思维链
思维链(Chain of Thought,CoT)是一种提示技巧,通过引导 AI 展示推理过程,提升复杂任务的准确性。
核心思想:像教学生解题一样,不仅给出答案,还要展示思考过程。
简单对比
没有 CoT
用户: 小明有 5 个苹果,小红给了他 3 个,小明吃掉了 2 个,还剩多少个苹果?
AI: 6 个。
有 CoT
用户: 小明有 5 个苹果,小红给了他 3 个,小明吃掉了 2 个,还剩多少个苹果?请一步步思考。
AI: 让我们一步步来:
1. 小明原有 5 个苹果
2. 小红给了 3 个,所以 5 + 3 = 8 个
3. 小明吃掉了 2 个,所以 8 - 2 = 6 个
答案是还剩 6 个苹果。
CoT 生效的原因
- 分配推理时间:让模型有更多”思考”机会
- 路径可视化:每个推理步骤都可以被验证和修正
- 中间结果:错误更容易被发现和纠正
- 形式约束:要求逐步推理,减少跳步导致的错误
CoT 的使用场景
1. 数学推理
计算:25 × 14 + 37 = ?
请一步步计算,列出每一步。
2. 逻辑推理
甲、乙、丙三人中一人是医生。
甲说:"我是医生。"
乙说:"我不是医生。"
丙说:"甲不是医生。"
已知三人中只有一人说了真话,谁是医生?
请分析每种可能性。
3. 代码调试
这段代码有什么问题?请逐步分析可能出错的地方。
4. 复杂决策
我想从北京去上海开会,时间是下周一,需要控制成本。
请分析可选的交通方式及其利弊。
CoT 的变体
1. 零样本 CoT
只需要加一句话,就能触发推理:
用户: 计算 123 × 456。请一步步思考。
(不需要示例,只需"请一步步思考")
2. 手动示例 CoT
提供完整推理示例:
问题:花园里有 5 朵红花,3 朵蓝花,拿走了 2 朵花,还剩多少?
解:
1. 原有红花 5 朵 + 蓝花 3 朵 = 8 朵
2. 拿走了 2 朵
3. 8 - 2 = 6
答:还剩 6 朵。
问题:[你的问题]
解:
3. 自我一致性 CoT
多次采样,选择最一致的答案:
用三种不同方式计算,选出最可能的答案。
CoT 的局限性
- 简单任务不需要:会浪费 token
- 模型规模相关:小模型效果不明显,通常需要 30B+ 参数
- 格式不稳定:推理步骤可能不完整或跳跃
- token 消耗大:推理过程会消耗大量 token
CoT 最佳实践
1. 明确要求推理格式
请按以下格式回答:
第一步:...
第二步:...
结论:...
2. 适当提示关键步骤
注意:先确定问题类型 → 分析已知条件 → 应用公式 → 验证结果
3. 验证中间步骤
请在每一步后检查计算是否正确。
4. 控制推理深度
请用 2-3 步推理解决,不要过度复杂化。
组合技:CoT + 其他技巧
CoT + 角色扮演
你是一个数学老师。请讲解并一步步计算这道题。
[题目]
CoT + few-shot
示例问题1:[问题]
推理过程:[详细步骤]
答案:[答案]
示例问题2:[问题]
推理过程:[详细步骤]
答案:[答案]
现在解决:[你的问题]
CoT + 自我反思
请先一步步推理,推理完成后,检查你的答案是否合理。
总结
| 场景 | 推荐 |
|---|---|
| 数学/逻辑问题 | 必用 CoT |
| 复杂代码问题 | 推荐使用 |
| 简单问答 | 不需要 |
| 小模型 | 效果有限 |
CoT 是提升 AI 推理能力的简单有效的方法,关键是用对场景。
相关文章
评论
加载中...
评论
加载中...