决策与推理
这一章把"如何想清楚"与"如何做选择"并置讨论。推理负责生成、筛选和评估理由,决策负责在不确定、有限时间和有限认知资源下落到行动。两条线索在真实认知系统中紧密耦合:形式逻辑告诉我们什么是有效推理,概率论告诉我们如何在不确定性下更新信念,行为决策研究告诉我们人为什么系统性偏离理性,神经科学告诉我们情绪和奖励系统如何参与选择。
前置知识回顾
推理(Reasoning)是从已知信息推出新结论的过程。它在认知系统中的位置是:从感知、注意、记忆提取的素材出发,经过规则化或概率化的加工,生成可供决策使用的中间结论。本节区分两种最基本的推理形态:
演绎推理(Deductive Reasoning)
从一般规则和具体前提推出必然结论。前提为真时,结论必为真,研究对象是形式有效性,与内容真伪无关。
归纳推理(Inductive Reasoning)
从有限观察推出一般规律或对未观察事件的预测。结论只有概率性,永远存在被新证据推翻的可能。医学诊断、科学假设、法律推断和日常预测大多属于归纳。
| 维度 | 演绎推理 | 归纳推理 |
|---|---|---|
| 结论性质 | 必然(前提真则结论真) | 概率(前提支持但不能保证结论) |
| 方向 | 从一般到特殊 | 从特殊到一般 |
| 信息量 | 结论不增加新信息 | 结论可能揭示新规律 |
| 典型应用 | 数学证明、形式逻辑 | 科学发现、统计推断、机器学习 |
| 失败模式 | 形式谬误、信念偏差 | 过度概括、样本偏差、忽视先验 |
flowchart LR
A["观察/前提"] --> B{"推理类型"}
B -->|演绎| C["形式有效性
前提真则结论真"]
B -->|归纳| D["概率性结论
可能为真"]
C --> E["数学证明
符号逻辑"]
D --> F["医学诊断
科学假设
日常预测"]
E -.新前提.-> A
F -.新证据.-> A
三段论(Syllogism)
亚里士多德提出的演绎推理范式:两个前提(一个大前提,一个小前提)推出一个结论。例如:
- 大前提:所有哺乳动物都是恒温动物。
- 小前提:鲸鱼是哺乳动物。
- 结论:鲸鱼是恒温动物。
只要两个前提为真,结论必然为真。三段论的难点在于:人类常被内容熟悉性和信念偏差干扰,对形式有效但内容反直觉的三段论判错,对形式无效但内容符合常识的三段论反而接受。
条件推理:四种形式
围绕"如果 $P$,那么 $Q$"展开:
| 形式 | 结构 | 是否有效 | 生活例子 |
|---|---|---|---|
| 肯定前件(Modus Ponens) | 若 P 则 Q;P;所以 Q | 有效 | 若下雨则地湿;下雨;所以地湿 |
| 否定后件(Modus Tollens) | 若 P 则 Q;非 Q;所以非 P | 有效 | 若下雨则地湿;地不湿;所以没下雨 |
| 肯定后件 | 若 P 则 Q;Q;所以 P | 无效 | 地湿也可能是洒水造成的 |
| 否定前件 | 若 P 则 Q;非 P;所以非 Q | 无效 | 没下雨地也可能被洒水弄湿 |
Wason 选择任务是推理心理学的经典实验。它告诉我们:人在面对条件命题时,并不会自动用否定后件去证伪,而是倾向于确认和匹配。课堂上使用的经典版本如下:
案例 1:Wason 选择任务(A D 4 7)
问题:桌上有四张牌,每张牌一面是字母,一面是数字。看见的一面是:A D 4 7。规则是"如果一面是元音,那么另一面是偶数"。要检验这条规则,最少需要翻哪几张牌?
- 翻 A:A 是元音(即 P),必须检查背面是否为偶数 Q。P 单独存在不验证,需要检查 P→Q 是否成立。
- 不翻 D:D 是辅音(非 P),规则对它没有要求。
- 不翻 4:4 是偶数(Q),但规则没说偶数背面必须是元音,所以不验证 Q→P。
- 翻 7:7 不是偶数(非 Q),若背面是元音 P,规则就被证伪。
答案:应该翻 A 和 7。
贝叶斯推理(Bayesian Reasoning)
给定新证据时,信念应当按贝叶斯规则更新:
其中 $P(H)$ 是先验,$P(E|H)$ 是似然,$P(H|E)$ 是后验。贝叶斯推理把"信念的程度"与"证据的强度"形式化地连起来,是归纳推理在不确定性下的规范模型。
关键区分:似然 vs 后验
$P(E|H)$("假设为真时看到证据的概率")和 $P(H|E)$("看到证据时假设为真的概率")方向相反,数值可以差一到两个数量级。把两者混用是基率忽视的根源。
案例 2:医学检测与基率忽视
问题:某疾病患病率为 1%,检测敏感性 98%,假阳性率 1%。若一个人检测阳性,他实际患病概率是多少?
- 取 10000 人:约 100 人患病,9900 人不患病。
- 真阳性:100 名患者中 98 人测出阳性。
- 假阳性:9900 名非患者中约 99 人测出阳性。
- 阳性总数:$98+99=197$。
- 实际患病概率:$\dfrac{98}{197}\approx 49.7\%$。
答案:约 50%,不是 98%。
Kahneman 与 Tversky(1974,1982)的核心贡献:人脑判断并非随机犯错,而是沿着一些可预测的启发式系统性偏离概率论和效用理论。启发式是认知捷径,在多数情境下能快速给出可用答案,但被特定问题击中时会暴露偏差。
| 启发式 | 估计对象 | 典型偏差 | 经典案例 |
|---|---|---|---|
| 可得性(Availability) | 事件频率 / 概率 | 生动事件被高估;媒体覆盖 ≠ 真实频率 | R 字母、飞机失事、鲨鱼袭击 |
| 代表性(Representativeness) | 对象属于某类别的概率 | 忽略基率、忽视样本大小、合取谬误 | Linda 问题、工程师/律师 |
| 锚定与调整(Anchoring & Adjustment) | 数量估计 | 调整不足,停留在初始锚 | 价格谈判、数字旋转盘 |
| 识别启发式(Recognition) | 大小 / 数量 | 熟悉 = 更大 | San Diego vs San Antonio |
可得性启发式(Availability Heuristic)
用某类别的实例"被回忆出来的难易程度"来估计该类别的频率或概率。媒体报道多、画面生动、情绪强烈的事件容易被高估;慢性病、长期风险常被低估。可得性受事件熟悉度、突出性、搜索方式有效性和可想象性影响。
案例 3:R 字母问题与媒体偏差
问题 1:英文单词中,以 R 开头(如 ride)的多,还是第三个字母是 R(如 circle)的多?
- 直觉答案:R 开头更多。
- 真实答案:第三个字母是 R 的更多。人脑对"以 R 开头"的提取线索(red, roof...)非常流畅,对"第三个字母是 R"的提取则不熟练,于是把可得性误当频率。
问题 2:发达国家中,交通事故死亡人数与胃癌死亡人数哪个多?
- 直觉:交通事故约为胃癌的 4 倍。
- 真实(美国):约 45,000 交通事故 vs 95,000 胃癌死亡。报纸报道比例却高达 137 : 1,媒体把胃癌"过滤"出公共视野。
代表性启发式(Representativeness Heuristic)
人根据对象与某个原型的相似程度判断其属于该原型的概率,几乎不考虑先验概率(基率)和样本大小。它快速、抓要点,但也导致严重偏差:合取谬误、析取谬误、基率忽视和小数定律。
合取谬误(Conjunction Fallacy)
对任意事件 $A,B$,$P(A\cap B)\le P(A)$。但当 $A\cap B$ 的描述"更像"原型时,人们倾向认为合取更可能。"Linda 是银行出纳员且参与女权运动"看似比"银行出纳员"更符合 Linda 描述,于是多数人选了更不可能的那个。
案例 4:Linda 问题
问题:Linda 31 岁,单身,坦率、聪慧,主修哲学。学生时代关注歧视和社会公正,参加反核示威。下列哪个更可能?
- Linda 是银行出纳员。
- Linda 是银行出纳员且积极参与女权运动。
- 经验结果:约 90% 选 (b)。
- 数学正确:应选 (a)。
- 解释:(b) 的描述更符合 Linda 的"原型",代表性启发式压倒了逻辑包含关系。
锚定与调整(Anchoring & Adjustment)
人在估计数量时被初始数字(锚)影响,即使锚是随机给的,调整通常不足,最终判断停留在锚附近。协商、拍卖、合同金额、股票目标价等场景都受此影响。
热手谬误(Hot Hand Fallacy)
认为随机序列中近期的"成功"会提高下一次成功的概率。在抛硬币、轮盘赌、篮球投篮里都常见。Gilovich、Vallone & Tversky(1985)分析 NBA 数据后指出,"热手"在统计上几乎不存在,连胜 / 连败是人类在噪声中虚构的模式。
案例 5:篮球热手
问题:球员在连续命中两球之后,下一次命中的概率是否高于连续失误两球之后?
- 康奈尔和斯坦福的篮球迷里,91% 答"是"。
- 统计分析:连续两球命中后的命中率与连续两球失误后的命中率没有显著差异。
案例 6:6 个孩子的出生顺序
问题:在调查了大量有 6 个孩子的家庭后,下面哪个出生顺序与"GBGBBG"同样常见?
- BGBBBB
- BBBBBB
- 直觉:(a) 更"乱",(b) 像巧合。
- 真实:两个序列出现的概率完全相同(每次独立,$1/2^6$),都是 1/64。代表性启发式让人们觉得"乱"比"齐"更典型。
如果推理关心"由前提得到什么结论",决策关心"在多个行动中选哪一个"。理性决策的规范性模型是期望效用理论;描述性模型以前景理论为代表;有限理性进一步承认人不是全知优化器。三条线共同回答:人应当怎样选 vs 人实际怎样选。
期望效用理论(Expected Utility Theory, EUT)
冯·诺依曼与摩根斯特恩公理化建立的决策规范模型。对一组结果 $x_1,\ldots,x_n$ 及概率 $p_1,\ldots,p_n$,理性决策者应最大化:
其中 $u(\cdot)$ 是 Von Neumann-Morgenstern 效用函数,反映主观价值而非金额本身。EUT 还要求传递性:若 $A\succ B$ 且 $B\succ C$,则 $A\succ C$。
理性选择的判据
- 内部一致性:选择不违反公理(特别是传递性)。
- 优化准则:在给定偏好下最大化某个目标(如期望效用)。
- 描述性 vs 规范性:实证发现 EUT 经常被违反,违反方式系统可预测,这正是行为决策研究的起点。
案例 7:抛硬币赌局
问题:掷一个公平骰子,若掷出 6 你赢 4 元,否则输 1 元。你接受这个赌局吗?
- $EU = \frac{1}{6}\cdot 4 + \frac{5}{6}\cdot(-1) = -\frac{1}{6}\approx -0.17$。
- 期望效用为负,理性选择拒绝。
- 如果改为掷出 5 或 6 赢 4 元、否则输 1 元,$EU=\frac{1}{3}\cdot 4-\frac{2}{3}\approx +0.67$,则应接受。
传递性违反(Violations of Transitivity)
Tversky(1969)用一组相邻差异小、整体差异大的赌局显示,人可以不传递地偏好循环:偏好 $A\succ B$、$B\succ C$、$C\succ D$、$D\succ E$,但又 $E\succ A$。这表明注意力焦点(payoff 差 vs 概率差)会切换参考维度,导致系统性不一致。
前景理论(Prospect Theory)
人们评估的不是最终财富,而是相对于参照点的收益和损失。一个常用形式的价值函数:
典型拟合参数 $\alpha\approx 0.88$,$\lambda\approx 2.25$。$\lambda>1$ 即损失厌恶:损失 100 元的痛苦比获得 100 元的快乐更强烈。
价值函数四特征
- 参照依赖:价值以参照点为锚,不是绝对金额。
- 损失厌恶:损失段斜率约为收益段 2.25 倍。
- 敏感性递减:远离参照点后边际感受变弱($x^{0.88}$ 的凹 / 凸性)。
- S 形不对称:收益区凹(风险回避),损失区凸(风险寻求),且损失更陡。
概率权重函数 $\pi(p)$
人用决策权重 $\pi(p)$ 替代客观概率:
- 小概率被超加权(买彩票、保险);
- 大概率被低加权;
- 中等概率的差异被压缩。
这解释了为什么同时买彩票(赌小概率赢钱)又买保险(防小概率灾难)——两种"小概率"都被过度放大。
框架效应(Framing Effect)
人们对实质相同但表述不同的问题做出不同选择。收益框架下倾向风险回避,损失框架下倾向风险寻求。框架效应是前景理论最直接的行为表现之一。
案例 8:亚洲疾病问题
背景:一种疾病预计造成 600 人死亡。请在以下方案中选择:
收益框架 A:
- 方案 A:确定救 200 人。
- 方案 B:1/3 概率救 600 人,2/3 概率无人获救。
- 结果:72% 选 A(风险回避)。
损失框架 B:
- 方案 C:确定死 400 人。
- 方案 D:1/3 概率无人死亡,2/3 概率死 600 人。
- 结果:64% 选 D(风险寻求)。
数学等价:A≡D、B≡C(都是期望 200 人获救 / 400 人死亡)。但"救 200"让人安心,"死 400"刺激人冒险。
有限理性(Bounded Rationality)
Herbert Simon(1957)提出:人是理性的,但只在人类处理能力的限度之内。记忆有限、时间有限、计算能力有限,决策者不可能枚举全部选项或计算所有后果,于是采用满意化(Satisficing)策略——找到第一个"足够好"的选项就停止搜索。
"我们理性,但只在人类处理能力的限度之内。" —— Herbert Simon, 1957
决策不是纯粹的冷计算。前额叶、顶叶、纹状体、杏仁核、躯体感觉皮层共同参与价值评估、风险预测和行动选择。理解这些回路,有助于解释为什么"知道正确答案"和"做出正确选择"经常不是同一件事。
奖励预测误差(Reward Prediction Error, RPE)
Schultz 等人在猴子的多巴胺神经元上发现:实际奖励高于预期时放电增加,低于预期时放电降低。多巴胺信号编码的是预测误差,而不是奖励本身。这套信号系统构成强化学习的神经基础,也部分解释了为什么意外的奖励更让人难忘。
LIP 神经元的"预期效用"编码
外侧顶内沟皮层(Lateral Intraparietal Cortex, LIP)部分神经元在奖励发放之前就活动,强度对应于该方向的预期收益。这说明价值信号可以在行动选择前就被编码,是神经层面"先把账算好,再动手"的证据。
- 评估系统(腹内侧前额叶、纹状体):编码主观价值与期望效用。
- 控制系统(背外侧前额叶):执行规则、抑制冲动、延迟满足。
- 情绪系统(杏仁核、岛叶皮层):提供"危险 / 值得接近"的快速标记。
爱荷华赌博任务(Iowa Gambling Task, IGT)
Bechara et al.(1994)设计:四副牌 A、B、C、D。A、B 表面奖励大但有更大延迟惩罚,长期净亏;C、D 表面奖励小但长期净赚。被试需要在反复抽牌中学会避开坏牌。
案例 9:爱荷华赌博任务结果
任务:被试从 A/B/C/D 四副牌中选牌,每张牌给奖励($50 或 $100),偶尔伴随惩罚。规则不公开,被试只能通过经验学习。
- 正常人:前若干次偏好 A/B,随后逐渐转向 C/D;在尚未明确意识到规则时,皮肤电反应(SCR)在抽坏牌前就已升高。
- 腹内侧前额叶(vmPFC)损伤患者:口头上能复述"哪副牌好",行为上却始终黏在坏牌上,且抽坏牌前的 SCR 不升高。
- 结论:好的决策不是"排除情绪",而是让情绪信号参与价值评估。
躯体标记假说(Somatic Marker Hypothesis, Damasio)
身体(和脑岛、杏仁核等模拟身体状态的脑区)在选项评估时产生情绪信号,给选项贴上"危险 / 值得接近"的躯体标记。这些标记帮助快速筛选行动,绕过耗时的全枚举。vmPFC 损伤破坏了把情绪信号转化为决策倾向的回路,所以患者"知道"但"做不出"。
系统 1 / 系统 2(Kahneman 2011)
系统 1:快速、自动、依赖联想和启发式、低认知负荷;系统 2:缓慢、努力、依赖规则和工作记忆、高认知负荷。两系统不是解剖分区,而是功能描述:同一脑区在不同任务中可扮演不同角色。
| 维度 | 系统 1(快思考) | 系统 2(慢思考) |
|---|---|---|
| 速度 | 快(毫秒级) | 慢(秒级,需要努力) |
| 控制 | 自动、无意识 | 受控、有意识 |
| 资源消耗 | 低 | 高,依赖工作记忆与血糖 |
| 典型任务 | 识别面孔、读单词、$2+1$、开车 | 17×24 比较、复杂推理、压抑冲动 |
| 优势 | 快速识别模式与威胁 | 处理抽象规则、串行计算、冲突监控 |
| 风险 | 系统性偏差(可得性、代表性、框架) | 慢、累、容易偷懒、未被激活 |
| 输出风格 | 直觉、判断 | 分析、论证 |
核心概念速查
- 演绎推理:前提真 → 结论必然真;三段论与四形式条件推理。
- 归纳推理:从样本到一般,结论有概率性;遵循贝叶斯更新。
- Wason 选择任务:检验"若 P 则 Q"应翻 P 和 非 Q(A 与 7),证伪思维。
- 贝叶斯公式:$P(H|E)=P(E|H)P(H)/P(E)$;自然频数补救基率忽视。
- 可得性启发式:易回忆 = 频繁;生动事件被高估。
- 代表性启发式:原型相似 → 概率高;导致合取谬误与基率忽视。
- 合取谬误:$P(A\cap B)\le P(A)$,但描述越具体越易被选。
- 锚定与热手:调整不足;随机序列中的伪模式。
- 期望效用:$EU=\sum p_i u(x_i)$;传递性常被违反。
- 前景理论:$v(x)$ S 形、参考点依赖、$\lambda\approx 2.25$ 损失厌恶;小概率被超加权。
- 框架效应:同一期望、收益/损失不同表述 → 风险态度反转。
- 有限理性:Simon;满意化而非最优化。
- 躯体标记假说:Damasio;情绪信号帮选;vmPFC 损伤破坏标记。
- 系统 1/2:快直觉 / 慢分析;偏差来自系统 2 未校正系统 1。
参考来源
- 本地课程材料:西安交通大学「计算认知科学与工程」课程 PPT — Decision Making 1:Heuristics and Biases。
- 本地课程材料:课程 PPT — Decision Making 2:Choosing between Gambles & Neural Basis。
- 本地课程材料:课程 PPT — Reasoning: Logical Reasoning and Human Nature。
- Kahneman, D., & Tversky, A. (1979). Prospect Theory: An Analysis of Decision under Risk. Econometrica, 47(2), 263-291.
- Tversky, A., & Kahneman, D. (1974). Judgment under Uncertainty: Heuristics and Biases. Science, 185(4157), 1124-1131.
- Tversky, A., & Kahneman, D. (1981). The framing of decisions and the psychology of choice. Science, 211(4481), 453-458.
- Tversky, A., & Kahneman, D. (1983). Extensional versus intuitive reasoning: The conjunction fallacy in probability judgment. Psychological Review, 90(4), 293-315.
- Simon, H. A. (1957). Models of Man: Social and Rational. Wiley.
- Bechara, A., & Damasio, A. R. (2005). The somatic marker hypothesis: A neural theory of economic decision. Games and Economic Behavior, 52(2), 336-372.
- Gigerenzer, G., Todd, P. M., & ABC Research Group (1999). Simple Heuristics That Make Us Smart. Oxford University Press.
- Kahneman, D. (2011). Thinking, Fast and Slow. Farrar, Straus and Giroux.
- Wason, P. C. (1966). Reasoning. In B. M. Foss (Ed.), New horizons in psychology. Penguin.
- Schultz, W., Dayan, P., & Montague, P. R. (1997). A neural substrate of prediction and reward. Science, 275(5306), 1593-1599.
- Stanford Encyclopedia of Philosophy. The Psychology of Reasoning. plato.stanford.edu
- The Decision Lab. Prospect Theory. thedecisionlab.com