大家好,我是来自北京大学物理学院的张彤 今天我所讲的题目是纽康姆悖论。
纽康姆悖论是美国 科学家纽康姆于上个世纪提出的关于决策理论的悖论
今天我们就来介绍一下这个悖论的基本内容和解决方法 纽康姆悖论的概述是这样的
有一个超级生物欧米伽带着一个设备来研究人的大脑 它呢可以预言人在二者择一时候的选择
经过多次的测试,准确率达到了 90% 以上。
箱子 A 是透明的 里面有 1000 元。
箱子 B 是不透明的,里面要么有 100 万,要么完全没有东西
欧米伽会告诉每一个受试者,说你有两个选择 一个是拿走两个箱子,获得其中的东西
但是如果欧米伽预测到了你这么做,他就会让 B 箱是空着的 因此人总共可以得到 1000 元。
还有一个选择就是只拿 B 箱子 获得其中的东西。
当我预测你会这么做的时候,我会把 100 万放到 B 箱子里 那么你就可以获得 100 万元。
人呢需要遵守两条原则 一条是,目的是在实验结束后要拿走尽可能多的钱
另一条是,不能借助心理过程之外的任何手段来进行选择
又假设有两个被试者,一个男孩和一个女孩。
男孩决定只拿箱子 B 他的理由是,他看见了欧米伽尝试了很多次
几乎每次都是预测正确的,也就是说凡是拿了两个箱子的人都只能得到 1000 元
所以他选择只拿 B 箱子,并且得到 100 万元,因为成为一个百万富翁也是不错了
女孩呢则决定拿两个箱子,她的理由是,欧米伽已经预测完毕并且离开了,他已经把钱放到- 了箱子里
所以如果箱子是空着的,那么它现在还是空的 如果箱子里本来有钱,那么它也不会再被拿走
所以如果我拿两个箱子,得到的钱一定比只拿 B 箱子多
两种理由看起来都很有道理,但是要么两人一样正确,可以拿到一样多的钱 要么就是有一个人的推理错了。
那么到底谁是正确的呢?谁能拿到更多的钱呢? 我们来看。
我们可以把纽康姆悖论归结成以下 14 个条件 接下来我们会论述这
14 个看起来都没有任何执行上难度的条件却会导致不同的结论 从而纽康姆悖论是一个悖论。
这 14 个条件是这样的 首先,欧米伽会预测你做哪种选择的正确率是
90% 第二是你的面前有两个箱子 A 和 B。
第三个是 A 箱内有 1000 元 第四个是 B 箱子里可以有
100 万元也可能什么都没有 第五个是你有两个选择。
第六,选择 1 是只拿 B 箱 第七是,选择 2 是拿 A 箱和 B 箱。
第八是只能通过自由意志来进行选择 第九是欧米伽会提前预测你的选择
第十是欧米伽会根据他的预测决定是否在 B 箱内放 100 万元
第十一是,如果他预测你只拿 B 箱,他就会把 100
万元放到 B 箱子里 第十二是,如果他预测你会拿两个箱子,他就会让
B 箱空着 第十三是在你做出决定之前,欧米伽已经根据他的选择把相应数目的钱放到了箱子里
这一点在你选择之后也不会再改变。
第十四个条件是最重要的,之后我们会继续提到 就是你的选择应当使你获得更多的钱
那么我们来严格叙述一下纽康姆悖论的内容 根据条件
1,欧米伽预测错误的可能性是存在的 我们决定根据概率论的期望收益原则来计算人的平均收益
选择 1 的收益是,B 箱中有 100 万元的概率是 90%
所以计算期望,平均收益就等于 100 万元乘以 90% 也就是 90 万元。
选择 2,A 箱有 1000 元,而欧米伽预测错的概率是 10%
相当于有 10% 的概率你可以从 B 箱里面浑水摸鱼,得到 100 万元 因此平均收益就是
1000 加上 100 万乘以 10%,等于 101000 元
那么考虑条件(14),就应该选择只拿 B 箱子,也就是说 B 箱子的平均收益 要更高一些。
但是呢,根据条件(13) 如果只拿 B 箱,那么就放弃了 A 箱中原本就唾手可得的 1000 元 这
1000 元是完全可以拿到的 也就是说人主动放弃了 1000
元,这是违背条件(14)的,从而得到了悖论 我们来分析一下,根据条件(8),要求人可以根据自己的自由意志来进行选择
根据条件(1) 和 (9),人的自由意志可以被欧米伽提前预测
根据条件(14),我们采用概率论来计算期望收益,并默认所谓的准确率就等同于概率
在衡量采用哪种选择的时候,我们又利用了博弈论的占优原则
如果一种特定策略在任何情况下都好于另一种,那我们就选择前者
因此,纽康姆悖论反映了基于自由意志的选择的可能性 概率论的期望收益原则和博弈论的冲突。
我们来首先思索一下纽康姆悖论的内容 一种观点是人的自由意志是不可以被更高的概率被预测的
假设条件(1) 改为欧米伽预测的准确率是 50% 那么按照原来的推理,选择
1 的平均获利是 50 万元 低于选择 2 的平均获利 501000
元,这些是可以计算的 此时悖论消失了,没有任何逻辑上的矛盾 但是我们知道,50%
是一个非常有趣的数字 准确率为 50% 的预测是一种随机的预测,就像抛硬币一样
因此有人认为,不可以以更高的概率来预测一个人自由意志下的选择了 但是可以想象这是站不住脚的。
事实上,使选择 1 和 2 的收益恰好相等 也就是恰巧不产生悖论的预测率并不是 50%,而是
50.05% 这表明欧米伽的预测也可以不是随机的,而是多多少少有一定的准确性
在这一点上,50.05% 和 90% 其实没有非常本质的区别
更何况如果我们改变 A 箱中固定的钱数,还可以得到各种各样临界的准确率
那么自由意志可不可以被预测呢?预测的准确率可以达到多高呢? 这是纽康姆悖论的一个关键问题。
而且我们可以看到 在纽康姆悖论中,对于预测机器的描述是很模糊的
欧米伽是如何预测人的行为的呢?预测的根据又是什么?这是同样是一个非常重要的问题
没有充足的理由表明自由意志是不能被预测的
我们以囚徒困境为例,这是一个博弈论中非常著名的例子 两个囚徒他们是凭借自身的自由意志来做选择
他们的目的是使自己获得的自由最大化 这与纽康姆悖论的前提其实没有非常本质的不同。
但是当我们用博弈论来考察他们的行为时 对于真正贯彻这两个目标的囚徒,我们可以
100% 地来预测他们的行动,那就是会互相出卖同伙 事实上如果自由意志都不可以被预测的话,经济学就是失败的了
因为经济学就是研究理性人如何通过行动来进行利益最大化的学科
但是要知道,上述的预测指的是有根据的预测 也就是经济学中给定了理性人的假设,给定了人的目标
给定了环境的约束和资源的初始禀赋,利用逻辑分析来进行的预测 这时预测自由意志的可能性是值得肯定的。
但是如果有人提出 我不需要知道任何的假定,也不知道预设,无中生有地来预测人的决策,这有可能吗?
我想这可能是值得怀疑的。
那么欧米伽做出的到底是什么样的预测呢? 我想欧米伽做出的很可能不是这样的预测。
他之所以预测人的行为,是因为他的机器探测人的脑波 在这个过程中他一定得到了些什么,使得他获得了预测他人行为的信息
他所得到的东西可能就是他预测的根据,这又回到先前的论断,预测根据是什么呢? 这可能是纽康姆悖论非常关键的问题。
在后面的论述中我们会发现,因果决策理论可以解决这个问题
接下来我要介绍两种解决纽康姆悖论的非常著名的理论 第一种是证据决策理论。
证据决策理论我们首先来回顾一下之前的探讨 决策人有两种决策,他可以只拿
B 箱子和拿两个箱子,分别记为事件(CB) 和 (C2)
欧米伽有两种预测的情况,他可以预测人只拿 B 箱子
和拿两个箱子,分别记为(DB) 和 (D2) 并且设欧米伽预测的准确率是 P。
因此,人的期望效用 公式,EU(CB) 也就是他拿
B 箱子得到的期望效用 是 P x 100 万 + (1- P) x 0
而他拿两个箱子的期望效用是 P x 1000 + (1- P) x (100 万+ 1000)
这种计算结果与我们之前的分析是相同的 也就是说准确率如果大于
50.05% 的时候应该选择拿 B 箱子 否则就应该拿两个箱子。
在上述分析中 准确率被认为是先验的,但这样其实不合适,因为先验的准确率来自于经验
统计或者是各种值得相信的信念。
例如抛硬币的正面概率 是 0.5,这一点我们即使不用做实验也可以 感受到,因为这是一个关于对称的理论。
但是在纽康姆悖论中 当人做出选择的时候,有意义的不是先验的概率而是条件概率
也就是针对人做出的某一个选择之后,对于这个选择欧米伽预测的准确性
也就是说我们预测欧米伽的一个准确率的时候,是需要在某一个实验之中预测的
由此,可以把两种选择的效用公式修正 EU(CB)
也就是人只拿 B 箱子的期望效用 是 P(DB|CB) 乘以 100 万 加 P(D2|CB)
乘以 0 EU(C2) 也就是只拿两,拿两个箱子的期望效用
是 P(DB|C2) 乘以 (100 万 加 1000) 加 P(D2|C2) 乘以
1000 由于欧米伽预测具有高度的准确率,因此 P(DB|CB)
和 P(D2|C2) 接近于 1 所以说拿两个箱子的期望效用小于拿
B 箱子的期望效用,我们应当拿 B 箱子 这里需要强调一下,所谓的
P(DB|CB) 是一个条件概率的记法,指的是当人选择拿 B
箱子的情况下 欧米伽预测人拿 B 箱子的概率是多少,可以看出这一点比刚才的 分析更加精确了。
可以看出,证据决策理论是概率期望原则的一种修正和扩充
其根基仍然是利用概率来计算期望,和预期效用的最大化
但是,在该问题中,人如果想得到欧米伽预测的条件概率,应当首先做出选择
在人没有做出选择的时候,我们只能得到先验的概率,这样的概率不能够提供证据
但是如果条件概率如果提供,可以提供证据了,那么人已经做出了选择,这个证据就没有- 任何意义
霍尔根曾经严谨地表述了以上的论点,可以自行查找相关的内容 从另一个角度,我们也可以清晰地看到这个缺陷的存在
计算期望时需要用到 4 个条件概率,我们以 P(DB|CB)
为例 由概率论中的贝叶斯公式可以得到 P(DB|CB)
可以被分解成以下的这一些部分 值得注意的是,贝叶斯公式是一个普遍的公式,对于任何概率论中可测的事件它都可以满足
换句话说,这个公式是形式化并且恒成立的。
但是此时问题又出现了 这个条件概率是与其他的条件概率紧密联系的
例如 P(CB|DB) ,也就是预测人选 B
箱子时,人确实选 B 箱子的概率 或者甚至先验概率,例如 P(DB)
,也就是欧米伽预测人选 B 箱子的概率 与这些概率都是紧密关联的。
但是由于欧米伽的预测是基于人的选择的 因此不给定人的选择直接讨论欧米伽预测人选
B 箱,这是没有任何意义的 我们怎么可能莫名其妙的来研究欧米伽预测人只拿
B 箱的概率呢? 由于不知道欧米伽探测人脑部的具体机制,对于各种条件概率的讨论都会变得飘忽不定
接下来我们暂时放弃证据决策理论的进一步探讨,来看另一种理论 这就是因果决策理论。
因果决策理论是由许多位科学家共同研究的 其中伯杰斯为因果决策理论提出了一个形式化的证明 他假定欧米伽是否把
100 万元放入箱子,取决于这样一个原因 也就是欧米伽做预测时,人大脑的状态,而人最终的选择
与被预测时大脑状态不一定相同,而是根据全部的信息进行的理性判断
首先,假设有一台大脑扫描仪,这就是欧米伽的机器了 来用于扫描大脑的状态。
再假设,被扫描的时候,人选择只拿箱子 B 的概率是 α
而相应的人选择拿两个箱子概率是 1-α,分别记为了 P(CB) 和
P(C2) 并且假设扫描仪显示人选择只拿箱子
B 为事件 OB 扫描仪显示人拿两个箱子为事件 O2
由于扫描仪本身是准确的,因此 P(OB) 就等于 α, P(O2)
等于 1-α 再假设,这一个假设是重要的,在扫描仪显示人选择只拿箱子
B 的情况下 欧米伽预测人选择箱子 B 的概率是 P(DB|CB) =
0.99 在扫描仪显示人选择箱子 B 的情况下,欧米伽预测人选择
拿两个箱子这的概率是 P(D2|OB)=0.01
需要解释,这一点也就是说扫描仪本身是准确无误地扫描人的大脑情况的 但是欧米伽本身不一定遵从它的扫描仪
呃,那么 P(D2|O2) 和 P(DB|O2) 也是按照相似的办法来定义,分别是
0.99 和 0.01 我们可以把这四种可能性换成一个列表。
例如第一种是 扫描仪显示人只拿箱子 B ,欧米伽预测人只拿箱子
B 这样的话,箱子 B 中就会有 100 万元,它发生的概率 是扫描仪显示人只拿箱子
B 的概率乘以扫,乘以欧米伽 预测人只拿箱子 B 的概率,也就是 P1=0.99α
另外三种情况也都是相类似的。
用 E 来表示 欧米伽把 100 万放进箱子这个事件,用 F 来表示欧米伽不把
100 万放进箱子的事件 根据上述表格,P(E) = P1 +
P4,而 P(F) = P2 + P3 前一个 P1 指的是概率。
我们回顾一下上一页的表格 发现 P1 + P4 是欧米伽预测人只拿箱子
B 从而我们可以给出期望效用的新公式,例如人只拿 箱子 B 的期望效用是
P(E) 乘以 100 万 加上 P(F) 乘以 0 而拿两个箱子的期望效用,是
A 箱子中固定的 1000 加上 P(E) 乘以 0.01 乘以
0.98α,这样已经代入了上一页的表格的内容 乘以 100 万。
可见 CB 的期望效用是始终小于 C2 的期望效用的,因此,人应该拿两个箱子
因果决策理论的优势在于它是一个机械论的理论
我们可以想象,纽康姆悖论的复杂性在于预测机器和人之间的动态互动
预测机器可能会预测人的行为,人考虑到自己被预测之后可能会有损失,就有可能改变自- 己的决策
而预测机器又会对此再做出反应,用博弈论的语言来说欧米伽与受试者进行的是一个理性共- 识的较量
更糟糕的是,当预测机预测完毕之后,人还有一次真真选择的机会
但是在这一次最终选择的时候,预测机就无法控制之后的情况了 悖论中先验的条件使我们感到迷惑
研究这一次最终的选择的时候,先验的概率还可不可信呢? 各种概率和先后不明的互动混杂在一起,使得这个悖论显得更加复杂
我们回忆之前研究过的证据决策理论 它一个重要的缺陷,就是由于人做选择和条件概率的产生先后
不明晰,使得其中用到的条件概率严格意义是经不起推敲的
但是因果决策理论并不是这样的,它大胆地把人和机器之间 复杂的博弈,简化成了一个机器扫描,欧米伽进行判断的两期模型
前后互不干扰,从而条件概率例如 P(DB|OB)
中的 DB 和 OB 都成为了具有明确先后关系的可以严格描述的两个事件 其中不含有更复杂的动态博弈。
用更严格的语言表述 预测机的预测模式在因果决策中是一个概率论中的一步的马尔可夫过程
它预测结果是随机的,而且只与前一时刻人大脑中的想法有关,与历史没有任何关系
在这个理论中,欧米伽可能也有自己的想法,她遵循扫描仪 概率的结果,概率是
0.99,而不遵从的概率是 0.01 这可能是因为她有自己的考虑,也可能是因为她的一种失误
但是因果决策理论是机械论的,这些失误与否的原因并不重要 它们的数值可以让我们得到最终的结论了。
但是也不能忽略 因果决策理论的缺陷,那就是事实可能比我们假设的要复杂
预测的机制不一定如此的简单,如前所述,人和预测 机器进行的很可能是更复杂更多期的动态博弈
但是因果决策理论至少提供了一种很可能的情景,并给出了证明 顺带一提,因果决策理论的数学分析并没有新的创新
很容易看出,因果决策理论运用的依然是占优策略的分析方法 是决策论的进一步拓展。
我们来总结一下 虽然我个人认为呢,因果决策理论比证据决策理论更加有优越性,但是这两种理论中任何一种
像我们之前所说的,都无法完美地压到另一种 后来诺齐克也将视野转向了选择本身的意义
也就是我们做出什么样的选择取决于我们偏好在什么样的理论框架下分析问题
这种对于决策的选择问题,可能是比纽康姆悖论本身更加复杂更加深层的问题
呃,对于这个悖论我个人还有一点见解,与大家分享 自从
1952 年马克维茨发表了题为《投资组合选择》的论文,引入了对于任何投资的
均值-方差分析模型之后,高风险意味高收益,人们投资 时会在风险和收益之间权衡的理念,就已经成为了人们的共识
我们需要注意到,风险是客观存在的,它并不是人为的定义 在纽康姆悖论中,是否放入
100 万元,权利在欧米伽手中 因此无论人进行怎么样的决策都有可能损失
100 万,也有可能得到这 100 万 这就是客观存在的风险。
在理性人进行决策时,大部分人不仅会考虑期望收益 也要考虑风险的波动,这并不是因为人们有某种怪癖,而是
在这些人们看来,低风险本身也是更多的钱的一种表述
并不是期望收益高就一定可以获得更多的钱,那么究竟怎样才算更多的钱呢? 这要取决于个体投资者的偏好。
现实生活中,大部分人既不是只关注风险,也不是只关注期望收益
而是选择那些期望收益不错,风险也不高的股票 较之期望收益极高,风险也巨大的股票更能给自己带来更多的金钱
接下来我们要把目光转回到这个悖论之中 纽康姆悖论的条件(14)也就是你的选择要使你获得更多的钱
这更多的钱该如何理解呢?现在我们就会发现,我们上面的讨论其实一直是有一些偏见的
我们一直认为,期望收益高的选择会给我们带来更多的钱
却没有考虑风险的因素,而且我们还把期望收益等价于期望效用,也没有考虑人对风险的厌恶
因此我们讨论的投资者,其实是经济学中最特殊的一类
这种只考虑期望收益而不在乎风险的偏好的投资者被称为风险中性偏好的投资者
而期望效用随着期望收益线性增长 却不满足边际收益递减的偏好被称为非凸的偏好
需要解释一下,为什么说在纽康姆悖论中,期望效用随期望收益线性增长呢
因为我们之前计算期望效用的时候,直接把期望收益等同了期望效用来计算
但是,如果效用函数是非凸的,就会产生类似于圣彼得堡悖论那样复杂的情形
因此在上述分析中,我们对于期望效用的分析本身就是有失偏颇的
另一方面,我们退一步来说,即使承认了受试者有风险中性的特性
那么我们也必须因此来给含义模糊的条件(14)重新来一个定义
我们定义成:你的选择应该使你获得更高的期望效用 这样就可以准确地描述其中证据决策理论的分析
但是,期望效用是与决策中各种结果发生的概率来准确联系在一起的
使用期望效用法来计算效用的时候,每种结果发生的概率必须有严格的定义才可以
但是,如果我们进一步思索这个问题,就发生了一些奇怪的事情
那就是开头处所谓的女孩,也就是认为拿两个箱子总比拿一个箱子占优的那个受试者
并不处于一种具有不确定性面临各种可能的状态 她面前的一切选择都是确定的,并且她可以操控的
她只是在考虑是否该把另一个箱子也拿走,因此我们判断她的收益的时候 不该使用期望收益原则来判断她收益的大小
也就是说不能用条件(14)来衡量使用严格占优策略来分析的投资者 而是只能使用占优策略来分析。
在这种情况下,女孩所做 的决策无论好不好,像我们前面说的,都不能轻易地与男孩相比较
如果我们勉为其难的认为女孩面临的确定性收益也是一种概率为 1 的不确定收益 那我们可以得到应该拿两个箱子。
但是还要注意到,女孩和男孩 在所面临的不确定结果,也就是他们面临的各种未来的可能性
其实这些可能性发生的概率都是不同的,换言之他俩面对的并不是同一个事情
这样比较是否合理也是值得担忧的,就像我们刚才所说
呃,比起纽康姆悖论本身,选择使用什么样的理论框架是一个更加重要的问题 对于两种不可以用同一个条件(14)来
衡量的选择必须使用不同的理论框架来进行分析 因此我们不应该盲目地比较这两种方式的收益大小
上述论断我在课程论文里已经给予了考虑,希望各位指正,谢谢!