西西河

主题:【半原创】“游客困境”的介绍(1) -- 四处张望

共:💬66 🌺104
全看树展主题 · 分页首页 上页
/ 5
下页 末页
家园 【半原创】“游客困境”的介绍(1)

这个帖子是根据《科学美国人》中文版今年7期上的文章《游客困境 博弈论的新麻烦》的内容抽取而成,因此谈不上原创,有兴趣的可以看原文,英文版应该是六月份的。

这个帖子是看了老马丁的文章并受老马丁的鼓励而写,我也发了一个投票贴,大家可以继续投票。

事先声明我并不是博弈论的专家,只是以前学习经济学的时候有所接触,因此超出文章内容的问题我无法解答,应该要高人解决。

投票帖子里面给出了一个假想的一幕,这个博弈是文章的作者Kaushik Basu 在1994年想出来的,称为“游客困境”(Traveler's Dilemma)。按照他的说法,他的目的是

驳斥经济学家和许多政治学家对合理行为及人之过程所持有的狭隘观点,质疑传统经济学的自由主意观点,同时凸现“合理性”在逻辑上的矛盾

为了满足心急的观众,我首先贴出文章的概述,免得我等等抗铁牛的时候有人扁我。

合理的不合理

1.在游客困境这个博弈对局中,两位参与者各自选择一个2到100之间的整数,选择较小数字的参与者将获得比对方大的收益。博弈论认定,如果参与者都是理性出招,那么他们都应该选择2。但实际上绝大多数人选择的都是一个接近100的整数

2.为了对这种理性选择并不理性的现象有一个全面的认识,需要一种全新的形式推理

3.经济学家主张,标准博弈论可以预测自私而理性的人将如何行事,游客困境的对弈结果与此背道而驰。同时这些结果也证明,利己动机并不总是有利于提高经济运行效率

如果有相关背景,这个概述提供了足够的信息,你也不需要看后面的内容了,否则......

土鳖先扛扛铁牛。

关键词(Tags): #博弈论#游客困境元宝推荐:爱莲,

本帖一共被 4 帖 引用 (帖内工具实现)
家园 要向老马丁那样

快速填坑

家园 一直觉得这个这个题目出得不好

关键是2块钱太少,少到几乎可以忽略的地步。2块钱的困境?!

而且这个游戏有3方,既然大多数人都选接近100的数目,游戏的结果,自然是大多数游客受益,航空公司受损。

还有,这个游戏是零和游戏,有人赢,就有人亏,而经济活动并不总是零和的。

拭目以待您的铁牛。

家园 我的想法是

博弈论要求的理性比普通经济学要求的理性需要更高更难的推理和思维活动,这样下来普通人根本就不理这个茬。再说,根据老马介绍的理论,我报100块,别人报99块,我还可以拿97块,就少拿3块,根本不算啥。对另外一个人说,别人报100,我做小人报99,就多拿一块钱,根本就不敏感。

我看复杂点的博弈论解释人的行为基本上是一解释一个错,因为人本来就不是那样想的。

希望能够有行为博弈学的出现。

家园 这个是个极端的例子,否则怎么能吸引眼球

稍作改进就可以变成180-300,惩罚数为5,你怎么选?

家园 呵呵,先花上。

博弈论的结果:很明显双方都选2,是一个nash均衡。如果把100换成5,10,15.。。呢?恐怕越小的数字,选择2的可能性越大。

这个问题其实是因为双方的风险偏好,并且都假设对方也原因为了更多的收益而冒风险而导致的。

等待楼主继续抗铁牛,呵呵

家园 所以你选了2

没错,这个例子是稍微夸张了一点,文章提到后面有人重复实验是用180-300,惩罚数5。结果类似。当数字从100降到3,那这个在数学上和囚徒困境等价。

家园 是啊,

其实这跟风险偏好有关,就像一般人都是风险厌恶的,比如我本人,但是我仍然会偶尔去买买彩票。

家园 【2】为什么说2是“理性”的选择

这里我会解释一下为什么说选择2是“理性”的选择,对于很多了解博弈论的河友来说,稍加推理就知道,但是很多河友估计还是想不明白,所以我首先解释一下。

博弈论广泛使用反向归纳(backward induction,也叫倒推法)的分析方法,我们可以应用到这个问题上。

以张三为例,一般来说,他首先会想到最大数100,如果李四也是选100,那么皆大欢喜,都拿到100。但是再一想,张三发觉99更合理,说不定还能比刚才多得1美元,即101(实际上投票时已经有河友想到这点),同样李四也会这样写,那么大家又会选择99。但是再想下去,98、97、96...到最后两人都会选择2。

注意一下,这里的类推完全是张三和李四分布推理得出来的,他们并没有任何沟通,而且明显都只想着自己的好处。

如果用更直接的工具,即收益矩阵,如下图

2 3 4 ... 98 99 100

2 2, 2 4, 0 4, 0 ... 4, 0 4, 0 4, 0

3 0, 4 3, 3 5, 1 ... 5, 1 5, 1 5, 1

4 0, 4 1, 5 4, 4 ... 6, 2 6, 2 6, 2

... ... ... ... ... ... ... ...

98 0, 4 1, 5 2, 6 ... 98, 98 100, 96 100, 96

99 0, 4 1, 5 2, 6 ... 96, 100 99, 99 101, 97

100 0, 4 1, 5 2, 6 ... 96, 100 97, 101 100, 100

这个图包含了两个参与者所有可能的选择及对应的收益的所有信息。

如果了解纳什均衡,很容易看出来只有个纳什均衡点(2,2)。这个东西应用范围很广,因此这个其实是这个困境说选2的最主要原因。前面烟波钓徒河友已经指出了这个结果。

现实当中这种拼死砍价的情况几乎不可能发生,不过在这里2的确是逻辑推理得出的“合理”结论。

家园 【3】和“囚徒困境”的关系

当我在老马丁的帖子里面提到这个问题时,老马立刻提出和“囚徒困境”很像,这真是目光如炬啊!!!专家就是专家!

以前河里有文章介绍囚徒困境,我这里不再具体说明。在“游客困境”这个场景里,把2-100的选择改成2-3,那么从数学上看就是等价的了。

不过,在这种情况下虽然说是“困境”,其实并没有困境,很容易发现只有一种合理的选择-2(囚徒困境来说就是揭发对方),因为选2无论如何都不亏。这个选择叫“支配选择”(dominant choice)。

而当选择为2-100时,不存在支配选择,如果李四选2或者选3,张三选2当然仍然是最好的,但是如果李四选择4-100时,对于张三来说选择一个比2大的数字是更好的选择。这点应该是“游客困境”和“囚徒困境”的最大不同。

家园 【4】说明一下博弈论里面的“理性”

前面的说明可能已经让不少河友觉得抓狂了,那么荒谬的结论怎么还能说是“理性”的呢?的确,这个结果和现实测试的结果并不一样,也正是因为不一样所以这个问题才有趣,但是这里并不说明上面的推导是错误的,按照作者的说法,博弈论学者提出了了一些其他的概念,但是应用到“游客困境”时都是给出了(2,2)的预测。这个逻辑推算出来的结果和实际测试不同的问题下个帖子我会详细说明,这里我先补充一下博弈论里面的“理性”,这个参考了这篇文章和文章作者在回复这篇文章发表后的反馈时的说明。

1.在博弈论的所有虚拟场景中,每个参与者都被假设是理性的,这个理性是指面对选择时,参与者会选择让自己得益最大化

2.每个参与者都知道其他参与者是理性的

3.每个参与者都知道其他参与者知道自己是理性的

...

无限循环下去

因此

理性就是参与者之间的共识

换句话说,这个基本上是博弈论场景下逻辑推演的大前提。

当然,作者要挑战的就是这个问题。我们后面会说明他的想法。

写个半原创都那么累,扛扛铁牛先。

家园 一个有趣的例子

作者为了说明博弈论和决策论的重要区别,即博弈论中对于一个参与者来说理性意味着什么可能和另一位参与者的理性概念有关,说了一个有趣的故事,我全文引述,可能有助于不理解的河友

我在印度听说了下面这则故事。

一个卖帽子的商人在树下打盹,醒来后发现一群猴子把帽子全部偷走,爬回树上去了。帽商异常恼怒,抓起自己戴的帽子用力摔在地上。猴子最喜欢有样学样,也纷纷把帽子扔了下来。帽商大喜,迅速收起帽子扬长而去。

五十年后,帽商的孙子继承了帽子生意,他也来到爷爷曾经做过的树下,也打起了盹。一觉醒来,他也发现猴子把他的帽子全弄到树上去了。生气之余,他想起爷爷讲过的故事,于是把自己戴的帽子摘下来扔到地上。奇怪的是,没有一只猴子跟着他学。倒是有只猴子爬下树来,一把抓起地上的帽子,然后走到他的跟前,打了他一巴掌说:“你以为就你有爷爷吗?”


本帖一共被 1 帖 引用 (帖内工具实现)
家园 恩,这个跟所谓模态逻辑似乎有点关系

又有点象那些海盗分金之类的智力题

家园 模态逻辑?听上去耳熟

介绍一下?好像我以前学逻辑的时候听过这个名词。

家园 我认为关键性的问题是惩罚数字2太小。所以大部分人宁愿吃2元钱的亏

我认为关键性的问题是惩罚数字2太小。所以大部分人宁愿吃2元钱的亏也要赌一赌对方不完全“理性”而得到90~100元的机会。如果惩罚是50而范围是50-100。那么我想多数人会选50。这不光是个博弈问题,也是个概率问题。

全看树展主题 · 分页首页 上页
/ 5
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河