- 近期网站停站换新具体说明
- 按以上说明时间,延期一周至网站时间26-27左右。具体实施前两天会在此提前通知具体实施时间
主题:【半原创】“游客困境”的介绍(1) -- 四处张望
作者提出这个模型后有多次实验,包括了各种变化。
在本题的情况下。甲的计算是:如果乙完全“理性”。那么我说2会得到2元;而说100会得到0。如果乙不完全“理性”。那么我说2会得到4元,说100会得到100元。
即使乙只有5%的可能不完全“理性”。甲说2的数学期望值是2×95%+4×5%=2.1元。而甲说100的数学期望值是0×95%+100×5%=5元。依然是说100会带来更高的预期收益。
因此你不能这样计算。
实际上如果按照你的解释,已经是对博弈论问题的新解了,这个也是作者要提出的问
谢谢!同意你的观点。我只是计算在实际中,而非完全理性人的判断。这也可以解释为什么大部分河友选了95~100这样非“理性”的结果。因为大家相信对方至少有2%是不完全“理性”的。(对方不理性程度低于2%则选2元的数学期望值更高)呵呵。。。
但是如果作为严格的研究而言,稍微变化一下就很难计算和解释了,比如后面铁牛的时候会提到的180-300,奖励/惩罚数额为5,你再用概率来计算就不容易了。就算你能解释,只要随意调整数字范围和奖励/惩罚数额,你的分析就会越来越复杂而且很难保持一致。所以我反复推敲这篇文章,发现目前河友提出的问题几乎都被他说了,包括你现在的解释。
我突然想到,根据这个还可以设计一个实验来验证实际人的“完全理性”程度。把惩罚值设为x,范围为x-100。让测试人群对不同的x做选择。可以预见在x超过某个值之后,大部分人会从选95~100改为选x。是否可以认为这时的x就是实际人的非“完全理性”程度呢?
什么叫理性,或者说传统的理性定义是否合适。
比如,如果把惩罚值设为20,范围为20-100。测试人群大部分选~100。而把惩罚值设为30,范围为30-100。测试人群大部分选30。这个实验就说明测试人群的平均“非完全理性程度”为20%-30%之间。
用这个平均“非完全理性程度”可能可以一定程度上预测不同的测验下实际人群给出的结果。比如“四处张望”兄提到的180-300,奖励/惩罚数额为5。也许可以用平均“非完全理性程度”来预测实际人群的测验结果。180的数学期望是180×(1-非完全理性程度)+185×非完全理性程度,而300的数学期望是175×(1-非完全理性程度)+300×非完全理性程度。看哪个高就大致可以预测实际人群的选择结果。
我猜测这个“非完全理性程度”值在不同的人群中会有不同。天真烂漫的孩童的平均“非完全理性程度”可能会明显高于饱经沧桑的老人。
把一个incomplete information的game 变成一个inperfect的game. 即首先由上帝来选另一个游客的类型:理性或疯子.但概率未知,这样,这个游客的最佳选择是一个mixed的策略,所以在绝大部分情况下,你应该选100.
等着抗铁牛,呵呵
经济行为学和博弈论的区别就是研究实际人和理想人行为的不同。所以研究一下实际人和理想人有多大不同应该是很有意义的。
土鳖必须承认,铁牛很重,扛的很是辛苦。
这个系列毕竟是我根据文章内容抽取的,到目前为止自己发挥的余地很小,又要忠实文章原文,又不能犯错,而且这些内容并不是我的专业范围,有些问题也不知道怎样扩展和回答,很是吃力。目前为止正文的内容都是完全忠实于原文,我个人的看法只会在结尾和回复中说明。
已经有河友在投票贴提出质疑,我想可能还是看完这个系列再做最终判断比较合适。好,回到“游客困境”这个问题上。河友普遍提出的问题是这个场景提出的数字范围2-100相差实在太远,不合理,因此选择100或者说不选择2是很明显的。
呵呵,你想想,如果一开始不是那么特别的比较,能抓住眼球吗?作者提出这个估计也有这个目的吧。
另外,关于2为何是“理性”的选择,我在一个论坛上看到的一个解答从直觉上我觉得比较有代表性,2是唯一能保证你能拿到钱的选择。
说了那么多还没转到正题,可能已经有河友觉得罗唆了,呵呵,言归正传。
首先,这个问题是进行过多次实验的,当然这些说明也都来自于文章内容。
你觉得2-100太特别吗?
好,改成80-200,这时候“理性”的选择总是(80,80)
研究人员在美国弗吉尼亚大学用真钱做了实验,实验规定参与者可得6美元,同时赢的钱也归自己(不过这个时候是用美分做为单位)
惩罚/奖励数额随着轮次不同而不同,最低5美分,最高80美分。在这种情况下其实大家可以猜得出结果。
1.5美分时,参与者的选择平均为180,这个结果和2-100的类似,也和河里的投票结果类似
2.80美分时,注意,这时候输了就一文不得了,参与者的选择大大降低,但是平均值仍然有120
好,我想有河友看到这里可能就会提出,那些人选择的时候可能没考虑清楚,如果再来一次可能结果就不同了。
的确,实验还让参与者反复进行对弈,看看行为是否有所不同。
结果是:
1.奖励数额较大的时候,如80美分,参与者的选择逐渐降低并向纳什均衡点(80)靠拢
2.奖励数额较小的时候,参与者的选择出现了向另外一个极端200攀升的趋势
结论是,通常都不会选择纳什均衡,我认为这个实际上意味着这不能用传统的博弈理论解释。
友来有趣河友提出了对0-100场景下的解释以及后续的一些想法,我很受启发,不过我很有兴趣看看他对【5】里面的实验结果是如何用那个理论解释。不过从学术理论的角度来看,我认同文章作者的看法
文章里面还提到了一个网上实验,以色列和美国的大学合伙搞得,不过是虚拟的,没钱。180-300,奖励/惩罚数额是5。参与者都是打算去听博弈论介绍的听众,涉及了7个国家约2500人参与。
结果呢?
55%的人选300,平均用时70秒
17%的人选择295-299,平均用时96秒
14%的人选择181-294,相当于随机选择,平均用时也大约为70秒,其实更短一点
13%的人选180,平均用时80多秒
要说明的是各种分组方法的结果是类似的,比如按照国家分组。
好了,你觉得应该怎样解释这个结果呢?
上贴最后那个实验的结果其实稍微想想应该都能理解,本能选择(300),随机选择(181-294)是跟随人的直觉,当然最快。形式理性选择(180)的,可能真是按照那个方法推理的,也可能是一开始就知道这个问题的“理性”答案的,因为有推理,所以会慢些。时间最长的(295-299)是推理后的,照我看是最狡猾的,明显考虑了对方可能选择并且期望获得最高的回报,因此花的时间最长。因为在这种场景里,300是这个博弈模型中唯一一个“被支配”的选项,也就是总是存在另一个始终不比它差,有时候甚至更好的选择,295-299都是。
之前我发起的投票,选择100的人超过7成,我想因为是在西西河,很多人看到这个都不会太用心考虑,也不会花太多时间,会跟随直觉选择。但是仍然和这个结果类似。
到这里可能有河友想,许多人不会费神做演绎推理,因此做出了并非他们本意的选择,如100。好想法,文章紧接着又提供了一个实验结果。
2002年德国霍亨海姆大学做了一个实验,是2-100的原始版本“游客困境”模型对弈,参与者是51名博弈论学会会员,实验是这样的进行的:
1.每个参与者事先选定策略,由主持人按照这个策略和其他50名一一过招(熟悉博弈论的朋友可能在其他地方见到过这种做法)
2.参与者可以选择一个数,每次都用这个,也可以选一组数,并附上使用的频率
3.有真钱奖励,最后会随机挑一个,按照他平均收益的20倍发放奖金。
你能估计结果吗?
最后的幸运儿获得了1700美元(平均收益85)
51个参与者中,45人直选了一个数(其他的选了一组),这45人中只有3个人选择了2,10个人选择被支配选项100,23人选择了95到99之间的数。
这些人毫无疑问懂得2是“理性”选择,但是他们仍然很少人做了“理性”选择。嘻嘻,这个地方凸显了博弈论和现实的巨大差异。我看到一个评论说道,如果你贪心的话,最好的选择是99,因为你可以估算大部分人会选择100,看来这些博弈论学会成员充分应验了这点。但是为何还是有10人选择了100或者说现实选择中大部分人会选择100呢?
到这里作者终于说出了他的想法
或许出了利己动机以外,利他主义同样也深深扎根于我们的灵魂深处,我们采取何种行为则是这两种思想较量的结果。我们知道,如果我们都选择100,那么航空公司经理付给我们的钱是最多的。许多人都不好意思为了多赢区区1美元而挖同行旅客的墙角,因此,尽管我们完全明白,从理性的角度分析,99对于我们个人来说是更好的选择,但我们还是宁愿选择100。
土鳖累了,要抗抗铁牛了,后面会说一下作者的结论和我自己的看法。