西西河

主题:【半原创】“游客困境”的介绍(1) -- 四处张望

共:💬66 🌺104
分页树展主题 · 全看首页 上页
/ 5
下页 末页
              • 家园 根据这个还可以设计一个实验来验证实际人的“完全理性”程度。

                我突然想到,根据这个还可以设计一个实验来验证实际人的“完全理性”程度。把惩罚值设为x,范围为x-100。让测试人群对不同的x做选择。可以预见在x超过某个值之后,大部分人会从选95~100改为选x。是否可以认为这时的x就是实际人的非“完全理性”程度呢?

                • 家园 送花得宝!!

                  恭喜:你意外获得【西西河通宝】一枚

                  鲜花已经成功送出。

                  此次送花为【有效送花赞扬,涨乐善、声望】

                  [返回] [关闭]

                  送花得宝!

                • 家园 比如,如果把惩罚值设为20,范围为20-100。测试人群大部分选

                  比如,如果把惩罚值设为20,范围为20-100。测试人群大部分选~100。而把惩罚值设为30,范围为30-100。测试人群大部分选30。这个实验就说明测试人群的平均“非完全理性程度”为20%-30%之间。

                  用这个平均“非完全理性程度”可能可以一定程度上预测不同的测验下实际人群给出的结果。比如“四处张望”兄提到的180-300,奖励/惩罚数额为5。也许可以用平均“非完全理性程度”来预测实际人群的测验结果。180的数学期望是180×(1-非完全理性程度)+185×非完全理性程度,而300的数学期望是175×(1-非完全理性程度)+300×非完全理性程度。看哪个高就大致可以预测实际人群的选择结果。

                  我猜测这个“非完全理性程度”值在不同的人群中会有不同。天真烂漫的孩童的平均“非完全理性程度”可能会明显高于饱经沧桑的老人。

                • 家园 其实这个问题的关键就是“理性”

                  什么叫理性,或者说传统的理性定义是否合适。

              • 家园 你这种解释对于目前这个场景可能合适

                但是如果作为严格的研究而言,稍微变化一下就很难计算和解释了,比如后面铁牛的时候会提到的180-300,奖励/惩罚数额为5,你再用概率来计算就不容易了。就算你能解释,只要随意调整数字范围和奖励/惩罚数额,你的分析就会越来越复杂而且很难保持一致。所以我反复推敲这篇文章,发现目前河友提出的问题几乎都被他说了,包括你现在的解释。

    • 家园 【4】说明一下博弈论里面的“理性”

      前面的说明可能已经让不少河友觉得抓狂了,那么荒谬的结论怎么还能说是“理性”的呢?的确,这个结果和现实测试的结果并不一样,也正是因为不一样所以这个问题才有趣,但是这里并不说明上面的推导是错误的,按照作者的说法,博弈论学者提出了了一些其他的概念,但是应用到“游客困境”时都是给出了(2,2)的预测。这个逻辑推算出来的结果和实际测试不同的问题下个帖子我会详细说明,这里我先补充一下博弈论里面的“理性”,这个参考了这篇文章和文章作者在回复这篇文章发表后的反馈时的说明。

      1.在博弈论的所有虚拟场景中,每个参与者都被假设是理性的,这个理性是指面对选择时,参与者会选择让自己得益最大化

      2.每个参与者都知道其他参与者是理性的

      3.每个参与者都知道其他参与者知道自己是理性的

      ...

      无限循环下去

      因此

      理性就是参与者之间的共识

      换句话说,这个基本上是博弈论场景下逻辑推演的大前提。

      当然,作者要挑战的就是这个问题。我们后面会说明他的想法。

      写个半原创都那么累,扛扛铁牛先。

      • 家园 先花上,

        等着抗铁牛,呵呵

      • 家园 恩,这个跟所谓模态逻辑似乎有点关系

        又有点象那些海盗分金之类的智力题

      • 家园 一个有趣的例子

        作者为了说明博弈论和决策论的重要区别,即博弈论中对于一个参与者来说理性意味着什么可能和另一位参与者的理性概念有关,说了一个有趣的故事,我全文引述,可能有助于不理解的河友

        我在印度听说了下面这则故事。

        一个卖帽子的商人在树下打盹,醒来后发现一群猴子把帽子全部偷走,爬回树上去了。帽商异常恼怒,抓起自己戴的帽子用力摔在地上。猴子最喜欢有样学样,也纷纷把帽子扔了下来。帽商大喜,迅速收起帽子扬长而去。

        五十年后,帽商的孙子继承了帽子生意,他也来到爷爷曾经做过的树下,也打起了盹。一觉醒来,他也发现猴子把他的帽子全弄到树上去了。生气之余,他想起爷爷讲过的故事,于是把自己戴的帽子摘下来扔到地上。奇怪的是,没有一只猴子跟着他学。倒是有只猴子爬下树来,一把抓起地上的帽子,然后走到他的跟前,打了他一巴掌说:“你以为就你有爷爷吗?”


        本帖一共被 1 帖 引用 (帖内工具实现)
    • 家园 【3】和“囚徒困境”的关系

      当我在老马丁的帖子里面提到这个问题时,老马立刻提出和“囚徒困境”很像,这真是目光如炬啊!!!专家就是专家!

      以前河里有文章介绍囚徒困境,我这里不再具体说明。在“游客困境”这个场景里,把2-100的选择改成2-3,那么从数学上看就是等价的了。

      不过,在这种情况下虽然说是“困境”,其实并没有困境,很容易发现只有一种合理的选择-2(囚徒困境来说就是揭发对方),因为选2无论如何都不亏。这个选择叫“支配选择”(dominant choice)。

      而当选择为2-100时,不存在支配选择,如果李四选2或者选3,张三选2当然仍然是最好的,但是如果李四选择4-100时,对于张三来说选择一个比2大的数字是更好的选择。这点应该是“游客困境”和“囚徒困境”的最大不同。

    • 家园 【2】为什么说2是“理性”的选择

      这里我会解释一下为什么说选择2是“理性”的选择,对于很多了解博弈论的河友来说,稍加推理就知道,但是很多河友估计还是想不明白,所以我首先解释一下。

      博弈论广泛使用反向归纳(backward induction,也叫倒推法)的分析方法,我们可以应用到这个问题上。

      以张三为例,一般来说,他首先会想到最大数100,如果李四也是选100,那么皆大欢喜,都拿到100。但是再一想,张三发觉99更合理,说不定还能比刚才多得1美元,即101(实际上投票时已经有河友想到这点),同样李四也会这样写,那么大家又会选择99。但是再想下去,98、97、96...到最后两人都会选择2。

      注意一下,这里的类推完全是张三和李四分布推理得出来的,他们并没有任何沟通,而且明显都只想着自己的好处。

      如果用更直接的工具,即收益矩阵,如下图

      2 3 4 ... 98 99 100

      2 2, 2 4, 0 4, 0 ... 4, 0 4, 0 4, 0

      3 0, 4 3, 3 5, 1 ... 5, 1 5, 1 5, 1

      4 0, 4 1, 5 4, 4 ... 6, 2 6, 2 6, 2

      ... ... ... ... ... ... ... ...

      98 0, 4 1, 5 2, 6 ... 98, 98 100, 96 100, 96

      99 0, 4 1, 5 2, 6 ... 96, 100 99, 99 101, 97

      100 0, 4 1, 5 2, 6 ... 96, 100 97, 101 100, 100

      这个图包含了两个参与者所有可能的选择及对应的收益的所有信息。

      如果了解纳什均衡,很容易看出来只有个纳什均衡点(2,2)。这个东西应用范围很广,因此这个其实是这个困境说选2的最主要原因。前面烟波钓徒河友已经指出了这个结果。

      现实当中这种拼死砍价的情况几乎不可能发生,不过在这里2的确是逻辑推理得出的“合理”结论。

    • 家园 呵呵,先花上。

      博弈论的结果:很明显双方都选2,是一个nash均衡。如果把100换成5,10,15.。。呢?恐怕越小的数字,选择2的可能性越大。

      这个问题其实是因为双方的风险偏好,并且都假设对方也原因为了更多的收益而冒风险而导致的。

      等待楼主继续抗铁牛,呵呵

      • 家园 所以你选了2

        没错,这个例子是稍微夸张了一点,文章提到后面有人重复实验是用180-300,惩罚数5。结果类似。当数字从100降到3,那这个在数学上和囚徒困境等价。

分页树展主题 · 全看首页 上页
/ 5
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河