西西河

主题:社会科学中的概率?读《直觉,固执,谋杀:三则故事》的困惑 -- 永远的幻想

共:💬21 🌺43 新:
分页树展主题 · 全看首页 上页
/ 2
下页 末页
      • 家园 我的理解

        只有在满足大样本空间可重复取样的前提下,“概率”理论才可以“有意义”地用于预测。

        小样本,或不可重复取样的时候,很难预测。

        这时的“概率”,其含义已离开“一事件出现的可能性”,而是“某认为一事件出现的可能性”。

        从贝叶斯及引申出来专家系统所得到的结论,只能是“某方所认为一事件发生的可能性”。

      • 家园 没错,我就是觉得起码法律问题上就是这个意思

        1个掷出国徽的概率是99%硬币拿在手上,并不能保证下一掷就不是数字。

        定罪是针对当前已经发生的犯罪事实和被告之间的确凿关系。而不是被告的犯罪“概率”,所以我觉得控辩双方扯统计数字是不合适的。

        罪犯在某些统计指标上的分布,也许应该是犯罪行为学、心理学该讨论的问题(给俺们做机器学习来研究也没问题),但是不应该在法庭上扯这个。

        但是,人家美国法律界到底是怎么看待概率的,还是特别想了解哈!谁去把原文作者召唤来啊~

    • 家园 说一下吧

      原作是牛博的兰小欢,他是UV经济系的博士生。

      社会科学中很多变量,样本不具有重复性,所以心理学和经济学各自发展出了统计子学科来解决问题,计量经济学和计量心理学。基于社会科学的样本问题的局限性,在计量经济学中对统计方法的使用和一般统计不同,妥协,妥协,再妥协,测试,测试,再测试都是经典的计量经济学口头禅。

      那个辛普森的案子,辩护律师说的是打女人的不一定杀女人,而检查官想证明的是,被打过的女人死掉了,凶手基本上都是打人者,而不是别人。即P(捱过打的老婆被打人者杀害|捱过打的老婆遇害)=90%。现在的条件是辛普森打过的老婆被杀了,那么,有多大的可能性是辛普森动的手?

      至于“各态历经性”,我不懂。不过这个问题直接挑战所有的医学检测了吧。

      • 家园 谢谢

        原作是牛博的兰小欢,他是UV经济系的博士生。

        哈哈,3Q啊,牛博我找到这帖子了,可惜俺即使翻墙也登不上去啊,没法交流。大哥好人做到底,干脆把他拉过这帖来看看吧?

        被打过的女人死掉了,凶手基本上都是打人者,而不是别人。即P(捱过打的老婆被打人者杀害|捱过打的老婆遇害)=90%。

        注意,这个90%好像是全部女人(未婚),凶手也包括了所以人(男人、女人、无婚姻关系)。

        原文里是:

        而在于被打过且被杀死的女人中,有多少死于打过她的人之手?

        那么就应该:

        P(捱过打的女人打人者杀害|捱过打的女人遇害)=90%

        而如果被告不是唯一嫌疑人的话,用这个的说服力不强啊,因为显然苦主是已婚,而且怀疑的被告就是男方一个。

        其实,照律师的数字:

        截至1992年,美国每年有400万女性被丈夫或男友打过,但是根据FBI的报告,其中只有1432人被丈夫或男友杀死,这概率大概2800分之一。

        按照这个包含关系,P(捱过打的老婆老公杀害|捱过老公打的老婆遇害)=100%才对嘛

        关于

        不过这个问题直接挑战所有的医学检测了吧。

        医学数据没接触过太多。但是机器学习领域,用过医学方面的数据集,比如根据病例的几个检查指标对某种疾病真实的阳/阴性 进行回归和分类。这时候通常以分类算法的在测试集上的误差做衡量,至于你把数据看成来自于什么样的随机变量,随便

        但是法律上,这么用统计学还是觉得有问题,问题我主贴说过了。

        • 谢谢
          家园 全文引用

          直觉,固执,谋杀:三则故事

          兰小欢 @ 2010-7-6 22:50 阅读(4660) 评论(13) 推荐值(240) 引用通告

          最近在学习贝叶斯理论,遇到以下三则有趣的故事,花了不少时间思考。对于这些故事,每个人可能都有不同的解读,所以这里我主要讲故事,只附上简短的评论。

          故事一:直觉

          有个问题是这样的:某女,31岁,单身,外向,聪明伶俐。大学时主修哲学。做学生期间,极度关注种族歧视和社会不公正问题,并参与了“反核游行”。以下八种对该女的描述中,你认为哪一种最可能对(概率最高)?请按照这可能性由高到低排序。

          A 她是小学老师; B 她在书店工作,平时还练瑜伽; C 她是活跃的女权主义者

          D 她是社工,做心理辅导; E 她是“女性投票者联盟”的成员;

          F 她是银行出纳; G 她是卖保险的

          H 她是银行出纳,并且是活跃的女权主义者。

          在很多人的答案中,H项排在了F项前面,但是没人把H项排在C项前面。

          这是个很奇怪的现象,因为H项不过是F项和C项的合并,逻辑上,“既是银行出纳又是活跃的女权主义者”的H项概率绝不可能大于F项, “银行出纳”。

          在日常生活中也有类似的现象。当某人向你讲述一件事时,他讲的细节越多,你越容易相信他讲的是真的。但是,细节越多,可能意味着这些细节同时发生的可能性越小,所以他讲的事越不可能是真的(当然,这些细节必须相互联系,你才会信以为真。所以他们之间不是互不相干“相互独立”的,但是这些联系是你做为听者自己加进去的)。

          简评:这则故事被用来说明古典概率论无法解释人类的决策过程,在起点和直觉上就可能错的离谱。这个实验是Tversky 和 Kahneman 1974年做的,后者后来得了诺贝尔经济学奖,前者本来应该分享这一殊荣,可惜没能活到得奖那天。这里的表述转引自以色列教授Itzhak Gilboa的著作《Theory of Decision under Uncertainty》, 这本书极好。

          故事二:固执

          某人不知道电视机的工作原理,他相信那个小盒子里肯定有许许多多小人儿,不停地高速运动来更换图像。这时候来了个工程师,一点点向他解释电视机的工作原理,频谱啊,发射接收啊,信号扩大啊等等。工程师讲得生动浅显,这个人也听得很认真,每一步都使劲儿点头。最后,这人说他很满意,完全明白了这工作原理。然后他问:“但是我觉得说来说去,也就是说那小盒子里其实只有很少几个小人儿,对吧?”

          简评:这个故事更像个笑话,不过它揭示了个道理:第一印象是很难改变的。第一印象一旦形成就很难彻底消除,以后就算接受了新信息,也往往不过是基于这第一印象进行调整。用现在流行的术语,这叫“锚效果”,第一印象就像一只锚,一旦抛下,很难撼动根本。用贝叶斯的理论说,如果这第一印象(先验概率)很强的话,要消除它或者大幅度的修正它,需要很多很强的新信息。

          举个例子,法庭在进行审判的时候,如果犯罪嫌疑人面相凶狠,给法官和陪审团留下了很不好的第一印象,辩方要翻案的困难就会加倍。所以诉方通常一上来的策略就是把嫌疑人描述成一个恶棍。嫌疑人要正装出庭,不止是尊重法律的意思,也是尽量消除在外表上的差异,避免偏差的第一印象。

          这个故事据说来自Douglas Adams, 被Richard Dawkins转述。 这里的描述来自理论物理学家Garrett List的小文章《We Are Inefficient Inference Engines》.

          故事三:谋杀

          在审理谋杀案时要庭审大量证据,很多时候要利用逻辑推理来建立因果链条,也要用统计数据来增加说服力,而用错数据和推理,结果可能是致命的。

          九十年代,辛普森杀妻案轰动美国,各种证据都似乎证明凶手就是辛普森,而最后辛普森的“梦幻律师团”帮助他成功脱罪。林达曾用了半本书来讲这个故事,极生动,主要讲这个案子的审理程序,想说明当国家机器想给个体定罪是多么容易,个体是多么无助,所以这些必要的程序每一步都疏忽不得。

          但是林达没有讲下面这个故事。

          为了证明辛普森有罪并给陪审团留下他杀妻的印象,检方举证说辛普森之前有家庭暴力行为,而“扇耳光是谋杀的前奏”。但辛普森的辩护律师说,检方不过是在误导陪审团。辩护律师说:截至1992年,美国每年有400万女性被丈夫或男友打过,但是根据FBI的报告,其中只有1432人被丈夫或男友杀死,这概率大概2800分之一。怎么能用这么小的概率来推理呢?

          这个辩护看起来很有说服力,但实际上完全与案件无关。问题根本不在于打过女人的男人有多大可能性杀死这女人(这概率,如上所述,是2800分之一),而在于被打过且被杀死的女人中,有多少死于打过她的人之手?这后者的概率,根据1993年的美国犯罪报告,是90%。在辛普森案中,检方从来没提起过90%这个数字,显然中了辩方的招。

          简评:我做过两学期初等概率论和统计学的助教,讲辅导课时,条件概率和贝叶斯定理很难教。我相信这些概念和推理是合乎逻辑的,但我也相信它们和人类直觉相悖,人通常不这么思考问题,人很容易被愚弄。

          这个故事来自加州理工的教授Leonard Mlodinow的畅销书《The Drunkard’s Walk: How Randomness Rules Our Lives》。

          尾声

          当辛普森脱罪之后,几乎所有的老百姓都认定他就是杀人犯,因为证据实在太多了,但大众也都尊重法律,接受陪审团对他无罪的判决。林达认为这是文明社会的表现。而对研究人类“决策行为”的Itzhak Gilboa而言,类似的事件有不同的解读:每个人都坚信嫌疑人有罪,而每个人又都接受法庭判处嫌疑人无罪,并认为这判决遵守程序而合理,这个区别,类似于贝叶斯决策和经典统计学的区别,也是为什么在贝叶斯理论大行其道的今天,我们依然要学习那个经典的大数定律。

分页树展主题 · 全看首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河