西西河

主题:【原创】冤假错案的数学原理 -- 同人于野

共:💬64 🌺284
分页树展主题 · 全看首页 上页
/ 5
下页 末页
        • 家园 重复检验主要是降低了将健康的人误诊为艾滋病的概率

          两个地方都将健康的人诊断为艾滋病患者的概率是0.01%*0.01%。

          两个地方同时将艾滋病患者诊断出来的的概率是99.9%*99.9%。

          代入公式里一算就知道了。

    • 家园 再拍一下

      声明:此帖对文不对人

      本来认为回一贴足够链接出处,但有童鞋加以嘲笑

      俺不厚道地嘲笑一下
      。我不得不对此文再拍一下。

      统计学中有一个置信度的概念,一般要高于95%。在样本空间一定的情况下,采样越多,置信度越高。这个可以用民意调查去理解。调查人数太多成本就大,太少则置信度就不够,调查结果就有问题,所以有一个最佳采样数的计算。

      另外还有取样方式的问题,是在全体中随机抽取还是有所偏好。比如在台湾作统一的民意调查,取样随机在整个岛屿还是某一部分多取样,是有不同的结果的。

      好了,楼主用了三个例子,前两个是说任何一个人被查得病的可能性问题,哪怕检测手段再高,对个人来说也不高

      第三个例子是说抓特务是容易造成大量冤假错案的,注意:这是用的统计结果,是指总的结果。所以应该有置信度和采样方式的说明,可是没有。

      给个和抓特务类似的例子:DNA亲子鉴定。

      其中怀疑对方不忠,孩子非亲生的比例占多数。出生前做亲子鉴定的近年来也有所增加,但大多数都是“80后”的年轻人。统计数据表明,这些要求做鉴定的人中,近10%为非亲生。
      外链出处。 还有
      亲子鉴定显示:北京有15%受试者在替别人养孩子
      外链出处

      统计结果的采样数没有1000也有500. 这怀疑方就相当于要抓特务的一般群众;亲子鉴定中心就相当于公安机关(当然准确率要低得多)。被怀疑的出生前的孩子是由于怀疑对方不忠,这是说明了取样方式,其中有10%到15%(不低,而且北京男同胞的素质较高)是非亲生的,说明怀疑不是无缘无故的。再加上鉴定中心的结果,这10%到15%的孩子有谁敢说是冤枉的。

      当然,外国法庭就有推翻DNA鉴定结果的(准确率能达到99.9999%),我估计是用了贝叶斯定理来忽悠陪审团,呵呵。

      • -- 系统屏蔽 --。
    • 家园 深入浅出,简显易懂

      写得好!

    • 家园 太好了

      深入浅出

    • 家园 艾滋题上课做过

      俺每次都是算小数最后弄错

      这题目的结果和平时的理解差了好多,弄得我一直在困惑这测试到底怎么了

      • -- 系统屏蔽 --。
    • 家园 以前搞运动有个5%的说法

      一个单位,总是有5%的坏分子,这是个指标,搞运动就是要把那些混在人民群众里的5%的坏蛋抓出来。

      这就说明领导同志对于这个被噎死概率是非常精通的。在发起运动时已经给出了5%的先验概率,给之后的革命行动指引了方向。

    • 家园 再查一次不就能确诊了么

      第一次是阳性,再查一次不就可以确诊了么

      第二次阳性确诊的概率:P(A)~=0.5,P(A|B)=(0.5x0.999)/(0.5x0.999+0.5xE-4)~=1

      所以按统计学原理,只要先拉网式排查一下,再对网里的仔细甄别,不就可以基本杜绝冤假错案了么。实际上也是这么操作的吧,先拘留,完了在起诉,然后一审,上诉,二审……

      你这个算出来的结果看起来很惊人,其实是假设一锤子买卖,模型建的可是有问题呀,呵呵

      • 家园 不一定

        多次检测的确可以提高检测的准确率,但要用你的概率模型来算,有个基本假设就是要两次检测是独立事件,这个假设事实上是不成立的。生物测试的误差有两方面,一方面是随机误差,这个可以通过多做几个replicates来校正;另一方面是系统误差或者说是实验偏差,就是所谓的intrinsic bias,这个是由测试技术本身所决定的。无论你做多少次检测,只要你没有改变测试技术,那些测量值都是相关的,而误差的平均就反映了这个实验偏差。所以多次确诊可能会提高检测的准确率,但提高的程度并没有你推导的那么明显。而即使改变了测试技术,两次测量值也未必是完全独立的,因为两种不同的测试技术也可能有相关性。很多所谓的不同测试技术只是在某些步骤上有所不同,而那些相似的步骤仍然存在共同的试验偏差。

        • 家园 即使只考虑随机误差,多做测试确实可以提高准确性,但是肯定

          做不到100%准确,也就是无法100%确诊!

    • 家园 这个。。。

      我记得概率课本上第一个有点意思的例题即是这个了,哪怕是医用概率也会上这东西吧,那个调查是不是揭示了德国的大夫不靠谱啊,嘿嘿

    • 家园 按照您的方法来算....

      第二种方法是按照你说的方法计算, Baysian's formula

      如下:

      there are Ai, i=0......n exclusive sets,

      A1, A2, A3,....An

      Pr(Ai|B)= Pr(B|Ai)*Pr(Ai)/(Pr(B|A1)*Pr(A1)+Pr(B|A2)*Pr(A2)+....+Pr(B|An)*Pr(An))

      晕了么....呵呵,在我们这里就是:

      Pr(H|I)= Pr(I|H)*Pr(H)/(Pr(I|H)*Pr(H)+Pr(I|Hc)*Pr(Hc))

分页树展主题 · 全看首页 上页
/ 5
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河