西西河

主题:【原创】冤假错案的数学原理 -- 同人于野

共:💬64 🌺284
全看分页树展 · 主题 跟帖
家园 学模式识别的飘过

我这个学模式识别的看见讨论贝叶斯公式真亲切啊。这个话题我喜欢,谈谈我的一点看法吧。

关于抓特务冤假错案,关键看代价函数是什么。很多情况下,宁可忍受冤假错案的数量(代价是人人自危、以后平反),也要降低真特务漏网的损失(核心机密泄露)。所以 对某嫌疑人x A:确实是特务 判断:B: 打成特务,那么,代价函数L(x) = alpha1*P(B|A)P(A) + alpha2*P

(A|B)(1-P(A))。其实就是对“拒真、受假”两类错误的加权。如果权值是0 1 就是最简单的,如果不为0 1 就很微妙了。改变两个参数,就会得到一条接收机特性曲线(ROC)。所以衡量一个检测方法好坏的标准不是在某个特定点上的分类效果好(比如文章中的99.9% 之类),而要求ROC曲线面积要大,这样才能把AAR(受真)FAR(受假)率都做得高。

文章里说让医生来做,还有40%的人错,这个不太相信啊,因为医生用药、治疗也要评估这两类风险的。医学里还特意为FAR AAR起了两个名词“敏感性”和“特异性”。

回到抓特务的问题上,我们看到,TG在战争年代,比如在苏区杀AB团、肃托,在延安康生的抢救运动,明显是更在意“真特务”造成的损失。而事实上,虽然有冤假错案存在,但是国民党也确实没能打入哪怕是基层的组织。而冤假错案并没有对整个组织的运作、吸收新人产生特别大的负面影响,也就是说,还是合算的。

反过来,花生米27年的“清党”才更杯具些。TG至多5w,清党前夕,国民党员总数号称100万,清党后,据1929年10月统计,减至65万。 减少的30多万党员中,最有可能是两部分人:一部分是思想急进的城市青年学生党员;一部分是基层农工党员。前者有可能被清洗,后者有可能因恐慌而自动脱党。实际上,被清除和自动脱党者可能还不止30万。因为在大批农工党员脱党和左派青年被清洗的同时,又有数以万计的“投机分子”涌入国民党内。

这样一杀了之的结果,就是彻底摧毁了自己的基层组织和与工农的联系。所以后面的失败腐朽,也就顺理成章了。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河