西西河

主题:【原创】如何判断不同品牌的产品合格率是否相同? -- 衲子

共:💬7 🌺5
分页树展主题 · 全看首页 上页
/ 1
下页 末页
  • 家园 【原创】如何判断不同品牌的产品合格率是否相同?

    现在手头的问题是: 有两种牌子的灯泡A和B, 分别有Na与Nb只, 其中各有na与nb只合格. 我们要想知道这两种品牌的灯泡的合格率是否相同?

    解决这个问题的方法是这样的. 这相当于在给定的实验观测下,来比较两种假设H0:{合格率相同}、H1:{合格率不同}, 看两者哪个有着更大的似然性? 我们预先需要设一个阈值, 比如1000, 即:当H1的似然性比H0的大1000倍时,我们就认为H1为真,否则接受H0.

    为达到这点, 先来证一个引理.

    ----------------------------------------------

    [引理]

    观测到的事件E是:

    E = {一批贴有标号的N只灯泡中, n只(特定标号的)灯泡合格}.

    而灯泡的合格率r是一个未知参数, 设遵循[0,1]间的均匀分布, 即f(r)=1

    在给定特定的r值时, 该事件E的概率是:

    P{E|r} = r^n * (1-r)^(N-n)

    其中, x^y 表示 x的y次方.

    于是

    P{E} = ∫_{0,1} P{E|r}f(r)dr

    = B(n+1, N-n+1), ………………(1)

    其中, ∫_{0,1}表示从0到1积分, B(x,y)为Beta-函数.

    ------------------------------------------------

    好, 运用方程(1)的结果, 我们就能计算两种假设的似然性.

    在H0的假设下,

    P{Ea,Eb | H0} = B(na+nb+1, Na+Nb-na-nb+1)

    而在H1的假设下,

    P{Ea,Eb | H1} = P{Ea}*P{Eb}

    = B(na+1, Na-na+1)*B(nb+1, Nb-nb+1)

    所以,

    P{Ea,Eb | H1}/P{Ea,Eb | H0}

    = B(na+1, Na-na+1)*B(nb+1, Nb-nb+1)/B(na+nb+1, Na+Nb-na-nb+1)

    ………………(2)

    现在让我们来看一个具体例子: 总共有312只灯泡, 编上了号. 但不知道两种品牌的灯泡各为哪些. 我们知道其中的22只是合格的(其余都不合格). 并且知道这其中的三只是A品牌,三只是B品牌. 要问的问题是: A和B两类灯泡的合格率是否相同? (不过anyway,它们的合格率也太次了一点 :-)

    这个问题不好办, 因为我们不知道其它的那些灯泡的品牌是什么. But just for fun, 让我们尝试所有的可能, 让其余16(=22-3-3)只合格灯泡中A品牌的数量从0变到16, 让其余290只次品中A品牌的数量从0变到290, 算出各种情况(总共16X290)下的两种假设的似然性的比率, 这要用到方程(2).

    点看全图

    将结果画出来,见上图, 其中的纵座标是似然性的比率的对数. 可以看到, 该曲面有两个极大值, 分别对应于A类灯泡的合格率远大于B类的(左峰)、以及B类灯泡的合格率远大于A类的(右峰). 让我们取个具体值, 当其余16只合格灯泡中的8个,和290只次品中的11个是A品牌--也即: A品牌共有11个合格品,11个次品--时, H1的似然率是H0的134万倍! 远大于阈值1000. 就是说, 在这样的实验结果下, 我们将认为这两种品牌的灯泡具有不同的合格率. (其实这个数据点取得已经很保守了, 要知道最极端的例子是当A品牌有19个合格品,0个次品--就是说次品全是B品牌的--这时的似然率比率为4e25!)

    所以, 只要剩余的数据确实是skewed, 就会suggest两类产品的合格率不同. 当然,在现实条件下人们通常能够得到足够大量的产品, 这时比较它们的合格率将是一件很容易的事了.

分页树展主题 · 全看首页 上页
/ 1
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河