西西河

主题:【求助】一道概率题, 通宝感谢! -- 王树

共:💬8 🌺16
分页树展主题 · 全看首页 上页
/ 1
下页 末页
  • 家园 【求助】一道概率题, 通宝感谢!

    某地有343个古墓,随机取样16个,这16个样本的线粒体高可变区测序结果完全相同。

    问:在这种情况下,这343个墓葬线粒体高可变区测序结果全部相同的置信度是多少?

    --------------

    等价问题:

    从343个小球中随机取出16个,发现这个16个颜色都是白色。问,343个小球全是白色的置信度是多少?

    --------------

    还有下面的背景可供参考:

    这16个样本,来自山东某个遗址,距今4800年,都是D5型的。

    山东另一个距今2000年前的遗址,D5型占9%。

    对于D5型而言,现代山东泰安的一个人群占8%,青岛的一个人群占10%,淄博的一个人群是6%。

    关键词(Tags): #考古
    • 家园 D5墓穴数大于300的概率接近0.9

      为了解这道题,我做出一个假设,如果假设不同,答案也不同: 假设最初我对于D5的先验概率没有任何猜测,D5的概率为1/343、2/343直到343/343的概率完全一样。

      程序是:

      from scipy import misc

      x = np.arange(343)

      prob = misc.comb(x, 16)/misc.comb(343, 16)

      accProb = np.cumsum(prob/sum(prob))

      plot(x, 1-accProb)

      xlabel("expected tomb number")

      ylabel("Prob(D5 tomb number > expected tomb number)")

      结果是:

      点看全图

      外链图片需谨慎,可能会被源头改

      大致可以这么说,当地343个墓穴中,在看到抽样数据之前,我们可以猜测D5墓穴数大于200的概率是143/343=0.41。

      看了数据后,D5墓穴数大于200的概率接近于1。大于300的概率接近于0.9.

      D5墓穴数精确等于343的概率还是不算大,只有0.05。

      如果你采样了200个古墓,它们都是D5,那么D5墓穴数精确等于343的概率能到0.58。总之,采样这个东西,很难给你一个100%的回答。

      通宝推:王树,
    • 家园 试着回答一下

      虽然题目不尽严谨,题意还是可以推测的。可设343球中白球为n.则:任取16球取法有C16,343(16为上标.343下标,下同),取到16白球有C16,n.则C16,n/C16,343=n/343 可解得n=343即可推断全部为白球。

    • 家园 用你这个小球的例子

      别的情况看不懂,所以用你这个小球的例子,球的颜色是非黑即白,还是有其它颜色?或者有其它颜色,但你只关心白和非白?如果确实只关心非此即彼,假设343个其它性质相同的球中有X个白球,随机连抽16个白球的概率应该很容易算出来,然后“倒着想”什么范围的X最有可能。

      下面燕轻笑河友的意见,我猜想也可能是这个方向上的。

    • 家园 你这个情况不太好用统计概率来算

      因为很难判定原始数据符合哪一类概率分布。

      而且抽样样本16也太小了,一般都要30以上的。

      套公式算出来的置信度不会太高的。

      还不如把所有样本的测序都做了。

    • 家园 我的概率知识全部还给老师了,不过我还记得概率的意思。

      343-16=327, 结果应该就是三百二十八分之一。这个328分之一是基于一个假定,那就是小球只有黑白之分。

      你给的条件是随机选取的,那就是这一个结果不影响下一个。但是基因可能不同,因为人群有聚居的特性,所以实际考虑可能性要大得多。

    • 家园 这道题的问法不对

      应该问判定“343个小球全是白色的”置信度是多少?

分页树展主题 · 全看首页 上页
/ 1
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河