主题：【原创】数字左右社会科学 -- 同人于野

共:💬59 🌺171

老大河待整

不錯，

統計方法越來越被廣泛的應用在科學研究中了。

例如，在所謂“后基因組”時代，為了研究DNA序列上的變異（例如SNP）與疾病之間的關系，統計遺傳學方法已經成為最主要的方法。不過，這里有兩個問題需要大家注意：

一是如何分劃統計樣本，同樣都是人，多多少少有些病癥出現，那么如何把這個總的population按照phenotype合理地分為兩類？如果病人不幸罹患多種病癥，如何合理采集樣本來使這些不確定因素的干擾達到最小？這在現實的操作中是一個很大的問題。因此，在具體的研究中，為了從權，往往通過調查一個家系（擁有相似的遺傳背景）來確定DNA上的與疾病相關（associate）的變異。但是，合適的遺傳病家系并不好找，因此是寶貴的資源。這也是為什么這樣的研究工作一般總是可以發表在頂尖雜志上的原因。另一方面，家系的population比較小，統計上的variation比較大，可能會有不確定的結果。一些非遺傳而又病癥明顯的疾病的采樣就好辦一些，例如老年癡呆或者帕金森氏綜合征，樣本數量可以達到幾千，那么結果就比較有說服力。

另一個問題，一般我們找到一個變異說它和某個疾病有關聯，其實并非說有了這個變異就一定有病或注定發病。其實差距還是蠻遠的。一個變異與疾病有關的程度可以采用一個概率來描述。在老年癡呆的研究中，最最顯著的基因APOE的變異其實也只有4～20%的概率有病癥。這說明，對統計出來的結果的解釋，一定要非常小心謹慎，否則就會得出“太超過”的結論了。

說這兩點，主要還是希望使大家了解統計推斷的過程，以及在實際操作過程中可能會出現的問題。總之，就是要要慎重。

全看分页树展 · 主题跟帖

相关回复上下关系8
- - 🙂手枪和游泳池的例子属于因果颠倒了胡亦庄字48 2009-06-13 19:40:37
  - 🙂这个DI的可信性再次证明了中国传统教育的优越性…… 2 郭既克字48 2009-03-20 12:09:10
    🙂DI方法只适合低年级一定阶段打基础益者三友字81 2009-09-14 10:15:52
  - 🙂不錯，
    🙂长见识了, leqian 字51 2009-02-27 07:02:16
  - 🙂对统计学持保留态度 8 预备役师的防化字1086 2009-02-14 17:44:39
    🙂浅见，统计只能提供相关，不能提供因果。因果还是逻辑上 2 物格修齐字12 2009-06-13 19:43:26
    🙂【讨论】但作者讲述的正是这么一个东西~ 2 肖邦字613 2009-04-06 13:33:30

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明