西西河

主题:几句与人口相关的杂话 -- 黑岛人

共:💬1360 🌺5814 🌵448
全看分页树展 · 主题 跟帖
家园 不管普查或抽查,否定原始数据是不应该的。

首先,

比如:基准年(假设无统计误差)实际人口数量=统计人口数量=10亿;统计年实际人口数量=10.5亿,实际人口增长量5000万;由于1%的统计误差,统计人口数量=10.5亿*1.01=10.605亿,统计人口增长6050万。于是出来1050万的数据误差。

你举的这种统计误差有一点点问题,这样的误差基本都是负的,就是漏查,少查。而重复多查的可能很小。专业人口期刊上有大量对这方面的论述。因为生活区域的原因,这种漏查少查在少数民族发生的概率应该更高些。

去看看1982、1990、2000的普查数据和1987、1995、2005的抽查数据,抽查数据的少数民族比例总要比异常跳高,说明这是统计的系统偏差。

第一,少数民族比例高就说是抽查数据系统偏差。这样不科学。数据就是数据,您不能没证据的情况下说这有系统偏差。国家统计人员不是吃干饭的,即使有偏差,这抽查数据的Margin of Error也是可知的或可控的。不是随便的一个东西。

第二,退一步说,就算是有什么“异常“偏高,那说明是前一次的普查数据中少数民族的人数少查了。原因在前面已经说了。抽查的控制性比普查好得多,毕竟规模小。所谓的普查,也就是一种最大规模的抽查。

“时候可能会看上去两个数据有矛盾,只能说这个采样带来的正负偏差让这两数据有重叠,那最好就别用这些数据”,您懂这个道理嘛,那么为什么使用不同序列的数据?只是为了得出自己需要的结论,那我可以用同样的方法,算出少数民族人口在5年间减少了,您是否承认呢?

所谓“不同序列的数据“,是一个不太格的说法,在某一年,进行普查也好抽查也好,它们的采样空间是一样的。至于你说的什么用什么方法算出少数民族人口减少,如果你明知一个方法错了还要用,再精确的数据都白搭。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河