西西河

主题:【文摘】04年37大城市购房难易度排名 -- 大众河蟹

共:💬26 🌺7
分页树展主题 · 全看首页 上页
/ 2
下页 末页
    • 家园 36 深圳 27596 82788 47189 6037 422590 8.96 (?!)
      • 家园 估计这个错误是来自 "平均可支配所得"

        国内数字只要涉及到某个地区的 "平均所得" 就会有偏差, 这主要来自于平均数的算法. 目前一般平均数是以设籍人口计算的, 也就是固定设籍居民, 不含外地打工人口, 所得的部份自然也是以报税的数字为主. 衍生出来的问题, 就是设籍居民人数与实际劳动人数相差大的区域, 所得结论的数字会偏离现实很远.

        深圳每平米6037看起来差不多, 但家庭可支配收入27596未免也高了些.

        同样的, 在看苏州平均所得与上海或深圳的对比时, 一样会产生类似的偏差.

        • 家园 没错,这正是统计数字的pitfall

          如兄所说"平均所得"计算的偏差,其实主要来源是两个,一是取样本身可能远远不具备代表性。目前的“收入”统计数字依据的主要是个人所得税以及社保的记录,而以江浙沪地区为例,这里存在着一个很大的私营经济规模是很大程度上未被记在内的,同样地,外企的管理层以及其它收入来源都不在这个口径之内。其次,就是学统计时老师再三关照的一个基本原则:单个的平均值(mean)是没有太大意义的,更要关心数据的分布(distribution)。单拿mean值来比较其实就是做了个非常危险的假设:所有城市的收入分布曲线类似。稍稍做些调查就可以知道这个假设前提错得有些离谱。

          不奇怪,只知道单纯地引用统计数字经常就会犯这样的问题,麦肯锡和高盛早些年关于国内市场的报告里也常闹这样的笑话。

分页树展主题 · 全看首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河