西西河

主题:如果您在我的位置,您会怎么办? -- 煮酒正熟

共:💬38 🌺59 新:
全看分页树展 · 主题 跟帖
Del
家园 花谢老... 那啥,俺先为兄弟保个密哈

兄弟的思路不错,只是忽略了一点细节 --- 或者说我原贴细究交待不够。那四万人,并非每个人都在9月-1月这五个月里,每个月都收到了哭胖,而是... 有七千人仅在9月收到,六千人仅在10月收到,五千人仅在11月收到,五千人仅在12月收到,五千人仅在1月收到,两千人仅在9-10月收到,一千人仅在9和11月收到...

这就是俺所谓的非常脏,not neat. 这种数据理论上也可以分析,但需要花费的时间非常多,远远超出了standard analysis 的范畴,在时间上是 prohibitive 的。另外,也非常容易出错。

所以,比较现实的做法还是,人为设计一个逻辑上干干净净 简简单单的实验。最后,俺为了叙事方便,原贴里扩大了数字。事实上,很多数据不是几千,而是几十或几百,在统计学上不太可靠。再一个复杂因素就是,我们有三个 deciles (6,7,8),这三个decile,在后面五个月中被寄哭胖的情况也各不相同。所有这些因素搀和到一起,使得以现在这种肮脏数据进行 valid analysis 成为 mission impossible...

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河