西西河

主题:【原创】数字左右社会科学 -- 同人于野

共:💬59 🌺171
分页树展主题 · 全看首页 上页
/ 4
下页 末页
    • 家园 热烈庆祝同人兄再次下河

      刚看到你BLOG那边有更新,河里居然也发了:)

      您的天才训练指南实在让我受益匪浅

      期待升级版

    • 家园 同人兄说的多是统计有用的一面

      俺来说说局限性的一面。

      1. 统计本质上是总结过去,并以过去推算将来,准确一点,是将来的概率。对当前变化的因素考虑较少(过去变化的因素已经涵盖在统计中了)。比如:红酒例子中,葡萄园边上刚修了个化工厂呢?或者上游修了个养猪厂(中国的例子,猪粪多了是一种污染。呵呵)

      2. 统计的滞后。从俺的经验来说,统计结果主要起个教长期的经验性数据佐证,比较多的还需要直接调研。基础这个比例高点,宏观的直接调研比例可以略低点。红酒的例子中,如果采购商坐在办公室里靠统计数据搞采购,是要出大乱子的。如A地和B地比较,在2000年冬季降水量,生长期温度,和收获期降水量都是A地好得多。但A地上游1999年修了个造纸厂,已经污染到A地了,但还没张扬开。。。

      3. 统计的方法和范围的掌握不同,带来的结果确定性不同,这个对宏观预测很致命。比如要预测明年奥马领导下的米果经济:要以什么数据为依据,那些纳入统计范畴,那些服略,采用什么统计技术,国内的参数、国际的参数。。。。大多了,所以各个统计机构各说各有理,事后也可以发现有准确的,但是事前,作为一般人,听哪家统计机构的结论呢?

      4. 统计的成本高昂,特别是准确的统计成本。统计需要较多的数据,以及这些数据的采集、处理、分析。红酒的例子,先直接到A地走访一下,后面就不用统计了,直接选B地。

      原来在基层做经济工作,赶上大学也是学这口的。但在实际工作中,统计的作用是有一定限制的。只能在数据的基础上发觉一些较普遍的规律。如预测一个区的发展,历年数据是平均增长12%,近两年增速加快,分别为前年13,去年13.2%,这样你基本上可以判断今年的增长基本上在12%的基础上综合考虑各种加减因素来判断,但不会离12%太远。但到底远多少,就需要走访企业作具体调研,不同行业的当前发展趋势和受金融危机的影响、竞争态势都是要考虑的。

      数字是重要的,过分强调数字,远离基层的看数字是相当有害的,因为数字容易被歪曲,活生生的现实不容易。如果说不是“统计方法只是社会科学研究的一种补充手段”的话,统计方法也只是社会科学研究的一种手段,“一种”而已。呵呵。。 统计还是很有用的,blah,blah。。。。

      • 家园 统计当然不能滥用,人的因素是相当重要的。

        红酒例子的关键,在于有这个公式之前,人们认为红酒十年以后的质量是一个迷,而且很多人凭直觉认为是酿酒方法起重要作用,而统计方法破解了这个谜。

        注意这个研究的主题不是为了某一次具体的红酒采购,而是为了给出一个具有一般意义的指导规律。

        而你所说的上游建个化肥厂,完全是一个具体的事件,与红酒品质规律无关。这就好比说你不能靠天气变化规律来预测一个装有空调的房间的温度一样。这是高科研和搞具体采购的区别。

        而你后面跟贴提到的关于人类思维局限性的辩解我也是不能同意的。枪与游泳池的例子,说的是如果你一个邻居家有枪,另一个邻居家有游泳池,请问你的小孩去谁家玩跟安全?很多人本能的认为去有枪的家庭不安全,这就是局限性。人类思维局限性是固有的,有很多心理实验都证明这一点,当然我们可以给每个具体的例子找一个借口,但这种思维对于怎么提高客观认识世界的能力是没有帮助的。

        • 家园 呵呵

          人的因素是相当重要的

          是“人”的就不是统计的,是统计的就不是“人”的。

        • 家园 什么东西最好都不要神圣化和扩大化了

          红酒的例子中,得出的“具有一般意义的指导规律”,说白了就是(例子中的结论,现实不知道)在其他条件不变的情况下,(因为一般的情况下,其他条件变化很小,如果样本大的话,还会被平均进去。比如100个地点,20年,只有其中1个地点从15年起有了污染,这样还是会得出文中统计结果)红酒的品质与主要与葡萄的品质相关,而葡萄的品质主要与冬季降水量,生长期温度,和收获期降水量相关。

          但要知道,这里面的隐含情况是:绝大多数葡萄园没有遭受污染(这里又提出一个统计的局限性,统计会抹杀个体的特殊性,这是统计的优势,也是劣势),并且酿酒工艺成熟并且同质化。上述例子揭示的真正意义恐怕就在于揭示了“酿酒工艺成熟并且同质化”这一情况。至于其他方面的用途恐怕很有限哦。

          老兄有空的话,不妨具几个该结论有用的例子。研究毕竟是为了应用,何况还化了不少钱用于数据记录、保存、整理和分析。

          想了想,用途应该还包括对促进红酒品质的措施管理。有了这个结论,业界有几个做法:

          1. 在保持其他条件没有大的变化下,根据“冬季降水量,生长期温度,和收获期降水量”调整产量,品质不好就少做点?几个因素都是不可控的。

          2. 人造小环境,以达到葡萄生长的最优环境。(这个可能最有用)

          3. 创新酿造工艺,出产新品,提高工艺在酒类品质的成分。

          4. 开展宣传攻势,把“冬季降水量,生长期温度,和收获期降水量”不好年份产的葡萄酒赋予特殊风味的标签,卖高价。

          最后,发现连评判标准都很值得商榷。什么是好的葡萄酒? 有人想涩点、有人想苦点、有人想甜点、有人想醇点、有人想清点。。。。

          统计的作用俺是一点意见都没有。但是要看到统计局限性的一面。以及统计结果的众多前提,以及统计结果的有限用处。真正科学的态度,在说明一个结果的时候,是要把前提、假设和限制条件说出来的。

          另外,枪和游泳池的例子,我看如果人人都不把枪当回事,都让小孩同等的去两家玩,我看去有枪家庭玩出事的比例很快就上来了,未必比游泳池低。(不过统计又需要好多年的滞后,死了N个小孩后,才能发现, 呵呵呵。)

          有些事情,真是脚趾头都知道啊。不是一切反直觉的东西都有问题,但是有问题的比例很大啊!!!

          常识和直觉 - 是人类千百万年积淀下的宝贵成果,与其他科学手段一样都是人类处理问题的重要工具。偏废一方都是不可取的。另外,不要光强调结果一面,多看看条件和限制。

          • 家园 直觉是靠不住的

            您所说的常识和直觉,也就是目前讨论很热的 conventional wisdom,是相当靠不住的。除了正文说的两点之外,最简单的例子就是很多人认为坐飞机很危险,而实际情况是坐飞机比去机场开车的路上要安全的多。不承认人的思维误区使不能客观的认识世界的。

            在几乎所有统计模型与传统专家的较量中,最后都是统计模型取胜。像文中最高法院投票预测这样的比赛只是一个例子,类似的较量还有很多很多。直到现在仍然有很多传统专家拒绝接受这个事实,这只能说明人的局限性。

            另外文中红酒质量评价的“标准”是它的价格。搞统计要一切都量化。

            • 家园 你强调数字,自己却举出不看数字瞎忽悠的例子

              > 实际情况是坐飞机比去机场开车的路上要安全的多

              This claim is simply wrong.

              Yes, airplane is much safer than cars--when we compare the accident rate per vehicle mile. So planes are much safer than cars when covering the same distance. Say, from San Francisco to New York, it is much safer to fly than to drive through the continent.

              But if you only drive 10 miles to the airport to take a 10,000 mile flight, you can do the math and find out that a 10 mile car ride is safer than the 10,000 mile flight.

              The devil is in the details. LZ just gave us an example of the danger of over-generalization.

            • 家园 关键不在于直觉靠的住靠不住

              而是得出“直觉是靠不住的”这一结论依然靠的是直觉。

              • 家园 人的直觉判断也是一种统计学推理过程

                人脑的直觉判断的基础同样是人脑中的以往经验,举一个例子,比如某人决得要不要做某事,

                决定于他的社会观察经验,如果他所处的社会中很多人都做这件事,他就很可能会做这件事。

                我个人的看法,人脑的推理过程与现代科学里的统计学的推理过程是很相似的,区别只在于

                人脑的直觉判断的依据是单个或少数的几个人脑中积累的经验知识,人脑直觉判断的结果取

                决于单个人脑后天训练所形成的反射过程。而统计学判断则依据调查统计的数据,统计学判

                断的结果取决于所使用的统计学公式。

                比较人脑的直觉判断与统计学推理,本质上是没有区别的,为什么统计学结论往往要比人脑

                直觉判断要可靠,往往是因为统计学推理所使用的数据都要比单个人脑的经验知识要全面,

                数据也要靠谱些,所以得出结论也更靠谱。为什么人脑的直觉判断有时候也很正确,我想也

                是可以从一个题目所需的判断数据与判断方法去分析的。

                另外目前在自然科学领域,至少在微观物理研究领域,由于微观物理所观察的不确实性,统

                计学方法已成为最基本的研究手段,以至于有那么一种说法:一切科学都是统计学。我比较

                赞成这种说法。现在的很多社会科学,从它们使用的研究手法来看,还太多依赖于人脑的统

                计学结论,从这点上看,它们更像宗教而不是科学。

                • 家园 对以下判断表示怀疑

                  人脑直觉判断的结果取决于单个人脑后天训练所形成的反射过程

                  反射过程是怎么认定的?

                  统计学判断的结果取决于所使用的统计学公式

                  统计公式是怎么选择的?

                  由于微观物理所观察的不确实性,... 一切科学都是统计学

                  “统计”没有改变确定性在科学里的地位。

            • 家园 常识和直觉在很多时候是靠的住的

              这是一个比例问题。飞机、汽车的例子俺没有太多意见。可能吧。但记住,统计数字掌握在少数人手里。

              俺说的是:常识和直觉在大多数时候就是人们辨明是非的法宝。统计数字有时揭示出到道理可能会有点反直觉,但需要细细品位、体会其中的逻辑,再谈接受。除了有人借用不可信的数据、有意忽悠外,统计本身也是有很多局限性的,统计也是由人搞的,有犯错误的可能。统计数据的解释问题更多,同一数据,不同人基于不同倾向,可以读出不同的东东。统计的前提、条件云云,都是限制统计数字用途的相当重要因素。但是,很多时候,谈统计结果时,完全不提统计条件、范围。。。

              统计的结果,一定要经过大众和时间的反复检验。统计的条件、范围、办法、出处也是要公开的。

              红酒质量评价的“标准”是它的价格== 这就很可笑了。价格可是受市场因素的影响的。市场供求关系,人们口味的变迁、广告费用的支出云云。又牵扯进一大堆因素。真不知道前面的统计是如何进行的?有可能的化,请说说他那么统计是如何进行的,具体的样本范围、数据来源、条件、云云。。。


              本帖一共被 1 帖 引用 (帖内工具实现)
              • 家园 同意,举个例子

                以前在俄国十月革命前,做过一个统计,是新生婴儿出生死亡率的统计,统计数据显示在现代医院的新生婴儿的死亡率远远高于在俄罗斯接生婆手底下的死亡率。如果只看结果的话,可以得出结论,古代流传下来的接生方式比现代医院更优。 但是仔细分析一下,原来当时大部分人都是选择接生婆,只有难产等出了问题才送到医院,所以医院的死亡率比较高。所以统计数据一定要分析,统计指标和方法也要设计合理

                • 家园 作者意外获得【通宝】一枚

                  谢谢:作者意外获得【通宝】一枚

                  鲜花已经成功送出。

                  此次送花为【有效送花赞扬,涨乐善、声望】

              • 家园 互惠互利

                恭喜:你意外获得【通宝】一枚

                谢谢:作者意外获得【通宝】一枚

                鲜花已经成功送出。

                此次送花为【有效送花赞扬,涨乐善、声望】

分页树展主题 · 全看首页 上页
/ 4
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河