西西河

主题:【原创】社会科学的全面数字化 -- 同人于野

共:💬106 🌺360 🌵16
分页树展主题 · 全看首页 上页
/ 8
下页 末页
      • 家园 因为世界不是完美的

        完美的世界里,由于central limit theorem,我们看到的很多事情是大量随机事件的总和,都是服从高斯分布的。但是只要有人掺和进来,就不那么随机了。比如说大家去参观航空母舰的飞行甲板,假设每个人对弹射器都比较感兴趣,那么甲板上人群的分布应该是围绕着弹射器的高斯分布。但是突然有两个人尿急,跑到甲板的左边想撒尿,结果一甲板的人以为左边有什么新鲜玩意,都一窝蜂都跑到左边去了,然后船就翻了。

        当然这个是非常不靠谱的例子,一般来讲,实际的分布都比高斯分布的尾巴要肥,也就是说极端情况更多。比如如果假设股价是连续的随机变化,未来某个时间股票可能的价格(的对数)是高斯分布。但是如果考虑到股价变化有跳跃——因为新闻总是在闭市的时候发的——那尾巴就肥了。考虑到有散户跟风,尾巴就更肥了。

        重要的是,虽然尾巴肥不了多少,总体上看着还是一个高斯形状,但是起决定性因素的,往往就是右尾巴尖的那一点。这个概率从万分之一跳到万分之十,可就有很多基金经理要跳楼了。

        说到底,并不是定量分析有什么问题,而是分析使用的模型要弄对,或者至少应该对模型的错误比较容忍。

        错的不是定量分析,而是用错了模型。再怎么着都比定性分析——又称忽悠——强多了。文科生屁股决定脑袋没办法。不忽悠你让他们干什么去啊

        • 家园 定量分析不错,但可不能小看定性分析

          老帖了。看了再说两句:俺同意重视定量分析,但反对过分拔高定量分析,反对贬低定性分析。以下是一些浅显的理由:

          1. 定量分析成本高,定性分析成本小。例子:当我们在路上看到一堆狗屎,我们就会简单避过,而完全不必用仪器详细分析狗屎的各项参数,如丑闻强度,干湿度等,再决定绕行半径。

          2. 定量分析依赖数据准确性和数据积累,要求高,成本高,时间长,并且主要是过去的数据,涉及的因素较为固定,对多变的发展环境的预测性低。定性分析主要是长期的常识性知识的积累,综合性高,能较好的应对负责环境(当然,其性质决定了必然有偏差,无法做到精确与完美,很遗憾,世界从来就不是完美滴)。

          文科有文科的长处,理科有理科的长处。相互欣赏是共进,相互鄙视是内讧啊。

        • 家园 错的不是定量分析,而是用错了模型

          错的不是定量分析,而是用错了模型。再怎么着都比定性分析——又称忽悠——强多了

          但是定量分析也要谨慎。定性分析包含了大量的COMMON SENSE,不符合数学表达或尚未被数学表达的知识积累, 如果无视的话很可能灾难性的忽略掉关键的便量。我道听途说金融建模用到高深的统计学,有听说某个模型拒绝负的输入。

          另外不知金融建模有没有对系统做稳定性分析。越是高效的系统,出问题后崩溃的可能性越大。

      • 家园 好像是这本

        超级数字天才

        作  者: (美)艾瑞斯 著,宫相真 译

        出 版 社: 中国青年出版社

        * 出版时间: 2008-8-1

      • 家园 高斯分布有个重要的性质

        任何分布,它们的sample mean的分布均符合高斯分布。

        • 家园 抓住行家问一下

          请问您这么说,是否说黑天鹅那本书对高斯分布的贬低是错的?

          看到那一节,我有点糊涂,不知相信谁好。

          • 家园 不好说,就事论事

            那书我没看过。我是就事论事,不涉及到那本书。高斯分布有很多很美好的性质,在计算基本靠手的日子里,它给了统计学家很多安慰和希望。

            当然,反对高斯分布的人也很多。他们说,嘿!统计小子们,你们看到钟型曲线分布很激动吧,以为那是高斯分布,其实那也有可能是Cauchy分布。

            点看全图

            外链图片需谨慎,可能会被源头改

            Cauchy这个分布很毒,我看就是绝户分布,没有mean,没有方差,很奇怪吧(这里有解释。)。所以搞统计的,你们怎么知道研究的是高斯,而不是Cauchy分布呢?

            • 家园 这次抓住了老马丁了

              如果在副无穷和正无穷间均匀分布,是找不到均值的。这个粗糙的理解方向对吗?刚看到Cauchy distribution的时候直觉均值是在中间。

            • 家园 看了一下link

              凭着俺残存的一点数学记忆.

              大概理解了一下为啥没有mean, 没有方差, 原来是这个分布看着象高斯, 实际上两边的尾巴比高斯粗很多, 高斯的尾巴是指数级变细的, 这个分布的尾巴是平方级变细的, 导致的结果是尾巴太胖, 算mean要算所有分量的积分. 尾巴太胖, 一积分体重就无穷大, 所以没法算积分, 也就没有mean了.

            • 家园 大概就是这个道理

              那个连接我看了,头马上大了一倍,里面的公式。。。。

              那本书里有一节对高斯分布大肆攻击,主要观点是指高斯分布的应用范围很窄,最令人发指的是在金融界里很多人靠这个吃饭。不知道这次金融危机跟滥用高斯分布有无关系?

    • 家园 走一走就好玩了

      看现在的趋势,这些数据分析多了就是当年计划经济的思路。玩了半天,老美慢慢的向计划经济走,中国慢慢的往市场经济走。回头一看,这不是当年全玩过嘛。。。

      • 家园 否定之否定,历史循环上升的逻辑

        我一直以为到上个世纪70年代计划经济的失败最主要原因不在计划经济理论本身上,而是人类的信息处理能力无法扩展到整个社会,无法在整个社会范围内协调生产过程以满足产生于整个社会多样化需求。因此才会给计划经济带来僵化死板的特征。

        但信息技术的发展已经给这个问题的解决带来上曙光。当信息系统扩展到社会的每一个角落,ERP系统覆盖了整个供应网络,这和计划经济的理念又有多少差别呢?

    • 家园 据我所知,奥派的开山祖师

      也不赞成用数学方法来研究经济学,这句话有失偏颇吧

      我国"主流经济学家"经常鄙视那些玩数学模型的海归,人们不习惯用数字说话。http://www.ccthere.com/article/1988180.html

    • 家园 经验不够,欠花一朵!!好文
    • 家园 如果数学,计算,分析可以做到这么多。

      那我们说不定还真的是生活在matrix里面的吧。

      有这么一天,从人受精的那一瞬间的数字关联信息,经过统计或数学计算就知道他的未来吗?同理,算命啊,预测啊,全是科学的?

分页树展主题 · 全看首页 上页
/ 8
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河