西西河

主题:【原创】道法自然——世界的运作方式的哲学思考 -- baiqi

共:💬16 🌺38 新:
全看分页树展 · 主题 跟帖
家园 【原创】四、社会领域广泛的幂率分布

四、社会领域广泛的幂率分布

混沌理论表明:某事物通过初始值经过不断地确定的迭代持续发展,因为初始值是难以获知的,而任一个微小的变动,都会迭代成与假使不变动的情况迥然不同,形成了复杂难测的局面。但是整个迭代过程与这个迭代函数这一个整体蕴含着一系列的结论,而人类的统计学、概率学结论,无疑与这些结论密切相关,当然,也可以说所有统计学、概率学结论都是确定结论的扭曲,因为一个确定系统本可以依赖对初始的了解与对迭代函数的了解清楚任一时间的状态,但人类的力量太过渺小,对这两者都不清楚,只能依赖于概率。就好像,如果把所有因素都考虑进去,必然可以知道任一次抛掷硬币是正面还是反面,而人类目前的能力不可能把所有的因素都考虑进入,由于这些因素还包括人,比如说人的心情、人的思维等,人类永远都不可能把所有因素都考虑进去,所以,也可以说概率是本质的。

有些统计学概率学至少在整体上比较贴切地反映了那个整体的规律。比如说Power Law-幂率分布,也即长尾理论,两变量满足Power Law是指两个数量之间满足幂关系,如y=x^{3} ,y=x^{-3 } ,y与x就满足冥关系。分形学是混沌理论的分枝,集中的反映了混沌的“迭代”这一含义,Power law 分布,与分形数学紧密结合。实际上如果你考察畅销书作家的成绩,或者富人财富的分布,你会发现其结构是分形的:每4个身价超过1亿美元的富人中,会有一个身价超过10亿的,而每4个身价超过10亿的人中,又会有一个超过100亿的。100亿级别富人看10亿级别富人,就好想10亿级别富人看1亿级别富人一样。Power Law贴切地反映了这一整体的“迭代”的特点,我们当今宇宙的一切都是由当初的切确初始值迭代而来,所以遵循Power Law的事物十分广泛。

横轴是x,纵轴是y.

Power Law有两类

1.帕累托分布(Pareto distribution)

-1-纵坐标代表财富额,横坐标上的某一点表示一个人,两点之间等距隔开;一个人与财富就可以用平面上唯一的点表示出来;把这些点按照财富额从大到小的顺序从左到右依次排开,发现这些点都在一条幂曲线上,这表示:人的财富分布满足幂率分布,这说明少数的人占了多数的财富,也就是著名的二八定律(二成的人占了总财富的八成)

-2- 纵坐标表示城市的人口,横坐标每一点表示一个城市,按照相同的规则排开后点都在一冥曲线中,这表示城市的大小分布满足幂率分布。

-3-满足tcp/ip协议的网络,所有的通道的流量满足幂率分布

-4-一产油区的各个油田大小满足幂率分布

-5-超级计算机所处理的计算耗费的时间满足幂率分布。

-6-一堆沙中,沙粒的大小满足幂率分布

-7-动物中不同的属下面的种的数量满足幂率分布

-8-各个股票的回报高低呈幂率分布

-9-齐夫定律(Zipf's law),一种语言的各个词汇使用频率满足幂率分布。

-10-人际关系网中,横座标的每一点代表一个人,纵坐标代表这个人拥有的朋友数量,横座标的每点等距间隔,则人拥有的朋友的数量也满足幂率分布。

帕累托分布的特点是,某种资源按照从大到小的顺序排列,最后发现呈幂率分布,讨论的是资源的分布情况。

2.递进帕累托分布

-1-横坐标表示各个财富值(从0到无穷),纵坐标表示拥有该财富值的人的人数,每个点的含义就是占某财富值的人的人数,则这些点连缀起来,在一条冥曲线上,这是财富分布的更深刻的结论。

-2-横坐标表示人口数量,纵坐标表示城市的个数,每个点表示拥有相应人口数量的城市的个数,各点连成一条线后,在一条冥曲线上。

-3-横坐标表示流量,纵坐标表示通路条数,每个点表示拥有这么流量的通路的数量,各点在一条冥曲线上。

-4-横坐标表示油田大小,纵坐标表示油田个数,每个点表示拥有某个大小的油田的个数。

其他依此类推,原理是将帕累托分布规律中的y轴变为x轴,再把原来取相同y值的点的个数作为新坐标的y轴坐标。

这个递进帕累托分布还可以再递进,读者能不能自己想出来呢?这种无限递进机制让我们一旦找到一个power law分布就可以牵出无数个。

提示:

相同财富值的所有人组成一个阶级,那么社会中有许多的阶级,每个阶级都有一个对应的数量,如果规定有相同数量的阶级可以加入同一个俱乐部,那么社会中会产生多个俱乐部,这些俱乐部的规模的分布满足幂率分布,也即横坐标表示各个俱乐部,等距隔开,纵坐标表示俱乐部的人数,俱乐部从大到小依次排列,所有的点都在一条冥曲线上。

在转化过程中,x轴时而代表某个没有数值的实体(如人、城市等),时而代表了具体的数值(如财富值,人口数等)值得注意。

符合Power Law的事物一般满足以下的性质:

1)Scalable,比如如果你上班拿工 资,你就不是 scalable 的,因为你的财富取决于你工作时间的长短,而你的工作时间是绝对有限的。反过来说如果你写书,那么你就是 scalable 的,你写一本书,这本书可以的销量可以无穷大。黑天鹅变量因为可以很极端,所以一定是 scalable的。Scalable, 意思就是可以随便做大数乘法。

2)self- reinforcing,这个性质与迭代性(分形性密切相关),越是自然的属性,就越蕴含着分形的原则,也就越蕴含着self-reinforcing的 可能。举个例子,越富有的人,越容易赚到更多的钱;越出名的作家,书越容易卖,然后正反馈,作家就更出名。财富的增加几率随着财富本身的增大而增大。正是 这个性质决定了 power law 的分布,这也表明,这其实是一种极其接近自然的规律。这个问题本身就有蕴含着另一本书“问题的解决 之道”的循环为问题解决(或质量增加)的关键突破点这一智慧,见我的另一章节.

根据以上两点,我们可以自己构造了几个服从Power Law的例子,如:

1)x:高兴度 f(x):高兴度为x的人的人数 :于此可见,多数人处于不怎么高兴的状态,而少数人的高兴程度很高, 这个高兴可以替代为:快乐、得意等等社会学上属于positive的东西。

这里的self-reinforcing的来源:社会心理学揭示出,如果你很高兴,很有喜气,一来更多人愿意靠近你,二来那些经常在你高兴的时候靠近你的人,你会更喜欢他们,所以这部分原因也导致更多人愿意靠近你,而有更多人靠近你,夸奖你,你会更高兴,这无疑是一个self-reinforcing,所以我断言这个分布是符合Paw Law的。

2)x:一件事的原因 f(x):该原因导致这个结果的重要程度 y(f):导致这个结果占某个重要程度的原因的个数

原因结点构成一个类似社交网,所以这个应该是满足PL分布的,这启示我们:找到主因点所有原因的比例总是巨大的,找到主要原因后,不应该继续投入过多的力度,不应该有完美主义倾向,因为其他原因是十分次要的.


本帖一共被 1 帖 引用 (帖内工具实现)
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河