主题:【原创】预言帝培养指南 -- 淮夷
最近端午节,在福建和一个做照明系统的民企老板开会。企业家给我看了一个业绩预测模型,说:预计2012年收入翻倍,之后两年继续保持50%的稳定增长。
我说:“三年太遥远了,只说2012吧。今年前半年你们工厂实际拿到多少订单?与同行业相比如何?”企业家答:“前半年出口不理想。据我判断,后半年的内销有一个爆发,所以全年翻倍能实现。”
在工作中我遇到太多这样的企业老板,他们具备多年经验,有人甚至用到复杂的统计模型支持预测,但是,若你观察这些老板给出的企业展望,十之八九都是错的,错的很离谱。因之,我赋予他们一个共同的称谓:预言帝。
最近我读到一本科普书籍是关于“预言帝”的。此书是2010年出版的畅销书《Future Babble》(未来狂言),作者是加拿大记者Dan Gardner。
这本书讨论的话题值得人们读一读:专家的预测到底准不准?
1968年,斯坦福大学生物学家Paul Ehrlich写了一本著名的预言书《The Population Bomb》,卖出几百万册,名噪一时。 Ehrlich对未来10年(70年代)的人口统计推测是这样:全球人口增长过快,粮食供应不足,结构性的矛盾造成世界大饥荒,几亿人口活活饿死。
Ehrlich预言的末世场景没有发生。从1961年到2000年,全球人口增加一倍,但农业技术“绿色革命”造成粮食生产快于人口增长,人均卡路里反而上升24%。美国人口要应付的并不是什么饥荒问题,恰恰相反,是肥胖症问题。
话说Ehrlich的人口预言失效之后,开始对金属发飙。1980年,Ehrlich挑了五种金属:铜、铬、镍、锡、钨。他坚信资源稀缺性将造成金属价格上升。经济学家Simon则认为金属价格下跌。两人于是设了一个著名赌局,称作”Simon-Ehrlich wager”,以1980年9月29日的价格为基准点,以10年后的价格为结算点。
10年一晃而过。五种金属相比10年前全部出现了跌价,锡价的跌幅甚至超过了50%。
Ehrlich并不是一个孤单的预言帝。
1952年,英国历史学家汤因比在一个讲座中,预测了2002年,也就是50年之后的世界。
汤因比认为人类文明遵循某种固定路径,就像你看到一个人的生老病死之不可避免。据此信念,他预测2002年将出现一个“世界政府”统一全球,这是一个政教合一的政府,政府首脑亦是教主。教主彻底剥夺人类物质自由,人类经济活动由政府全盘规划。作为交换,每个人将获得真正的精神满足。
1952年汤因比提出这个猜想时,他的盛名如日中天,被誉为史学奇才。这个 “世界政府”我听起来像是马克思主义和基督教的奇怪合体,不知汤因比是否看过唐代《推背图》,推背图59象所预测的人类终极形态就是“天下一家,治臻大化。”好在汤因比的展望全部落空,否则过着他预言的这种“物质做奴隶,精神陪上帝”的日子,帝哥你不如早点弄死我算了。
比汤因比更神奇的是张召忠同志。
对伊拉克战争,张召忠预言“伊军顽强防御将重创美军。”结果美军轻松逼近巴格达。张召忠修改预言说“伊军将展开巷战,美军将陷入人民战争的汪洋大海。”结果伊军集体投降。
他对利比亚的预言是“卡扎菲不可能藏在自己的家乡苏尔特”,两天后,卡扎菲在苏尔特的下水道被抓。
2012年4月,朝鲜火箭发射倒计时。他在电视上讲话,“发射成功概率应该在80%以上。”几个小时之后,火箭化为碎片。
从统计样本量来说,Ehrlich、汤因比、张召忠,虽然失败方式各有各的神奇,但充其量只是一些孤立的例子,这样小的样本量,也许很难证明,大多数专家都是废物。
这个反驳颇有道理。不过,让专家绝望的是,宾夕法尼亚大学心理学家Philip Tetlock创设了一个开拓性的社会实验,有力揭示了专家预测的真实水准。
这个实验始于1984年。Tetlock征募了284位专家,请他们对未来的政经情况进行预测。
实验的设置是这样:
1)专家团包括政府官员、经济学家、媒体人士,研判未来政经大局正是他们的日常工作。这些人匿名参加实验,以免在心理压力下预测失常。
2)每一个预测问题都应有清晰的答案,譬如“请预测印巴5年内会否爆发战争?”就是一个清楚的问题,只有唯一正确解。如果问专家“请预测印巴关系未来5年是否趋紧?”,这就是一个模糊的问题,专家有可能为错误预测找到辩解空间。
3)对每个事件的预测,须给出0%-100%之间的具体概率,不得使用“很可能发生”、“也许吧“这种含混词语。他们预测的事件跨度,既有短期事件(1-2年内),也有中长期事件(5年,10年)。
上面的实验设置很聪明,您看得到,完全是为专家量身挖坑。从1984年到2004年,Tetlock用20年时间搜集到了27,450个预测数据点,堪称史上最大规模的专家预测实验。
Tetlock把这些预测数据和真实发生的事件逐一比对。他发现大多数专家的预测得分都很低,如果他们肯放下专家的身份,随机乱猜一通,平均得分甚至更高。用Tetlock的话总结就是,“专家准确率甚至不如一个投飞镖的黑猩猩的中靶率!”
另外,测试表现最优的专家也比不上一些简单的计算机算法,比如有一个简单算法就是“不管未来如何风云变幻我都预测没有任何改变”,这个机械的算法应对诸如“未来20年埃及是否继续由穆巴拉克掌权?”这种问题,几乎秒杀全部专家的预言。
搞笑的是,Tetlock用Google点击率作为指标,测量了这284位专家的知名度。他发现,越有名的专家,预测的准确度越差。
问题是,人们为何愿意相信这些不靠谱的专家呢?换言之,一个预言帝是怎样培养成的?
我想最重要的是搞到一个专家身份。97年亚洲金融危机时,有人预测道:“1929年美国大萧条将在亚洲重演,很可能出现国家分裂,继而引发亚洲战争。”两年之后亚洲重焕活力。回到97年,如果我讲出上面的话,也许直接就送北京安定医院了。可这预言的作者是经济学家Paul Krugman(后来的诺奖得主),所以在97年非但不是疯话,而且很有市场。
其实人类对专家和权威的服从心理在许多实验中都有揭示。譬如1973年南加州大学心理学家Donald Naftulin做了一个实验,请一个演员装成大学教授,给他印了一份假的学术简历,又安排他1小时讲座。
讲座主题听来高深,是“数学博弈论在教育中的应用”,听讲的是一群蒙在鼓里的教育工作者。演讲稿故意漏洞百出、废话连篇。听众如果根据内容判断,很快就能发现教授是冒充的。但是教授的身份吓住了听众,在讲座后的反馈问卷中,听众纷纷表示赞赏,感觉“这场讲座非常启发自己的思考”。
1968年亦有一个类似实验。澳洲心理学家请一位剑桥大学访问学者给学生讲三堂课。该访问学者的头衔在每一堂课都不同:讲师、高级讲师、教授。课后要求学生估测这位学者的身高。结果是,头衔每高一级,学生对他的身高估测就相应提高0.5英寸!
现在不难理解,张召忠在电视上露面时,字幕上一定要不时闪烁“国防大学教授”。
除了专家身份,预测未来也是一个信心游戏。
1997年康奈尔大学心理学家Stephen Ceci创设了一个信心实验。春季学期,Ceci用正常的个人风格讲课。秋季学期,他故意换了一个“信心加强版”,譬如用一些有力的手势强调要点,适度调高嗓音,等等。
春秋两季所讲内容一模一样,唯一差别是传递的信心强度不同。学期结束后,学生给老师打分。 “信心版”的秋季得分大增,从3.5分升到4分(5分制)。学生们的普遍评价是“Ceci老师太有知识了”,尽管事实上该老师的知识一点没变。
现在,如果您想做预言帝,上面实验揭示的道理也许很有实用价值:你讲的内容一点都不重要,重要的是你必须信心爆棚。
从这个角度出发,你可能注意到一个奇怪的现象就是:走极端路线的人更易吸引眼球,并成为明星预言家。但是在概率的角度,极端预测更易于出错。这造成一个变态的循环,也就是Tetlock的专家实验所发现的问题:Google排名越靠前的专家越不靠谱,但是越不靠谱的人越出名。
关于这个现象,1997年荷兰心理学家Giedon Keren做的实验给出很好的证实。
这个实验请受测者评价两个天气预报员哪一个更出色。预报员对未来4天的下雨概率作出如下预测:
预报员A 预报员B
90% 75%
90% 75%
90% 75%
90% 75%
两人都预测未来4天可能连续下雨,区别在于A的预测更极端(90%概率),B的预测偏于谨慎。实际上,4天中有3天下雨,1天晴天。
从预测能力说,B给出的概率分布可能是更优的。他和A都测对了3个雨天,而测错的1个晴天,B的偏差不像A的“绝对下雨”错的离谱。
但是受测人群一边倒的喜欢预报员A。他们认为A“观点清晰、结论鲜明”,B“没有信心、结论无力”。
基于同样道理,张召忠预测朝鲜火箭使用“80%成功概率”是一种聪明的风格。虽然他彻底猜错了,但是人们打开电视愿意听到的就是极端预言,人们根本不会对“可能也许大概”这种话留下印象。
现在你“可能也许大概”快变成一个成功的预言帝了。但在最后,你还要掌握一个预言帝的保命秘笈:如何体面的解释自己的错误预测。
一个好办法就是不停延长自己的预测时限。我预测事件A会发生,虽然它没如期发生,但这不代表以后不发生。我只是弄错了时间,事件A早晚会发生的。所以原则上我的预测是对的。
这种逻辑挺无敌的。很多有趣的“末世理论”,都有类似的逻辑。譬如19世纪美国有一个信徒众多的米勒派(Millerites),教主是威廉米勒。 米勒认为,1843年1月1日是圣经预言的世界末日。那天太阳正常升起之后,米勒被迫修改了预言:“末日将是3月21日,这一次是按照犹太算法。”
时钟滴答向前,米勒继续不停的修正他的末世时间:1843年4月23 -> 1843年12月31 -> 1844年3月21 -> 1844年10月22。
米勒真是太忙了。其实有一个更体面的下台办法,就是所谓的“self-negating prophecy”(自我否定的预言)。简单来说,因为我预言了某事将发生,这造成未来的行为发生某种负反馈,结果该事件反而不会发生。
最常见的“负反馈预言”就是股评了。我在《Critical Mass》这本书中读到一个很好的例子是关于高盛的股市预测。高盛预言股市要崩盘,但崩盘最终并未发生。于是高盛分析师的辩解是:恰恰因为我们预测了崩盘,造成投资者提前的警惕性减持,从而避免了一场大的崩盘!
对高盛的理论能说脏话吗?不能。那我没什么可说的了。
真的预言帝太难了,假的预言帝太多了。
佛家说:一切有为法,如梦幻泡影,如露亦如电,应作如是观。
预言的成功,在于看破幻像。看破幻像,岂是轻易?
真的预言帝,是像主席那样,可以贯通本源的人,只有那样不被幻像所惑的人,才能作出正确的预言。那样的人,和是否是专家、学者关系不大,更看悟性。
但是,我们仍然不能因为假的预言帝太多,就否定真的存在预言帝。但即使这样的预言帝也如同主席所说,并非算命先生,也只能勾画一个未来的大致轮廓。
是实践帝。
理论上一个明确的预言——也就是一个可见真假的命题,在没有任何额外资讯的前提下,胡乱猜测应该有50%的概率押中。只要命题相互独立,样本增加的情况下预测准确率应趋近50%(大数定理)。专家之所以为专家应该比瞎猜的常人拥有更多的背景资料,因此预测准确的概率应该会高一些。专家预测实验的为何出现相反的结果是一个很值得分析的事情。
我的猜测是实验的设计有可能出问题,如果这些预测不是相互独立的(估计很难设计出完全独立的预测),那么专家反而可能倒霉。因为他们的结论是相关的,只要错一个就可能一块儿错好几个。
反过来看结果,错得越离谱的专家可能反而是真正专家,因为他们可能掌握了事件中的相关性,相关性掌握越多关联预测就越多,因此要不就是大部分错,要不就是大部分对。也许他们的模型是对的,只不过当前的数据是错的,如果允许修正的话,这个预测实验的结果会大不一样。
预言比较厉害,这属于麻衣相术的范畴,预测天机,按马克思的说法,这是唯心主义。
江相派,靠做局搜集信息,观察微表情(察言观色),统计学(关心什么说什么,还总结了“7问8,8问7”之类的口诀,类似速算扣除表之类),这是唯物主义的做法。
当然,什么“桃园三结义孤独一枝”之类放诸四海而皆准的话,那个简直就是辩证唯物主义的做法,绿锅格林斯潘做得比较好,不过要说做到最好的,那得看忽悠咱们搞共产主义的那些位了……
一、 企业家来说,重要的挣钱么,下面一帮兄弟嗷嗷待哺,一旦没哺了,或者预期非常确定没哺了, 最先跑的是中上层然后就剩孤家寡人了。。。。
二、
这个结论 咋感觉有点像 “观君之背贵不可言”捏。只要兄弟够多,板凳够厚,自然有人给你搭天梯。。厄。。。
三 。
从这个角度出发,你可能注意到一个奇怪的现象就是:走极端路线的人更易吸引眼球,并成为明星预言家。但是在概率的角度,极端预测更易于出错。这造成一个变态的循环,也就是Tetlock的专家实验所发现的问题:Google排名越靠前的专家越不靠谱,但是越不靠谱的人越出名
看着极端路线的例子, 类似痛苦指数一样,以前看过 老马丁还是谁的帖子,结论是,人类对于痛苦的敏感高于快乐的敏感。
结论:
高明的预言帝,就是要不断的搞事,为自己的理念营造声势,通过把握人心来控制时势,即使在风平浪静之时也要为暴风雨来临时做准备。 而作为枭雄来说,即使让人打的满地找牙,也要想着未来可能的满嘴金牙。 所以未雨绸缪加 民心 为最重,切切
其次,预言帝要有自知,彼得说每个人的能力都是有限的,在达到极限会停下来,能做到 良禽择木而栖,最好,做伍子胥,做张良 做范蠡 做萧何 都不可忘乎所以,如果真听信了观君之背贵不可言的话,那上梁后抽梯子就怪不得人家了。
您提了几个挺好的问题,我尝试回应下:
1. 关于大数定律失效:284个专家也许并不是一个足以制造“群体智慧”的数量。在预测未来方面,准确度更好的是一些“预言交易市场”,有成千上万的市场参与者发挥独立决策并制造大数效应(可参见我写的《群众的智慧》)。
2.实验设计机制:1)一方面很难设计出完全独立的预测目标,另一方面一个人在他的专业领域做预测会存在很高的自相关性,所以您说的对,一错就错一串。2)但这实验的机制还是尽量遵循了统计原则。譬如有一专家预测事件A有60%的发生概率,那么您不但要看A本身情况,还要把该专家预测的其他近似60%概率事件(事件B,事件C...)都找出来,然后看一看是否事件的整体出现概率接近60%,或者偏差有多少。这就是一个“calibration"的过程,可以剔除对单一事件碰运气的乱猜。另外,如果一个专家给出绝对的100%概率或者0%概率,而事件如其所测,Tetlock会分配额外的加分,这也是一种公平算法。
3.错的特别离谱是真正专家:同意,尤其是特别深入某一领域的人士,因为他的固执己见可能额外严重,从而一错再错。这类专家在Tetlok的比喻中是"刺猬"型的,观点尖锐,权威感十足。还有一种"狐狸"型专家更愿意吸纳多方意见和调整预测,所以准确率略好,但是不被普通人追捧,成不了预言帝。
4. 为何预测未来出错:预测未来的出错可能是不可避免的,不管是否专家。预测对象皆属政经大势这种复杂性系统的问题,我的看法更接近于不可知论。不可知论的话题跟预言帝无关,所以就不展开说了。
ID为liwang3894在06年发的一个帖子“意淫一下中国的未来”:
这是这个id在天涯发的第一个帖子,从07年预测到2040年,其中有不少预测是定量预测。
下面的就是 宣传了。
之后 就可以组织 一下。
最后么,该杀了吃肉的杀了吃肉 该抄家的抄家。。。。
这个形而上的东西好是好,但是形而下了感觉就俗了,但是 这两个没比较哪里又知道哪是上哪是下呢,哪是好哪是坏?
周星星说:“革命也就是抢回我们的银子和女人,至于要不要反清复明,本来就是脱裤子放屁——干你屁事啊!”
敢说,敢盛世危言,敢别人不确定的时候言之凿凿,敢被事实打脸了面不改色地继续说。新闻只有十五分钟热度的时代,这是成为专家的基本要素。快恨准不能同时达到时,只抓快狠二字就上位的专家当然在google排位靠前.大家都记得预言末日而不准的教派, 但整支一神教一开始就是末日教的事实,多被人当宁可信其有的背景了.
首先我没说清楚,我说大数定律失效不是说专家数量太少,而是独立命题数量太少。但仔细想想政治经济方面实在难以找出独立命题,即使找出来了这些命题估计是分属风马牛不相及的学科,没有一个专家能覆盖这种范围,因此最后估计和瞎猜没什么区别。
另外,类似预言交易市场类的东西其实起作用的不仅仅是预言。参与者还会付诸行动,因此所谓预言和结果本身就具有相关性。这是单纯预言所不能达到的效果,我个人认为这就是一种群体智慧。(所以我不认为老头子是预言帝)
单纯预言是另一回事,理论上讲是试图复制一个信号源,从信息论角度来看你不可能用一个低熵的信号源复制一个高熵的信号源。所以你说的不可知论从这个角度上看是正确的。所谓预言不过是把看上去高熵的信息源还原为它本源的熵值,不可能降得更低。而熵总是存在的,所以预言总有可能失败,否则如果一个信息源是可预测的那么就不再是随机过程,所谓预言也不是预言了。
扯远了,说回专家,我是这么看的。排除个别哗众取宠的特例。真正的专家总会有一套相对靠谱的理论,通过一个惊人的预言来推销一套理论是一种不错的营销手法,即使预言是失败的,在失败前有足够的时间让人了解和接受这套理论,只要这些理论是相对靠谱的,那么在预言失败的时候总有办法辩解或直接被人当作是一个偶尔的失误。所以真正的专家确实不怕预言失败。人们通常也能原谅这种失败。然而书中提到的预言帝培养的例子就接近骗术了,对于专家来说是不能这么干的。
淮夷出品,必属精品!
http://weibo.com/2590730652/ypzeC6sIL
既然专家错的比对的多,我们能不能反向利用呢?这样专家还是了不起的专家!
在枫叶国有影响的大报Ottawa Citizen任高级专栏作家,主持两周一刊的政经时评,文风一向犀利。
这位具备扎实的法学和现代史背景的新闻作家,曾被誉为“加国为数不多、富于思辩的专栏记者”。他在2005年听过美国著名心理学家Paul Slovic讲演,深为震憾,开始醉心于心理学和相关科学机理研究。之后汇集心得写成的《风险:恐惧背后的科学与政治》(《Risk: The Science and Politics of Fear》)一书广受好评,并被翻译成多国文字出版。
心理学从本质上讲,是与人们感知、思考、决断和交流过程息息相关的科学。现代研究已证明,有关上述过程,许多大家想当然视为正确的东西,实则大谬不然。Dan Gardner希望通过自己的努力,拨乱反正,以改善世人的思维、判断、组织和交流。
我发现,预言的热点往往是政经话题。为什么呢。我想有几个原因。
1.政经话题门槛低,关注度高。比较专门的话题,如中国四川页岩气储量的预测,关注度就低些,专业门槛也更高,口水闲人们被挡住了不少。更专门的话题,如渗流力学未来十年内可能的突破点,就更加冷门,门槛也更高,基本没有预言帝们跳大神的空间。
2.如淮夷所说,政经话题太复杂,以目前的技术无法预测(或者有天会跳出个Kurt Godel式伟大人物证明出这类问题根本无解)。好像巫医总是在现代医学无能为力的绝症上大展拳脚一样,总有自大狂或者骗子跳出来声称解决这类问题,给出预言。反正科学方法承认自己当下力有不逮,那么就看这些预言帝给个答案吧,有答案总聊胜于无。这么多人预测未来,好像无数人买彩票一样,总有人撞上大运,于是这个人就成了预言帝。子贡“亿则屡中”,恐怕运气的成分居多。即便某些人推崇的死去或活着的伟大先知也一样,在预测未来上也不靠谱得很,这些“先知”不过比常人更胆大,更敢说罢了。而且先知说得多了,总给崇拜者们以空间,可以断章取义契合现实:看看,先知早就预言了!
相反地,那些专业的,简单的,预测风险小的话题,先知们都消失了。在成熟理论和清晰事实的阳光下,一切装神弄鬼都蒸发了。
人们懒得思考的时候,往往会选一个看起来更有担当的人作为伙伴。而有些人越是想八面玲珑滴水不漏,越是哪儿都讨不了好啊