主题:【原创】预言帝培养指南 -- 淮夷
最近端午节,在福建和一个做照明系统的民企老板开会。企业家给我看了一个业绩预测模型,说:预计2012年收入翻倍,之后两年继续保持50%的稳定增长。
我说:“三年太遥远了,只说2012吧。今年前半年你们工厂实际拿到多少订单?与同行业相比如何?”企业家答:“前半年出口不理想。据我判断,后半年的内销有一个爆发,所以全年翻倍能实现。”
在工作中我遇到太多这样的企业老板,他们具备多年经验,有人甚至用到复杂的统计模型支持预测,但是,若你观察这些老板给出的企业展望,十之八九都是错的,错的很离谱。因之,我赋予他们一个共同的称谓:预言帝。
最近我读到一本科普书籍是关于“预言帝”的。此书是2010年出版的畅销书《Future Babble》(未来狂言),作者是加拿大记者Dan Gardner。
这本书讨论的话题值得人们读一读:专家的预测到底准不准?
1968年,斯坦福大学生物学家Paul Ehrlich写了一本著名的预言书《The Population Bomb》,卖出几百万册,名噪一时。 Ehrlich对未来10年(70年代)的人口统计推测是这样:全球人口增长过快,粮食供应不足,结构性的矛盾造成世界大饥荒,几亿人口活活饿死。
Ehrlich预言的末世场景没有发生。从1961年到2000年,全球人口增加一倍,但农业技术“绿色革命”造成粮食生产快于人口增长,人均卡路里反而上升24%。美国人口要应付的并不是什么饥荒问题,恰恰相反,是肥胖症问题。
话说Ehrlich的人口预言失效之后,开始对金属发飙。1980年,Ehrlich挑了五种金属:铜、铬、镍、锡、钨。他坚信资源稀缺性将造成金属价格上升。经济学家Simon则认为金属价格下跌。两人于是设了一个著名赌局,称作”Simon-Ehrlich wager”,以1980年9月29日的价格为基准点,以10年后的价格为结算点。
10年一晃而过。五种金属相比10年前全部出现了跌价,锡价的跌幅甚至超过了50%。
Ehrlich并不是一个孤单的预言帝。
1952年,英国历史学家汤因比在一个讲座中,预测了2002年,也就是50年之后的世界。
汤因比认为人类文明遵循某种固定路径,就像你看到一个人的生老病死之不可避免。据此信念,他预测2002年将出现一个“世界政府”统一全球,这是一个政教合一的政府,政府首脑亦是教主。教主彻底剥夺人类物质自由,人类经济活动由政府全盘规划。作为交换,每个人将获得真正的精神满足。
1952年汤因比提出这个猜想时,他的盛名如日中天,被誉为史学奇才。这个 “世界政府”我听起来像是马克思主义和基督教的奇怪合体,不知汤因比是否看过唐代《推背图》,推背图59象所预测的人类终极形态就是“天下一家,治臻大化。”好在汤因比的展望全部落空,否则过着他预言的这种“物质做奴隶,精神陪上帝”的日子,帝哥你不如早点弄死我算了。
比汤因比更神奇的是张召忠同志。
对伊拉克战争,张召忠预言“伊军顽强防御将重创美军。”结果美军轻松逼近巴格达。张召忠修改预言说“伊军将展开巷战,美军将陷入人民战争的汪洋大海。”结果伊军集体投降。
他对利比亚的预言是“卡扎菲不可能藏在自己的家乡苏尔特”,两天后,卡扎菲在苏尔特的下水道被抓。
2012年4月,朝鲜火箭发射倒计时。他在电视上讲话,“发射成功概率应该在80%以上。”几个小时之后,火箭化为碎片。
从统计样本量来说,Ehrlich、汤因比、张召忠,虽然失败方式各有各的神奇,但充其量只是一些孤立的例子,这样小的样本量,也许很难证明,大多数专家都是废物。
这个反驳颇有道理。不过,让专家绝望的是,宾夕法尼亚大学心理学家Philip Tetlock创设了一个开拓性的社会实验,有力揭示了专家预测的真实水准。
这个实验始于1984年。Tetlock征募了284位专家,请他们对未来的政经情况进行预测。
实验的设置是这样:
1)专家团包括政府官员、经济学家、媒体人士,研判未来政经大局正是他们的日常工作。这些人匿名参加实验,以免在心理压力下预测失常。
2)每一个预测问题都应有清晰的答案,譬如“请预测印巴5年内会否爆发战争?”就是一个清楚的问题,只有唯一正确解。如果问专家“请预测印巴关系未来5年是否趋紧?”,这就是一个模糊的问题,专家有可能为错误预测找到辩解空间。
3)对每个事件的预测,须给出0%-100%之间的具体概率,不得使用“很可能发生”、“也许吧“这种含混词语。他们预测的事件跨度,既有短期事件(1-2年内),也有中长期事件(5年,10年)。
上面的实验设置很聪明,您看得到,完全是为专家量身挖坑。从1984年到2004年,Tetlock用20年时间搜集到了27,450个预测数据点,堪称史上最大规模的专家预测实验。
Tetlock把这些预测数据和真实发生的事件逐一比对。他发现大多数专家的预测得分都很低,如果他们肯放下专家的身份,随机乱猜一通,平均得分甚至更高。用Tetlock的话总结就是,“专家准确率甚至不如一个投飞镖的黑猩猩的中靶率!”
另外,测试表现最优的专家也比不上一些简单的计算机算法,比如有一个简单算法就是“不管未来如何风云变幻我都预测没有任何改变”,这个机械的算法应对诸如“未来20年埃及是否继续由穆巴拉克掌权?”这种问题,几乎秒杀全部专家的预言。
搞笑的是,Tetlock用Google点击率作为指标,测量了这284位专家的知名度。他发现,越有名的专家,预测的准确度越差。
问题是,人们为何愿意相信这些不靠谱的专家呢?换言之,一个预言帝是怎样培养成的?
我想最重要的是搞到一个专家身份。97年亚洲金融危机时,有人预测道:“1929年美国大萧条将在亚洲重演,很可能出现国家分裂,继而引发亚洲战争。”两年之后亚洲重焕活力。回到97年,如果我讲出上面的话,也许直接就送北京安定医院了。可这预言的作者是经济学家Paul Krugman(后来的诺奖得主),所以在97年非但不是疯话,而且很有市场。
其实人类对专家和权威的服从心理在许多实验中都有揭示。譬如1973年南加州大学心理学家Donald Naftulin做了一个实验,请一个演员装成大学教授,给他印了一份假的学术简历,又安排他1小时讲座。
讲座主题听来高深,是“数学博弈论在教育中的应用”,听讲的是一群蒙在鼓里的教育工作者。演讲稿故意漏洞百出、废话连篇。听众如果根据内容判断,很快就能发现教授是冒充的。但是教授的身份吓住了听众,在讲座后的反馈问卷中,听众纷纷表示赞赏,感觉“这场讲座非常启发自己的思考”。
1968年亦有一个类似实验。澳洲心理学家请一位剑桥大学访问学者给学生讲三堂课。该访问学者的头衔在每一堂课都不同:讲师、高级讲师、教授。课后要求学生估测这位学者的身高。结果是,头衔每高一级,学生对他的身高估测就相应提高0.5英寸!
现在不难理解,张召忠在电视上露面时,字幕上一定要不时闪烁“国防大学教授”。
除了专家身份,预测未来也是一个信心游戏。
1997年康奈尔大学心理学家Stephen Ceci创设了一个信心实验。春季学期,Ceci用正常的个人风格讲课。秋季学期,他故意换了一个“信心加强版”,譬如用一些有力的手势强调要点,适度调高嗓音,等等。
春秋两季所讲内容一模一样,唯一差别是传递的信心强度不同。学期结束后,学生给老师打分。 “信心版”的秋季得分大增,从3.5分升到4分(5分制)。学生们的普遍评价是“Ceci老师太有知识了”,尽管事实上该老师的知识一点没变。
现在,如果您想做预言帝,上面实验揭示的道理也许很有实用价值:你讲的内容一点都不重要,重要的是你必须信心爆棚。
从这个角度出发,你可能注意到一个奇怪的现象就是:走极端路线的人更易吸引眼球,并成为明星预言家。但是在概率的角度,极端预测更易于出错。这造成一个变态的循环,也就是Tetlock的专家实验所发现的问题:Google排名越靠前的专家越不靠谱,但是越不靠谱的人越出名。
关于这个现象,1997年荷兰心理学家Giedon Keren做的实验给出很好的证实。
这个实验请受测者评价两个天气预报员哪一个更出色。预报员对未来4天的下雨概率作出如下预测:
预报员A 预报员B
90% 75%
90% 75%
90% 75%
90% 75%
两人都预测未来4天可能连续下雨,区别在于A的预测更极端(90%概率),B的预测偏于谨慎。实际上,4天中有3天下雨,1天晴天。
从预测能力说,B给出的概率分布可能是更优的。他和A都测对了3个雨天,而测错的1个晴天,B的偏差不像A的“绝对下雨”错的离谱。
但是受测人群一边倒的喜欢预报员A。他们认为A“观点清晰、结论鲜明”,B“没有信心、结论无力”。
基于同样道理,张召忠预测朝鲜火箭使用“80%成功概率”是一种聪明的风格。虽然他彻底猜错了,但是人们打开电视愿意听到的就是极端预言,人们根本不会对“可能也许大概”这种话留下印象。
现在你“可能也许大概”快变成一个成功的预言帝了。但在最后,你还要掌握一个预言帝的保命秘笈:如何体面的解释自己的错误预测。
一个好办法就是不停延长自己的预测时限。我预测事件A会发生,虽然它没如期发生,但这不代表以后不发生。我只是弄错了时间,事件A早晚会发生的。所以原则上我的预测是对的。
这种逻辑挺无敌的。很多有趣的“末世理论”,都有类似的逻辑。譬如19世纪美国有一个信徒众多的米勒派(Millerites),教主是威廉米勒。 米勒认为,1843年1月1日是圣经预言的世界末日。那天太阳正常升起之后,米勒被迫修改了预言:“末日将是3月21日,这一次是按照犹太算法。”
时钟滴答向前,米勒继续不停的修正他的末世时间:1843年4月23 -> 1843年12月31 -> 1844年3月21 -> 1844年10月22。
米勒真是太忙了。其实有一个更体面的下台办法,就是所谓的“self-negating prophecy”(自我否定的预言)。简单来说,因为我预言了某事将发生,这造成未来的行为发生某种负反馈,结果该事件反而不会发生。
最常见的“负反馈预言”就是股评了。我在《Critical Mass》这本书中读到一个很好的例子是关于高盛的股市预测。高盛预言股市要崩盘,但崩盘最终并未发生。于是高盛分析师的辩解是:恰恰因为我们预测了崩盘,造成投资者提前的警惕性减持,从而避免了一场大的崩盘!
对高盛的理论能说脏话吗?不能。那我没什么可说的了。
- 相关回复 上下关系8
🙂【原创】预言帝培养指南
🙂对专业人士来说任何预测都是废话 3 内野高飞 字632 2012-09-04 00:12:13
🙂真正会预测的人,谁会靠发布预测吃饭? 自以为是 字72 2012-09-22 00:16:42
🙂高盛的手段在江湖术中叫‘两头堵’,原为一种诡辩技巧 11 旧时月色 字561 2012-08-31 12:48:34
🙂呵呵,您讲的真好 淮夷 字0 2012-10-26 22:35:56
🙂很靠谱的预言帝培养法 10 changshou 字1659 2012-07-01 00:29:16
🙂呵呵, <Bible Code>就是这样写出来的 4 淮夷 字163 2012-07-02 04:42:01
🙂也凑个热闹 6 cshu 字1777 2012-06-29 22:23:57