西西河

主题:阿基米德的报复 by 保罗?霍夫曼  -- foundera

共:💬18 🌺3
全看树展主题 · 分页首页 上页
/ 2
下页 末页
家园 第十章 计算机――未来的象棋之王

第十章 计算机――未来的象棋之王

  到此为止,我们所注意的大部分是计算机科学中的理论问题,计算机和人在原则上能进行哪些类型的计算。我们已经讨论的限制都是无条件的。如果综合性理论学家能够证明他们的推测是真实的,那么旅行推销员问题就不可能找到有效的解法。这既不是因为数学家的问题,也不是计算机缺少适当的运算工具;而是根本没有这种工具,将来也决不会有。

  大多数的数学家和计算机科学家都不会遇到理论上难以超越的限制。他们所面临的障碍都是自我设置的,而且都是可以超越的,至少在原理上是可以超越的。一个主要的障碍――在数学之外的许多工作中也很突出――就是这样一种倾向:稳妥的做法是照搬被普遍接受的他人的解题方法,即使这些方法不是那么圆满。那些想靠自己的努力取得成就的人,最好一下子就能搞出名堂来,否则就会招来他人的嘲笑。本章内,让我们看看汉斯?伯利纳的开拓性工作,他制造了一台能够下好国际象棋的计算机。下一章,我们则将探讨W.丹尼尔?希利斯的工作,他试图用他自己的改革性设计取代曾很好地为电子计算机服务了40年的基本体系结构。

  汉斯?伯利纳是美国匹兹堡市卡内基-梅隆大学计算机学科的研究人员,他本人态度文雅,还很想跻身于世界佼佼者行列。他曾经有过这样的荣誉,现在也想为他的计算机成果赢得同样的荣誉。1968年,他曾以42步一盘棋的卓越成绩击败了苏联足智多谋的国际象棋策略家J.埃斯特林,成为国际象棋通信比赛的世界冠军,为此他曾扑在棋盘上琢磨战术整整500小时。1979年,他又设计了称为BKG(15子棋)9.8的计算机程序,并在蒙特卡洛城举行的大做广告的15子棋①比赛中,以7-1的压倒比分击败了世界15子棋冠军意大利的卢吉?维拉。伯利纳也和他自豪的父亲一样,他很高兴,BKG9.8程序已成为第一台能在任何棋盘上或纸牌游戏比赛中击败人类世界冠军的机器。

  现在,BKG9.8程序已被搁置起来,世界15子棋联合会已禁止在正式比赛中应用计算机,但是,由伯利纳和他的研究生卡尔?埃贝林设计的一种称为Hitech(高科技)的新计算机程序却在另一种棋盘竞赛场所中保持了计算机的荣誉。1985年10月,Hitech程序赢得了北美计算机国标象棋的冠军称号。这项成功与其他一连串击败人类天才的胜利一起,完全证明了Hitech程序在下国际象棋方面优于任何其他计算机,也优于参加美国国际象棋协会认可的各种比赛的30,000名高明棋手(“思维”人)的99%。

  现在,伯利纳已注视着弗雷德金奖金,这项10万美元的奖金将给能击败人类世界冠军的第一台计算机的设计师。Hitech程序目前要击败人类世界冠军力量尚不足。但就伯利纳的顽强性格、教育情况与比赛纪录来看,其程序的前途是不可低估的。

  若按年月顺序来看,伯利纳早先热爱国际象棋,而后才爱他的计算机。他1929年出生于德国, 8岁时随父母迁居美国,定居在首都华盛顿。他发现那里的学校的要求比德国松得多,因此他寻求课堂外的挑战。在1942年的夏令营时,他看到了一些年轻人在下国际象棋,就向他们请教比赛规则。伯利纳回忆说:“甚至就在第一天,已有些棋手成为我的手下败将,情况就是这样。我从此着了迷。”

  两年以后,他是他所在地区国际象棋俱乐部的冠军,并且保住华盛顿地区最佳国际象棋俱乐部冠军的称号。伯利纳说道:“我父母从不鼓励我。他们警告我说,如果我把时间都花在下棋上,我将没有什么前途。如果没有人告诉我,谁知道我将成为什么样的人?”不过在短期内,伯利纳未控制自己的棋瘾。到了1949年,他终于赢得了人人盼望的华盛顿市国际象棋冠军称号,那时他刚刚20岁,这是个破纪录的年龄。

  同年,美国数学家克劳德?香农发表了一篇颇有影响的论文,他在论文中概括地论述了如何编制计算机下国际象棋的程序。当时电子计算机刚刚问世,但是,下国际象棋已被作为在新生的人工智能领域中的一个重要的目标。它与其他智力游戏不同,国际象棋引起人们的兴趣是因为在控制的条件下,通过让计算机与人类选手对阵就可以精确判断出计算机在国际象棋上的能力。参加比赛的棋手都有数字的等级,这是根据他们与其他等级对手比赛时的成绩如何而定的。计算机也要取得等级,以反映它与人的等级棋手比赛所获得的成绩。

  当计算机科学的先驱们努力把香农的想法付诸实践时,年轻的伯利纳正集中精力于下国际象棋。1954年,他是这个国家中最佳的12名棋手之一,并保持了12年。50年代初期,他阅读有关计算机下棋的第一批研究成果。他回忆说:“他们的把戏在我看来是相当可笑的。”

  英国数学界杰出人物艾伦?马西森?图灵也是计算机的开拓者之一,他是人工智能方面有创造性的思想家(已在第八章中论述过),而且,惮精竭虑地穷究数学领域的奥秘。他还是一名国际象棋手,和爱因斯坦一样,即使算不上精通,也至少乐此不疲;也许由于他认为国际象棋是少数几种他未掌握的智力活动之一,因此他毕生热爱这项活动。不管情况如何,他至少撰写了6页有关以机械方式下国际象棋的配方性棋步,这实际上是一种计算机程序。虽然他还没有花费精力把下国际象棋的方法译成编码输入计算机,但他曾用这些配方棋步于1952年与阿利克?格伦尼对弈。阿利克?格伦尼是英国曼彻斯特大学的一名学生,他也是很有才能的计算机程序设计者,但却是一名不大高明的木材推销员。图灵的纸上下棋机(所以这么叫它是因为它还只是在纸张上存在)在那次对弈中失败了,但毕竟是首次用任意一种理想化的或者可以实现的计算机下棋。

  图灵的配方是给每个棋子以数量价值,像国际象棋教科书所定级的那样,以便大体上反映各棋子的相对实力:王1,000,后10,车5,象3.5、马3和兵1。在选择棋步时,都是接着走所有后续棋步,包括捉子在内,一直走到两方既不能吃子也不能给予将死的静止棋势时为止。对于每种静止棋势,两方的相对实力是把棋子的数值加在一起进行计算的,并把计算机的棋子数值看成正数,把对方的棋子数值看成负数。选择导致静止状况的棋步,在这种状态中,机器能使其相对实力增加到最大限度。

  图灵的估值方案是能够找到求胜的棋步的,但是在静态情况下则无法使用。例如,它不能判别白方的头一步如何走,因为在比赛开始时,在其20个可能的棋步(16个进兵步和4个上马步)中,没有一步棋捉子或者可能捉子,因此这20个静止棋势都是同样0值的相对实力,显然,要用该方案判断是很荒谬的。

  图灵还用加权的方法来克服这个问题,在静态棋位中考虑诸如机动性与王的安全性等因素。例如对兵来说,走兵越过自己的布阵之后,每横线增加0.2,如果受到别的子而不是本方兵的保卫,则另加0.3,如果不受到保卫,则要另减0.3。对于车、象、马和后来说,如果走它们能走的法定棋步,则每走一步棋都增加其数值的平方根,如果这些棋步中至少有一步棋可以捉子,则另加1点。而且,要是车、象、或马(不包括后)受到保卫,得到保卫一次另外奖给1点,两次或两次似上另外奖给2点。如果王得到车的保卫,则加0.3,如果与车保持均势,则加0.2,要是以车保王未来仍能出现,则加0.1。

  图灵也考虑王的安全性。在他的估值方案中,王所要损失的点数取决于它易于受到攻击的程度。图灵设想王是另一个后,并计算这个后的机动性,用此来量度其受到攻击的程度。此外,图灵还给攻对方王棋的棋步增加0.5,给立即能将对方王棋的威胁性棋步增加1。

  在静态情况下,纸上下棋机将按照其求值函数、最大的机动性、本方王的安全性以及对方王的易受攻击性来决定棋步。在1952年与格伦厄博弈时,纸上下棋机以P-K4开局,即走王前兵两步,在20个可能棋步中,P-K4棋步具有最大的数值,这个棋步不仅可以进兵到第四横线,而且还可以提高后、王前象和王前马的机动性。早在第三步棋时,纸上下棋机走了一步软着的兵出击,但格伦尼并没有乘机利用它。在第二十九步棋时,由于纸上下棋机的求值函数示出格伦尼没有立即有效的捉子应步,因此它贪婪地用后吃掉一兵。

  纸上下棋机的程序忽视一个简单然而可以压车的棋步,该棋步可以用下棋机的后看住对方的王,使得后可以强行捉子。最后,图灵这个安乐死控制论的倡导者,代表纸上下棋机主动认负。

  纸上下棋机尽管非常原始,仍然有一些独到之处。例如,它认为,只有在没有任何捉子的可能时,实力的研究才有重要性。在棋盘上的某一棋位中,你可能缺少后,这种情况通常是很糟的,但只要是该你走子,你仍有机会,你可能捉住对方的后。你大概不需要一个估值的过程,它只不过统计出棋子的相对实力,却没有把可能的捉子考虑进去。

  当图灵把诸如机动性与王的安全性等国际象棋知识的一些方面包括在求值函数之内时,他的思路是正确的。在与格伦尼博弈时,纸上下棋机的棋输掉了是由于这些知识还不够充分。它不能辨别在特定的棋局中的内在的危险性:王与后在同一纵列上。

  伯利纳和其他国际象棋大师,甚至许多很不熟练的棋手都把这种棋局和不计其数的其他棋局牢记在他们脑子里。研究证明,人类国际象棋大师对棋局和棋位都有非凡的记忆力,而且这种优异的记忆力不一定会转移到与国际象棋无关的事物上。站在人的水准上,伯利纳觉得,他在棋盘上所享受到的成功的喜悦没有延续到教室中,至少在最初时没有。

  伯利纳回忆说:“一些人往往刚上大学不久,就会遇到麻烦,我就是其中之一。本来,我曾是一名物理学的优等生,但是不知怎么一来,我走上了岔道。我一边打工,一边上学,终于攒够了钱来付学费,可以不再打工。这是一个关键性的错误,忽然间我有了很多时间,因此除了下国际象棋之外,我还打桥牌。很快地,我就成为华盛顿市15名最佳桥牌手之一。一切都砸了锅。”

  伯利纳服完兵役后,想返回学校。他接着回忆说:“我未能完成物理学学业,因为我的平均学分太低,因此我转修心理学。看来这是个广阔的研究领域,因为全是些有兴趣的事。”伯利纳是从物理学转来的,他期望能把事实归纳成理论,但是他失望地发现,情况恰好不是那样。

  1954年,伯利纳结婚了,在家庭生活与新工作之余,几乎没有时间打桥牌,不过他还是想方设法继续下国际象棋。他接着说道:“我在美国海军研究实验室从事称为人类工程的工作。那是非常严肃的工作,牵涉到心理学与物理学,与设备的设计有关。那是在1955年,当时计算机刚刚问世,实验室里也造出一部。我曾修过一门程序设计课程,大概编写过20行有关加数的程序,但是除此之外,我没有接触过计算机。”

  “因为没有时间旅行去参加国际象棋比赛,我决定参加通信国际象棋活动。这又是另一项重大错误。它无休止地在棋盘上花去我更多的时间。随后的13年内,我参加了许多国际象棋的通信比赛,并且赢得了所有比赛。在世界通信锦标赛中,我必须下16盘棋。我估计,要思考每一步棋,平均需要花去4个小时的时间,一盘棋大约需要走35步,这就意味着,要赢得该比赛冠军,我要投入2,200多小时的时间。接着,我实际上还是放弃了该项比赛。”他考虑为了保持该项冠军还得再花2,200多小时的时间,是很不值的。

  1961年,伯利纳进了美国马里兰州贝塞斯达的国际商业机器公司(IBM),成为一名系统分析家,并且主要工作是面向军界。虽然他在那里工作了8年,而且奋力进取,升任了经理,但他仍觉得这项工作得不偿失:“如果你很认真地工作,这是一种可怕的生活。作为一名经理,你必须对上下都要负责任。你有一批人为你工作,但他们的确对工作毫不关心。还有一个家伙来自军界,他其实什么都不懂,还对你指手画脚,或提出一些无理要求。后来又有一个人接替了这个家伙的工作,他根本不知道第一个人想要什么,于是命令改变一切。我开始觉得,我所要做的工作应该是,在我回首往事时,能使我感到骄傲的工作。我希望从事研究工作。”

  伯利纳继续进行用计算机远距离下棋的探索,但他看到进展很慢,感到失望。在50年代期间,学者们曾做过乐观的预测,但它与实验室内的成功不相吻合;例如,1957年,美国卡内基-梅隆大学现代诺贝尔荣誉获得者罗伯特?西蒙就曾声称数字计算机将在10年内成为世界的国际象棋冠军。

  计算机程序设计的重要性还没有完全得到认识。按照公众的看法,国际象棋大师就像一种人类的计算机:当他选择一步棋时,他在心目中还要探索几百步后续棋,如果我上了王前兵,那么他将同时攻我两车,而后我将捉他的后……都以惊人准确的闪电速度下棋。计算本来是计算机的主要功能,因此它们在国际象棋上似乎应该是天生的冠军。问题在于公众的这种看法是错误的,对于国标象棋大师来说,计算不是惟一的甚至不是成功的主要的秘诀。他们的成功更多地取决于对棋局的判断,而不是研究那些令人头痛的棋步。

  荷兰的心理学家安德里安?德格鲁特发现,在典型的棋法中约有38步可能的法定棋步,而国际象棋大师平均只考虑其中的1.76棋步。换句话说,一位象棋大师通常根据自己曾经下过或看到别人曾经下过的成千上万步棋,在他所能判断的两个候选棋步中进行选择,这种选择对实现该棋步的眼下和长远目标有利。美国的一位国际象棋特级大师威廉?隆巴迪老人曾经写道:“在实现目的之后,即取胜的布局转变成为数学上的强力取胜的时刻,计算最为常见。”只要花一两秒钟,就能一眼认出所熟悉的布局,这是象棋大师们在棋赛中具有惊人优势的根本原因。在动态的棋局中,简直没有时间进行预测。

  许多早期的计算机程序都只局限于考虑选择候选棋步的数量(尽管它根本就不会是1.76这么小的数)。应用选择搜索方法的问题在于没有人知道如何用计算机语言,更不用说是用英语,来表示用于选择候选棋步的一般失效保险原理。 1966年,由美国麻省理工学院的理查德?格林布拉特研究的早期选择搜索程序MacHack最为成功,它已成为在比赛中击败人类棋手(即使是最弱的一名棋手)的第一部国际象棋计算机。MacHack程序还有幸驳倒了休伯特?德赖弗斯的看法,德赖弗斯是《计算机不能做些什么》一书的作者,他曾靠贬低计算机的能力而出了名。

  然而MacHack的功能一般说来还有严重的缺陷。虽然它在下棋时能够胜任持续时间很长的棋局,但它还是易于突然犯下某种可笑的错误,而这种错误多少是由编入该计算机程序的象棋原理造成的。此外,它有时也会对某些巧妙但却显然违背了象棋原理的棋步视而不见。但是它已在比赛中击败了人类棋手,因而是计算机国际象棋的里程碑。

  伯利纳回忆说:“我的上帝!当我听到有关MacHack程序取得胜利的消息时,我认为,尽管计算机国际象棋受到如此冷遇,尽管人们做了种种努力却收效甚微,但还是有希望的。我去拜访格林布拉特先生,虽然我还不完全理解计算机真的会按他所希望的去做,但我还是留下了深刻的印象。由于我离了婚,还没有再婚,我又一次有了许多时间,因而我自学计算机程序设计,并花去许多晚上和周末时间编写计算机国际象棋程序。我向美国国际商业机器公司申请让我到该公司在纽约的约克顿海特斯研究机构中从事计算机国际象棋的工作。他们答复说:‘我们不资助这类项目。而且,你还没有博士学位,因此,如果你能做些对公司有益的其他事的话,我们顶多让你稍微做一点这方面的工作。’”

  “我认为,要达到我的目的,惟一的途径是获得博士学位,以便进入该公司。我对自己的基本情况很自负。我向几个学校提出了申请,但只有卡内基-梅隆大学接受我。”他在1968年获得世界通信国际象棋比赛冠军的胜利显然有助于他进入该校。

  “因此,我是在1969年秋季40岁时成为一名学生的。这对我是多么大的震惊。我觉得我需要学习的东西实在太多了,像自动化理论、各种不同的程序设计语言、多种多样的硬件配置、以及人工智能本身等等。”伯利纳早年在高等学校中不喜欢的许多课程,现在反而都要修读它们。

  在卡内基-梅隆大学时,伯利纳继续进行他在国际商业机器公司空余时间内开始的计算机程序设计工作。1970年,在美国纽约市举行的第一届美国计算机国际象棋锦标赛上,一种叫做J.Biit的计算机程序(其英文发音与“正好由于它在那儿”的英文首字母缩写词的发音相近)做出相当不错的表演。J.Biit程序也和MacHack程序一样,用选择搜索法工作。该程序的实力就是它的估值函数,即它所考虑每步棋的实力强弱如何都以数值来权衡,但是由于它是选择性搜索,因此有时甚至都不考虑某种正确棋步,更不用说去走它了。伯利纳说道:“在某些具体情况下,它很有下棋的才华。但是这还不够。在所有不同类型的棋局中,你都必须是始终如一的正确。J.Biit程序还不具备强大的实力,足以成功地应付整盘比赛。”

  在第一届美国计算机国际象棋锦标赛上,J,Biit程序败于国际象棋3.0程序,后者是美国西北大学研究生戴维?斯莱特和劳伦斯?阿特金设计的。3.0程序的后来版本执行的不是选择搜索法,而是全方位搜索法:对所有可能的续步进行彻底的分析,一直到规定的某种深度。虽然全方位搜索法总是包含它看到的候选棋步中的正确棋步(因为它看到了所有棋步!),但在选择一步棋时效率却很低。很多时间都浪费在令人吃惊地探索无价值的棋步上,即使是最笨的人类推木式棋手对此也不会给予片刻的考虑。要是计算机能够看清博弈的最后结局,比方说像它能够在三连棋中所做的那样,那么,这些无用的努力将是毫无意义的。

  国际象棋的数学可以证明全方位搜索的低效性。在人类国际象棋大师之间的对弈,典型的是对弈了84着棋(1着棋即指定的一方走一步棋)。由于每个棋位平均有38步法定棋步,因此穷举搜索法必须考虑3884个可能的棋位。那是一个庞大的数字:3884大于10132,即1的后面有132个0。宇宙已经存在了大约1018秒,因此,即使让计算机能够工作像宇宙年龄那么长的时间,每秒钟也要分析10114个国标象棋棋位,才能看清博弈的结局。

  在国际象棋比赛中,计算机也和人一样,不允许进行无限期的思考;40步棋大约只能给定120分钟,每步棋平均3分钟。即使计算机减小了胃口,仅探索出后续几步棋所有可能的棋步,数学上也是不允许的。在只走两着棋之后,即每方各走一步棋之后,可能的棋势数就会超过1,000。而走了4着棋之后,就可能有超过100万可能的棋势。

  计算机不仅生成所有这些棋势,而且还要求出它们的值。计算机是通过数值加权的方法来相当粗略地达到上述目的,诸如考虑实力(即各方的子与兵的数量与特点)、机动性、中心方格与纵列的控制、兵的结构、王的安全性、等等。比方说,在3分钟结束时,无论走什么棋步都要使对手的潜在的最大增益降至最低的程度;这种策略,是从有关竞赛的数学理论借鉴而来的,它设想对方可看出你所看出的一切,力求确保自身的利益。

  如果不是发现了a-β算法,全方位搜索法即使只局限于几着棋的深度,也是不实用的。a-β算法是一种巧妙的求值方法,可以让计算机无需求出每种可能棋势的值就能选择它所要走的棋步。然而令人惊奇的是,所选择的棋步正是计算机考虑了每一种续步后所要走的同一步棋。这怎么可能呢?

  假设计算机首先在一定范围内探索称之为A的某一特定棋步的所有后续棋步。设想两方都走最佳的弈法,计算机给A定的极小极大值比方说为1。(在这种方案中,正值相当于计算机所具有的优势,而负值相当于计算机所处的劣势。优势值为1,表示比对手多一兵,其他条件都相同。)现在,计算机开始对另一个叫做B的可选棋步求值,B是特别愚蠢的一步棋,表示将后置于可以立即被对手的弱兵捉住的方格中。如果计算机现在分析对手的正常应着棋步――以兵捉后,并排除掉一种微小的可能性,即为了一次锐不可挡的进攻而英勇牺牲了后,那么,计算机将定这个棋势的数值为-9,它表示其对手已具有强大的优势。

  现代的计算机国际象棋靠的是极小极大值法:所走的棋步应使对手的可能最大增益降至最小程度。假设计算机可选择的棋步为A和B。它看出了对手对A的最佳反应是走一步棋a(图中的数目表示按照计算机的观点所产生的棋势的优劣程度如何)。这时计算机又考虑棋步B,并看出了对手将应以d,从而能保证时B取得比对A更好的结果。这时计算机有足够理由选择A,而对手反应e或f的结果是什么都无关紧要。

  计算机不需要考虑所有其他应着棋步的结果,其中也包括对手不能吃后,因为计算机已能识别对手的走棋路线是确保它自己对B步棋的应步能优于对A步棋的应步。因此,计算机根据自己的观点,知道走A步棋比走B步棋更为可取。

  要有效地执行a-β算法,计算机必须按顺序考虑各种棋步:在上述例子中,它必须先检验A,再检验B,并且在分析B时,必须先检验捉后的棋步,再考虑其他的应步。审查各种棋步的顺序取决于各种不同的探试法或一般经验。

  例如,捉子探试法指令程序对那些涉及捉子的各种棋步给予最优先考虑。(这样捉子成为一着好棋的机会将更多一些,特别是如果被捉的子未受到保护时。这种方法还能帮助计算机减轻负担,对机器大有稗益。而棋盘上少了一个子,计算机考虑的应着棋步也就相应减少。)

  杀子探试法始终监视着对手的哪一步棋被杀或被驳倒(一种特殊的棋步)。当计算机仔细考虑了另一步棋时,首先要研究杀方的反应。现举一特殊例子。计算机发现它所考虑的捉对方车的一步已被对手弈出将军棋步所驳倒,在仔细考虑替代的棋步时,它将首先决定是否要走避免被将军的棋步。换句话说,杀子探试法可用来识别并监视这种威胁,这里所指的是能立即将军的致命威胁。另一次探试优先考虑那些能将军的棋步,从而应了一句古老的格言:“常将,就能将死。”简单地说,这时计算机的做法就有些更像人了。

  在全方位搜索法中,要是采用渐进地深入考虑所有的续步,而不是每次一步地充分考虑这些续步,那么就能做到省时省事。从棋盘上的某种棋势着手,首先分析所有可能的续步,然后分析某一特定的棋步,根据目前所进行的搜索,就能看到最佳的一步棋。再从这步棋开始,对其余的所有续步进行有效的分析,一直到两着棋的深度,并且再次找到其中最佳的一步棋。这种过程叫做迭代深化法,它不断重复下去,直到达到所期望的深度时为止。

  有一种表记录了计算机已经求出值的棋势、对这些棋势所给定的数值、以及迄今已搜索到的最佳一步棋,通过这个表就可以提高全方位搜索法的有效性。在全方位搜索法中,各种棋势都往往会不止一次地出现,只要程序设计好,查找所求的数值的时间自然比重新计算的时间少,因此,这种表在节省时间方面是很有用的。

  在70年代,美国西北大学的斯莱特和阿特金已能够利用变最大为最小求值法、a-β算法、捉子探试法与杀子探试法、迭代深化法和已经检验过的棋势表等各种方法成功地用国际象棋3.0程序的后来版本进行工作,而且,它也像图灵的纸上下棋机一样,深入地搜索了下国际象棋的战术棋路,直到走到走不动的棋势为止。这就是国际象棋4.7程序,它下国际象棋的能力略低于国际象棋大师的水平。

  1981年,全方位搜索程序Belle由美国电话电报公司贝尔实验室的肯?汤姆森和乔?康登共同开发出来,它已成为第一部达到国际象棋大师级水平的计算机,进入全美国际象棋比赛最高棋手1%的行列。Belle程序的成功应归功于专为进行国际象棋运算而定制的硬件。华盛顿的官员显然很重视Belle程序。1981年,当汤姆森和康登试图携带Belle程序去苏联莫斯科参加国际象棋表演比赛时,联邦局人员拘捕了他们。里根当局担心该程序会泄露军事秘密。而汤姆森却坚持认为,Belle程序所知道的事情只是如何去下国际象棋。汤姆森告诉新闻界说:“在军事上可以使用Belle程序的惟一方式就是可以把它从飞机中扔出,也许你可以以此杀死某一个人。”这些日子,华盛顿已不大注意了,因为Belle程序的等级已滑落在国际象棋大师的水平之下,然而它仍然可以探索平均8着棋的深度,每秒钟分析120,000种棋势,弈出比较难对付的国际象棋。

  当斯莱特、阿特金、汤姆森、康登及其他人应用全方位搜索法进行工作时,伯利纳却集中精力于求值函数上。伯利纳回忆说:“当时我正考虑德格鲁特关于国际象棋大师怎样弈棋的著名的研究――他们如何观察弈至一半的棋局变化,然后如何转向考虑别的方面,再如何回到考虑最初的棋局变化。看来那是正确的。至少那是我所考虑的如何下棋的方法。”另一方面,现有的计算机下国际象棋的程序,不会在变化中来回移动。它们随着特定的变化到达一定的深度,给最后的棋势求出数值,再转到另一种变化。

  伯利纳接着说:“给定某一具体值的困难在于你不能出错。你可以弈出牺牲两子兵,以换取具有极强攻击力的棋势。如果你使用类似α-β的算法,你就能够弈出最后一种棋势,对此你必须赋值;要么为换取攻势值得抛弃两兵子,要么就不值得。无论你持哪种看法,都会在一定时间内出现错误。更确切地说,‘我还不能肯定。我已经丢掉两兵但拥有强攻势。也许实际上我可以将死王或者赢回的多于两兵,而我也许只是丢了两兵’,所以你先摆出问题,再进一步深入研究,看你能否解决它。”

  “对于这类问题以及如何把计算机程序编写得更深入,我思考得很多。一个晚上,我忽然有一灵感:对于一种棋势,可以给定一个值,为什么不能以一系列的值取而代之?”

  一系列值中最高值意味着棋势处于最佳状态,而最低值则相当于可能出现最坏的情况,计算机程序要对一系列值而不是对单一值进行比较,而且当这些值的范围太宽时,它还可以比较深入地考虑棋势,以便把最高值和最低值都包括进去。伯利纳说道:“这种想法是遗漏的组成要素。它是许多不可思议的事物之一,这类事在科学上隔一段时间就发生一次。你提出某一方案,那么突然间,一切都迎刃而解了。”使用系列值的想法已经成为众所周知的B*算法(发音为“B-星”),而且伯利纳还把它列为他的诀窍。

  1975年,当伯利纳完成计算机国际象棋博士论义时,他决定为计算机编写下15子棋的程序,这种棋是他最近向新岳父学习的。他发现15子棋对研究求值法是一个很吸引人的领域,因为在这种棋中进行搜索,不会让你探索得太深。在典型的15子棋棋势中,约有400多种可能性(21组掷骰点数和每组点数的约20种走棋法),与之相比,在典型的国际象棋棋势中,则“仅有”38种可能性。

  在15子棋的计算机程序BKG中,伯利纳没有沿用人工智能中按规则求值的一般做法,他注意到“在医疗诊断体系中,也许还有一种惯例,比如说,如果有一位患者,他有这样那样的疾病,而且其年龄已超过6周岁,那么可以给他以如此这般的治疗。可是忽然间来了一位患同样病的患者,但他的年龄仅为5周岁9个月,按照惯例,不能对他进行那种治疗。当然,那是错误的。因为你真正需要考虑的不是黑白分明的年龄截止点,而是由于某种原因需要考虑诸如年龄、体重以及一般健康情况等因素的平缓函数。在上述特定病例中,可以开出降低剂量的药方”。

  “当你首次设计智能系统时,这几项考虑已不很重要了。它们远不及把基本信息输进计算机中那么重要。但是,如果你想与最佳的人竞争,那么你就不能按照一套完全不灵活的规则去工作。”

  当然,伯利纳想以他的15子棋计算机程序与人类最佳棋手博奔,因此他没有认真地考虑较为惯用的方法,摈弃了把棋势分为几种类型而且每类都有不同求值函数的通则。相反,他却依赖数学上的单一复杂函数,这个函数包括大约50个不同的变量,与具有不同程度重要性的特定部分相一致,其重要性取决于博弈阶段。每个变量都由一个数值来替代,来衡量存在于已知棋势中相应特点的重要程度。这样一来每个数都是加权的:它们都乘以另一个数,这个数称为系数,用以表示对该点的特点所给予的注意力有多大(或多小)。随着博弈进程的变化,这些系数也平缓地变化着。

  这种成功的方法叫做SNAC法(带有应用系数的非线性平缓函数法)。在SNAC法提出后,只有几个月的时间,BKG程序就击败了人类15子棋冠军选手,这显然表明SNAC法是成功的。虽然BKG程序有一些掷骰子般的幸运,而且也曾有过少量较小的错误,但它还是一个强劲的棋手。

  伯利纳根据他在计算机15子棋上获得的成功,知道找到一种平缓变化的函数对国际象棋上的有效求值法也是很关键的。在这一点上,惯用的一种方法也与通则有关。考虑一下王的棋势。当博弈到中盘时,你想把王躲藏在角落里,那里很可能少受骚扰。求值函数可以对王的实际位置与角落之间的棋盘方格进行计数;这个数愈大时,你的处境也愈坏。然而,在弈至残局时,那时只剩下几个子,将死的危险性甚微,于是王应该处于棋盘的中央,它在那里还可以起着很强的战子作用。所以在残局时,求值函数可以对王的实际位置与中央之间的间隔数进行计数。如果你采用了如下通则:BKG程序在与人类的世界15子棋冠军卢吉?维拉对弈时赢得了胜利

  BKG程序在与维拉比赛的第一局中,掷出一个 4点和一个2点。这时,BKG程序(黑方)具有优势,但不得不留下一个暴露棋子。它走了9-5步和9-7步,在7点处,留有一个暴露棋子,它可能受到13组掷骰点数的攻击。从表面上看,好像走5-1步和4-2步比较安全,在5点处留下一个暴露棋子,它只可能受到11组掷骰点数的攻击,但这却是糟糕的走法,因为它在9点处会留下两子,当它们必须走步时,就有可能成为后来的暴露棋子。

  “当棋盘上还有一定数目的子和兵时,棋局就是中盘,而当其只有很少几个子时,则是残局”,那么,你几乎要患精神分裂症了。

  伯利纳接着说道:“你当然不想这样,棋势是连续性的――中盘是逐步转为残局的。由于残局的逐渐接近,你不再那么执意要让王走到角落,而是容许王缓慢地移到棋盘的中部。每当人人都承认残局终于来到时,王应该靠近棋盘的中央,而不是藏在角落里。”达到这一目的的方法是需要有一种缓慢变化的求值函数,而在中盘与残局之间不应有任意的差别,而且两者也不应有不同的求值函数。

  BKG程序在与维拉最后一局的比赛中,如图所示,掷出一个5点和一个1点。这时,BKG程序走出了引起轰动的13-8步和3-2步。如果BKG程序的暴露棋子中任何一子受到进攻,那么它将有更多的时间去组成棋步,以阻止对方的棋子前进。反之,如果它们未受攻击,那么就能够在本方棋盘中形成据点,使维拉的棋子更难于回到本方的棋盘中,然后再逃脱掉。

  的信息而工作,太阳牌计算机是Hitech程序的国际象棋的知识源。

  Hitech程序的成功秘诀在于它能更好地思考(由于Oracle程序)以及比呆板的对手快50%的求值速度(因为它可以同时对一步以上的棋步顺序求值)。Hitech程序执行全方位搜索法,平均每秒可以观察惊人的175,000种不同棋势,换句话说,每步棋3分钟内可以均摊到3,000万种棋势分析。伯利纳说道:“毫无疑问,人们要考虑3,000万种棋势需要花去他们一生的时间。”

  Hitech程序的速度及其智力水平已使它成为世界上最高级的国际象棋程序,优于几乎全部的苏联人棋手。伯利纳认为, Hitech程序或其新一代程序在1990年的国际象棋对弈中击败人类棋王的可能性有50%。为了达到这一目的,它计划把更多的知识输进Oracle程序,并使Hitech程序试用选择搜索法,或许还得用B*算法。

  Hitech程序下国际象棋能下得多好?就此而言,任何一种计算机在某项智能活动中究竟能有多好?伯利纳说道:“我认为,我们将会发现,在输入计算机的一些信息开始与另一些信息相抵触之前,你能输入计算机的信息量是有限度的。”某些研究工作者试图借助于一种信任系统,来消除这种可能性。计算机对相抵触的信息不大注意,因为它的来源不可靠。

  伯利纳接着说道:“但是我不认为信任系统就是答案。我认为,我们需要制造一种学习机,把它摆在架子上,观看录像带,并从基础学起。开始,可能学得很慢。也许要花20年时间,才能达到成年人的理解水平,那也就很好了。如果所得到的成果是有价值的,那么学习机本身也是值得的。然而,我不会屏息不语。学习机最终必定会出现,不是在80年代,或许是在90年代。”

_______

①也可以译为国际双陆棋

家园 第十一章 男孩和他的计算机

第十一章 男孩和他的计算机

  1986年夏天的一个清晨,在马萨诸塞州坎布里奇,创办电子计算机公司的30岁科学家丹尼尔?希利斯正倒在椅子里,犯愁地凝视着一面空白的电视荧屏。他在键盘上输入了一些指令,屏面上显示出像一块投镖板的黑白线条图像。当希利斯按动按键时,设在大厅一间房间里的一个黑色光滑得像玻璃的5英尺高的立方体――希利斯设计的名为连接计算机――断断续续地出现大量狂乱闪亮的小红光,形成无法辨别的图像。

  这种明显的随机性,也许就是计算机的未来。他说:“昨晚我们有个突破。这个计算机确实学到了,是它自己学会的,我从未告诉它是对还是错。”

  希利斯和一个同事花了整个晚上编制连接机程序,把已经输人的有些变形的黑白线条图像加以分解清理。这是人们能做得很出色的被称为是视觉适应的原始范例。希利斯说:“如果我悄悄地给你戴上一副古怪的眼镜,使你视觉变形,你能学会正常地看东西。”但是大多数计算机不像人,它们不能从经验中学习。

  那晚那个连接机是个例外。它收到一个变形图像之后,会显示它认为真正的图像是什么样子。希利斯从未告诉过它,它工作得多么出色。它与国际象棋计算机不同,国际象棋计算机不会后一盘棋比前一盘棋下得更好,除非程序编制员对程序加以改进,而连接机每次都有改进。经过几百次试验之后,它把图像显示得相当正确。

  经过3分钟或500次试验之后,它完全纠正了变形。

  对希利斯来说,这一突破并不是说连接机能做到视觉适应――虽然这种技术可能对解释模糊的照片有用,甚至可以想象对清理杂乱的密码电文也很有用,而是说它已经学会做这件事。如果它能学会做此事,无疑它也能学会做其他事。希利斯认为,假如人工智能模拟有一日不再是个梦想,这可太重要了。

  连接机是新近出现的一种最引人注目的计算机,带有一个并行处理机,它正开始改变计算机科学。传统计算机,即使是功率大的,也只靠单独的处理机进行计算。连接机则根本不同;它利用65,536个小处理机,或叫做微型电脑的总体功率,一起工作,解决一个问题。

  并行处理机仅仅是一个带有一个以上处理器的计算机,其基本原理较简单:2个头比1个强,那么,如果2个头比1个强,为什么不用4个,或16个,甚至是65,536个头呢?从理论上说,增加的头,或处理器,加速计算机的转速,使它不仅能解决有关视觉和言语理解的人工智能模拟的问题,而且也能解决物理学家、工程师和军事策划家每日都面临的许多数学难题。

  在某种程度上,伯利纳的国际象棋计算机是个并行处理机,它有64个芯片,每一芯片对应于棋盘上的一个方格。不过这些芯片只能求出象棋的步法数值,而希利斯的处理机的灵活性足以处理各种计算问题。

  并行处理的概念听起来简单,但要把这种想法变成硅,就有难以克服的障碍。带有多少处理器才是最理想的呢?每一个处理器该有多灵巧呢?处理器应该如何连接起来,才能有效地联络和一起工作?

  还有个困难就是如何编制程序或指示处理机解决某个具体问题。有些问题就像汤姆?索耶油漆围篱的工作,很容易看清楚可以分配给几个工人去做。其他工作则更像马克?吐温的《哈克贝利?费恩历险记》,看不出吐温能从别的作家的帮助下得到什么益处。

  连接机是对付这些困难的一种方法。 1986年8月,电子计算机公司向第一个商业顾客佩金-艾尔摩公司交付了一部按比例缩小的带有16,384个处理器的连接机,价值100万美元。这部连接机安装在维吉尼亚州奥克登MRJ公司的佩金?艾尔摩智囊机构。这家公司承包美国国家航空和航天管理局和国防部的工程。MRJ公司职员汤姆?克雷说:“在使用这部机器几周以后,我们解决了一个重要的军事问题。”假设你知道敌人雷达的位置和你要达到的目标,你应该选择哪条航路,才能把被敌人发现的机会减到最低程度?克雷说:“这个问题经常出现,如同我们轰炸利比亚时那样。”这虽然是件普通的事,但数字分析却是大量的,而且总体解决办法是难以捉摸的。

  希利斯的电子计算机公司于1983年5月成立。那时,有些公司从事研制人工智能模拟机,人们喜欢称它为智能计算机。那些公司在研制专家系统,模拟人类专家们某一特定活动,例如决定走哪一步棋、买什么证券、或在什么地方勘探石油。专家系统仍在流行,尽管新闻媒介和华尔街大肆宣传人工智能机,最好的专家系统只不过是愚蠢的学者;例如一个国际象棋计算机,除了下棋之外,不能做其他事。

  成立电子计算机公司的长远目标不是研制专家系统,而是希利斯所说的业余系统,是一种有普通思考能力的计算机。正如该公司漂亮的宣传手册所说:“总有一天我们会制造出一种能思维的电子计算机,它将是一台具有真正智能的机器。它既能听又能说,是一台令我们骄傲的计算机。”如果这种夸张仅仅是公司要努力获得的东西,它可能还没有开始这项工作,但是作为达到其理想目标的手段,电子计算机公司有它制造第一部大规模并行处理机的短期目标。

  即使这个目标非常宏大,但希利斯至少有如何实现它的主意。此外,那些对智能模拟曾经持怀疑态度的人,对并行处理的可能性也有兴趣。电子计算机公司的30多岁的女总裁雪利尔?汉德拉认为,为了达到这些目标,最好的办法是集中一些超级科学家,组成一个顾问班子。汉德拉曾经协助首创了生物工程公司――遗传学研究公司。今天,计算机公司的顾问有麻省理工学院教授、人工智能的先驱之一,马文?明斯基;诺贝尔奖获得者物理学家理查德?费因曼,他曾执行过总统委派的调查“挑战者”号事故的任务;原麻省理工学院院长、前总统约翰?肯尼迪和林登?约翰逊的科学顾问捷隆姆?魏斯纳;还有斯蒂芬?沃尔弗勒姆,他是一位曾在高等学术研究院工作过的青年物理学家,他15岁时发表过他第一篇科学论文。就连希利斯等人吃维希式胡萝卜汤、沙拉、葡萄干蛋糕和巴甫洛娃佳肴的公司美食食堂的职工也都很聪明,其中一个厨房工人因获得富布赖特奖学金而离开了公司。

  随着电子计算机公司不断云集一批学术精英,许多外界人士视之为一个有高度文化修养的智囊机构,对智能模拟充满浪漫思想,却缺乏制造打蛋机所需的那种简易技能,更不用说是一种新颖的计算机了。然而,该公司得到哥伦比亚广播公司创始人威廉?佩雷和其他投资者的1,600万美元投资、国防部先进工程研究局的470万美元投资后,只花两年半时间就制出了连接计算机。

  身高六英尺、目光炯炯的顽皮的希利斯,不像是开创计算机结构革命的人。他的办公室距离他的母校麻省理工学院只有几个街区,看上去不像是个高科技工作场所,却很像是婴儿围栏。他的办公桌旁有一堆日本机械玩具、一个像牛一般大的卡纸板恐龙和一件推进器式防湿衣,穿上这种衣服可以在水上行走。这种防湿衣可能不是他的得意之作;他上大学时曾用钓鱼用具和许多修修补补的玩具,制成过一个巨大发滴答声的机械玩具。他说,玩具和小机件能使他浑身放松,头脑清醒。

  希利斯说:“我要按照人脑的结构制造计算机,即使不够精确。人脑不像传统计算机只有一个处理机。它有很多东西――神经原――并行工作。那就是我把连接计算机设计成大规模并行工作的原因。”

  希利斯并不是惟一给计算机增加处理器的人。可能有一些大学或公司正计划制造其他上百种多头计算机,这些机构主要是由企业提供小规模经费的科研单位。许多公司都宣称它们在卖并行处理机,但工业分析家对谁能提供真正的东西还有不同意见。所谓真正的东西就是一组处理机必须能够共同投入一项工作,而不是各自单独地处理不同的工作。(真正的并行处理等于在家务中妈妈和爸爸一同做饭;但妈妈做饭的时候,爸爸却在结算支票本,不管他做这事有多少用处,也是不行的。)国际商用电器公司是世界上最大的计算机公司,它也在花千百万美元在此领域进行研究工作,并希望在1987年搞出两个实验性的计算机设计和试验。可是,希利斯已成功地比其他人多连接好几万个处理器。

  尽管在并行处理领域中存在一阵风的活动,其技术还处在萌芽状态。然而,对于计算机科学广泛一致的意见是,并行处理是将来的技术。1980年,日本宣布了其第五代计算机规划,国家10年投入10亿美元制造一种新型计算机,能容易地与人交谈和与环境相互作用。日本人说,这项工作的中心就是并行处理。美国政府和工业界对此做出了警惕的反应。美国国防部先进工程研究局是在苏联人造地球卫星发射成功后成立的,以确保美国在尖端技术领域永不落后。美国公布了其计算机战略,即第五代计算机规划。作为这项规划的开始部分,美国国防部先进工程研究局准备投入7,000万美元。

  卓越的数学家约翰?诺伊曼是老式计算机――传统的单一处理器――的灵魂。他在量子力学、弹道学、气象学、对策论及核武器设计等方面有所创新。他在40年代提出单一处理器的结构时,并不是因为懒惰或对计算目光短浅,而是因为他认为制造一个以上处理机的计算机技术根本不存在。既然晶体管和微型芯片尚未发明,最早的计算机是用笨重的真空管制造的,连只有一个处理机的通用计算机――1946ENIAC(电子数字积分计算机)――也占满了整个房间。

  在诺伊曼的设计中,处理器与计算机的存储器是分开的,存储器不仅存储某一问题的数据,而且还存储运算该数据的指令。在40年代这种分离是讲得通的,因为牵涉到两种不同的技术。处理器是用速度快而较昂贵的真空管做的,而存储器则用速度较慢而价廉的水银延迟线做的。诺伊曼的想法是,编制计算机程序,使快速的真空管忙碌,迟缓的存储器相对地闲着。这就要求程序编制员设法分解一个问题,使之一步一步地解决,如希利斯所说:“使存储信息流过处理机。”大量数据和指令通过狭窄的通道,在处理器和存储器之间来回地分流。

  今天,处理器和存储器之间的明显区别不再有意义了,虽然只在一些原始的计算机里还会找到。处理器和存储器现在都用同样的材料――硅。尽管技术已经改变,但在传统计算机中让处理器忙于一步一步地解决一个问题的想法尚未改变,其结果是效能极低:97%的硅――用于存储器的部分――通常是闲着的,而只有2%―3%的硅,在极端忙碌地工作。希利斯决定找出一种方法,以便更好地利用存储器和取代一次一步地解决问题。

  希利斯有而诺伊曼没有的,是小而价廉的处理器。1970年在加利福尼亚州的桑塔?圣克拉拉,有一家刚开业的小公司,名叫综合电子公司,或不太谦虚的话就叫它“智能”,曾设法把一个处理机的2,300组件做在一块八分之一英寸长、六分之一英寸宽的硅片上。微型处理器,或称“在一块芯片上的计算机”诞生了。在40至50年代,那种占满整个房间的计算机,现在只有拇指指甲那样大。

  综合电子公司和其他公司不久就想出,如何成批生产微处理器,使工业都能普遍用上计算机,如同用电和水那样。按市场调查公司的统计,1975年有75万个微处理器,1985年有3.53亿个,1990年会有12亿个。

  综合电子公司在70年代初期带头搞微型化的时候,另一家初出茅庐的公司:基地设在明尼苏达州的克雷研制公司,却朝相反的方向进军。该公司隐居的创始人西摩?克雷,开始制造世界上最快的计算机,其方法是把芯片结合起来,制成一庞大超功率的处理机。在克雷第一台超级计算机里的处理机,克雷Ⅰ号,形状像个巨大的字母C,高六英尺,最宽处的直径为九英尺。该机比当时任何一个计算机快5至10倍。如果不是足智多谋的克雷想到用氟里昂管蜿蜒地通过,它发出的热量准会烧穿地板;老式冰箱的工艺,使他终于获得成功。

  克雷研制公司已经制造了现有的180个超级计算机的三分之二。克雷Ⅱ型计算机有4个处理机,采用了极有限的一些并行性元件,它是目前世界上最快的计算机,它比原来的克雷计算机快6至12倍。虽然这些计算机明显地比微处理机更快,但它们不成比例地昂贵。克雷Ⅱ型计算机比一个简单的微处理机快5,000倍,但其价格高达2,000万美元,比微处理机贵几十万倍。这个难以接受的经济事实,是政府、大学和许多公司追求并行处理的一个主要原因,尽管其技术还没有达到希利斯相信它能达到的人工智能的水平。

  并行处理的利害关系很大。工业部门及政府部门想当然地认为,年年都会有功率越来越强的计算机制造出来。在过去40年中,单一处理计算机的运算速度提高了1,000倍,这主要是通过缩小基本的电子元件,并提高集成度而实现的。然而,进一步提高单一处理计算机的速度可能行不通,因为设计遇到了基本物理限度这一障碍,例如电路中信号的传递速度不可能超过光速。可能只有利用一个以上处理机的功能,才能明显地改进其性能。

  要一台计算机做必须带有智能的所有事情,单一处理机简直太慢了。一台希利斯称之为真正聪明的计算机――“业余系统”――必须能看,能懂人语,能读英文,能推理和能计划。希利斯说:“这些事,单一处理机的计算机难以胜任,因为做这些事需要大量信息。如果你想给它更多的信息,使它更聪明,其实你却使它更愚蠢,因为它存取信息的速度要慢得多。”一台单一处理机的计算机,如果负责引导一个无人驾驶的军用运载工具,用了一年时间,才能“看出”一辆敌人坦克和一块巨石的区别,就毫无价值。并行处理可能是出路。把信息分给不同的处理机,可以保持速度。

  从某种理论意义上讲,并行处理机具有的惟一优点,就是速度,认识到这一点是很重要的。艾伦?图灵对计算理论的贡献仅次于诺伊曼,他1937年的实验证明,给任何一个计算机足够的时间和信息存储,它可以做其他计算机能做的事。所以,任何能在并行处理机运转的程序,即使该机有许多处理机,单一处理机也是能够模拟的,尽管模拟是缓慢的。那么,从理论上说,所有计算机都是一样的。

  然而在实践中,科学家所需要的是能快速行事的计算机,例如,他们希望能按正常的谈话速度同计算机谈话,不必等很长时间,就能得到它的回答。快速行事正是并行处理机针对单一处理机提出的保证,它不仅在人工智能问题上是这样,而且在解决气候模型、流体流量、等离子物理、亚原子粒子物理、战争处理和战略防御计划、里根总统的太空基地导弹防御计划、众所周知的星球大战等许多棘手的计算问题上也是这样。

  丹尼?希利斯出生于巴尔的摩,是美国空军一个内科医生的儿子。他父亲到世界各地研究肝炎传染病,他一直跟随着他父亲。每到一地,他都制作一些奇妙的玩意儿。他曾做了一个固体燃料火箭,把蚱蜢送上天;他曾利用一个铁罐和一个轮转烤肉器的电动机,制成一个活动机器人。即使他进了麻省理工学院,在大学生和研究生期间,也继续做些古怪的玩具,例如,他做了一根短棒,拿着它在人们面前晃动,就能说话。

  希利斯1974年在读大学一年级时,开始同当时47岁的马文?明斯基合作。自从40年前这一领域出现以来,明斯基就一直热心于人工智能研究工作。像希利斯一样,明斯基不但是一个深思熟虑的人,而且动手能力极强。1951年,他用300个真空管、一批马达和一个B-24轰炸机的自动驾驶仪,制出了第一台学习机,这是最早的电子学习机之一。这部机器像在心理实验中的老鼠一样,学着“钻”迷宫。1956年,明斯基同3个同事,组织了第一次人工智能会议。在那个会议上,人工智能领域才正式开始。两年后,他参与创立了麻省理工学院人工智能实验室,致力于制造从事诸如模拟推理那种非数值性工作的计算机。

  当希利斯未经通报就冒冒失失走进明斯基的办公室时,这个年轻的能工巧匠和年长的计算机先驱初次会面了。明斯基,这位经验丰富的计算机科学家,正在试制一台能正确制图的便宜计算机。计算机内部构件――复杂的线路――都摊在他的桌子上。明斯基回忆说:“这个大学一年级学生出现了。他在办公室里踱来踱去。当他看见那些线路时,我们俩的谈话开始了,然后他指着其中的一根线路说:‘我不明白你为什么需要它,因为那边的一根可做同样的事。’我一看,他确实说得对。他给了我相当深刻的印象,因为他只凭他的直觉――他不知道那些线路是做什么用的!显然,这个大学一年级学生是个相当出色的人物。”

  希利斯同明斯基第一次讨论的问题是:为什么一个计算机不能更像一个人呢?自从那次讨论之后,这个重要问题,一直萦绕在希利斯脑海中,其自然产物就是连接机。

  希利斯说:“有许多事,人做起来轻而易举,而机器却办不到。你能制出一种机器,它能以它的准确力把一根小针顺利地插进一个小孔里。可是,那机器虽具有那种准确性,却不能拿起一杯水而不让水溢出来。这是个矛盾――机器比人准确得多,但也笨拙得多。”在希利斯之前想到这种矛盾的人,通常把人的成功,归于他有一个与他相互作用的、准确的环境形象。希利斯发现这种解释是表面的;他认为,那水杯给人的形象不是静态的,是因有触觉的反馈而不断调整的:“如果你看我们怎样拿起一杯水而不让水溢出,这与我们手的位置如何准确或如何准确地用力毫无关系。有关的是我们的手指所得到的反馈很好――即使闭上眼睛也能做到,只需凭感觉就知道这事做得多好。如果做得不好,我们调整握力。”希利斯称这种快速反馈的作用过程为一种“受控制的幻觉”:我们对现实世界有个假设――一个幻觉――(以水杯的位置来说)来自我们手指感觉的反馈,使我们去调整水杯位置,我们的手指提供了有关调整过的水杯位置准确性的信息反馈,等等,一直到我们自信地拿起那杯子。

  五年前,当希利斯是研究生时,他用256个小压力传感器在一个机器人的指尖里做了一种原始的反馈器,其用意是制造一个用控制幻觉来操作的机器手指,手指通过触摸,能辨别6种不同的东西,全是常用的坚固件――螺母、螺栓、垫圈、暗销、扁销和定位螺钉。手指对感觉到的东西有个“幻觉”(比方说,一个垫圈),然后它检验那个幻觉(比方说,用触摸垫圈当中的孔的方法)。在机器的有限的领域中,这方法是够好的了,但给手指任何别的东西,如一小块口香糖,它会自信地把它认作一种紧扣件。

  在明斯基的指导下,希利斯写的硕士论文就是“手指”,并开始了并行处理的研究。6个处理机,每个功率相当于一台IBM个人计算机,为手指提供了计算能力。从这个经验中,希利斯认识到,需要相当大的计算能力,才能把一切可辨认的东西提高到人的食指水平来辨认。希利斯不是谨慎行事的人;后来他把微处理机连在一起,那就是连接机的原型。

  希利斯在考虑了计算机里的电子组件和人脑神经原(神经细胞)的区别之后,决定连接几万个处理器,每个处理器比电子游戏机的微芯片弱。神经原要慢100万倍,而人脑做一些简单的事,如区别一个男人和一个女人,认读手写的字母,或说出一个4个字母的花名与hose押韵,则比任何计算机快得多。人脑怎样做这些事,人们知道很少,但它那眩目的速度,无疑来源于它有比计算机更多的基本组件,大约有几千亿神经原,其数目可上下波动10倍。而且希利斯还说:“人脑的结构,就我们能看到的,是完全不同于传统计算机的,原因在于它用很多东西并行工作。所以那就是在连接机内制造许多并行结构的直觉原因。”

  希利斯是第一个承认人脑和连接机比较类似的人。首先,神经原的连接关系可能有100兆个,这意味着画出线路图是不可能的。确实,连接关系是那样多并缠绕在一起,神经生物学家还未曾成功地绘制过单一神经原的图,更不用说所有的神经原了。因此,人脑不能为连接机提供一个如何把处理机连在一起的模式。然而,大规模的并行性是人脑基本的特征,看来那就值得试制一个与人脑相似的计算机结构,即使是相差很远和不精确也问题不大。

  此外,希利斯认识到,大规模并行性可能会使计算机做许多事,例如图像的分析及识别,这些人们容易做的事,单一处理机计算机,却根本不能开始做。举个例子,还没有一个计算机能区别一只狗和一只猫。传统计算机遇到障碍,因为它必须一点一点地分析一个图像。所有的点都储存在计算机的存储器中,而每次只能通过连接存储器和处理机的单一狭窄通道――“诺伊曼瓶口”,取出一个点,希利斯说,它像是通过一个窥视孔在画面上移动,细看画面,而不像人的视觉那样,马上可以处理整个形象。连接机有指望做得更好,因为每个处理器实际上是分配到形象的一个点,65,536个处理器一起工作,就能分析整体形象。

  希利斯在麻省理工学院写博士论文时开始研究连接机。明斯基回忆说:“在设计问题上,丹尼应该认真一点,我对他说:‘我希望你不要犯伊利阿克Ⅳ型计算机的错误。’他说:‘哦,什么是伊利阿克Ⅳ型计算机错误?’我告诉了他。”

  伊利阿克Ⅳ型计算机是70年代伊利诺斯大学制造的一个庞大计算机。它有64个处理机,每个像个直立的钢琴那样大,因为是提前制成的。事实上,他们要用叉车插入部件。它花了七八年才制成,制成时却已经过时了。该大学把它送给了国家航空和航天管理局,该局答应使用它,但用起来非常困难。

  在现有的技术条件下,那项工程过于雄心勃勃,并非明斯基所谓的伊利阿克Ⅳ型错误。他告诉希利斯,其概念本身就有缺陷。他说,限定所有64个处理机在同一时间里做完全同样的工作,是个错误,是个扩大的奥林匹克配乐游泳表演用的电子计算机翻版。明斯基告诉希利斯,处理机应该能独立工作。

  “大约一个月后,”明斯基回忆说,“丹尼回来对我说:‘喂,我已决定犯伊利阿克Ⅳ型的错误了。’”希利斯告诉明斯基,问题不在于处理器做什么,而在于它们如何交换信息。他说,处理器间的信号在业务繁忙时阻塞了,这主要是由于连接线路限于二维。希利斯认识到,需要有个更充分的连接方案,尤其是他要连接的处理机不是64个,而是65,536个。信号交换将会像为65,536个客户服务的电话网络,这些客户每秒钟要打2.5亿次电话。那就是希利斯在设计连接机时所面临的主要技术难题。

  最后,希利斯和电子计算机公司的同事们,决定搞三维结构,把结构内的处理机连接起来,如同形成一个16维的立方体。这意味着,每个处理机虽然只同其他16个处理机直接连接,它离其他65,536个处理机的任何一个,决不会超过16步。此外,信号堵塞的可能性减少了,因为在16维中,在任何两个处理机之间有无数的路线可通。

  传递信息的方法也很新颖。希利斯描述信息传递系统如同介于使用邮政系统工作方法和老式电话系统工作方法之间的方式。

  在邮政系统中,投递一封信件采用的路线,有很大灵活性。希利斯说:“如果邮政飞机已经载满,他们可以把你的信件交下班飞机寄出。”邮政系统的缺点是,如果你有很多话要说,你必须寄出大量的信件。电话系统的优点是,你能一直占线到你联系完毕。“你和我通话时,至少是打本地电话,有一条线是给我们的。但是,我们不说话的时候,那条线我们仍占用着。”连接机胜过这两种系统。“它好像是我寄一封信给你,那信系着一根线连着另一封信,后一封信再系一根线,连着第三封信,等等。这样我们就可以不间断地联系。有必要的话,我们可以把线割断――把余下的信从一条不同的路线寄出。”

  当佩金-艾尔摩公司汤姆?克雷的上级叫他观察连接机时,他有些怀疑。他回忆说:“我不能想象你怎么能控制65,000个处理机。听上去毫无事实根据,但结果却是容易的。不管我构思的是什么问题,它都运算得快得多。把一个问题的数据分散,让小块数据分到每个处理机里去,从大规模并行性获得的好处之多,是出乎意料的。”

  连接机问世的时间还不够长,所以我们不知道它对人工智能会有什么贡献,但是它在不太特殊的领域中,已经证明是有用的,例如像缩短一些牵涉到文件检索、线路设计和气流模拟等日常而棘手问题的工作的时间。

  文件检索是个较大问题的一部分,它是从大量信息――计算机科学家称之为数据库――里去搜寻某一特定的文件。这种问题未必多有趣,但却一直出现着。再者,当数据库相当庞大时,传统计算机的缓慢是无法容忍的。拿扫描《纽约时报》一年的文章这个问题来说,计算机世界中的伊夫林?伍德连接机能立刻阅读全部文章,因为每篇文章是有效地分配给每一个单独处理机的,而不像传统计算机那样逐篇地看。希利斯说:“你可以设想扬基体育场有65,000人,每人有一份不同的文件。你通过扩音系统宣布一个题目,然后每人读他的文件,看看是否与题目相符。”那就是连接机做的事,但只需花三百分之一秒时间,比任何计算机快几百倍。

  电子电路的设计,是单一处理机计算机一项费力的基础工业工作。在一个芯片内,成千的电子元件需要连接起来。一旦元件之间的连接大体完成,元件线路必须确定,使连接线路的长度减到最短,并尽量避免交搭。传统计算机做此工作缓慢,它是一次一个元件地改变电路设计的。这一工作是留给连接机做的,因为它的每个处理机代表一个不同部件,容易检查部件的各种布置。确实,连接机正为其后代设计芯片,据说新一代连接机有100万个处理器。

  连接机最令人兴奋的潜在应用,是模拟气流,甚至可在一项列入计划的飞机机翼设计中,进行气流模拟。计算机科学尚未达到这样一种水平,即航空工程师能在一个超级计算机上模拟一架新型飞机乃至一个机翼的设计,并对它的功率能有把握。描述一架飞机或一个机翼周围气流的数学方程式,是人或计算机非常难解的。即使制造一个按比例缩小的飞机模型,放在风道里运行得极好,也不能保证真正的飞机会飞。除了制造和检验一架实体样机之外,没有代用品。

  斯蒂芬?沃尔夫拉姆这位身材矮胖、年近30、戴眼镜、留着细面条似的头发和长鬓颊须、每时每刻都想吃冰淇淋的物理学家,是探讨连接机采用新方法来解决气流问题的智囊。麦克阿瑟基金会曾给他颁发过权威性奖状,证明他是个“天才”,见到他的人都同意他这个称号。

  沃尔夫拉姆认为不必担心描述空气聚集作用的复杂数学,要倾全力于个别空气粒子。每一个处理机有效地分配给一个粒子。在沃尔夫拉姆的样机中,粒子都以同样的速度向六个方向之一的方向移动。一个简单的规律解释了一个粒子与另一个粒子相撞,粒子是如何分散的。虽然这个样机由于受到每个粒子的速度和方向的限制而相当原始,但它似乎很有前途,这显然是因为分子实际上不能解数学方程式,但可以说它们是高举起双臂积极参与的。

  如果模型按计划工作,航空工程师将会从他计算机终端的荧屏上看到粒子轰击计划中的飞机机翼的设计。最近,沃尔夫拉姆和希利斯决定,采用现有的工艺,有可能在连接机里再增加几十万个处理器,一直到它像一座小建筑物那样大。这样一个计算机要花1,000亿美元,而且需要消耗现有最大的发电站的能源。沃尔夫拉姆说:“用那个计算机,你能模拟整架飞机。”别人对这条新闻可能感到沮丧,但沃尔夫拉姆不是。他说:“它给我带来希望。因为,如果工艺发生改变,我们可能终于能够设计出一架飞机。”

  电子计算机公司不乏乐观主义。计算机未来的应用,是公司餐厅里人们交谈的熟悉的话题。希利斯和他的同事们提到,总有一天连接机能解决传统计算机即使是慢慢地,也无法解决的问题。这样一个问题,要搜寻的不是文件而是图片,每幅图片分配给它自己的处理器。电子计算机公司高级科学家小盖伊?斯蒂尔说:“你可以设想问计算机:‘在哪几部影片里,有3个滑稽演员配角同滑稽演员泽罗?莫斯提尔一起演出?’或‘在哪些人造卫星照片里有玉米?’我肯定地说,解决这类问题需要大功率的并行处理能力。”

  沃尔夫拉姆幻想用连接机模拟各种物理系统,以便可以完全省略数学方程式。希利斯盼望有朝一日有个与连接机相似的巨大同类,作为计算机电站,为整个城市每家每户及商业机构提供计算功率。明斯基计划用连接机了解人是怎样思维的,采用以每个处理机模拟一小组神经细胞的方法,来模拟人脑。

  该公司总体上想开发连接机的多头工艺,以制造真正的人工智能机器人,会走动,会说话,完全像“星球大战”中那个通用和服从的、控制论的合作者C3PO。希利斯说:“公司长远的目标是制造一个真正的机器人,家用机器人最终将会是家庭主要的帮手,同今天汽车一样重要。它会做你要它做的一切事:打扫房屋、拿报纸、收拾盘碟、喂狗。”

  在国际商用电器公司,谨慎的实用主义而非乐观主义是法则。这个拥有500亿美元的大亨确信,计算的未来就位于并行处理之中,但对利用几万个低功能处理器是不是出路这一点,还不能肯定。国际商用电器公司拒绝对连接机做出官方的评论,但它的研究人员们说,希利斯对计算机神经细胞似的结构宣传太过分了,而使这位科学家更像是个追逐名声的人,就连他新搞的信息传递方案,也可能低估了信息堵塞的可能性。

  国际商用电器公司副总裁、计算机科学主任阿贝?裴勒德说:“我希望对那些与并行处理有关的问题有个更好的理论性理解。”为了获得理解,通常守口如瓶的独往独来的国际商用电器公司正在同至少8所大学合作,大学的研究人员在采用不同的战略。国际商用电器公司的计算机科学家格雷格?普菲斯特说:“我们不能单干,我们的方法是浇水施肥,培养它们开花,看哪一朵花先开。”

  国际商用电器公司预计RP3型和GF11型计算机这两朵花,将在1987年开放。RP3是由普菲斯特牵头,40人参加制作的计算机。它包含512个大功率的处理器。不像连接机那样是由较多的小功率的处理器组成,它们都不限于同时做同样的事,而能各自分别去做。在实践中,这种大功率的灵活性效果如何,尚待观察。

  GF11处理机不像RP3是个多面手的计算机,它只有一个目标,那就是检验物理学家关于物质特性的最基本理论。自从苏格拉底前的原子论哲学家时期以来2,400多年,人们曾经寻找物质不可分割的组成部分。在过去几十年中,实验家已经制造了大功率的机器,用越来越强大的力量,把物质碎块一起加以粉碎;在那些互撞的碎片中,他们已辨认出200种以上亚原子微粒新种类,是质子和中子的奇特亲属,质子和中子是两个我们熟悉的原子核组成要素。这些粒子有许多又呈现内部结构的迹象。1964年,理论物理学家假定每种有结构的粒子,是由叫做夸克的几种基本建筑块料的不同组合构成,这样就把像凌乱的动物园似的粒子群系统化了。在70年代初期,夸克成为量子色动力学,或称QCD的基础。QCD是描述粒子是由什么构成的和它们如何相互作用的综合理论。

  参加GF11工程的粒子物理学家唐?韦恩加登说:“今天,QCD看上去有5,500万种方法是不错的,但所有这些方法,都是粗糙的和定性的。你所希望的,是有个准确的数字预测,以便你可以把它拿出去与一种实验结果相比较。”QCD对奇特现象确实能做出准确的数字预测,大大超过实验物理的范围,例如一个快速质子,其规模大得像整个宇宙一样。从QCD抽出关于切实物质的预测,如普通物质中的质子,需要一系列棘手的计算,而这种计算,无论是人或任何现有的计算机都做不到。例如,计算一个稳态质子团,要求大约千兆次运算。做如此大量的运算,会占用一台克雷I型计算机30年,或占用一台个人计算机至少20万年,而GF11并行处理机只需用4个月,其结果与测定的物质相比较,可能会提供第一次精确的量子色动力学测验。

  GF11确实不像理论物理学范畴的计算机。由两个冰箱一般大的空调器进行冷却,它占满整个房间。40万个芯片形成576个处理器,塞满20个类似特大型的体育场巨大的单人衣帽柜。那些处理机是用200英里长的线路连接起来的,形成2,000根多种颜色蜿蜒电缆。在国际商业电器公司大家知道它叫“蒙提的大蟒”,是以GF11机3位设计师之一的蒙提?邓诺埃的名字命名的。邓诺埃说:“那个把所有线路连在一起的人,他眼睛仍然蒙着一层薄翳。他曾经是音乐家,可现在他什么都干不了。”

  那576个处理器的每一个,都能通过叫孟菲斯转换器超幂转换网络,同任何一个处理器联系。所有的信息,即使在同一个柜里的处理器之间,必须经过孟菲斯转换器发送,正像早期联邦捷运公司的快递服务那样,所有的包裹(即使一件,例如从芝加哥至底特律),都必须经过盂菲斯城市递送。该转换器能在同一时间内处理相当于200万次的电话通话。

  与连接机中的65,536个处理器一样,GF11中的576个处理器也都同时执行同样的指令,但它每个处理器的功率则更大。每个处理器能在60万亿之一秒时间里,用一个7位数乘一个7位数,比连接机中的一个处理器快3,000倍。这种极强的数字运行能力是计算质子质量所必需的。虽然GF11的设计是为了量子色彩动力学方面的计算,国际商业电器公司希望将这种计算机做些较小的调整之后,能解决计算量很大而传统计算机不能解决的其他科学问题。

  GF11和RP3计算机在进行制造的时候,佩金-艾尔摩的奥克顿智囊箱里的连接机在紧张地工作,它的小红灯迷人地闪烁着。战略防御计划小组需要用镜子,把激光光束弹射到太空,佩金-艾尔摩公司正在给连接机模拟这种镜子。

  不论是否具有人工智能作用,连接机适用于战场指挥。“今天,一场战役会牵涉10万支部队,每支部队以每小时25,000英里的速度行动,”佩金-艾尔摩公司汤姆?克雷说,“只需15分钟,战役就会完全结束,所以你必须同许多方面保持联系,连接机就起这种作用。”

  电子计算机公司的第一个主顾佩金-艾尔摩公司购置了连接机,是再高兴没有了。克雷说:“我们喜欢它,即使别人还不准备抛弃用单个处理器编程序的40年的经验。并行处理像摇摆舞。当初人们说:‘这是什么讨厌的东西?这个艾尔维斯?普雷斯利①是什么人?’但人们接受了它,人们也将会接受并行处理机。”

________

  ① 艾尔维斯?普雷斯利(ElvisPresley),1935―1977年,美国著名摇滚乐歌唱家。译者注。

家园 第十二章 数学中的民主

第四篇 “一人一票”

  数学被卷入计算机是不足为怪的。从实质上说,计算机毕竟只是0和1这两个数字的操作机。最初的电子计算机是由像艾伦?图灵和约翰?冯诺伊曼这样的数学家设计出来的。

  早在人们梦想着有计算机之前,哲学家和政治科学家们就在为建立一个民主国家的方法而大伤脑筋。那时,数学以令人惊奇和令人讨厌的方式伸出它那丑陋的头角。美国经济学家肯尼斯?阿罗获诺贝尔奖的研究工作说明实现完美的民主理想在数学上是不可能的。确实,不受欢迎的悖论不仅会在表决中出现,甚至在表决进行之前,在间接代表制中,决定分配给每一选区的代表名额时也会出现,如同美国众议院那样。

第十二章 数学中的民主

  对策论是对冲突进行数学分析,它存在于政治、商业、军事或各项事务之中。对策论诞生于1927年,由数学全能行家约翰?冯纽尔曼创立。冯纽尔曼认识到经济与政治中的某些决策条件在数学上与某些策略对策等价。所以从分析这些对策中所学到的东西可以直接应用于现实生活中的决策上。在1944年冯纽尔曼与普林斯顿大学经济学家奥斯卡?摩尔根斯特朗合著的当代经典著作《对策论与经济行为》出版之前,对策论,也叫冲突的科学,是鲜为人知的。

  对策论的部分智力感染力在于它的许多成果,如量子力学或相对论,似乎是直觉的,甚至是颠倒性的。典型的一个问题是1948年《美国数学月刊》提出的,它还不时地在文献中出现。有3位名叫阿尔、本和查理的男子,参加一个新式的以气球为目标的掷镖游戏。参加游戏者每位各持一气球,只要气球不破,就可以继续参赛,优胜者属于惟一保持气球完好的参赛者。投掷的每一轮参赛者都以抽签决定游戏的掷镖顺序,然后依次投掷一支习镖,他们对各自的投掷技巧全部心中有数:阿尔可以在5次中4次击破气球(命中率80%);而本则在5次中可3次击破气球(60%命中率);查理却是每5次只有2次可以击破气球(40%命中率)。那么每位参赛者究竟采用什么策略呢?

  答案很明显。每位掷镖者都得把目标对准较强对手的气球,因为如果把它击中,他所要面对的只是较弱的掷镖手。不过,如果所有3位参赛者全都采用这种切合实际的试探策略,那么他们会得到与掷镖技巧相反的结果!概率计算显示,查理这个最差的掷镖手,取胜的机会最大(37%)。而阿尔这个最好的掷镖手,获胜的机会最低,为30%。本的获胜机会也只有33%。

  问题出在哪里?问题就在于阿尔和本自己互相拼斗时,查理几乎不受任何威胁。由于阿尔和本彼此都坚持他们开始的策略,而使查理增强了他的幸存能力。

  对于阿尔和本两者来说,最佳的策略莫过于在把查理除掉之前彼此之间不进行争斗;而查理的最佳对抗策略仍然是把镖掷向较硬的对手阿尔。在这种形势下,阿尔和本获胜之机会分别增加到44%和46.5%,而查理获胜的机会则会戏剧性地下降到9.1%。然而这种局面可能是不稳定的。因为它需要阿尔和本进行合作。虽然阿尔是最佳的掷镖手,但他还是没有取胜的最佳机会,他可能想欺骗本。但是如果他不能用欺骗的飞镖把本击败,则本可能回击,而且计算出来的获胜机会将会再次发生变化。

  如果阿尔不与本合作,不论他是否可以欺骗本,他可能试用另一种策略,这个策略曾在耶鲁大学数学研究所经济学教授马丁?苏比克所著的《社会科学中的对策论:概念与解法》一书中讨论过。

  主要观点是阿尔通过口头威胁,试图形成一种局面,使阿尔与本处于一种拼斗状态,但使查理不向他掷镖,如同第一种情况那样,而是把镖掷向本。阿尔声称,只要查理不向他掷镖,他也决不向查理的气球掷镖(而且总是把镖掷向本)。阿尔要让查理明白,如果查理向他掷镖,他会还击的。假如有报复的威胁,则概率计算就会证明,查理最佳做法仅是向本的气球掷镖。如果本也攻击阿尔,则阿尔的总获胜机会仍为44.4%,本则为20%,查理却是35.6%,阿尔虽然未能增加其获胜机会――百分率没有变化――但现在他是竞争中的领先者。

  当然,本也不善罢甘休。因此他也会像阿尔那样,对查理发出警告:“只要你不向我掷镖,我也不向你掷镖。要是你向我攻击,我也以牙还牙。”面对来自两个对手的威胁,查理的最佳策略是不对两者中任何一位攻击,而是掷向空中,假定规则允许持这种消极态度的话!苏比克解释说,这种奇特的策略对查理来说是最好的,因为只要没有人攻击他,那么他在游戏第一阶段中的惟一目标就是在第二阶段中增加他与本的一对一的对抗,而不是与阿尔对抗。查理聪明的手腕已使他获胜的机会增加了0.6%,因而对阿尔来说获胜的机会现在是38.1%,对本来说则为25.7%,对查埋来说则是36.2%。不过这还不是最后的定论。如果阿尔扩大了他的威胁面,从而使查理不再向空中掷镖,那么局面就会变得愈加奇妙。

  这个问题是对策论中诸多问题中典型的一个。其基本前提是每位参赛者都是有理性的,而且都是力图为自身利益考虑。这个问题的一项教益在于,显而易见的策略――每位参赛者都试图除掉较强的对手――并不一定是好策略。这就是我认为解法是反直觉的解释。当然,由于你更进一步地投身于对策论,那么你的直觉就会改变,而且如果它是完全意想不到的话,则意想不到的局面就会更加意想不到。气球战的另一项教益是,在缺乏有关参赛者能否联络、共谋、进行威胁或达成有约束力并可以实施的协议等信息的情况下,对可能的解法是不能进行正确评估的。在对策论中,往往需要了解这样的社会学因素。

  无须试图进行严格的论证,我们就能很容易地理解,气球战可能类似于政治或经济的竞争。按照纽约大学政治学教授斯蒂温?布拉姆斯的看法:气球战的知识可以扩展到多位候选人的政治竞选上,诸如1984年新罕布什尔州的民主党总统预选,当时有8个候选人竞选。布拉姆斯说道:“看来这些候选人的最佳战略,莫过于在他的部分政治势力范围内追随最强的对手。如果你是一个自由主义者,而且另外还有两位自由主义者,那么你就要追随最强的一位。于是所发生的情况将是两位最强的对手就会彼此攻击,而且最弱者就会存留下来了。”这时,如果所发生的情况全面出现,那么最弱的候选人就会在其政治势力范围内幸存下来。布拉姆斯说:“这是没有办法的,强有力的候选人会在这类竞选场合中崭露头角。”

  1951年,美国经济学家肯尼思?阿罗令人信服地论证:任何可以想得出的民主选举制度可能产生出不民主结果,这一论证使数学家和经济学家感到震惊。阿罗这种令人不安的对策论论证立即在全世界学术界中引起了评论。

  1952年,后来在经济科学方面获诺贝尔奖的保罗?赛缪尔森这样写道:“它证明了探索完全民主的历史记录下的伟大思想也是探索一种妄想、一种逻辑上的自相矛盾。现在全世界的学者们――数学的、政治的、哲学的和经济学的――都在试图进行挽救,都试图挽救阿罗的毁灭性发现中能够挽救出的东西,对数学政治来说,这一发现就是1931年库尔特?哥德尔的数学逻辑的不可能证明一致性定理。”

  阿罗的论证,称之为不可能性定理(因为它证明了完全民主在事实上是不可能的),该论证已帮助他于1972年获得了诺贝尔经济科学奖。对策论中最早的和最惊人的成果之一,也就是阿罗的“毁灭性发现”所产生的影响使人们至今还能感觉到。

  在民主投票中所固有的不民主悖论可以用一实例进行很好的解释。现有3位朋友,罗纳德、克拉拉和赫布,他们在辛苦工作一天之后,渴望吃一顿快餐。他们决定一起到3家餐馆(麦克唐纳、伯格王或温迪)中的一家去就餐。但3人不能取得一致意见。罗纳德渴望在麦克唐纳餐馆吃饭,那里有漂亮的分餐盘,里面装着油腻的汉堡包和大量新鲜的炸土豆条,至于其他两家餐馆,他喜欢伯格王,然后才是温迪。克拉拉想去吃牛排,因而他喜爱温迪胜过麦克唐纳,最后才是伯格王;赫布想吃大奶酪饼,因而最喜欢伯格王,最不喜欢麦克唐纳。

  这3位朋友决定用表决方法解决问题,首先在麦克唐纳和温迪之间选择,然后在取胜者与伯格王之间进行表决。如果罗纳德、克拉拉和赫布每人都按他们所实际喜爱的投票,那么他们最后会选定伯格王(第二名则是温迪)。

  因为伯格王是克拉拉的最后选择,她会很不高兴。如果克拉拉在第一次投票不选择她真正喜爱的温迪,而改而投选她的第二选择麦克唐纳,那么她就能确保麦克唐纳在第一次和第二次中都能赢得表决。克拉拉由于开头违背了她自己的意愿而最终实现了所喜爱的结果,这就是悖论。

  况且,即便罗纳德和赫布识破克拉拉的策略,他们也不能有效地加以干扰。赫布很生气,这是由于克拉拉巧妙的投票才使他的第三意愿餐馆成为获胜者。反之,克拉拉这一方的“诚实”投票就会使赫布的第一意愿成为获胜者。赫布试图说服罗纳德,让罗纳德和他一起合谋进行某种不诚实的投票。但罗纳德不愿意参与,因为这样做也不可能改变他自己的处境。克拉拉的投票已使罗纳德的第一选择的餐馆成为获胜者。

  表决顺序的改变也不能消除巧妙投票的可能性。它所能做的是给别人而不是克拉拉不诚实投票的机会。假定这3位朋友首先在伯格王和温迪之间进行表决,再对获胜者与麦克唐纳进行表决,如果他们全都“诚实地”投票,那么最终会选择麦克唐纳,使赫布大失所望。

  如果赫布足够机敏,能预见到这个结果,那么他应在第一次投巧妙的一票,以促使他们最终转向选择温迪。

  其他可能的表决顺序――即首先在麦克唐纳和伯格王之间表决,而后在获胜者与温迪之间表决――情况也并不好些。

  它只会给罗纳德以进行机敏投票的机会:虽然这3位将要就餐者遇到的窘境是虚构的,但它却不是编造出来的。在一系列的投票中,是从3个或者更多候选者中选出一个获胜者,巧妙投票的可能性可以在任何多数规则的表决中出现。

  当美国众议院提出一项议案修正案时就会发生这样的情况。首先众议院要就修正案投票表决,如果获得通过,那么就应在修正案和完全否定议案之间进行第二次和最后表决。如果修正案未获通过,则第二次表决是在原议案和否定议案之间进行。

  美国罗彻斯特大学的威廉?赖克在其《政治科学中的数学应用》一书中分析了1956年众议院关于要求联邦政府资助学校建设议案的表决情况。当时提出了修正案,要求联邦政府只向那些已经取消种族隔离学校的州进行资助。众议院实质上已分成三个利益集团:共和党人、北方民主党人和南方民主党人。反对联邦资助,但

  赞成取消种族隔离的共和党人完全赞成否定议案,但相比之下,宁愿要修正案而不愿要原议案。而北方民主党人赞成修正案,但宁愿要原议案而不愿要否定议案。南方民主党人都是来自实行种族隔离学校的各州,他们赞成原议案,但宁愿要否定议案而不愿要修正案。

  对于修正案的表决,共和党人和北方民主党人一起投票,赢得了表决。但是在第二次表决,即在修正案和不否定议案之间表决时,共和党人与南方民主党人联合,否决了修正案。在这里,这种悖论表现为:在没有修正案的情况下,要在原议案和否定议案之间进行直接表决,则原议案无疑会赢得胜利!

  赖克得出结论:“选择可能取决于表决顺序这种看法似乎还是不够的,这一事实可以用来扭曲立法程序的结果。它有可能会产生一种表决上的悖论,即使议案在悖论产生之前就已获得通过,也会使立法机构无法采取行动。立法议员可以提出修正案,使这种悖论得以产生,而且如果表决程序恰好正确的话,那么修正议案将会被否决。”

  早在18世纪,法国数学家让-安托万-尼古拉斯?卡里塔特,德?孔多塞侯爵就看出了表决的悖论。他发现社会上往往有优先选择,但是如果是个人的优先选择,就被认为不合理而不加以考虑。现在回过头来考虑我们3位饥饿的朋友,罗纳德喜欢麦克唐纳胜过伯格王,而伯格王又胜过温迪。已知这些优先选择,要他喜爱温迪胜过麦克唐纳,对他说来是不合理的。然而,这些却恰恰是我们的朋友作为整体时的优先选择!在集体表决中,他们宁愿去麦克唐纳而不去伯格王,宁愿去伯格王而不去温迪,宁愿去温迪而不去麦克唐纳。所以,从数学的观点来看民主是不是有内在的不合理呢?

  罗纳德的优先选择:

  麦克唐纳→伯格王→温迪

  因此:麦克唐纳→温迪

  集体的优先选择:

  在民主表决中的数学悖论已由世界上一位大对策学家史蒂文?布拉姆斯进行了广泛研究。他不仅把数学用于涉及表决方面的各种问题,还用于各种各样看来难以进行定量分析的问题。在他的《总统选举的对策》一书中,布拉姆斯使用对策论分析了理查德?尼克松总统的行为和最高法院关于那件迫使总统交出有罪的“白宫录音带”的案例。他在《圣经的对策》一书中把对策论用于分析旧约全书中上帝和人类的矛盾,并得出结论:上帝是个出色的策略家,一位敏感的、沉思的,又为他在世上的声誉所困扰的武断的神。在《高傲的神:如果他们存在,我们怎能知道?》一书中,他探讨了无所不知、无限权力、不朽的生命和不能理解性的对策论含义。布拉姆斯还将对策论应用于实际之中,从超级大国的矛盾和职业运动员的选拔到劳工管理谈判以及电视演播计划等种种主题。

  布拉姆斯对应用数学感兴趣还得追溯到他在麻省理工学院当大学生时,那时苏联刚刚发射了人造地球卫星。他曾有志于主修物理学,但他发现他在实验室里是一个十足笨头笨脑的人,从而打消了这个念头。那些损坏的设备,使他清醒了,他转而攻读数学,并在数学领域一直遥遥领先。他还选修比较新的政治科学系中大名鼎鼎的教授的课程。在那里他发现了他的专长:把数学应用于政治形势上。他的第一批成果主要涉及对国标贸易流通进行数学模拟的统计工作。离开麻省理工学院,他又到西北大学当研究生。因为他在政治科学方面有一种标新立异、特别的定量分析课程。

  布拉姆斯说道:“像每一位有自尊心的政治科学家一样,我考虑应在政府中从事某些工作,但不愿意在和平队里干活。”在1963年和1964年夏季里,他先在国家卫生研究所任所长,而后又到国防部部长办公厅任职。当他完成研究生学业时,他已把整个身心投入国防分析研究所的工作,那是一家非盈利的研究机构。主要是为联席参谋长和国防部长办公室工作。布拉姆斯回忆道:“我被特别雇用从事如何在国防部进行决策的研究。在6个月内,我设计并预先试验了一种调查表。我将要进入战地并会见一些高层人物――副部长、将军、舰队司令――可是国防分析研究所所长停止了这些研究工作。这时越南战争升级,热化,而所长认为这项研究太成问题,特别是由于国防部是国防分析研究所的主要委托人。我感到非常恼怒,并且断定能够自由和独立地做我想做的事的惟一地方是大学。”

  他开始在罗彻斯特大学教学,校内拥有国内最有效地进行定量分析的政治科学系。曾经分析1956年众议院关于学校建设问题投票的赖克当时正在罗彻斯特大学,于是布拉姆斯从他那里获益匪浅,对对策论产生了强烈的爱好。而且,布拉姆斯补充道:“从那时起,我从未离开过这个主题。”

  对策论的评论家们不时指责它是一门诡诈科学,为赞成政治掮客的狡猾策略而打上了数学的印记。然而对策论不会产生表决的悖论,它只不过用形式的方法来认可它们而已。1956年众议院就学校建设议案所做的悖论表决是自然产生的,而不是由于国会众议员们从马基雅维里式的某些对策论杂志中获得的提示得来的。

  一旦悖论被正式认可,对策论就能有助于评估悖论通常是如何产生的。例如,现在我们看看法国数学家孔多塞的观察,由每个人投票决定的群体优先选择在悖论上可能是“非传递性”;如想吃快餐的群体,宁愿去麦克唐纳而不愿去伯格王,宁愿去伯格王而不愿去温迪,然而又喜爱温迪胜过麦克唐纳。如果这个群体由3个人组成(罗纳德、克拉拉和赫布),而仅当每个餐馆首先由一个人排序,其次由另一个人排序,第三再换一个人排序时,这种“非可递性”就将出现。假定所有可能的个人优先选择看来都是相等的,则整个群体的非可递性的机会为5.6%。这个数字看来似乎不大,但要记住这个百分率只不过是针对了个人和3个选择对象的最简单情况。

  布拉姆斯在《政治学中的悖论》一书中总结了更复杂情况中群体非传递性概率的最新研究,其结果是在选择对象和投票人数目增加的两种情况下,非传递性的概率才增加,但它对选择对象的数目更为敏感。如果选择对象固定数为3时,则悖论的可能性会略有增加,从5.6%(投票人为3时)增加到8.8%(投票人数接近于无穷大)。如果投票人固定数为3的时候,则悖论的可能性会陡然上升,从5.6%(选择对象为3时)增加到100%(由于选择对象数接近无穷大)。的确,布拉姆斯特别提到对于投票人的任何固定数,由于选择对象数无穷地增加,悖论的概率必然会逐渐上升。

  摘自史蒂文?布拉姆斯著《政治学中的悖论》(纽约,1976年自由出版社)第42页。

  对策论中的数学可以与许多其他抽象数学学科中所涉及的数学进行简单的比较。但它决不是无价值的。的确,数学常常会导出反直觉的或者违背所预期的结果。数学的简明性不会使对策论的严密性比高维拓扑学的严密性更差,刊登这种问题的杂志也只有一小部分博士能够读懂。简明性甚至可能是优点:对策论中的数学是这样容易理解,从而几乎没有可能由于文献中的数学论述模糊难懂而引不起人们的兴趣。

  美国数学学会的全体官员都认为布拉姆斯的论述有误。这样一个著名的数学家团体能出现差错的事实表明对策论的结果是如何令人吃惊。这种错误论述出现在美国数学学会的投票说明上,学会会员将使用该说明选出参加特别委员会的代表。对于这次投票,美国数学学会恢复了表决程序,采用单一的可转让投票制度(又称选择投票法)。它是19世纪50年代后期由不引人注意的英国律师托马斯?黑尔提出的,他曾撰写过两本书,批判传统的投票制度。

  黑尔曾特别为下述事实所苦恼:在传统的比例代表制中,每个选区选举一位以上的候选人,实际上,为数甚多的少数选民可能会被剥夺掉选举权,尽管他们的原号码表明他们有资格选出代表。现考虑一个假设的选区,要从4位候选人中选出两位代表。把其中的两位候选人称作匈奴人阿蒂拉和吉?乔,他们都是典型的保守派人士,两人中阿蒂拉是极右人士。另外两位候选人是哈尔?汉道特和弗里达?弗里拉夫,他们都是自由派。两人中弗里拉夫更富有同情心。该选区内有23位选民,其中13位是保守派,10位是自由派。23位选民的选举意愿,按照对候选人的选择从第一选择到最后选择的顺序排列如下:

  选民数 第一选择 第二选择 第三选择 第四选择

  7 阿蒂拉 吉?乔 汉道特 弗里拉夫

  6 吉?乔 阿蒂拉 汉道特 弗里拉夫

  6 汉道特 弗里拉夫 吉?乔 阿蒂拉

  4 弗里拉夫 汉道特 吉?乔 阿蒂拉

  在选举中,每位选民允许选出两位候选人,阿蒂拉和吉?乔都将当选。因为这两位候选人每位都各得13票。结果是10位自由派选民将没有代表,即使他们构成全体选民的43%。而13位保守派选民仅构成全体选民的57%,却有100%的代表。

  黑尔认为,所选出的代表应更精密地反映全体选民的构成,他巧妙地设计出一种复式选举制,它要求每位选民按其选举意愿顺序列出候选人名单,使选民能在候选人中间区别他们。然后把第一选择投票列成表格,而候选人只要达到定额选票,都要当选。

  定额需要计算,它应是第一位选票的最小数,使得最大数目的候选人都能达到与候选席位数相符合的定额。例如上述例子中,有23位选民和2席候选席位,当选的定额应是8票;这样只有2位候选人(并非3位)能得到8票的第一位选票。定额定为7票又太低,因为有3位候选人可能会达到这个定额;由于只有两个待选席位,因此达到定额的候选人多出了一位。(一般说来,定额可用下法求出,即用选民数除以比待选席位大1的数,再加1即为定额数,但要舍去得出的任何分数。)

  假设至少有一位候选人达到了定额选票,而且至少仍有一个席位空缺待选,那么当选的候选人超出定额的选票会按比例地转移到那些选民票数多的候选人身上。如果这种转移促成另一位候选人达到定额,那么他也当选;而且如果席位仍然未满,则超额的选票会再次按比例地转移。这个过程会继续下去,直到所有席位选满为止。如果在任何一处还有待选席位,但却没有超额选票转移,那么得票数最低的候选人就会被淘汰掉,而他的支持者会简单把他们的选票转移到他们选择的、票数最多的、仍在参加竞选的候选人身上。这个概念就是不会有选票作废的概念;如果选举需要选出的不只是一位候选人,可以在别处计票;如果把它分散在最少选票的候选人身上,也可以在别处计票。

  理解这些选举规则的最好方法是把它们应用于具体实例上。

  试把这些章程用于我们上面设想的选区内。由于定额是8票,4位候选人中每位都不能达到定额。因此得票最少的候选人弗里达?弗里拉夫就被淘汰掉,而她的4位支持者将他们的选票转移给哈尔?汉道特,即他们的第二选择。如果弗里拉夫已从选举意愿表中淘汰掉,那么其顺序表如下:

  选民数 选举意愿(从最好到最差)

  7 阿蒂拉 吉?乔 汉道特

  6 吉?乔 阿蒂拉 汉道特

  10 汉道特 吉?乔 阿蒂拉

  现在哈尔?汉道特已超过定额2票,因此他已当选,他的超额两票已转移到吉?乔身上:

  选民数 选举意愿(从最好到最差)

  7 阿蒂拉 吉?乔

  8 吉?乔 阿蒂拉

  这时吉?乔也已达到定额票数,所以他赢得了另一席位。

  汉道特和吉?乔的当选使黑尔兴奋:不论保守派还是自由派都有了代表,每个阵营中比较激进的候选人均未能当选。这样一种结果给约翰?斯图尔特?穆勒以深刻印象,他称颂黑尔的选举制是“在政府的理论和实践方面所做出的最伟大的改进之一”。今天,黑尔的选举制已广泛地用于澳大利亚、马耳他、爱尔兰共和国和北爱尔兰的立法选举和纽约市的学校董事会选举以及马萨诸塞州坎布里奇市的市政委员会选举上,更不必说许多像美国数学学会这一类的专业组织的投票选举了。

  美国数学学会的投票包括两种强硬的说法:“标出较少的候选人不会获得战术上的有利条件。”以及“按你的选举意愿顺序标出候选人,直到你认为不了解或你不感兴趣而没有标出的候选人,这是可取的。”而布拉姆斯举出了一个能够证明这种做法是不真实的例子,它可能有利于标出较少数的候选人。假定有17位选民,2个待选席位和4位候选人,现称他们为格拉夫博士、迪济特博士、波因特博士、马尼福尔德博士,选民的选举意愿顺序如下:

  组选

  别民 选举意愿顺序(从最好到最差)

   数

  A 6 格拉夫博士 迪济特博士 波因特博士 马尼福尔德博士

  B 6 格拉夫博士 波因特博士 马尼福尔德博士 迪济特博士

  C 5 格拉夫博士 马尼福尔德博士 迪济特博士 波因特博士

  格拉夫博士赢得了17张选票,定额为6票,超额了11票。因此这11票需要转移。在这种情况下,选民们都支持当选者,不会再做其他选择了。而黑尔的选举章程(这是美国数学学会所遵循的)要求将超额的11票按比例地转移:11票的6/17转移到A组,11票的6/17转移到B组,而11票的5/17转移给C组,其结果如下:

  组别 选民数 选举意愿顺序(从最好到最差)

  A 3.9 迪济特博士 波因特博士 马尼福尔德博士

  B 3.9 波因特博士 马尼福尔德博士 迪济特博士

  C 3.2 马尼福尔德博士 迪济特博士 波因特博士

  由于没有一个候选人能达到定额,得票最少的候选人马尼福尔德博士就被淘汰掉,而其支持者的3.2票会转移到他们选举的选票高的候选人波因特博士身上:

  组别 选民数 选举意愿顺序(从最好到最差)

  A 7.1 迪济特博士 波因特博士

  B 3.9 波因特博士 迪济特博士

  现在迪济特博士已超过6票定额,所以他与格拉夫博士一样,成为当选的候选人。

  B组的6位选民(其选举意愿顺序为格拉夫博士、波因特博士、马尼福尔德博士和迪济特博士)为他们的第一选择当选而高兴,但也感到不安,因为他们的最后选择也当了选。假定选举重复下去,一切照旧,那么6个选民中就有两位决定不去理会美国数学学会的说法(“标出较少的候选人不会获得战术上的有利条件”),而且都把选票投在格拉夫博士身上。这样选举意愿就会分成4类:

  组别 选民数 选举意愿顺序(从最好到最差)

  A 6 格拉夫博士 迪济特博士波因特博士 马尼福尔德博士

  B’ 4 格拉夫博士 波因特博士 马尼福尔德博士 迪济特博士

  B” 2 格拉夫博士

  C 5 格拉夫博士 马尼福尔德博士 迪济特博士 波因特博士

  在第一个顺序表上,格拉夫博士再次成为全体选民一致选择。他支持者的11票超额选票的6/17分配给A组,4/17分配给B’组,2/17分配给B”组,还有5/17分配给C组。于是B”组就被淘汰了。因为其成员除在第一选择外不能再标出其选举意愿了。因此情况形成如下:

  组别 选民数 选举意愿顺序(从最好到最差)

  A 3.9 迪济特博士 波因特博士 马尼福尔德博士

  B’ 2.6 波因特博士 马尼福尔德博士 迪济特博士

  C 3.2 马尼福尔德博士 迪济特博士 波因特博士

  在第一次选举中,第二位候选人未能达到定额,所以得票最低,也就是说波因特博士就被淘汰掉,而他的支持者的2.6张选票要归并到C组中:

  组别 选民数 选举意愿顺序(从最好到最差)

  A 3.9 波因特博士 马尼福尔德博士

  C、B’ 5.8 马尼福尔德博士 波因特博士

  其余的两位候选人都少于定额的6票,但波因特博士由于票数较少而被淘汰,而马尼福尔德博士就被宣布当选。B组中两位聪明的选民标出了不足的选票反而得到更可取的结果:他们的第三选择而不是第四选择就赢得了一个席位。

  在实际的选举中,这样的结局可能难以实现,布拉姆斯写道:“我希望能搞清楚。我并不是说投票者会一成不变地把战略考虑搞得很绝对(在美国数学学会投票说明的反例中)。这些考虑不仅相当复杂,有时还由于其他选民在对策运用方面的反策略考虑而形成中立。相反,我认为投票者按选举意愿对所有候选人的顺序进行排列的意见,在黑尔选举制下并不总是合理的。”

  况且,在布拉姆斯的反例中,如果B组中有太多的选民试图进行巧妙投票并投了不足的选票,那么结果会失控。假定6位选民中有5位在其投票中只投格拉夫博士,那么在第一次投票之后,情况就会变成:

  由于没有一位候选人达到定额,因此波因特博士被迫退出,而其支持者加入C组;

  组别 选民数 选举意愿顺序(从最好到最差)

  A 3.9 迪济特博士 马尼福尔德博士

  C、B’3.8 马尼福尔德博士 迪济特博士

  这次马尼福尔德博士必须退出竞选了,剩下的迪济特博士是获胜者,与原先B组的6位选民在他们的选票上排列全部4位候选人时他所处的位置一样。

  由于惟恐你认为布拉姆斯的反例取决于当选票按比例地转移时而产生的分数,他解释了另一个反例,只是在这个反例中,全部选票由于候选人被淘汰而转移。这个实例涉及了21位选民,他们要从4位候选人当中选出1位代表。由于只有1位候选人被选,因此这种投票选举制是一种淘汰竞选,选举则在1位候选人获得11票的微弱多数后就立即终止。我把这个问题留给你,让你充当对策论学家的角色并解释一个反例。当然,其目标是以下述方式确定选举意愿,即让一些选民可以从不理会美国数学学会的意见而得到好处。(在本章最后你会看到布拉姆斯所提出的反例。)

  黑尔选举制的问题,要比这些公认的人为的反例深得多;仅仅知道某些选举意愿,或只有一些选民确切掌握有关他们竞选伙伴的全部选举意愿,这些难题就会出现,如果“敌对”的选民没有采取有效的对抗策略,或者如果相当多具有同样想法的选民不试图采用巧妙的花招,问题也同样会出现。罗彻斯特大学的吉迪恩?多隆和理查德?克罗尼克提请人们注意黑尔选举制的反常特点,即使所有选民都能诚恳地投出反映他们全部选举意愿的选票,这种反常特点也会出现。①多隆和克罗尼克注意到,在黑尔的选举制中,一位候选人如果接受附加选票,那么他可能受到损害。的确,多余的选票可能使一位当选者成为落选者。

  为了理解这种反常的可能性,可考虑多隆和克罗尼克的例子。

  并以我们的老朋友阿蒂拉、吉?乔、哈尔?汉道特和弗里达?弗里拉夫为例。这次该选区有26位选民,有2位候选人当选,所以定额为9票,26位选民的意愿是多种多样的,不必划分自由派阵线和保守派阵线:

  由于阿蒂拉已经达到定额票,他当选了。阿蒂拉没有超额的选票,所以是最低票数的当选者,而吉?乔被淘汰了,他的5张选票转移给B组:

  汉道特拥有11张选票,因此当选了。

  现考虑第二组选举意愿,除两位选民外,它与前一组相同,原先这两位选民宁愿投弗里拉夫票,不愿投汉道特票(C组),现在改而投汉道特票,不投弗里拉夫票(C’组)。换句话说,C’组的选举意愿与B组的选举意愿相同。因而汉道特开始有8张第一位选票,比以前多了两票:

  阿蒂拉已再次立即当选,没有超额选票转移。然而这次最低票数当选者是弗里拉夫,不是吉?乔。而且弗里拉夫的4票与E组中的5票结合,选出吉?乔,超出定额:

  组别 选票数 选举意愿(从最好到最差)

  B 6 汉道特 吉?乔

  C’ 2 汉道特 吉?乔

  E、D 9 吉?乔 汉道特

  这样的结果不太反常。回想一下,除了2位选民把汉道特从第二选择抬高到第一选择外,所有的选举意愿顺序都是一样的。这样就具有否定他的选举的效果。多隆和克罗尼克得出结论:“这简直太不公平,1位候选人落选了,是因为他(或她)得到的选票过多了。大多数选民可能会十分反感和愤怒,被转让了,他们听到假想的(但是理论上是可能的)选举之夜的报道:‘奥格雷迪先生在今天选举中没有获得席位,但是,如果在第二个地方而不是在第一个地方有5,000名支持者投他的票,那么他会反败为胜的!’”

  过多的选票能使一位当选者成为落选者这一反常的可能性,不仅仅是黑尔选举制的人为产物。美国电话电报公司贝尔实验室的数学家布拉姆斯和彼得?菲什伯恩在其合著的《认可的选举》一书中指出,它还可能困扰着类似于流行的相对多数选举这样的选举制,该选举制必然会产生2位得票最多的候选人之间的最后角逐。现在考虑3位候选人,马尔柯?迪拿芝、帕特里克?奥罗克、巴兹尔?杰斐逊,同时有17位选民,他们的选举意愿如下:组别 选票数 选举意愿(从最好到最差)

  A 6 迪拿芝 奥罗克 杰斐逊

  B 5 杰斐逊 迪拿芝 奥罗克

  C 4 奥罗克 杰斐逊 迪拿芝

  D 2 奥罗克 迪拿芝 杰斐逊

  如果所有的选民都诚实地投票,那么迪拿芝(得6票)和奥罗克(得6票)将进行角逐,最后迪拿芝当选,11票对6票。

  现在设想除了最后一组选民把迪拿芝从第二选择抬高到第一选择之外,其余的选举意愿均相同:

  组别 选票数 选举意愿(从最好到最差)

  A 6 迪拿芝 奥罗克 杰斐逊

  B 5 杰斐逊 迪拿芝 奥罗克

  C 4 奥罗克 杰斐逊 迪拿芝

  D’ 2 迪拿芝 奥罗克 杰斐逊

  在第一次投票中,迪拿芝(8票)和杰斐逊(5票)进行角逐,于是迪拿芝输了,8票对9票,因为奥罗克的4位支持者成为了杰斐逊的支持者,迪拿芝获得的支持虽有增加,但却反常地破坏了他的胜利。

  布拉姆斯还认为,在不需要最后角逐的简单多数选举中,候选人在预选投票中有何进展的公告也可以产生同样的反常效果。假定上述的第一组选举意愿中有两位D组选民喜欢选奥罗克而不选迪拿芝,投票的结果将通知杰斐逊的支持者,他们支持的候选人已处于最后一名。于是杰斐逊的支持者得到了信息,他们必须放弃他们支持的候选人,策略性地转投他们的第二选择意愿迪拿芝,迪拿芝因而将当选。假定上述的第二组选举意愿中,迪拿芝得到了D组选民的支持,投票结果将通知奥罗克的支持者,他们支持的候选人已处在最后一名。理所当然地,他们将转而支持杰斐逊。尽管迪拿芝也获得两位以上选民的支持,杰斐逊还是击败了迪拿芝。实际上,民意测验代替了第一轮投票,使实际选举相当于最后的角逐。

  多隆在另一篇论文②中指出,黑尔选举制的另一种困境是:一位候选人在两个单独选区内都可以获胜,而在两个选区的合并投票时却会落选。在多隆的例子中,1个候选人由4组选民选举。每个选区有21位选民,因此每个选区当选的定额是11票。

  在两个选区内,最初时无一人达到定额11票。在第一选区,汉道特得到倒数第一位的选票,被淘汰了,他的支持者的选票都转给阿蒂拉,使阿蒂拉得到11票当选。在第二选区,阿蒂拉从选票最低的候选人弗里拉夫处获得3票,成为当选者。

  现在再考虑当这两个选区合并成单一选区时会发生什么情况,其中42位选民的选举意愿仍然不变:

  现在当选定额是22票。由于选民的选举意愿完全相同,要是阿蒂拉不再当选,那么它将是反常地矛盾。但是反常的情况还是占优势。由于没有一个人能得到规定额选票,所以吉?乔被淘汰了,而其支持者的8票转移到他们的第二选择,也就是投汉道特的票:

  合并成一大选区

  组别 选票数 选举意愿(从最好到最差)

  A 16 阿蒂拉 汉道特 弗里拉夫

  B 8 汉道特 弗里拉夫 阿蒂拉

  C 9 汉道特 阿蒂拉 弗里拉夫

  D 6 弗里拉夫 汉道特 阿蒂拉

  D’ 3 弗里拉夫 阿蒂拉 汉道特

  全部候选人再次都没有得到定额选票,因此得票最少的弗里拉夫被淘汰了。弗里拉夫在D’组中的3位支持者把他们的选票转移到他们的第三选择阿蒂拉,而弗里拉夫6位在D组的支持者则转移他们的选票给汉道特:

  合并成一大选区

  组别 选票数 选举意愿(从最好到最差)

  A,D’ 19 阿蒂拉 汉道特

  B,C,D 23 汉道特 阿蒂拉

  汉道特已得到23票,成为胜者。

  这种反常结果也可能在相反的情况下,即当大选区划分成两个较小的选区时出现。不论合并成大选区或是划分成小选区,这种可能性“将使不公正地划分选区成为一种非常具有吸引力的选择,从而影响其选举结果”,多隆得出这样的结论。

  而这决不是悖论的终结!布拉姆斯与菲什伯恩在一篇有趣的文章中③提醒人们注意黑尔选举制中两种扰乱人心的特点:不到场的悖论和挫折的大多数的悖论。在不到场的悖论中,对于排列在最后的一些候选人,增加的选票可以使该候选人成为一位当选者,而不是落选者。换句话说,一些把某候选人排列在最后的选民留在家里可能要比把该候选人填写在他们选票的最后好一些;在挫折的多数的悖论中,即使一些候选人可以在面对面角逐中击败其他每一位候选人,但却不能当选。(我极力主张那些渴望成为对策论专家的人们,去构思一些数字的例子,以便一一证明这些悖论;如果你未能成功,你可以随时请教布拉姆斯和菲什伯恩的可读性文章。)

  挫折的多数的悖论不仅仅折磨着稀奇古怪的黑尔选举制,而且还折磨着许多普通的选举制,诸如简单多数选举制等。设想“自由派”先生(49%的优势),“温和派”先生(10%的优势)和“保守派”先生(41%的优势)之间进行三方竞选。现在考虑三派中每一位选民的第二选择。自由派选民当然喜欢“温和派”先生胜过“保守派”先生,因而在这些候选人之间的两方竞选中,“温和派”先生将当选。他获得选票的59%(对“保守派”先生的41%);而保守派的选民们必定喜欢“温和派”先生胜过“自由派”先生。所以在这些候选人之间的两方角逐中,“温和派”先生可得51%的选票(对“自由派”先生的49%),也将当选。然而,在三方竟选中,“温和派”先生将落在最后。在一些预选中,如果没有候选人获得半数以上的多数票,那么要在两位得票最多的候选人中间进行最后的角逐。即使“温和派”先生在两方竞选中能够击败任何一个对手,但他也可能被阻止进入最后的角逐。

  悖论还会更加深刻。假设在政治领域内,“自由派”先生是属于中间偏左的,而“保守派”先生只是中间略微偏右。那么,在“自由派”先生和“保守派”先生中间进行最后竞选时,所有温和派选票都会投向“保守派”先生,使他因获得51%的选票而当选。现在由于在选举意愿上有这样巧妙的联合,于是“保守派”先生要靠两票方可当选。“自由派”先生只靠一票就能当选,而“温和派”先生却具有在面对面竞争时击败任何一位对手的能力。所以说在你选择你的选举制时,也就选择了你的当选者。

  布拉姆斯鼓吹一种选举制――认可选举制。它既可完全消除这里讨论的悖论,减低它发生的可能性,也可减少它的影响。这种认可选举以“一人多票”的原则取代由来已久的“一人一票”的原则。换句话说,虽然每位选民对每位候选人只能投一票,但是每位选民只要他喜欢就可以认可许多位候选人(即都投他们的票)。其概念就是,选民不必担心他的选票白白浪费在不受欢迎的候选人身上(比如说,在1980年的总统选举中的约翰?安德森),因为选民还可以再投另外他认可的候选人,不论他是谁。

  在认可选举中,当选者将不是在简单多数选举中由于其对手分散了选票而获得胜利的候选人。认可选举制不太可能使多数派的希望受挫。而且当多数派还没有明确的选举意愿时(换句话说,当存在群体非可递性时,即当群体喜欢麦克唐纳胜过伯格王,喜欢伯格王胜过温迪,而喜欢温迪又胜过麦克唐纳时),认可选举制将就大多数人所赞同的意愿进行选择。我们可以看出,当罗纳德、克拉拉、赫布依靠2票来选择餐馆进餐时,那是多么有利于不诚实的投票,即为你的第二选择而不是你的第一选择投票。当有3位候选人时,认可选举制就可防止这种不诚实的投票:决不会出现有利于你投第二选择的票而不投第一选择的票这样的情况。此外,在认可选举制中,决不会出现留在家里并不去投票反而得利的情况,如同你在黑尔选举制中所做的那样,而且也不会在选区合并或分开时发生滑稽可笑的事情。

  尽管认可选举制具有这些明显的优点,但显然没有被世界上任何公共论坛(除了少数专业学会外)所采用,只有在联合国安全理事会选举秘书长职位时采用过,其会员国可以投一人以上候选人的票。美国的纽约州和佛蒙特州都曾考虑采用认可选举制,但制定的议案已在州立法中被否决。对策论学家在影响公众政策方面所起的作用还是微不足道的,即使是在他提出一个建议,而该建议对社会的益处在数学上似乎是无懈可击的时候。

  回答提出的问题

  此处布拉姆斯提出的事例,可能有利于缩短你在黑尔选举制中的投票时间。现有11张选票和4位候选人竞选1席公职。

  组别选票数 选举意愿顺序(从最好到最差)

  A 7 格拉夫博士 马尼福尔德博士 迪济特博士 波因特博士

  B 6 马尼福尔德博士 格拉夫博士 迪济特博士 波因特博士

  C 5 迪济特博士 马尼福尔德博士 格拉夫博士 波因特博士

  D 3 波因特博士 迪济特博士 马尼福尔德博士 格拉夫博士

  由于没有一位候选人获得11票,最低得票者波因特博士落选了,而他的支持者的3票都被转移给C组:

  组别 选票数 选举意愿顺序(从最好到最差)

  A 7 格拉夫博士 马尼福尔德博士 迪济特博士

  B 6 马尼福尔德博士 格拉夫博士 迪济特博士

  C、D 8 迪济特博士 马尼福尔德博士 格拉夫博士

  仍然没有一位候选人获得简单多数票,于是又有一位不受欢迎的候选人马尼福尔德博士被淘汰了。当他支持者的6票和A组的7票联合在一起时,格拉夫博士入选了,他获得13票。

  D组的3位选民不高兴,因为他们的最后选择竟是当选者。假设他们在选票上只标出第一选择的话,那么:

  组别 选票数 选举意愿顺序(从最好到最差)

  A 7 格拉夫博士 马尼福尔德博士 迪济特博士 波因特博士

  B 6 马尼福尔德博士 格拉夫博士 迪济特博士 波因特博士

  C 5 迪济特博士 马尼福尔德博士 格拉夫博士 波因特博士

  D 3 波因特博士

  同前面一样,最初没有一位候选人获得11票,于是波因特博士被淘汰了。然而这次他的3票没有被转移,因为他的支持者没有表明任何其他选择意愿。剩下3位候选人,迪济特博士现在成为最不受欢迎的候选人。当他的5票加入B组时,马尼福尔德博士就崭露头角成为当选者――一个更合D组选民胃口的结果。

________

  ① 见多隆和克罗尼克著《单一的可转移选票:反常的社会选择功能的一个实例》,美国政治科学杂志4期(1977年5月):303―311页。

  ② 《黑尔选举制是矛盾的》政治研究杂志第27期(1979年6月):283―286页。

  ③ 见菲什伯恩和布拉姆斯的《选举投票的悖论》,数学杂志第56期(1983年9月):207―214页。

全看树展主题 · 分页首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河