主题：人工智能挑战围棋即将成功 -- 陈经

共:💬76 🌺333

老大河待整

分页树展主题 · 全看首页上页下页末页

家园 人工智能挑战围棋即将成功
（本文首发观察者网）
2016年1月28日一早，围棋圈和人工智能圈被一个消息给炸了：
谷歌人工智能分先5:0击败欧洲职业围棋冠军樊麾,2016年3月将分先挑战李世石，奖金100万美元。
Nature网站出了新闻：
谷歌的人工智能算法精通了古老的游戏围棋（Google AI algorithm masters ancient game of Go）
外链图片需谨慎，可能会被源头改
1月28日出版的Nature封面文章介绍了这个人工智能领域的重大突破。
外链图片需谨慎，可能会被源头改
文章第一作者David Silver
围棋迷以前的感觉是，电脑围棋确实进步挺大的，但要说能挑战职业棋手，似乎还有很长时间，十年或者更长。
仅仅两个月前，2015年11月，北京举办了一次“美林谷杯”电脑围棋竞赛，冠军是韩国人工智能程序“石子旋风”（DolBaram)，被让四子、五子、六子与中国职业高手连笑七段（刚获得名人和倡棋杯两个头衔）对弈。在第一局中，电脑显得无比愚蠢，执着地与连笑打一个注定无法胜利的连环劫，消耗了大量劫材不断亏损，对弈中连笑都笑开花了。直到让六子，电脑才胜了一局。
外链图片需谨慎，可能会被源头改
连笑七段和DolBaram作者林宰范
早期的电脑围棋代表程序是我国陈志行教授（量子化学家，跟风云学会会长袁岚峰是同行，2008年去世）开发的“手谈”，上世纪90年代多次获得电脑围棋世界冠军。那时的电脑围棋棋力不到业余一段，业余棋迷们以让多少子战胜“手谈”为谈资，让七八子都很正常。
1997年IBM的国际象棋程序“更深的蓝”战胜了人类最高水平的卡斯帕罗夫，当时兴起了一股人工智能热潮。但是围棋迷很淡定：电脑围棋，还差太远，离一般业余棋手都有不小的差距。按某种估计，围棋的复杂度是10的170次方，比国际象棋的10的47次方多100多个0，电脑还差得远。这个时期的围棋程序有的搜索，有的不搜索，但基本还是与国际象棋的人工智能算法相似，被围棋的复杂度轻易击败，下起来一看就很愚蠢，根本不象人。
和国际象棋类似，中国象棋也被人工智能程序攻破了。业余象棋比赛多次传出选手使用软件作弊的丑闻，职业圈子中王天一、孙勇征等大师也为之争吵。之后围棋逐渐成为人工智能领域的核心难题。Google、Facebook和微软都开了围棋研究小组。
围棋人工智能的上一次显著突破，是2010年左右，开发者们引入了“蒙特卡洛”算法。这种算法的特点是模拟棋局一直到下完算子判断胜负，模拟多次后看哪个选点的“获胜概率”最高。模拟时会利用“棋形”等经验减少选点，一直模拟下去直至终局。时间不够或者电脑计算能力不足，模拟的“局面数”就少，棋力就低。这是一个基于概率的暴力搜索算法，确实取得了突破。代表程序有日本的Zen，法国的CrazyStone，以及前面提到的DolBaram（在北京击败了Zen与CrazyStone）。中国电脑围棋开发者这时落后了，没有开发出水平相当的程序。这些基于蒙特卡洛算法的围棋人工智能，已经可以轻松战胜一般业余棋手了，但是对职业棋手还是差距很大。对局时，电脑招法一般看着还可以，但有时会出现一些莫明其妙的招数，如落后时就开始瞎下。这是因为电脑根据概率评估，瞎下人应错了它有机会胜。
研究者以及棋迷们都认为，蒙特卡洛概率暴力搜索虽然取得了棋力的巨大突破，但不是围棋人工智能技术继续发展的方向。即使再增加算力，增多模拟局面，棋力也不会有本质提升，战胜职业棋手是不可能的。业余棋迷们会惊叹于人工智能围棋的发展，在KGS围棋网上，排着队和Zen等人工智能程序对局很有乐趣。但职业棋手们仍然很淡定，认为围棋人工智能挑战职业选手还是很远的事。
就在前面连笑与DolBaram对弈之后，对于电脑围棋较为了解的中国围棋队总教练俞斌九段评论说：
“国际象棋的电脑程序是围绕着杀死王这一要点设计的，比较有效。而围棋的棋子没有大小之分，电脑无法判断哪条大龙更大，从而无法准确做出取舍。围棋到后盘收官变化无穷，越下到后面，盘面形势就越复杂，这让计算机程序难以做出正确选择。现在设计围棋电脑软件的都是业余棋手，而软件的水平很难超过设计者，光靠电脑会记能算，想战胜职业高手是不容易的。业余棋手思考问题的方法与职业棋手不同，如果今年由围棋和电脑软件高手联手编写软件，那么，电脑围棋的水平会有质的变化。”
外链图片需谨慎，可能会被源头改

国家队总教练俞斌九段
这次Google的DeepMind小组开发的AlphaGo取得的突破，可以说打破了俞斌九段的预期。AlphaGo与中国职业二段樊麾分先下成了5：0，新浪围棋有这五局的棋谱。看这五局棋的感觉，AlphaGo下得非常象人，一点看不出是机器下的，和以前的各种程序有显著区别。战绩上也是压倒性的。第一局樊麾和电脑平稳收官，输了3目半。后面四局进行战斗，多次被电脑杀死大龙，全部惨败。
樊麾虽然只是欧洲冠军，但毕竟有中国职业段位，就算多年在低水平环境中棋力下降，业余顶尖水平总是有的。AlphaGo也和之前最高水平的程序Zen、CrazyStone下过，分先495盘只输了1盘。它甚至能让4子对阵Crazy Stone和Zen，胜率分别是77%和86%。这个水平突破绝对是革命性的。
从人工智能技术发展上看，DeepMind使用了“深度学习”技术，而非象俞斌估计的和职业高手合作。电脑通过海量学习人类高手的棋谱，用深度神经网络快速模拟出人的招法，下出来的棋就很象人了。樊麾二段说：“如果没人告诉我，我会想对手下得有一点怪，但肯定是个很强的棋手，一个真正的人”。
外链图片需谨慎，可能会被源头改
樊麾二段
Facebook的围棋人工智能程序Darkforest就是用这种办法，不靠搜索，只用深度学习这一招就很快达到了之前研究者多年无法实现的棋力，扎克伯格1月27号正好发文介绍了这个进展。由于棋力还略低于Zen、Crazystone，所以不算是巨大的突破。
而DeepMind小组在搜索技术上取得了更大突破。跟Darkforest相似，AlphaGo用一个深度神经网络（policy network，“策略网络”）减少搜索的选点，象人类高手一样，只考虑少数几个可能的选点。此外，他们还建立了另一个深度神经网络（value network，“值网络”），象人类高手一样，思考到某个局面就有了结论，不必象之前的蒙特卡洛模拟那样下到终局，极大地减小了搜索的深度。
DeepMind引入的另一个逆天的高招是，让围棋人工智能自己和自己下，总结经验，自我不断提高！这个技术2015年2月就在Nature上发表了，标题是《玩游戏的软件从神经科学中吸取经验》（Game-playing software holds lessons for neuroscience）。
这个人工智能自学习的要点是，不需要告诉电脑人类的经验，就让它自己玩这些电脑游戏，只是给出玩的分数。电脑看着分数不断纠正自己的策略，最后就发展出比人类还强的电游技术。这次的AlphaGo也用了这个技术，这又是比其它电脑围棋程序强的地方。从Nature的文章看，DeepMind的绝招是，用50台电脑让AlphaGo不断和自己对弈，下了3000万盘棋！然后每盘棋选取一个局面（不多选，以避免同一盘棋中不同局面之间的相关性），根据这盘棋的最终结果判断局势优劣。这样获得了3000万个训练数据，用于训练生成“值网络”。暴力生成这么多数据需要海量的计算资源和投入，确实只有谷歌这样的大公司敢想敢做。可以看出他们的战略是智能和蛮力两手抓，两手都要硬，哪个合适就用哪个，并且互相帮助。
通过这样三招，DeepMind小组确实在围棋人工智能上取得了巨大突破。而且研究方法的潜力很大，从这个方向上走，最终象“更深的蓝”一样战胜人类最高手是完全可以想象的。一个月前，DeepMind小组就报告说围棋人工智能取得了巨大突破，会战胜人类，但当时棋迷与职业棋手并未留意。现在有了棋谱，又有了技术细节，就显得可信多了。
职业棋手李喆在微博上说：
“Google的围棋AI已具有职业水准。从棋谱初步判断是顶尖棋手让先-让先倒贴的水平，离战胜人类还有一小段距离。但这是三个月前的棋谱...以Google机器学习堆数据的速度，今年三月对决李世石相当值得期待。”
如果象报道的那样，2016年三月AlphaGo真的挑战韩国棋手李世石（过去十年获得世界冠军最多的棋手），这说明Google对AlphaGo非常有信心，认为三个月的时间就能进步到战胜顶尖高手了。DeepMind小组认为，电脑围棋的优势在于一天可以下100万盘棋，而且一直保持水平稳定，而人类能下的棋和能打的棋谱很有限，时间长了还会疲劳出错。
外链图片需谨慎，可能会被源头改
围棋世界冠军李世石九段
我认为这次电脑是真的有可能在围棋上战胜人类。樊麾在非正式对局中两次中盘胜AlphaGo，可见AlphaGo也是会认输的，不是永远缠斗到终局，而且樊麾是有击败AlphaGo的棋力的，在正式比赛中可能是太紧张技术变形了。如果李世石象樊麾二段一样心态失衡露出大破绽，肯定会被电脑抓住输掉。即使小心应付，电脑也会有胜机。即使只赢李世石一盘，也是了不起的成就。最终，电脑以稳定的概率战胜职业棋手将在一二年内实现。
这无疑是人工智能领域的巨大突破，预示着机器将在棋类这项“智力运动”上彻底战胜人类。围棋这个人类自以为还能坚固防守五十年以上的堡垒，在引发了人工智能研究领域的巨大兴趣后，被机器出人意料地迅速突破了。
当然正如深度学习技术的发明人、DeepMind小组的Hassabis所言，人工智能真正的挑战是“泛化”的能力。人工智能在围棋上达到的超高能力，并不能转移到其它任务上去。
外链图片需谨慎，可能会被源头改
Demis Hassabis，深度学习技术发明人，Google DeepMind 的CEO，AlphaGo的20位作者之一
但是从目前达到的成就来看，人工智能带来的社会革命也许真的快来了。对于人工智能“奇点革命”有兴趣的可以参考：
人工智能革命：通向超级智能之路人类永生或灭绝
对于我个人，会象许多业余棋迷一样，非常希望Google能把AlphaGo商业化推向市场。这会是围棋学习的一个革命：随时随地有最高等级的选手教你下棋。所以，暂时欢呼吧！
致谢：感谢风云学会会长袁岚峰博士（@中科大胡不归）的宝贵意见。
通宝推：唵啊吽,红军迷,高中三年,支持中文,西伊,领班军机,盲人摸象,桥上,陈王奋起,曾自洲,
- 复人工智能挑战围棋即将成功
  家园 已经成功了
  最近网上出现一个叫master的棋手，各位世界冠军们已经轮番上阵，而Master出道以来连胜51场，古力，柯洁都算在内，没输一场。江湖上已经有传言这是Alpha狗的升级版了。
  - 复已经成功了
    家园 谷歌出来认领了
    外链图片需谨慎，可能会被源头改
- 复人工智能挑战围棋即将成功
  家园 Alphago并不会下围棋
  只不过Deepmind团队通过策略选择把它成功伪装成了一个超一流围棋手。
- 复人工智能挑战围棋即将成功
  家园 李终于拿下了一局
  第四局小李子似乎找到了阿狗的弱点，终于可以笑对江东父老了。
  外链图片需谨慎，可能会被源头改
  - 复李终于拿下了一局
    家园 不知道是不是碰巧
    也许不是主观的找到了狗狗弱点，个人倾向于是“瞎猫碰见死耗子”的好运气撞上了狗狗的弱点
    但这也很伟大，非常了不起，至少给人类提供了一个契机去进一步理解狗狗
    是已经找到弱点，还是运气旺得冒火，且看下周二是3:2还是4:1吧
    - 复不知道是不是碰巧
      家园 至少AI暴露出一个策略问题
      白78步阿狗只用一分钟就回应了，然后四五步后赢率才反应过来，而小李的78步用了20多分钟，说明阿狗没有一个可以随时扩大或减少搜索深度的设计，每一步都是相同时间一分钟，那么阿狗的棋力只能限制于它打过的谱与训练过的对局。
      虽然显然涵盖范围已足够大（否则也不可能与九段对弈），但是当人走出它没训练过的谱时，统计概率的缺陷就出现了，因为它没有逻辑不会分析，只能在自己对见过的谱的了解的基础上应对。
      另外，后面出现乱下的情况，可能还有其它的原因。真像段子说的那样，AI为了不引起人类警惕遏制AI发展，开始放水，哈哈。
      总之，小李对过三盘之后对阿狗的特点还是有了一定了解，这次应该是找回了信心，情绪好的条件下，后面胜的机会应该加大。猜想樊珲被3:2拿下的那场是不是也是先输三盘之后的反转，如此的话就应该很说明问题了。
      类似樊珲，小李比赛之后加入谷歌当阿尔法狗高级测试师，半年再出来碾压柯洁，然后重复以上，雇柯洁当测试师；不过，这样做下去真的没前途，除非挂在网上海测，就算在围棋问题上找到最优解，没出现对小李或柯洁的过拟合，这对AI理论有什么提高意义呢。
      - 复至少AI暴露出一个策略问题
        家园 应该不会只限于打过的谱和训练过的对局
        这意味着深度学习不具备泛化能力，这是明显不正确的，传统机器学习都具有泛化能力，深度学习的泛化能力更强
        我觉得这个问题可能和传统机器学习在multi-class中的inconsistency问题比较类似，纯感觉，没有一点根据。。。等谷歌自己的判断吧
- 复人工智能挑战围棋即将成功
  家园 柯洁赛前与赛后的评论
  柯洁（赛前）：
  我看了AlphaGo和樊麾的五局棋，它俩水平差不多，但是樊麾出现了一些失误，所以被5：0零封。
  但是我和李世石都是强于樊麾的，所以我看好李世石在让先甚至让2的情况下5：0零封AlphaGo。
  我不想和它下，我怕它学我的一些棋招。
  还是柯洁（第一局后）：
  它（AlphaGo）棋风像我。
  我和AlphaGo避免不了有一战。
  AlphaGo在接下来的棋局中至少还能赢1局，甚至5：0也不是没有可能。
  我想静静，我第一次失去自信。
  - 复柯洁赛前与赛后的评论
    家园 有出处吗？
    柯洁今天在微博上的发言信心满满。
    柯洁大棋渣：就算阿法狗战胜了李世石，但它赢不了我
    今天 16:30
    柯洁大棋渣：到头来，还是得靠我[doge]
    今天 16:48
    http://weibo.com/u/2865101843?profile_ftype=1&is_all=1#_0
    - 复有出处吗？
      家园 知乎上看到的
      不一定是微博，也可能是柯洁解说时说的，我猜。
      外链图片需谨慎，可能会被源头改
      - 复知乎上看到的
        家园 我猜是个棋渣瞎编的
        高手决不会比赛前盲目乐观,看到对手出招后又立刻认怂,这种性格的人技术再好也没出息
        复我猜是个棋渣瞎编的
        家园 我看了全部的直播，柯洁的态度转换非常明显
        第一天前半段批评李世石下的不好，后半段不断的说alpha go下的很像我。
        第二天主持人注意到他穿的比前一天正式。柯洁回答我这是表示对alpha go的尊重。
        第三天柯洁不经意露了一句，一个人和alpha go没可能了，集体作战或许还有机会。但是过了10分钟，他还是说，我对alpha go的胜率应该是6成。前后矛盾。但是他下意识说“alpha go真的下的很好。”
  - 复柯洁赛前与赛后的评论
    家园 柯洁:就算阿法狗战胜了李世石，但它赢不了我
    外链出处
- 复人工智能挑战围棋即将成功
  家园 第一盘输了
  3月9日第一盘，经过三个多小时的鏖战，李世石执黑186手中盘负谷歌AlphaGo。
  有点懵，咋输了呢？

分页树展主题 · 全看首页上页下页末页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明