如何评价AlphaGo 和韩国棋手李世石石的这盘棋,从棋力上分析

我的留言 加载中 &已留言&今天去公司加班,开始大规模抓取推~特数据的工作,抽空看了第三盘棋,这盘棋Alphago看上去没有任何问题,把巨大的优势从比较早就开始保持到最终李世石认输,这个时候我感觉李世石同学是绝望的,完全无法看到机器犯错误,即使机器走了一些“看不懂”的招法,也常常会引起李世石的长考,可见李世石对Alphago是完全重视的。第一盘和第三盘都显示出了李世石在布局阶段比较弱的问题,后面机器又不犯错误,最终看不到取胜机会只好投子认付。今天我想起我小时候下围棋,当时也没有互联网,找一个小伙伴下棋是很难的,只能自己对着棋谱打谱,揣摩各种变化。如何布局,如何战斗,如何做活,我相信聂卫平这一代的棋手都是怎么过来的。而网络发达以后,新一代的棋手比如古力,柯洁,他们从小就开始下网棋,可以快速和各种高手过招,解决了交流的问题,从而加速了学习的过程。到今天人工智能发达,再新生代的棋手可能就开始和机器下棋了。。那么我们再归纳一下这个过程第一代棋手:人和棋书切磋,和物切磋第二代棋手:通过互联网,和大量的对手切磋第三代棋手:借助智能机器,和智能体切磋整个演化过程其实可以适用很多领域,前不久看报道,说Alphago战胜了樊蕙以后,他和Alphago下了很多盘棋,水平很快。也看到报道说能参加高考的机器人很快也会面试。那么以后复习考试也可以借助智能体帮助提高解题水平了,人类的学习效率将会大大加快。我隐隐看到一个趋势,也许未来不仅仅是让&机器人去通过智能去完成一些具体的任务”,而是能够帮助人类提高学习速度。。这就是本文想表达的观点。(完)&【并行科技有限公司招聘 】北京并行科技股份有限公司是一家专注于高性能计算和大数据分析领域的高新技术企业。公司成立于2007年,坐落在北京市海淀区上地软件园二期,现有员工100余人,在天津武清公司之外,分别在上海、广州、成都、武汉、西安设有办事处。&并行科技立足于高性能计算领域,提供数据中心设计、运维、运营大数据采集分析、业务运行优化等全方位服务。2015年获得6000万元A轮融资,预计将于2016年4月底在新三板挂牌&公司待遇:15/17薪,五险一金,补充医疗保险,带薪休假等公司官网:简历投递:HR联系电话:010-&Android开发工程师/中高级/北京/2人职责:1.负责移动产品线Android客户端的设计与实现要求:1.2年以上工作经验,其中Android相关经验不少于1年2.精通Android常用组件与框架的使用并理解其内在机制,能独立进行功能开发3.有钻研精神,能独立解决技术问题&后端开发工程师(Java)/级别不限/北京/5人(接受在校生实习)1.负责各产品服务器端的设计与实现要求:1.精通Java语言,对后端开发常用基本概念(如并发,异步等)等有深入理解2.深入理解J2EE架构,熟悉常用数据库与中间件3.熟悉常用的数据结构与算法4.有高性能数据库应用开发或分布式系统开发经验者加分&Web前端开发工程师/中高级/北京/2人1.负责各产品Web前端的设计与实现2.负责移动端的Web页面以及混合App的设计与实现要求:1.3年以上Web前端开发经验2.精通网页前端开发常用技术(JavaScript、HTML、CSS等);3.至少精通一种前端MVC/MVVM框架(如AngularJS)4.熟悉移动Web页面相关技术或混合App开发者加分5.熟悉ReactJS,Node.js等新技术者加分(完)【网友来信】网友A:&虽然我不怎么懂围棋,我认为基于围棋的复杂性和棋力天花板,人类的围棋水平其实仍然处在一个比较低级的水平,哪怕是顶尖棋手(并无有心贬低的意思),经典的定式基于历史经验而非科学。故而,阿尔法狗下出的一些人类所认为的“失误”,也许多年后会被定义成新的定式而流行。从低级往高级的发展道路上,一定是需要出现个天才,用新的下法和理论才能突破没一个层级!就像道策开创了近代围棋,吴清源开创了现代围棋那样!而阿尔法狗这个“天才”把围棋同样带入了美丽新世界!我姑且把她称之为“量化围棋”时代!人工智能会“教”会人类其实在任何一个领域都很菜。。。这会让我们更好地认识自己,极大地促进人类在各种技术上的飞跃式发展,包括围棋!答: &求解概率这个事情很可怕,人其实大脑中也在不断计算“概率”,但人类推进的广度和深度和计算机没法比。电脑能对每一步棋的结果,用蒙特卡罗方法try无数种可能,然后算到一个终局的获胜概率,这个方法本身保证了很大概率能获得全局最优解,这也是为什么alphago好几次都能够弃子,脱先。这太可怕了。其他常见问题Q:如何在pennyjob投放广告A:我们暂时只服务码农的找工作需求和招聘广告发布。请联系编辑:&发布你们的信息 。&Q:本栏目担保的靠谱服务有哪些A:&详见:http://assurances.pennyjob.net/
看过本文的人还看过
人气:27715 更新:
人气:22913 更新:
人气:21427 更新:
人气:18179 更新:
job的更多文章
大家在看 ^+^
推荐阅读 ^o^
用妓女思维做电商(趣味干货)
真羡慕从来不发朋友圈的人,因为…
阿玛尼都宣布零皮草了!看看皮草产业的可怕利润,别说你还惦记《小时代》中26万的貂!
赌王女儿之传奇:4妻17子女的争夺战,一个女文青的另类胜利
猜你喜欢 ^_^
24小时热门文章
微信扫一扫
分享到朋友圈AlphaGo逆转李世石:机器本性战胜人性弱点
[摘要]李世石表示,没想到会输,一开始犯的失误一直伴随到了最后,成失利主要原因。
腾讯科技 雷建平 3月10日报道3月10日,人机世纪大战迎来第二场较量,这场较量注定会备受瞩目。在此前的3月9日,人机世纪大战第一场结果出乎大多数人的意料,()人工智能系统AlphaGo竟然在局势不利的情况下,挑战世界围棋冠军李世石成功,李世石则投子认输。很多人认为李世石故意放水,李世石则在随后的发布会中表示,“比赛中有两件事让我吃惊,一个是AlphaGo开局下得非常好,第二个是在比赛过程中不断有一些令我想不到的下法。”李世石说,“我没想到过我会输。我觉得我一开始犯的那个失误一直伴随到了最后,成了我失利最主要的原因”。创新工场CEO
正在加载...
[责任编辑:loiswang]
您认为这篇文章与"新一网(08008.HK)"相关度高吗?
Copyright & 1998 - 2016 Tencent. All Rights Reserved
还能输入140字本题已收录至知乎圆桌 >> ,更多关于李世石对战人工智能的解读欢迎关注讨论。相关问题:
这一切的一切,还是得先从AlphaGo的原理讲起。----------- AlphaGo的原理 -----------深蓝战胜卡斯帕罗夫靠的是什么?国际象棋的棋力源于你能在当前盘面上往下推演多少步棋。深蓝利用在当时超强的计算能力,能比人类冠军多推演2-3步,这是它最终以“3.5比2.5”取胜的法宝。随着计算机能力的发展,如果放在今天,哪怕对手是一部手机,人都没有任何的胜算。那么围棋呢?围棋不一样的是,变化太多了,每一步棋可以有多达300多种选择。仅仅推演6-7步,就已经是现在计算机所不能及。所以,用深蓝的套路来下围棋是行不通的。下围棋,很重要的是“感觉”,即便是人,在很多场景下都要靠感觉来决定下一步往哪里走。这种“感觉”,靠的是智力。AlphaGo基于当今最领先的“深度学习”技术,来建立机器的智力。当前的这种人工智能技术,是一种仿生学技术,运用数学模型去模仿人类的大脑。这种机器大脑,在面对棋局时也可以“感觉”出情势的好坏。而“感觉”的好坏体现的就是智力水平。那么,智力水平怎么比拼呢?通常我们数“脑细胞”的数量。就像人的脑细胞比狗多,所以人比狗聪明;狗的脑细胞比蟑螂多,所以狗比蟑螂聪明。4年前,Google就研发出了一个脑细胞数量达到百万量级的大脑Google Brain,能识别出猫脸。为此Google动用了1000+台服务器,如果以每台服务器10,000人民币来计算,就是10,000,000人民币的投入。如果要让机器大脑更聪明怎么办?一个直接的办法就是,增加服务器,例如我把服务器数量增加到10,000台,脑细胞数量就能增加10倍,机器大脑就更聪明了。所以,AlphaGo有多聪明,主要看它有多少“脑细胞”。“脑细胞”的数量和它投入了多少计算资源是正相关的。----------- 花多少钱可以让计算机和人一样聪明 -----------这主要看人的脑细胞有多少。通常认为人脑有数百亿脑细胞,比当年的Google Brain多10,000倍以上。由此计算,要达到或接近人的智力,大约需要10,000,000+台服务器。按每台服务器10,000人民币计算,以2012年的计算机硬件能力,如果Google能投入100,000,000,000人民币的硬件成本,就可以做出和人一样聪明的机器大脑。如今,随着软硬件技术水平的提升,这个投入可以降低一个数量级。----------- AlphaGo的有多厉害 -----------AlphaGo的智力水平肯定是不如人的。虽然时过进迁,Google能投入的硬件资源应该至少数十倍于当年了,但仍然不可能达不到当年10,000倍。从第一盘比赛中,也可以看得出来,李世石在开局和布局是占有优势的。不过超出我预期的是,这种优势居然不是特别大,看来Google这次在计算资源上也是投入血本了。可是,第一盘棋下完,更让人感到害怕的却不是AlphaGo的棋力,而是它的没有情绪、不知疲倦、沉着冷静。这与AI无关,是机器的本性。情绪、体力、心理波动等人性弱点对棋局结果的影响不可低估。事实上,李世石并不输在棋力,而是输在获得优势以后的轻敌,以及之后所犯的错误。----------- 李世石还有机会吗 -----------双方对比来看,李世石比AlphaGo聪明,棋力更深厚。AlphaGo比李世石情绪控制更好,它不会紧张,不会嘚瑟,不会沮丧,也不会体力下降。李世石面对的其实是一位棋力比他稍差的忍者。好在,他是占据主动的一方。在棋力占优的情况下,只要不犯错误,是可以立于不败之地的。即便第一局失利,综合来看,我仍然看好李世石。和AlphaGo对抗时,人类需要注意的是。AlphaGo所基于的人工智能技术,强项不在于推演,而是借鉴过去见过的局面。所以,如果要击败AlphaGo,需要尽可能把局面导向历史上没人下过的棋。此外,围棋的边角战斗靠计算,中空战斗靠感觉,所以人类一定要尽量把胜负手留在棋盘中间(或许古力、武宫正树更适合pk AlphaGo?)。一旦进入到局部缠斗,尽早将局部肉搏战打完,不要留出大量小区域短兵相接的局面,保持局面尽可能大开大合。此外,需要格外小心的是,一定要克服自己人性的弱点。局面领先时,避免骄傲;落后时,避免气馁;胶着时,避免紧张。李世石如果能在后面几局注意控制自己的心魔,相信后面还是有很大机会可以搬回。总的来说,要战胜AlphaGo:1. 准备一些历史上没下过的布局;2. 把胜负手留在棋盘中间;3. 不留短兵相接的局面; 4. 控制自己的心魔。还有一点,可能是李世石犯的错误,但已无法改变了。据说,他要求下快棋。AlphaGo系统的分为两个部分,一是学习,二是对弈。其中,学习的部分是最耗时间和资源的,而对弈部分相对计算没那么大。要限制AlphaGo,应该要限制它的学习时间,而不是对弈时的思考时间。特别是,对于AlphaGo这样的分布式系统,Google完全可以通过增加一倍服务器数量来让落子速度倍增,而李世石是不可能给自己的大脑扩容的。其实,最好的限制AlphaGo的办法是尽早与他对弈,不让他继续学习下去 :)——当然,说这些已经晚了。————— 如何看AlphaGo -----------从今天双方在棋力上的差距来看,差距已经不是很大了。只要Google愿意投入目前5-10倍的资源,AlphaGo的棋力应该可以超越人类了。我想,随着技术水平的提升,和投入的加大,大概只需要1~2年,AlphaGo在棋力上应该也可以超越人类。写到这里,我其实还是很羡慕AlphaGo团队的科学家的,他们有一个很好的sponsor,能给他们一个环境去完成一件划时代的壮举——我何尝不想拥有这样的环境。不过,后来我也想明白一个事情。其实我们的大环境缺的并不是有理想有抱负的科学家,而是sponsor。所以真正挑战人类的其实是IBM,不是许峰雄;是Google,不是DeepMind团队。就像,真正修成圣彼得大教堂的,是天主教会,而不是米开朗基罗。商业的成功,带动科学的成功,在数据和人工智能的时代尤为重要。
和小伙伴一起从演播室出来,心里空空落落的。&br&今早我还在朋友圈说,这将是一个新时代的开端,让我们一起来迎接吧。&br&整个比赛直播过程中,我们也始终很轻松,但当最终的结果出现后,心还是慢慢的沉了下去。&br&这将是伟大的一天,虽然甩下了一些落寞的身影。&br&&br&理性上,大家都知道进步的意义。&br&也都知道长远来看,人工智能的发展不仅对人类生活的方方面面都有积极意义,对围棋本身也是利大于弊的。&br&更知道人工智能战胜人类顶尖棋手,这一天早晚会来。&br&可是当这个事实摆上桌面之后,大家感情上都还是有一丝失落的。&br&&br&从棋局来说,这是一盘精彩的对局,但算不上一盘高质量的对局。&br&双方都出现了不少的失误,李世石的更致命一些。&br&大家在赛前都认为李世石在第一局会求稳,而可能在赢得三盘之后才会行险挑战。&br&我们错了。&br&李世石第一局开局就采取了极为冒险的下法,而被很多人解读为“为了避开电脑的棋谱库”。&br&&br&黑棋错小目配上中国流靠下一路拆边的下法,是两种常见布局的糅合,但这糅合体是一个非常不常见,给人感觉也不见得高效的下法。&br&右上定式中,白棋托角是常见的定式错着,然而李世石却没有选择简明的脱先拆左边,而是强行大飞起来后手捞空,坐等AlphaGo打入上边。这颇合李世石的性格和棋风。&br&可打入的结果大家都看在眼里:黑棋极为被动。甚至很多人当时认为,李世石已经崩了。当然,也有高手经过精确计算后认为,后面的变化黑棋并不差。&br&后来来看,这是李世石开局刻意的冒险,在试探电脑。&br&&br&此后,李世石开始“认真”下了,形势快速的接近了,黑棋越来越主动。&br&黑61原本走在下一路的长,控制住外侧的大局就行了,后面黑棋将越来越主动。然而李世石选择了61的尖,瞄着上面两个子的向下跳靠,意图拿住一个田字斜对角的棋型,将来靠过来之后白棋无法扳头。然而这步尖可能过于贪心了。&br&被白棋长了之后64尖住,黑棋根本就没有机会动出上面两子......&br&当然这问题不大,黑棋此时仍然稍稍有利。&br&&br&白棋一路后推车推至下边,黑棋抢到先手本可抢先于下侧拆边,然而李世石选择了完全不符合自己性格的稳健的枷死棋筋。&br&且不说这步枷的好坏,此时黑棋局面仍然绝对不差。&br&此时AlphaGo走出了80位的长,补尽了上边的味道。这是一步大缓手。&br&黑棋左下双飞燕夹击之后,胜负的天枰已经明显的倾向于黑棋了。&br&&br&白102,是AlphaGo在不利局面下释放出的精彩的胜负手。&br&而白108,是更精彩的手筋,这体现了电脑在局部战斗中精准的计算。&br&白110飞之后,局部黑棋大致已经无法避免亏损。&br&此后黑121于右上后手吃一子也有缓的嫌疑,李世石明显还惦记着白棋大龙。&br&而白122是争议很大的一手。&br&&br&很多人当时认为缓了,也有很多人说像是好手。这步棋如果是由人类下出,有胜利宣言的感觉。&br&此后的黑129拐而不是挡三三,几乎让我们所有人惊掉了眼球。&br&事后至今,仍然有很多人认为这步棋很可能是黑棋最后的败着。&br&只要挡三三然后尖二路,黑棋要么先手收官,要么局部虽是后手却官子便宜甚多。这可能优于此前按照尖顶扳粘的方法收束。如此黑棋应该仍然有盘面十多目的优势。&br&白142挡住显然是错着,按照柯洁的分析,只需跳在一四,黑棋就可能在局部落后手,否则将来白棋有扳了断,救出上面三个子的手段。&br&如果AlphaGo下出这个手段,李世石将输的更快。&br&&br&后面黑棋始终将左边看的很小,而在下面和左下走棋,不知道是为什么。&br&但白棋抢到左边的拆二和四路尖,怎么点目也更大。&br&后面没什么可说的了,棋局早已结束,盘上留下的空间很小了,在电脑精准的官子面前,李世石无力再次翻盘了。&br&有些人说,电脑其实一直觉得自己形势占优,只不过人的判断是错的。&br&这种想法直接推翻了人类几千年在盘上的积累,令人细思恐极,但应该是想多了。&br&棋理是摆在那里的。&br&&br&总的来说,AlphaGo展现出了职业的水平,但还称不上达到了碾压人类的水平。&br&李世石的下法也称不上发挥失常,但也确实下的不好。&br&然而不管怎么说,这对人工智能来说,都是一盘堂堂正正的胜利,阴谋论的说法必将一时大行其道,但意义不大。&br&&br&说一下大家对AlphaGo的一些观感和评价:&br&它始终按照自己的节奏,将棋走在自己认为最大的地方上,丝毫不被对手的节奏所带动。&br&冷冰冰的,没有一丝情绪。这正是电脑最强的一点。&br&前半盘来说,AlphaGo的水平还达不到顶尖职业的水平,在复杂的全局攻防和判断上,它还有很大的提升空间。&br&而进入后半盘,只要空间缩小,电脑就显示出了极其强大的实力。&br&局部战斗的精准手段,局部官子的精准收束,准确的形势判断和全局收束选择,失误的低发生率,使得AlphaGo成为了“一名后半盘显著强于前半盘的棋手”。&br&李世石,不知道是否想到和重视了这一点。&br&&br&赛前,我曾认为结果会是4:1,而那一盘胜局就将是新的历史开启的标志。&br&现在看来,我仍然相信李世石能赢得比赛,但比分也许不会这么悬殊了。&br&客观来说,通判全局,AlphaGo的实力仍然要弱于李世石,但差距没那么大,李世石的任何冒险和失误都可能遭到电脑的严厉惩罚。&br&而从人的心态上来讲,这不是一场均衡的比赛。&br&李世石赢了不算什么,可他输任何一局都会造就历史。&br&&br&一盘过去,李世石的应激反应应该强于电脑,后几盘棋里李世石的处境应该比今天要好一些。&br&但我们都知道,这一次的赛果只是暂时性的。&br&即使李世石后几盘中更加认真起来,最终取得了胜利,也如柯洁所言,AlphaGo现在不是他(柯洁)的对手,然而几个月后呢?一年后呢?&br&李世石如果落败,AlphaGo的下一个挑战对手一定是柯洁。&br&而下次比赛时,柯洁面临的AlphaGo,可就不是今天的AlphaGo了。&br&一两日间,人的应激学习速度快于电脑,可是在现在的技术条件下,给人工智能几个月的训练时间,人是无论如何也赶不上的。&br&&br&AlphaGo对李世石的挑战,不是一次单一的挑战,而是开启了人工智能在围棋盘上不断挑战人类的过渡期,直到人工智能彻底超过人类为止。&br&这是新时代的开启,而旧时代却不会一下子落幕。&br&从情感上来说,我们都希望这过渡期可以长一些,人类抵抗的久一些。&br&然而这过渡期却以人类的一场失利开启。&br&也许这过渡期比大家想象的要更短了。&br&&br&二十年前,卡斯帕罗夫在第一次接受“深蓝”挑战时,也是在第一局比赛中因行险试探电脑而输掉了。&br&赛后的晚上,他在散步时忧心忡忡的问助手:“如果那玩意儿是不可战胜的该怎么办?”&br&当然众所周知,第二天起他奋起心力,最终战胜了电脑。&br&可他也只多坚持了一年,次年他就被击败。&br&历史会重演吗?还是,人类在围棋盘上挣扎的时间更短?&br&&br&我的朋友圈里,已经被“信仰崩塌”刷了屏。&br&大家都知道这一天早晚会来,可是单局的落败,到来的太快了。&br&理性上值得高兴,感情上却禁不住难过。&br&今天结束后,一起走在街上,聊起各自童年的梦想,和那些拼搏与坚持。&br&落寞之余,心头一片空白。&br&&br&我们不仅仅在见证着,甚至可以说是在亲历着历史上的重要时刻。&br&可这见证,真的好艰难啊。&br&&br&明天还得直播,大家打起精神来吧。&br&此时此刻,我真的庆幸自己没有接各种出镜的邀请,不用在摄像机前遮掩自己的感情。
和小伙伴一起从演播室出来,心里空空落落的。今早我还在朋友圈说,这将是一个新时代的开端,让我们一起来迎接吧。整个比赛直播过程中,我们也始终很轻松,但当最终的结果出现后,心还是慢慢的沉了下去。这将是伟大的一天,虽然甩下了一些落寞的身影。理性上…
关于今天alpha go的获胜,看到一个有趣而且可怕的观点:&br&alpha go 的蒙特卡罗树遇弱则弱,遇强则强;胜率很大时,取胜可行解多,则AI会随意选择一个可行解,从而走出“俗手”;而双方均势时,取胜可行解少,就会打出力挽狂澜的神来之笔。所以如果AI走棋“失误”,就说明你已经输了。&br&这就是为什么今天在李世石使用罕见开局时,alpha go开始表现一般,而当后来李世石认真起来慢慢逆转却被alpha go中盘102手,108手和110手以神来之笔奠定胜负,最后胜负已定时alpha go 122手又打出小失误。&br&如果真是这样的,最后alpha go以5:0取胜也就不奇怪了。&br&&br&===================重新看完nature论文的分割线===========&br&论文原文的方法也验证了这个观点:神经网络在fine tuning阶段使用的是win or lose作为分类输出,而不是输赢的目数。&br&细思恐极……&br&&br&===================来自评论区的补充==============&br&之前欧洲一战也体现出这个规律,同样以一种非碾压的方式取得5:0完胜。&br&&br&朋友圈有人庆幸,还好AI没有为了避开人类注意而佯输,naive。AI的做法更厉害,就是只赢你那么一点点…&br&&br&当全世界人类都在惊讶alpha go在四个月中的进步时,alpha go却一脸蒙蔽地说:我一直都这么厉害啊&br&&br&==================论文链接================&br&要论文的朋友实在太多了,所以就不一一邮件回复。感谢评论区 &a data-hash=&c000dd40755a4fecedf8ad23& href=&///people/c000dd40755a4fecedf8ad23& class=&member_mention& data-tip=&p$b$c000dd40755a4fecedf8ad23&&@Zhaoyuan Zhang&/a& 给出的论文链接&br&&a href=&///?target=http%3A//www.willamette.edu/%7Elevenick/cs448/goNature.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&willamette.edu/~levenic&/span&&span class=&invisible&&k/cs448/goNature.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&
关于今天alpha go的获胜,看到一个有趣而且可怕的观点:alpha go 的蒙特卡罗树遇弱则弱,遇强则强;胜率很大时,取胜可行解多,则AI会随意选择一个可行解,从而走出“俗手”;而双方均势时,取胜可行解少,就会打出力挽狂澜的神来之笔。所以如果AI走棋“失…
已有帐号?
无法登录?
社交帐号登录&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp&&nbsp
当前位置: > 深度解析:李世石首局两大策略与AlphaGo的弱点
深度解析:李世石首局两大策略与AlphaGo的弱点时间: 09:05:50来源:搜狐体育
  这必将是载入史册的一天。人机围棋巅峰大战第一局,人类输了。
  赛前的预测,棋界绝大多数认为李世石必胜,科技界则大约是两派各半。认为李世石必胜的一方并非全都是出于傲慢无知,更多人不能相信的只是――这么快。科技界也有很多人了解算法之后认为AlphaGo还不足以战胜人类。从去年10月的五盘棋谱,到谷歌公开的论文,人们认为围棋AI仍然存在弱点,存在不能在这么短的时间内解决的问题,而这些问题将会导致AI在巅峰对决中失利。
  然而,李世石输了。
  关于这盘棋,会有很多解读。不止在今天,甚至在数十年之后,这盘棋还可能会被拿出来研究,从棋谱上,更从人机不同的思维上。不论未来回看这盘棋的是人类还是真正有了自我意识的AI,想必都会有与当下的我们不同的感受。而我们有义务把我们的感受和思考记录下来,让后人知道当时的人究竟是如何理解这盘棋,他们有哪些错误的认识、可笑的想法,又有哪些深刻的洞察。
柯洁李世石围棋2016年1月,围棋柯洁胜李世石视频,,李昌镐李世石决赛棋谱,李世石对柯洁最新棋谱,天元围棋柯洁对李世石,,alphago李世石,围棋讲解孔杰对李世石,聂卫平李世石对局棋谱,,围棋高手评价李世石,时越对李世石围棋视频,  我们来看看,今天这盘棋,究竟发生了什么。这盘棋可能将是有史以来职业棋手最难以统一意见的对局,以下观点是我个人见解,只是在围棋AI时代毫无预兆迅猛而来时,一名棋手尽可能理性的分析和思考。
  一、李世石的针对性策略
  从棋谱来看,我认为李世石在这盘棋前后主要使用了一个试探,和两个策略。
  1)试探:从未出现过的布局
棋谱复盘人机大战
  李世石第7手,没有按常规布局在上边连片,而选择走在右边。李世石自己在职业比赛中从未使用过这一开局,甚至整个职业围棋界,没有人见过这一开局。
  李世石不按常规布局,显然是对电脑的一种试探。在去年10月AlphaGo对樊麾的五盘棋中,所有开局都是常规布局,虽然那五盘的开局在今天已经不是主流,但都是曾经流行一时的布局。
  避开流行布局,甚至避开曾经流行过的已经被淘汰的布局,选择一个从未出现过的布局。李世石在考验AlphaGo在布局阶段的应变能力。我们知道AlphaGo的深度学习基于大量已有对局的数据,那么,面对一个棋谱库里从未见过的布局,AlphaGo你将如何应对?
  AlphaGo给出了完美的回答。
棋谱复盘人机大战
  白8挂角正常,黑9二间高夹最为激烈。白10,这一手&&非常出色。
  通常情况下,在右上白8遭遇二间高夹的时候,白10是“不存在”的一手,它不在任何定式之中。面对黑9,白棋有诸多定式选择,却没有白10这一手。
  然而,我认为白10是好手。
  白10的好处在于使黑7变成效率低下的一手,虽然在右上局部白棋稍稍亏损,但加上黑7的低效,白棋一点也不吃亏。
  AI竟然会通盘考虑!传统的围棋AI,会根据已有棋谱来走定式,定式是经过长期检验的局部双方可以接受的定型。然而定式的弊端就在于,不同的周围环境,定式的适用性有所不同。从这盘棋来看,黑9夹击之后,白棋如果选择面对二间高夹最常用的“妖刀”定式,即走在15位,反而将使黑7的位置成为绝对的好点,黑7的效率将会大大提升。
  实战白棋选择了一个定式里没有的、局部稍亏的、却使得黑7这个遥远棋子的效率变低的下法,非常清楚地证明了两点:
  电脑不依靠背谱来下棋
  电脑的考虑基于全局而非局部。
  当然,第一点其实在对樊麾的棋谱中已经可以看出来。在对樊麾的常规开局中,AI出现了数次不同于“谱着”的下法。其中有一盘出现“大雪崩”定式,电脑选择的次序是定式和棋谱里没有的,而且是从逻辑上不如谱着的。注意,这里强调是逻辑上不如谱着,而不是在经验上。即,AI当时的次序是“绝对弱于”谱着,只可能亏没可能便宜,虽然选点是正确的,但在我们看来是“次序错误”。这体现出,AlphaGo不依赖于定式和谱着,但也暴露出AI在逻辑上的不足,反应在棋盘上就可能会出现次序错误。这一点,也是棋手普遍不看好AI能战胜李世石的一个原因。
  但这一问题在这盘棋我们并没有看到。起码,没有非常明显地显现出来(后面会提到一个细微的类似问题)。
  而第二点则是这盘棋AI开局给我们秀出的能力。他轻易摆脱了李世石设下的定式圈套,以全局的视野作出了定式中不存在的选择。
  如果说第一点是我们在AlphaGo对樊麾时已经能够看到的情况,那么第二点则是这局棋在布局阶段对人类试探的完美答复。如果只依靠大量棋谱堆砌出来的局部图像识别,AI做不出这样的选择。
  2)策略一:开放式复杂局面
  李世石第一次试探得到了AI的完美答复,然后李世石使用了他的一个重要策略。从局后来看,正是这一策略导致了李世石局面的被动,但在赛前,我们并未想到这一点。
  我们不知道李世石在赛前有没有接受人工智能领域专家对Alphago算法的分析,但从李世石采取的策略来看,他显然有非常强的针对性。
  我们知道,深度学习在围棋盘上的主要作用是大量剪枝,通过价值网络和策略网络,将搜索的空间大幅减小,形成“棋感”。在这个基础上,再辅以传统的蒙特卡洛算法做搜索计算,最终确定落子的选择。围棋中存在一些封闭的计算空间,比如局部的“死活题”,对于AI而言可以通过穷举来遍历每一个选点,从而完成计算,得出落子点。但围棋中更难的部分是开放式的复杂局面,每一处的不同选择都会波及到其它地方,所谓“牵一发而动全身”。而这种局面头绪繁多,可供思考的选点很多,不同选点之后变化的深度和广度都很大,并且往往一个细微的计算失误会导致整局棋的彻底失败。对于职业棋手而言,这种局面正是最难把握的局面之一。
  赛前有人猜测,AlphaGo的剪枝面对开放性复杂局面的效用将会降低,而搜索的深度广度和准确度要求又使得AI不能依靠蒙特卡洛算法达到精确,因此这很可能是基于深度学习和蒙特卡洛的围棋AI的一个弱点。
  不论李世石是否了解到这些,总之他使用了一个策略:迅速导入开放式复杂局面。
棋谱复盘人机大战
  这里不做过于具体的技术分析。李世石第23手靠,和第27手挡,将局面导向了开放式复杂局面。原本李世石有更为柔和的选择,但他选择了最为强硬的下法。我们看到,AI的白24、26、28是非常敏锐的战斗嗅觉,完全没有避战。
  从我的经验来看,这个战斗是由黑方挑起的,而黑方挑起战斗的时机并不成熟。在势均力敌的对局中,我们往往会试图在认为有超过50%成功率的时机选择战斗,只是棋手有力战派和稳健派的分别,力战派对于战斗的判断会更为乐观一些。
  李世石是偏力战的棋手。但在本局中,这一开战时机仍然是过早了,可以说是立足未稳时冲向了敌营。我相信在对手是人的情况下李世石通常不会如此选择,他会寻找一个更合适的时机展开战斗,而且他本身就是一个极为擅长寻找战机的大师。
  但是他选择了不等布局结束,直接开战。
棋谱复盘人机大战
  至此,形成了六七块棋互相纠缠的局面,头绪非常之多。这是典型的开放式复杂局面。
  仔细观察可以看到,AI是有机会避开这种局面的。
棋谱复盘人机大战
  白42手可以选择在1位这里贴吃,选择吃掉中间两子,弃掉上边三子形成转换,如此便会避免复杂的战斗局面,形势也并不落后。
  但实战白棋选择把上边三子跳出,形成混战局面。这是更强的下法。
  那么,在进入开放性复杂局面之后,AlphaGo的表现如何呢?
  答案是,非常好。
棋谱复盘人机大战
  下午我和俞斌老师一起做现场直播时,同步进行至此,俞老表示担心白棋上边二路立一个先行搜刮,趁黑立足未稳先赚取利益。话音未落我们就看到AlphaGo下出了这一步。
棋谱复盘人机大战
  这步靠,本身似乎是“不成立”的,因为黑棋可以轻易地征吃白棋。这一步是业余棋手绝难想到的下法,因为白棋右上自身正处于防守状态,顺着往下贴是本能下法。然而AI下出这一步,在防守时反手一击,包含了弃子整形、试问应手等诸多人类理解的含义。
棋谱复盘人机大战
  诚然,黑棋可以很轻易地吃掉白棋靠出来的这个棋子,但代价是黑1的俗手打吃和白4的先手便宜。职业棋手能够很容易地看出白棋送一个子整形是有所便宜的,但AI也能轻松地做出这一判断,并且在防守时有此“意识”,真的很神奇。
  当然,对于跨断送吃这步棋究竟是否“好”,棋界并不能给出十分确定的统一答案。但是AI下出这步棋,仍然是对其能力的展现,起码认为AI不会主动弃子、不会防守反击的论断可以休矣。
棋谱复盘人机大战
  棋局至此,其间的进程在这里不做技术细节上的评论。简而言之,面对开放式复杂局面,白棋处理得井然有序,该弃的弃,该取的取。李世石的第一策略宣告失败。
  这证明了,基于深度学习和蒙特卡洛的围棋AI面对“开放性复杂局面”时的能力并未如设想般下降,反而应对得法,在李世石挑起不利战斗的情况下取得了局面的领先。
  李世石或许意识到了这一策略并未奏效,于是迅速调整,进入了第二策略。
  3)策略二:胶着的细棋局面
  事实证明AlphaGo并不惧怕复杂的战斗格局,于是李世石选择及时收手,试图将局面导向细棋。
  细棋局面下,要求双方在每一处细小的地域争夺上都尽量做到极致,一两处的失误虽然不会造成大片伤亡,但常常足以致负。
棋谱复盘人机大战
  第77手,这是李世石第二策略的开始。这手棋宣告停战,进入胶着的细棋状态,比拼后半盘的功力。如果不选择停战,李世石可以考虑直接在左下挂角,引诱白中腹两子逃出,进而继续战斗。
  但李世石认为第一策略的试探已经完毕,没有奏效,因此选择了第二策略。
  接下来的棋局,我们转换一下视角,从AlphaGo的角度来探究。
  二、AlphaGo的争议着法
  关于AlphaGo在此局的表现,棋界比较一致的观点是从布局到中盘的激战白棋下得很好,分歧点主要在对AlphaGo在后半盘的表现。
  1) 缓手?
棋谱复盘人机大战
  第一个焦点是第80手。上一手黑棋刚在下边挂角,白棋正常的下法是在左边跟着守一步。但实战白棋选择脱先,在左上补了一手。
棋谱复盘人机大战
  黑棋上一步没有选择在左上马上行动,是认为这样直接作战并没有把握。实战先在下边挂角,稳住实地,再作图谋。
棋谱复盘人机大战
  面对左下挂角,局部跟着应一个是最常见的下法。但黑棋在确保了下边的地域之后,左上可能会选择现在2位迂回,如果白棋毫不退让,那么6位再战出相当严厉。如果白棋退让,黑棋可以得到左上的角地。这里具体的定型变化并不容易得出结论,存在不少分支。
  实战白棋选择了脱先补左上,左下黑棋得到“双飞燕”作为补偿。至此,对棋局的判断出现分歧。做直播的棋手中,有一些认为此时已经是黑棋优势,白棋上一步补棋是大缓手。也有人认为白上一步虽然缓,但形势还是白棋不错。
  上一步究竟是不是缓手?我们这里先不做结论,往下看。
  2) 恶手?
  下一个焦点在第86手。
棋谱复盘人机大战
  白86断,又是棋谱里没有的下法。不过对局至此,我们对此已经并不惊讶。这步断的意图对人而言很好理解,由于黑棋右边很厚,白棋想通过弃子整形,使黑棋的厚势变得重复、效率低下。从人的角度来看,这是白棋最明显的意图。
棋谱复盘人机大战
  实战结果,棋手普遍认为左下白棋亏损,并且是严重亏损。这是因为,黑棋围住了一大块空,白棋实地受损。
  普遍推荐的变化是这样,白棋在确保自身安全的同时尽可能缩小黑棋的地域。有人认为,这样的进行白棋比实战“便宜一个贴目”,也就是六七目。如果是这样,实战白棋的选择亏损严重。
  但是,这个图存在一定的风险,关于这个风险我们留到后面来说。
  三、载入史册的一手!
  左下定型结束,人类棋手普遍产生乐观情绪:李世石优势,AI也不过如此嘛。
  然而,接下来的AlphaGo的一步棋成为了此局最为闪耀的明星。
棋谱复盘人机大战
  白102,右边三路点!
  这一手必将载入围棋的史册,与古今诸多妙手共同谱写灿烂的篇章!
  在未来的AI棋谱中,必将留下非常多震撼人心的妙手:它们或许比这一手更加精妙,或许比这一手更加深奥,但它们都无法取代这一手在围棋历史中的位置!
  此手完全出乎了李世石的预料,他面对这一手,进行了全局唯一一次长考,仍然遭受重创。
  在直播时,也有职业高手在白棋下出这一步之前已经预测到这一手。但是,对于人而言这里有一件非常有趣又苦恼的事情:对局者对于对方这种着法的预计往往不如观战者。
  这是因为,观战者可以很轻松地站在双方的立场来思考棋局,为双方寻找最强的着法;而对局者更多时候是在思考自己的着法,相较而言会容易忽略对方隐蔽的强手。李世石如果预料到这一手,或许会在之前找机会刺一下作为防备。但作为对局者很难有如此周密的行为,尤其在面对AI的时候,更难想到电脑会有如此强的手段。
  更有趣的是,这一手包含了相当大的计算量,有不少需要计算的分支,如果是人来下,即使能想到这一步,离真正算清楚并下出来还有不小的距离。也就是说,即使人类看到这一步,也要通过大量时间的计算来验证这一步是否成立。然而,电脑下出这一步,并不比其他的着法用时更长,相反比后面一些人类看来简单甚至必然的着法用时更短。
  我们不禁要问:AI真的都算清楚了吗?
  AI、真、的、都、算、清、楚、了、吗??
棋谱复盘人机大战
  实战的结果是这样,白棋右边先手割下黑棋三子,回到左上守角。顺便提一句,这里守角的手法值得注意,大量棋谱以及多数棋手的第一感都会走在旁边一路,但只要仔细看一下就会发现,此局面下实战AlphaGo的选点更好。
  棋局至此,我认为已经是白棋稍优的局面,但也有人认为仍是细棋。
棋谱复盘人机大战
  实战黑棋123手以下明显亏损,如图尖顶活角优于实战。但此图究竟谁胜,还需要深入的仔细研究。我个人的意见是,白棋稍优,并且我猜测AlphaGo也认为能赢。
  黑123以下在目数上亏损了接近一个贴目,使得棋局直接失去了悬念。最终双方盘面接近,李世石无法贴目,投子认负。
  我们惊异于AlphaGo的表现,惊叹于李世石的败北。对于接下来的比赛,很关键的一个问题是,AlphaGo究竟有没有失误?
  四、AlphaGo的“失误”
  这盘棋AlphaGo有没有失误?
  令人欣慰,从人的眼光来看,我们可以找到AlphaGo的明显失误。这种失误不是指那种基于人类经验而认为的失误(经验有可能会骗人),而是可以通过逻辑分析来确认的失误。
  1)“失误”一:
棋谱复盘人机大战
  白136手吃。对于职业棋手而言很容易判断,应该吃在一路,比实战便宜大约1目。
  2)“失误”二:
棋谱复盘人机大战
  白142手挡,对于职业棋手而言,这也是一个很容易确认的明显亏损。
棋谱复盘人机大战
  白棋正确的下法是1位跳,这样将来留下了5、7、9吃两子救回三子的下法,从目数上分析明显优于实战(大约1-2目)。即使白棋不在5位扳,走8位先手粘掉也优于实战一点点。
  这两处“失误”都是在局部,没有任何与外界的关联性,属于封闭式的失误,其亏损可以用逻辑推理的方式证明。相较于AI展示出来的水平,似乎这两个失误是“不应该”的。
  基于此,又有棋手表示:“这都看不到,AI不过如此啊”。
  前面“恶手”里讲到的左下角白棋的问题,也有人看做是第三个失误。但那个失误的性质与这两个不同,我们对那个失误的认定在很大程度上还是基于经验的,虽然也包含了逻辑推理,但并不完全。在我看来,按照笛卡尔的理论,对这那失误的认定是可怀疑的。
  但这两个失误却不可怀疑。既然如此,我为什么要在标题里给“失误”打引号呢?
  这引出了一个非常有趣的话题:在棋盘上,失误的定义是什么?
  3)不同的“失误”定义
  对于我们棋手而言,什么是棋盘上的失误?假如我们把基于经验认定的失误都排除在外,只留下基于逻辑推理认定的失误,那么失误意味着:A在逻辑上优于B,而我选择了B。
  在这个意义上,只要我们找到了“可确认的更优下法”,就认为我们出现了失误。
  但是,对于AI而言,失误是否意味着相同的事情?我们怎么理解AI出现了在我们看来低于其水准的失误?
  这就涉及到AI的算法问题。假如AI有一天穷尽了围棋,那么只要它有一步不踏在最优解集合里,就是失误。但是,现在的AI还远无法穷尽围棋。
  AlphaGo的算法运用了神经网络加蒙特卡洛,蒙特卡洛算法的一个特点是:不求最优。
  蒙特卡洛算法给出搜索之后的胜率评估,然后AI会根据这个胜率来选择落子点。也就是说,AlphaGo本来就不追求最强最优的下法,它只是追求在它看来胜率最高的下法。
  那么,回到前面那两个“失误”,之所以打上引号,是因为在AlphaGo看来,或许这根本不是失误!
  虽然在我们人类看来,逻辑上明显A优于B,但AI在那时认为两者的胜率相似,从获胜的角度来说,两者没有区别!甚至A之后的犯错概率高于B,从而导致它认为B的胜率高于A!
  如果两条路同样能通往胜利,在AI的意义上,你还能说它是失误吗?
  或许能!
  但是前提条件是人类利用这种“失误”击败了它!否则,在AI的意义上我们无法指责那是它的失误。
  再回过头看前面,白棋左上的补棋和左下损目抢得先手,真的是可以确认的坏棋吗?
  左上的补棋,证明AI认为补棋的胜率优于走左下,这一判断很可能是建立在AI对右边那手点的认识之上。甚至大家公认的左下白棋亏损,也可能是基于对右边那手点的认识,希望在左下抢一个先手,并且在胜率上认为这是没有问题的。
  而李世石对形势的判断显然是基于没注意右边那手点。
  五、AlphaGo的“弱点”
  这么说,难道AlphaGo真的就不可战胜了?不一定。从这盘棋中,我们可以看出AlphaGo的弱点。问题在于,这几个弱点是否足以影响人机对决的胜负?
  1) 逻辑缺失
  虽然上一章我认为对AI失误的认定需要谨慎,但在另一个层面上,这还是说明了AlphaGO的弱点。
  深度学习加蒙特卡洛,AlphaGo在剪枝和搜索这两方面的能力在这盘棋中已经得到证明,人类下棋同样依靠剪枝和搜索,并不能在这两点占得上风。
  但是,AlphaGo的算法缺乏逻辑能力。这一点实际上在10月对阵樊麾时已经有所体现,在这一局的两处“失误”则体现更为明显。
  蒙特卡洛算法使它并不是根据“逻辑上A优于B”来做选择,而是根据AB各自的胜率来做决策。
  在准确性上,概率不如逻辑。
  AI基于逻辑缺失而导致的“失误”,是否可能成为人类棋手的突破口?
  2) 逃避劫争?
  AI面对复杂劫争时的糟糕表现,是蒙特卡洛时期固有的顽疾。去年在北京夺冠的围棋AI,在对阵连笑时甚至不能理解循环劫,不停地找劫来回提,使局面一塌糊涂。这是因为,基于概率,循环劫也总有打赢的可能。这也是第一个弱点的延伸,如果基于逻辑,会明白这是不可能的事情。
  使用的深度学习的AI能否避免这个问题?目前我还没有看到。不过,似乎AI有刻意逃避劫争的倾向。
棋谱复盘人机大战
  回到有争议的左下角,棋手普遍认为白棋如图是最强的下法,
  但是AlphaGo可能担心劫争:
棋谱复盘人机大战&
  黑6开劫是最强的下法,在右边点一手找劫,接下来可能形成转换,白棋是否肯定便宜?粗粗一看,不能确定。
  另一处有趣的是最后的官子:
棋谱复盘人机大战
  此时白棋胜势已定,在做最后的定型。黑棋左下先手搜刮,白棋需要做活。
棋谱复盘人机大战
  实战白棋选择的是1、3做活,并非最强手。
棋谱复盘人机大战
  最强手是白1,成连环劫活,目数优于实战。
  但是,无论是出于不考虑最强手,还是出于对劫争的逃避,实战白棋没有这样选择。
  这么看来,起码AlphaGo还没有显示出它有应对复杂劫争的能力。
  那么,劫争是否会是AlphaGo的一个命门呢?
  在我目前看来,AlphaGo最可能的弱点只有这两个。
  六、人类可能的策略
  基于对AlphaGo弱点的分析,我认为李世石接下来可选择的策略并不是很多。
  1,我最期待的策略是,李世石按照人类研究很深的套路开局,因为AI并不会背套路。即使不能凭此占优势,也要尽可能保持局面的均势。在这个条件下,AI或许会在一些简单的局部因逻辑缺失而有所亏损,人类牢牢把握住这些微小的利益,最终取得小胜。不过,这似乎并不是李世石常用的风格。
  2,另一个策略是在局面选择中尽可能制造劫争,即制造对方不开劫就不利的局面。当然,AlphaGo目前没展现出复杂劫争的能力并不能证明它没有这种能力,因此这种策略是存在风险的,太过刻意是不行的,还要考虑局面的自然和均衡。
  七、结语
  如果我们只用人类思考围棋的方式来理解AlphaGo,或许我们将永远都不知道是怎么输的。
本文相关推荐
16-03-0916-03-0916-03-0916-03-0916-03-1016-03-10
日光网,声明:本站部分内容来源互联网,如有不实内容、造谣信息请将网页地址和有法律效力的侵权造谣证明发往邮箱
24小时内处理!

我要回帖

更多关于 韩国棋手李世石 的文章

 

随机推荐