王小川:人类棋手被吊打而不自知
摘要:万众瞩目的人机大战已经完成两回合,机器超出大多数人的想象获胜了,而且是大胜,棋坛震动。而深度学习下的概念抽象,Value Network同时既保留了全局信息,又兼顾了局部信息,直接对应到局势评分。
文/王小川
万众瞩目的人机大战已经完成两回合,机器超出大多数人的想象获胜了,而且是大胜,棋坛震动。另一方面,我们又听到这样的声音:“一开始是李世乭占优,中盘被大逆转”,“是李世乭几次失误才输的”,“机器这一手业余五段水平,哈哈”。
这类观点背后的一个漏洞是,这些评价都基于人类棋手百年来积累下来的共识经验来判断。另一种细想极恐的解释是:机器一开始就占优而人类棋手以之前的经验并没意识到,待到醒悟时已经来不及了。机器这一步棋厉害到人类棋手从来没想到过。
赛后从Google传来的消息已经证明了后一种观点:至始至终白棋都在占优!也就是说以机器的视角看:“人类呀,这盘棋不是啥逆转,我一开始就吃定了你的。你以为我的昏招只是你!没!看!懂!”
你没看懂!我相信确实发生了这样的事情,人不仅是没有预料到机器的下棋能力,更是机器已经落子了我们还没看懂为啥这么下,反而评价不高,这是多么大的差距!现在到了需要思考人和机器谁更懂棋而不只是谁更会下棋的时候了。
AlphaGo已经表现出十二段的水准,而我们还在遮羞“逆转”、“失误”以及“嘲笑”,这就是被吊打而不自知。
无招胜有招的宇宙流
机器和人下棋有什么区别呢?人类下围棋是靠的“搜索”+“计算”+“棋感”。传统意义上,计算机没有棋感只能靠搜索,这对于围棋的海量变化和可能性完全不适用,也是我们之前不看好机器下围棋的终极理由。而这个棋感配合一定的计算,就变成了对局势判断的抽象概念,比如“厚薄”、“虚实”、风格“稳健或强硬”、策略“缠绕攻击、弃子整形”以及每步棋的招式“跳、长、靠”等等等。这些概念的引入:当前棋局->局势抽象判断->走棋招式抽象选择->局势抽象验证->落子,大大减少了搜索量。谈论这些抽象概念,就像是武功开始比试流派和招式,成为这项智力游戏的乐趣所在。
因为深度学习,世道变了。深度学习最大的魅力就是抽象能力,通过对3000万局人类对弈数据的学习,机器建立了一套抽象局势和落子招式的棋感。
既然机器掌握了棋感,一个未被大家深入讨论的问题是:机器会把局势、棋形抽象成多少类呢?会把落子策略和招式抽象成多少类呢?
答案是0!
这就是机器与人在抽象时最大的不同。当我们抽象出多个概念来,每一种概念便是一种简化,一方面忽略了全局信息,一方面也排斥了其他概念,也是在丢失信息。
打一个比方,我们都知道光的波粒二象性,光既是波又是粒子。当我们把光描述成波,就会忽略了粒子特性,如果把光描述成粒子,就会忽略波的特性。但是如果同时表达这两个属性,对人的理解就是很大的挑战了。
而深度学习下的概念抽象,Value Network同时既保留了全局信息,又兼顾了局部信息,直接对应到局势评分。Policy Network对应的走棋的抽象,兼顾了所有的招式并融会贯通,直接对应到落子的概率。
这便是小说里写的无招胜有招,真实地在围棋里再现。
以前我们赢机器,是因为我们有“抽象概念”而机器没有。现在我们输给机器,也是因为我们太有“抽象概念”,太细碎失去了整体,机器建立了大统一的抽象概念。
更多强调,这种无招胜有招,并不只是“见招拆招”,而是在时空双重维度上的“终极大招”。之前我们有质疑机器没有“大局观”,在深度学习框架下,机器不仅是有大局观,而是全局观,包含了全部细节的全局。再有,这个全局观不只是棋盘空间上的全局,而是每一步局势的判断以及落子的选择都是指向最终赢棋的概率提升,这是时间维度的全局观。
这种全局观下,棋感与搜索的交织融合,每一步搜索中包含棋感、每一步棋感后都进行搜索,便打造出完全超越人理解的走棋逻辑来。
有了这种超越人的时空全局观,机器就会走出一些人没法解读的匪夷所思的招式来,这些招式要么超越我们的定式,要么在招式下计算更精准,要么两者兼有。
这便是无招胜有招的宇宙流。
Google心机婊的棋外棋
Google这次人机大战获得了空前的关注,一方面是这个事情本身足够吸引眼球,号称人类棋类智慧的最后一块堡垒被攻破,具有足够的象征性意义,另一方面是Google进行了深谋远虑的市场运作。
从前几日樊麾的口述可以看到,他在2015年11月就败给AlphaGo,但是保密协议规定他不能对外透露。而等到2016年1月Nature杂志刊登了Google研发成功基于深度学习的围棋机器时才公布此事,两事情碰到一起互相佐证迅速引爆了媒体的关注。
再往深里想,为什么会找到樊麾?因为能造成最大的争议:职业棋手以及欧洲“冠军”的身份,看起来很有种,但是又只是二段棋手,与九段的世界冠军形成强烈的反差和悬念,又使得这次首尔的胜利极其突然。
真够心机!
往下有两个继续心机的预测:
1、有可能Google会放水让李世乭赢1-2局,不至于人类太难看。
2、赢了李世乭之后,鸣金收兵迅速解散AlphaGo团队宣布人工智能进军医疗领域,为下一个战场造势,并且避免后起的各家基于深度学习的围棋机器挑战AlphaGo,Google输不起赢了也无趣,没必要陪着玩。
那后起的围棋机器怎么出头呢?没机会挑战Google,挑战世界冠军也不是大新闻了。我的一个建议是设立一个“刷副本”赛:挑战一位世界冠军,同时运行其他网友随时从这个棋局的任何复盘位置进入接着下。不是觉得人有失误么,悔棋修正了失误继续来。这样会有看头,彻底体现机器怎么碾压人类智商。
程序狗的春天
这次关心人机大战真是万人空巷,也是几家欢喜几家愁。
最受伤的是职业棋手,段位越高伤害越大。你懂的,生命的意义受到冲击。
最被激励的应该是拥有人工智能理想的程序狗,会更加相信自己代表的先进生产力能改变世界。比赛前,我调研了我司好些做机器学习的工程师,他们大多表示相信机器未来会赢,但这次做不到。科技行业主流的声音也是这样,不相信自己手中掌握的武器有如此能耐。两场比赛后,已经有工程师给我发微信表示要更加努力了。
这是一场人工智能的启蒙运动,让大众接受和相信了机器的力量,也会促进人工智能的研发以及应用。
此外也会有对人工智能如何帮助人、取代人、伤害人的讨论。这是好事,我们开始没那么自大,开始更好地思考“我是谁”,“我要到哪里去”了。
这场比赛的意义足够深远,或许百年后看,是21世纪最大的历史事件之一。
很幸运,我们参与见证了这场世纪之战。
王小川:搜狗公司CEO、国内顶尖人工智能专家。1994年,王小川参加“几何定理机器证明”课题研究组,首次在微型机下完成初等几何命题的全部证明。1996年王小川代表中国参加第8届国际信息学奥林匹克竞赛(IOI),并获得金牌。
王小川2月初在知乎断言AlphaGo将完胜李世乭:
https://www.zhihu.com/question/39902308/answer/84411083
责任编辑:王聪