昨日李世石九段,当前人类围棋界最强者之一输给了谷歌的电脑机器,在棋类游戏中人机大战并不少见,如世界著名国象大师卡斯帕罗夫就曾经与电脑对决过,当然他赢了,至于日本将棋的电王战,一些知名棋手都不敢和电脑硬对了,输了会影响自己的声名,所以李九段输的层面会大一些也是很正常的。
大战结果:
3月9日,韩国世界冠军李世石九段与谷歌AlphaGo对抗赛首局在韩国的四季酒店战罢,李世石执黑186手中盘负AlphaG
完整对局动态棋谱:
http://www.sinaimg.cn/dy/slidenews/2_img/2016_10/820_1729832_868827.gif
棋谱截图:
失败总结:
李世石在比赛开始时选择了他并不太擅长的进攻性打法,在 AlphaGo 出现一次重大失误后,李世石没有捉住机会一举拿下比赛,而是在之后多次的正面交锋中节节败退最终选择了认输。
让敌人用不擅长的方式应战,这是李世石陌生的套路,也是 AlphaGo 胜利的正确方法。
「早期象棋机器会有盲点和可加利用的弱点,而且吸引棋手的是将(利用)这些(弱点)作为目标,而不是正儿八经对弈。对战深蓝时,我就没有抵挡住这一诱惑。心智(Mind)运动,比如象棋和围棋,需要高度集中的精神,当你的注意力被试图对计算机耍花招打乱时,最终就是诱惑自己下出客观上并不可靠的棋招。随着机器变得强大,这些做法会受到惩罚。」
20年前曾输给 IBM 「深蓝」机器人的国际象棋大师 Garry Kasparov 输给了曾经的「穷举法」,而 AlphaGo 进步的地方在于,他在更为复杂的运算体系里只使用了「穷举法」几千分之一的计算量。
AlphaGo 的核心是两种不同的深度神经网络——「策略网络」(policy network)和 「价值网络」(value network)。它们通过相互配合来计算出相对有优势的步法并摒弃差棋,从而将计算量控制在计算机可以完成的范围里。