AlphaGo成功关键分析：策略结合值网路

人气: 186

【字号】大中小

更新: 2016-03-18 10:35 PM 标签: AlphaGo, Network, Value, 值网路, 围棋, 李世乭, 黄士杰

【大纪元2016年03月18日讯】（大纪元记者陈懿胜台湾台北报导）谷歌（Google）旗下DeepMind开发的人工智慧系统“AlphaGo”，日前以4:1大胜韩国九段围棋高手、世界冠军李世乭。AlphaGo主要开发者、来自台湾的黄志杰18日返台及分享经验，他表示，AlphaGo成功的主要关键在于策略网路（Policy Network）与值网路（Value Network）的分析方式，让它能在20~30万份对战棋谱中，找出最好的20步，才能够在此世纪之战中获胜。

黄志杰指出，围棋第一步的下法选择就高达361种，变化数有10的364次方，对早期人工智慧来说，根本无法计算。但对AlphaGo来说，运用策略网路来减少搜寻广度，从360步只要找到20步；价值网路则是直接判断盘面状况，了解优势还是劣势，减少搜索深度，自然会提升胜率。

对于第四局对战AlphaGo落败，黄志杰说，当时李世乭下了神之一手，以致值网路发生误判，接连处在劣势。由于AlphaGo会在比赛中随时计算胜率，如果胜率低于20%就会投降，但为何会误判，目前仍不清楚详细原因。

黄志杰说，当AlphaGo通知投降时，他自己有笑了一下，因为他很尊敬李世乭，看过李世乭大部分的棋谱与比赛，很荣幸能够坐在他对面。“我为李世乭高兴，因为知道他的压力很大，4比1是蛮圆满的结果。”

至于AlphaGo的未来发展，黄志杰表示，未来人工智慧可望运用在医疗及机器人上，并达到预先诊断、找出病征，协助医学诊断。◇

责任编辑：吴明芳

即时新闻

热门排行

台湾之光

评论