site logo: www.epochtimes.com

AlphaGo成功关键 分析:策略结合值网路

人气: 186
【字号】    
   标签: tags: , , , , , ,

【大纪元2016年03月18日讯】(大纪元记者陈懿胜台湾台北报导)谷歌(Google)旗下DeepMind开发的人工智慧系统“AlphaGo”,日前以4:1大胜韩国九段围棋高手、世界冠军李世乭。AlphaGo主要开发者、来自台湾的黄志杰18日返台及分享经验,他表示,AlphaGo成功的主要关键在于策略网路(Policy Network)与值网路(Value Network)的分析方式,让它能在20~30万份对战棋谱中,找出最好的20步,才能够在此世纪之战中获胜。

黄志杰指出,围棋第一步的下法选择就高达361种,变化数有10的364次方,对早期人工智慧来说,根本无法计算。但对AlphaGo来说,运用策略网路来减少搜寻广度,从360步只要找到20步;价值网路则是直接判断盘面状况,了解优势还是劣势,减少搜索深度,自然会提升胜率。

对于第四局对战AlphaGo落败,黄志杰说,当时李世乭下了神之一手,以致值网路发生误判,接连处在劣势。由于AlphaGo会在比赛中随时计算胜率,如果胜率低于20%就会投降,但为何会误判,目前仍不清楚详细原因。

黄志杰说,当AlphaGo通知投降时,他自己有笑了一下,因为他很尊敬李世乭,看过李世乭大部分的棋谱与比赛,很荣幸能够坐在他对面。“我为李世乭高兴,因为知道他的压力很大,4比1是蛮圆满的结果。”

至于AlphaGo的未来发展,黄志杰表示,未来人工智慧可望运用在医疗及机器人上,并达到预先诊断、找出病征,协助医学诊断。◇

责任编辑:吴明芳

评论