刘知青解读“阿尔法围棋”原理:棋感+搜索
人民网北京3月14日电(张帆)自围棋“人机大战”开赛以来,在关注胜负之外,公众都很感兴趣的是“阿尔法围棋”到底是怎么运算的?今天,北京邮电大学教授、计算机围棋研究所所长刘知青做客人民网《体育+》访谈,为网友进行了专业解读。
刘知青在节目中谈到,围棋对于国际人工智能领域来说是公认的重大挑战,因为围棋涉及了形象思维、逻辑判断、优化选择等复杂的重大的人类智能。国际学术界原来认为需要十年到二十年才能彻底解决人机对弈的问题。这次“阿尔法围棋”的出现,大大缩短了大家对人工智能的预期。
“过去十年过程中,计算机围棋一直使用新的技术叫蒙特卡洛树搜索,蒙特卡洛树搜索底层有一个坚实的数学基础,上层使用并行计算,通过计算、模拟、采样、优化等一系列的数学方法,使计算机围棋技术有了明显的提高。”刘知青这样解释说,“蒙特卡洛树搜索也是‘阿尔法围棋’的一个基础技术点,在此之前使用新的技术,就是基于机器学习的神经网络。神经网络有很大的作用:第一是通过学习高水平棋手的棋谱,获得如何在盘面落子的一种棋感;第二是通过机器的增强型学习,获得形势判断的棋感。这两个棋感通过蒙特卡洛树搜索的技术进行验证,从而达到了目前的技术突破。”
刘知青认在围棋对弈方面,计算机的优势在于可以不受情绪的干扰、理性地计算每一步的胜势。“计算机展现出来的应对水平还是非常强大的,而且显现出前所未见的优势。尤其在中后盘。‘阿尔法围棋’背后的技术也是它强大的原因,它使用了非常类似于职业选手的方法,棋感加上判断。同时它不受情绪的干扰,没有人的压力,它可以理性地、仔细地计算每一步的胜势,这是它的优势。”
目前,在本次围棋“人机大战”五番棋中,“阿尔法围棋”在连赢三盘后,被李世石九段“妙手”扳回一局。双方的最后一盘棋将于北京时间明天(3月15日)中午继续在韩国首尔进行。
分享让更多人看到
相关新闻
- 评论
- 关注