基于强化学习的智能黑白棋游戏设计文献综述

 2021-11-05 07:11

毕业论文课题相关文献综述

文 献 综 述1.1研究的背景 人工智能(Artificial Intelligence,AI)已经成为了科学研究中最热门的研究领域之一,并且已经在生活中产生了很多的实际应用,比如在语音或者图像识别、医学诊断、自然语言处理等领域都有了众多的成果。

简单地说,人工智能就是使人类设计的智能体具有能够代替人类完成各种复杂任务的能力,而验证这个能力的方法就是对智能体进行图灵测试。

图灵测试由阿兰图灵在 1950 年提出,具体方法为让智能体和一个人坐在幕后,让裁判同时和人或者智能体进行交流,如果超过百分之三十的概率裁判无法判断是人还是机器,那么图灵测试通过,说明智能体具有人工智能。

随着科学的日益进步发展,智能机器人领域也取得了十分明显的进步,尤其是在棋类方面的研究成果便可窥见一斑,1997年5月,IBM开发的超级计算机深蓝击败了国际象棋世界冠军卡斯巴罗夫;2016年3月,AlphaGo挑战世界冠军韩国职业棋手李世石,并且以4:1的比分获得了胜利;而到了2017年,AlphaGo的团队于2017年10月19日在《自然》杂志上发表了一篇文章,介绍了AlphaGo Zero,通过跟自己对战,AlphaGo Zero在40天内超过了所有之前的版本。

AlphaGo的做法是使用了蒙特卡洛树搜索与两个深度神经网络相结合的方法,其中一个是以估值网络来评估大量的选点,而以走棋网络来选择落子。

在这种设计下,电脑可以结合树状图的长远推断,又可像人类的大脑一样自发学习进行直觉训练,以提高下棋实力。

本次的研究课题便主要是使用蒙特卡洛树搜索算法,并且实际运用到黑白棋中。

黑白棋的棋盘是由8*8共64个格子组成的。

每次开局,棋盘中央的4个格子分别有2枚黑棋子和2枚白棋子相邻放置。

游戏开始后,由持黑色棋子的玩家开始下棋,黑白棋子轮流落子。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

免费ai写开题、写任务书: 免费Ai开题 | 免费Ai任务书 | 降AI率 | 降重复率 | 论文一键排版