基于深度学习的扑克牌特征提取文献综述-文献综述网

研究背景及意义

1）背景：全球的科技巨头纷纷拥抱深度学习，自动驾驶、AI医疗、语音识别、图像识别、智能翻译以及震惊世界的AlphaGo，背后都是深度学习在发挥神奇的作用。深度学习是人工智能从概念到繁荣得以实现的主流技术。经过深度学习训练的计算机，不再被动按照指令运转，而是像自然进化的生命那样，开始自主地从经验中学习。

深度学习(deep learning)也被译为深层学习，是美国学者Ference Marton和Roger Saljo基于学生阅读的实验，针对孤立记忆和非批判性接受知识的浅层学习(surface learning)，于1976年首次提出的关于学习层次的一个概念。2006年，加拿大多伦多大学教授、机器学习领域泰斗——Geoffrey Hinton和他的学生Ruslan Salakhutdinov在顶尖学术刊物《科学》上发表了一篇文章，开启了深度学习在学术界和工业界的浪潮。Hinton提出了深层网络训练中梯度消失问题的解决方案：无监督预训练对权值进行初始化有监督训练微调。其主要思想是先通过自学习的方法学习到训练数据的结构（自动编码器），然后在该结构上进行有监督训练微调。2011年，ReLU激活函数被提出，该激活函数能够有效的抑制梯度消失问题。2011年，微软首次将DL应用在语音识别上，取得了重大突破。2012年，Hinton课题组为了证明深度学习的潜力，首次参加ImageNet图像识别比赛，其通过构建的CNN网络AlexNet一举夺得冠军，且碾压第二名（SVM方法）的分类性能。也正是由于该比赛，CNN吸引到了众多研究者的注意。

自2006年以来，深度学习在学术界持续升温。斯坦福大学、纽约大学、加拿大蒙特利尔大学等成为研究深度学习的重镇。

国内对深度学习的系统研究起步较晚。 2005年，上海师范大学黎加厚教授在《促进学生深度学习》一文中率先介绍了国外关于深度学习的研究成果，一般以此作为我国深度学习研究的起点。文中介绍了深度学习的概念，提出深度学习是指在理解的基础上，学习者能够批判地学习新思想和事实，并将它们融入原有的认知结构中，能够在众多思想间进行联系，并能够将已有思维知识迁移到新的情境中，做出决策和解决问题的学习。

2）意义：扑克牌识别本身是识别技术中的基础内容，但是其影射出了图片识别技术这些年的巨大变化，具有很好的学习价值。

本次研究的课题名称为基于深度学习的扑克牌特征提取，课题的主要目的是设计并实现一个功能完整，操作简单的特征提取系统，使其能够对静态的扑克牌图像进行特征提取和匹配，从而实现对扑克牌的分类识别。

本次研究以扑克牌的特征提取为例子，简单实践了基于深度学习的扑克牌特征提取系统的实现。扑克牌一共有四种花型，分为：红桃，黑桃，方片和梅花。每种花型只有十三张牌，标志内容清晰，明确。

该研究是基于深度学习框架的。考虑到，PyTorch是相当简洁且高效快速的框架，设计追求最少的封装，设计符合人类思维，可以让用户尽可能地专注于实现自己的想法，入门简单，考虑采用。

国内外研究概况

1）国外：在国外深度学习领域，较为出名和基础的是基于MNIST数据集进行的手写数字识别系统的搭建，其对本研究具有极大的学习价值。MNIST数据集来自美国国家标准与技术研究所, National Institute of Standards and Technology (NIST)。训练集 (training set) 由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局 (the Census Bureau) 的工作人员。测试集(test set) 也是同样比例的手写数字数据。原始的MNIST 数据集中包含了 60000 张训练图片和10000 张测试图片。本次研究，将模仿MNIST数据集构建扑克牌识别数据集，图片来源为www.google.com、www.baidu.com。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

基于深度学习的扑克牌特征提取文献综述

您可能感兴趣的文章

登录

注册

找回密码

您可能感兴趣的文章