基于FPGA的卷积神经网络加速器的设计与应用文献综述

 2022-01-01 10:01

全文总字数:4773字

文献综述

一、引言卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,是人工神经网络(Artificial Neural Network,ANN)的一种,它的权值共享网络结构减少了传统全连接型神经网络所需的训练参数的数量。

CNN可以提取出图像中的深度特征,其主要包括卷积层、非线性激活层、池化层和全连接层等。

其多层次的网络结构保证了输入图像的特征提取的充分性,并且特有的输入信息特征提取的方法(卷积和子采样)不仅避免了识别算法对信息复杂的处理过程,还在处理含有不同种类和程度变形的图像或语音信息时也有着很高的识别率。

因此CNN 的研究是当前语音分析和图像处理领域的研究热点,近些年来,卷积神经网络已经在图像分类、语义分割、目标检测和跟踪等领域取得了重大成就。

但卷积神经网络是一个计算密集型模型,其中的卷积、池化和全连接操作带来的计算量极为庞大,在训练和部署期间会消耗大量的计算能力,而便携式嵌入式设备自身的计算能力难以应付如此庞大的计算量,如今有着诸多加速技术如特征图共享、级联检测、网络压缩和量化等,但都是属于算法层面的优化加速,依旧有较大延时,利用硬件进行神经网络加速已经成为当下的研究热点。

在硬件实现方面,嵌入式处理器和图形处理器(Grapgics Processing Unit,GPU)由于运算架构以串行方式的特点,同样无法充分应对 CNN 中大量独立重复的运算,无法充分发挥算法并行性的优势,此外,GPU自身的高功耗限制了它在嵌入式场景中的应用。

现场可编程门阵列(FPGA) 作为一种可编程器件,含有丰富的逻辑计算资源,有着小功耗和可重构性的优点。

借助 FPGA 中的专用乘法器、查找表等硬件资源可以高度并行地实现 CNN 中大量独立的乘法、加法和乘加运算,基于FPGA的CNN加速器成为越来越多的研究焦点近年来,随着可编程器件的迅速发展、软硬件设计工具的改变,可重构计算(Reconfigurable Computing,RC)已经成为了计算机领域新的研究热点。

RC 通过对可编程器件进行在线配置、利用其可重复编程能力高效地完成不同的计算任务,充分地发挥了可重构器件的性能,在加解密、神经网络和图像处理等领域有着重要应用。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。