基于PyTorch的林业病虫害识别研究文献综述

 2022-04-14 09:04

基于PyTorch的林业病虫害识别研究

林业是我国国家经济的重要组成部分,为我国生态环境保护提供了最基础的保障,并给人们的生产生活提供了丰富的环境资源。但随着林业的生产发展,城区与乡村的树木栽植面积不断扩大,更多的树木品种被引入,林业病虫害所造成的问题在发展宏图上显得尤为突出。近年,我国已经成为全球外来林业有害生物发生和危害最为严重的国家之一[1]。林木病虫害如在早期未被发现和有效处理,则极有可能造成大规模扩散的严峻形势,并且会给未来的预防与治理工作带来阻碍。因此,利用现有科技实现有效且快速地识别林业病虫害尤为重要。本研究课题的目的是通过Python语言下的PyTorch高效框架,开发对于林业病虫害进行机器识别的系统。此系统将收集来的林木图像进行分类归纳,整理总结后构建神经网络模型,有效提高识别准确率,减少识别所需的时间,释放人工识别资源。以更高效的方式完成林木病虫害图像的快速识别,将病虫害遏制在初级阶段,减少后续治理成本。

与传统的人工识别病虫害相比,基于PyTorch的机器识别所拥有的优势集中体现以下几个方面。

  1. 增强了准确性,减少了误判现象。早期人工判断林业病虫害的方法主要有目测法、敲击辩声法和解剖观测法等,此类方法准确性低、时效性差,在检测的同时容易对树木造成不可逆转的损害。针对数量繁多、种类复杂的病虫害,更需要的是极大量的数据对比,用已有病例的成像去筛选现状,排除不可能的选项,将误诊的概率降至最低。这样的大数据算法有助于更好地针对不同情况下的林木病虫害做出精准检测。
  2. 削减昂贵的人工成本,将资源集中在治理环节。人工检测病虫害的成本相较机器识别更为昂贵,使得病虫害防治的工作重心发生偏移。在当前治理环境下,识别并判断病虫害类型只是防治的准备工作,真正的重点是投入人力、物力去治理已患病的林木。不同于传统方式,机器识别的重点不是调动人力去识别把目标树木的病虫害,也无需关心劳动力分配问题。其重点在于通过神经网络算法自动识别成像。因此使用机器完成识别作业,顶替人工环节无疑是省时省力的。
  3. 扩大了识别范围,填补了人才缺陷。传统人工检测林木病虫害的方法要求工作人员拥有相应的检测技术或技能。人脑不同于机器,学习专业化知识是一个长期过程,因而难以在短时间内培养出快速投入实战的检测人员。与此相对的,通过构建卷积神经网络的机器识别,在学习大量的专业案例后,能迅速投入实践,有效节约了培养专业化人才所花费的时间与资源。同时,针对一些国内鲜有发生的病虫害案例,识别系统也能在学习分析外国案例后掌握相应检测技术,拓宽了检测案例种类,实现横向与纵向的双重发展。
  4. 技术迭代快,发展前景可期。进入信息化时代以来,电子信息技术在各个行业和领域当中都得到了十分广泛的应用,打破了传统的生产生活方式。通过机器识别实现检测林木病虫害的信息化,也有效地提高了工作效率与质量。这样的信息化发展迅速且剧烈,每次技术革新都能给现存的运作流程带来蜕变。在不久的将来,机器识别或将完全替代人工识别,配合轨道卫星,在工作人员的“纸上谈兵”中准确检测出病虫害种类,完成防治作业。

机器学习是人工智能中最为年轻的分支[2],其发展之迅速迎来各界的瞩目,并在国际上形成了逐渐统一的理论与方法。与许多其他研究一样,机器学习也可以分为很多种类。

  1. 监督学习:此类学习方式是将学习行为应用于标记的数据或者是所需的结果,例如购物网站的推荐系统、天气应用系统,它还有助于预测数据未来的结果。
  2. 非监督学习:与监督学习相反,非监督学习是将学习应用于未标记的数据集,例如NASA使用非监督学习方法来创建天体的不同簇,每个簇都由相似的自然物体组成。
  3. 半监督学习:这是一种将监督学习与非监督学习相结合的学习方法,其训练所用的数据由少量的标记数据和未标记数据组合而成。例如,通过对某种图形的命名标记(监督学习),自动从图片集群中检测此种图形(聚类-非监督学习),然后自动将名称标签附加到该图形所存在的所有图片中。
  4. 强化学习:它作为机器学习的方法之一,又称深度学习,通过有效地观察学习系统的连续学习行为以及周遭环境,提高累计奖励或奖励的频率,因而也被称作基于奖励的学习系统。

分析上述方法,可见最适用于识别林业病虫害的学习方法是强化学习方法,通过搭建AlexNet的卷积网络模型,将样本图片进行训练,从而提高训练的准确率,并对给出的图片做出预测。

但目前的机器学习依旧存在着不少瓶颈,机器学习方法与人脑机制间有着巨大的差异,机器学习距离人类思考方式还有很远的距离。实现智能识别林业病虫害必须要解决以下问题:

  1. 机器学习系统能够被用于执行多种不同的任务,在识别林业病虫害上则应表现为能在学习识别新的病虫害的同时,保证识别已学习病虫害的性能不会随着训练发生显著的下降。在学习样本随时间增多时,保证识别准确率不会越来越低。
  2. 须让机器学习系统学习到有意义的知识表示,撇去杂糅的无意义信息。有效的知识表示不但可以在不断的学习中积累、提高,而且也可以通过逻辑的自洽令机器学习系统更加鲁棒,同时也可以处理很多未学习过但可通过推理得到的结论。因此,如何将机器学习所学到的模型与病虫害专业知识系统相结合,也是研发识别系统的重要课题之一。
  3. 保证系统安全性。系统实际运行时,会被有意或无意的对抗性样本攻击。攻击者可以系统地制造对抗性样本,使得机器学习系统失效,系统将会以极高的置信度误判目标图像。

由此提出以下可行的解决方案:

  1. 加强对于任务的记忆能力,实现在新的识别任务进入系统后,依旧有旧任务的信息残留,不会被新的学习内容顶替或干扰。
  2. 增加相似样本数量,保证样本数量与实际发生率保持一致。避免学习过多的罕见病例而产生对常见病例的误判。
  3. 提高系统安全性,在测试性能的样本中人为掺入对抗性样本,借此训练系统识别病虫害的安全性。

深度学习是机器学习的第二次浪潮[3],首先,要完成整个识别系统需要一个强力可行的学习框架。PyTorch是一个灵活的深度学习框架,它允许通过动态神经网络(即if条件语句和while循环语句那样利用动态控制流的网络)自动分化。它支持GPU加速、分布式训练、多种优化以及更多的、更简洁的特性。

Pulkit Sharma[4]认为,一个良好的深度学习框架应该具备优化的性能、易于理解的框架与编码、良好的社区支持、并行化的进程以及自动计算梯度等特征。PyTorch无疑在这些方面都有良好的表现。PyTorch框架是在张量上进行运算,并将任意一个模型看成是有向非循环图(DAG)。其属于更为Python化的框架,动态DAG是内置的,可以随时定义、随时更改、随时执行节点,并且没有特殊的会话接口或占位符,相当灵活。此外,因为PyTorch中的计算图是在运行时定义的,使用者可以使用任何一个喜欢的调试工具,比如PDB、IPDB、PyCharm调试器或者原始的print语句,实现了调试的多样性。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。