全文总字数:3437字
文献综述
文 献 综 述1. 研究背景随着5G通信技术的发展,飞行控制和自主导航技术的不断发展,无人机在无线通信中的应用越来越广泛。
当前,无人机在航拍摄影、农业植保、快递运输、灾难救援、野生动物观察、传染病监控、军事侦察、电子对抗、通信中继等军事或是民用领域都有着举足轻重的地位。
通常情况下,手动操作无人机可以很好地执行完成既定任务,然而在某些情况下,需要无人机自动地前往目的地完成任务,比如大范围的搜索、快递运送等。
此时就需要无人机自动规划它的飞行线路,并根据飞行过程中实际的环境(如移动障碍物、天气变化等)动态调整飞行线路[1]。
无人机航迹规划是指在一定的约束条件下,从起始点到目标点规划出一条最优或次优的无碰撞路径。
随着无人机面临的实际环境日益复杂,规划出一条实用有效的飞行路径是无人机顺利完成各项任务的前提。
强化学习来源于心理学中的行为主义,作为解决序贯决策的重要方法,它采取持续的交互-试错机制,通过与环境的不断交互学得有效策略。
强化学习过程反映了人脑如何做出决策的反馈系统运行机理,符合人类面向实际问题时的经验性思维与直觉推理的一般决策过程。
因此,近年来,随着深度强化学习的发展,将深度强化学习应用于无人机航迹规划成为当前的研究热点[2-5]。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
