时延估计在目标定位与探测系统中的应用文献综述

 2022-07-08 02:07

混响环境中基于最优峰值关联声源定位

摘要

在本文中,我们考虑源定位问题,其中几个麦克风合作在混响环境中定位有源声源。在过去的几十年中,基于广义互相关(GCC)函数的声源定位(SSL)被广泛研究。然而,在混响环境中,由于多径效应,GCC函数的最大峰值不一定对应于真实的源位置。在这种情况下,传统的基于GCC的方法表现不佳。在本文中,通过组合来自所有可用麦克风对的信息,我们的目标是寻找一组源源峰而不是最大峰。为了实现这一点,对于每对麦克风,首先提取指示候选TDOA的GCC功能的多个峰值。然后基于从多个麦克风对提取的TDOA构建图形模型,并且可以通过优化给定峰值组的关联代价函数来获得对应于真实时间延迟的峰值的最佳关联。最后,以最小平方意义估计源位置。仿真结果表明,与传统的基于GCC的定位算法相比,该方法具有优越的性能。

关键词 - 广义互相关(GCC);到达时间延迟(TDOA);混响;最佳峰序列

一.介绍

使用麦克风阵列的声源定位(SSL)通常由一组协同操作以定位源的麦克风组成,在视频会议,监视,源分离和助听系统中非常重要。SSL的主要挑战来自语音信号的宽带性质,室内混响以及信号和噪声的未知混合过程。

参考[1]讨论了通过一系列传感器定位远距离噪声目标的时间延迟估计问题。在最大似然意义下给出了多个声源的定位,并且在[2]中导出了相应的Cramer-Rao下界(CRLB)。在[3]中,采用高分辨率频谱估计器,即子空间方法,基于信号子空间和噪声子空间的正交性来定位近场源。

基于时间延迟估计(TDE)的定位是SSL领域的一个重要研究分支。在[4]中存在不相关噪声时,由最大似然(ML)估计器估计给定麦克风对的源生成信号的时间延迟。在[5]中,开发了一种使用最小均方(LMS)规则的自适应滤波方法来估计线性时变延迟,显示出抗噪声能力。考虑到GCC功能在混响环境中表现不佳的事实,[6]中的倒谱滤波(CEP)技术消除了倒谱域中的最小相位分量,通过使用已知的信道特征来消除严重的反射。结果,对于固定或缓慢移动的声源,可以实现改进的估计性能。在[7]中,基于谐波频谱间隔的估计周期性,提出了包含噪声和多径信号失真的GCC滤波器。在[8]中,给出了使用角谱和聚类技术的多源TDOA估计方法,并进行了大规模的实验评估。在[9]中,基于混响环境中的时频信道间相位差(IPD),提出了利用音频信号的非平稳性和稀疏性的TDOA估计框架。结合清洁方法和传统的PHAT-GCC方法,可以减少机器人听觉系统中反射波的影响[10]。在[11]中,通过频域声音活动检测和事件开始检测(EOD)来进行时域语音活动检测。参考[12]通过非负监督字典学习(通过非负矩阵分解(NMF)与基于GCC的定位相结合)开发了盲源分离和源定位算法。 在传统的基于GCC的定位方法中,仅从GCC函数中提取一个峰值。在[13-14]中,提取多个峰值并用于软关联框架中的声源跟踪,其中每个提取的峰值被视为计算似然函数的候选测量值。

在本文中,我们假设只有一个声源。鉴于在混响场景中每个麦克风对的GCC功能的最大峰值可能不对应于来自声源的真实TDOA,我们为每个麦克风对提取GCC函数的多个峰值。然后建立图形模型,其中图形模型中的列数被设置为麦克风对的数量。列中的每个节点代表GCC函数的峰值,表示候选TDOA估计之后,通过定义和最大化组合来自不同麦克风对的峰值的关联成本,可以提取源的源峰值的最佳集合,基于该峰值可以获得最终的源定位。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。