基于机器学习的声源位姿估计方法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:grasskeeper
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动智能设备的推广以及人机交互技术的发展,声源定位技术被广泛的使用在语音增强、视频会议等领域。但是室内环境中背景噪声、混响等因素的干扰会导致系统定位效果的下降,如何提高声源定位算法的鲁棒性和精确性一直是当前研究的热点问题。同时基于声源定位算法的智能家居等设备在实际应用过程中,特定区域内声源的朝向信息往往也是很重要的,如何有效的利用声音的特征信息提高声源朝向判别的准确度也是当前研究的一个难点问题。针对以上的问题,本文从机器学习的角度来处理声源位姿估计问题,分别针对声源位置与声源朝向,完成了以下两部分工作:1.针对目前基于位置指纹的声源定位算法在其预处理阶段通过K均值聚类等算法对其数据库进行预处理后,位于聚簇边缘的测试点由于参考信息不足,导致定位误差过大的问题。本文提出了一种基于局部聚类优化的声源定位算法,用于减小位于聚簇边缘的测试点的误差,提高系统的定位精度。首先,本文使用主成分分析(Principal Component Analysis,PCA)算法对测试点采集到的声达时间差(Time Difference of Arrival,TDOA)特征信息进行了降维处理。然后,通过局部聚类优化算法对测试点对应的聚簇进行了二次选取。最后,通过动态WKNN算法对测试点的位置进行了估计。实验的结果表明,基于局部聚类优化算法的声源定位方法可以有效的提高位于聚簇边缘的测试点的定位精度,并且在算法的实时性和鲁棒性上也有了提高。2.针对现有的声源朝向估计方法在通过人工设置阈值的方式对声源的朝向进行判别时,由于操作者水平的不同以及阈值选取的差异,导致判别的结果存在很大的主观性的问题。本文提出了一种基于注意力机制的声源朝向估计方法,通过引入长短时神经网络和注意力机制,对声音的能量特征信息进行了分析,在室内特定区域内,实现了声源朝向的判别。对比实验的结果表明,采用注意力机制,可以有效的提高模型的精确性和泛化能力,同时也可以减少模型训练的时间开销。
其他文献
改革开放以来,在我国经济发展迅速的同时,交通事业也有了跨越式的发展。但是,多雨地区或蓄滞洪区公路路基滑坡、冲刷等水毁问题比较常见,这对公路建设、交通运营和人民生命财产造成了严重的威胁。因此,对公路路基边坡水毁与防护展开研究,具有十分重要的研究意义和实用价值。本文通过对路基边坡水毁资料的分析,从影响边坡冲刷的因素出发,充分考虑了水力和土质对路基边坡冲刷侵蚀的影响,同时通过软件仿真与模型试验对路基边坡
重金属污染土修复是近些年环境治理面临的一个棘手的问题,尤其是尾矿区、制革和电镀等工业区附近的土壤,其所含重金属成分复杂,往往是多种重金属共同污染,且含量较高。电动法因可实现土中离子的定向移动,且具有操作简单、修复速度快等优势,被广泛研究,但聚焦效应、重金属去除率分布不均匀等缺陷是电动法在实际应用过程中需解决的关键问题。本文针对电动法的缺陷,提出以电动原理为基础的化学联用法。首先明确电动法在修复铬、
我国大量老旧在役梁桥由于抗震设计缺陷和构件老化等问题,存在不同程度上的抗震隐患,危及交通安全。从桥梁震害的调查可知,碰撞效应是加剧梁桥震害的主要原因。为了对在役梁桥进行抗震能力提升改造提供一些建议与参考,以实际工程为依托建立有限元分析模型,采用非线性时程分析法研究影响在役梁桥抗震能力的关键因素以及有效的抑碰减震措施。本文主要的研究内容和结论如下:(1)根据三种碰撞刚度计算理论,对碰撞单元碰撞刚度、
桥梁上部结构在地震作用下易发生落梁震害,据统计,桥梁发生纵向落梁的次数远多于横向落梁,因此,工程研究人员针对纵向防落梁减隔震限位装置的研究较多,而忽视了横向防落梁装置的重要性。目前大部分桥梁结构仅利用混凝土挡块限制上部梁体横向位移,而挡块作为横向抗震的重要构造措施,仅有限位功能不具备耗能能力,无法顺应由被动抵抗向主动消能转变的结构振动控制思想。本文根据桥梁横向限位设计要求,提出兼具限位和耗能功能的
期刊
由于工业废水不达标排放、海水入侵等问题,水体中Br-、I-等阴离子和Pb2+、Mn2+、Ca2+、Mg2+等阳离子含量增加。这些无机离子在消毒过程中对消毒副产物(Disinfection Byproducts,DBPs)的生成造成一定影响。为此,本文以富里酸(FA)氯化过程为主线,金属离子(Pb2+、Mn2+、Ca2+、Mg2+)和Br-、I-为干扰因素,研究氯化消毒过程中无机离子对三卤甲烷(TH
学位
冬季,我国北方大部分地区气温较低,当降雪时路面易出现积雪和结冰情况,不仅降低道路通行效率,而且严重威胁行车安全,导致交通事故率明显增加。交通流仿真作为研究交通领域问题的重要工具,可通过对冰雪下道路交通流的仿真,为冰雪下道路管理控制措施提供更加准确的决策依据,从而降低交通事故概率,提高道路交通安全。目前,不良天气下的道路交通安全研究主要集中于宏观统计分析及管控、车辆动力学分析等方面,借助于交通流微观
最优分红问题是金融保险中研究较多的问题之一,其中基于Cramer-Lundberg风险模型的研究也十分普遍.一般说来,要求得最优分红问题的值函数与最优分红策略是保险中随机控制理论中非常困难的问题之一.相关文献中关于值函数与最优分红策略的数值算法的研究很少.此前曾有文献应用迭代算法分析两个合作的保险公司的最优分红问题.受其启发,本文给出了Cramer-Lundberg风险模型下最优分红问题的值函数与
我国西部地区地形以山区为主,地震活断层分布广泛。为适应多山及多峡谷特点,建设了较多连续刚构桥并且临近地震活断层。具有向前方向性效应的近断层地震动含有速度脉冲且在历史上造成了较严重的桥梁破坏。近断层地震动显著脉冲并不仅仅发生在垂直断层方向,而且会出现在一定角度范围内。目前国内桥梁抗震分析尚未考虑地震活断层走向影响,或者说尚缺少足够的认识,因此本文结合工程实际,进行了近断层地震动作用下断层走向对连续刚