论文部分内容阅读
随着人民生活水平的日益提高和科学技术的的进步,服务型机器人的应用也在逐渐的推广。针对比较贴近人类日常生活的服务型机器人来说,更好的实现人机交互就显得十分必要。语音识别已经在机器人上得到了应用,声源定位功能的开发也将是一个具有重要意义的研究方向。正是在这样一个背景下,本文对服务型机器人上的声源定位方法进行了研究。提出了相应的解决方法,有望提高其智能化水平。本文的主要研究内容有以下几个方面。(1)分析比较了常用的几种声源定位方法,最后选择了易于实现的基于声信号到达时间差的声源定位方法作为本文的研究主线。(2)对信号预处理阶段开展了细致的研究。基本信号模型进行了分类。针对语音段与非语音段的划分,采用了行之有效的语音端点检测方法-频带方差法,可以有效去除非语音段,减小了计算复杂度。由于一般的带通滤波只能滤除设定频带范围外的噪声,对于频带内叠加的噪声无可奈何,所以提出了基于改进谱减法的语音增强方法。(3)系统分析了几种时延估计方法,对它们的工作原理进行了比较细致的研究,并进行了仿真对比。最后选定GCC-PHAT作为本文的时延估计方法,并改进了它的时延估计性能,使它在信噪比较低的情况下时延估计的准确性以及可靠性得到提高,为下一步的位置估计提供可靠的时延值。(4)介绍了两大类定位估计方法:几何定位法和目标函数搜索法。在传统几何定位法的基础上提出了一种基于七元麦克风立体十字阵列的定位方法,快速的缩小了定位的范围,有效排除了模糊解,提高了定位的成功率。(5)对基于声信号到达时间差的声源定位方法进行理论分析以后,又进行了实验验证。通过麦克风阵列采集语音信号,经处理器对数据打包处理后通过串口送入电脑端,运用MATLAB软件对采集到的数据进行分析处理,最终得出声源的估计位置。结果表明本文所采用的方法能够定位出声源的位置,且精度较高,能够满足一定的实际需要。