论文部分内容阅读
社会的发展过程中音频监听方面的应用越来越多,例如在公安行政工作中为了案件的侦破需要在嫌疑人活动范围内安装监听设备,录音时长可能达到24小时或48小时甚至更长,但是有用的部分只是嫌疑人的语音信息,而这有用部分只占整个录音的一部分甚至极少部分,如果公安人员把录音信息从头到尾倾听一遍这将会耗费很多不必要的人力,浪费很多不必要的时间。如果可以使用计算机进行自动检测,就能在几分钟之内将录音中的语音片段提取出来,将会使工作效率得到很大提升。音频监听系统在其他方面也有广泛的应用,比如在做会议记录中,在录音笔、窃听器或频率扫描中。本文的研究内容为检测录音信号中的语音信号部分并进行提取,最终只保留语音信号部分,方便有目的性地倾听。文章中音频监听系统中活动语音信号检测技术研究在总体上分为两步,分别选取合适的方法与实际相结合完成最终研究。第一,音频信号检测和提取即有声和无声检测,主要使用双门限法端点检测技术进行有声音频段的检测,传统的双门限法是根据经验设定一个阈值,根据参数的计算值与阈值进行比较得到结果,这种方法缺少灵活性,文中对其进行改进,根据前导无话段设置阈值,使得对每段话都设置针对性的阈值。此外,在有声无声检测的基础上添加后处理操作消除毛刺现象,为了听觉效果,如果两个音频片段相隔时间很短(3秒以内),将两段信号视作一段音频信号不进分割;第二,语音信号检测和提取,通过对提取的音频段进行分类,找到语音信号段并进行提取。该部分在五类别的层次化音频分类的基础上对特征参数和判断顺序进行调整使其更适应音频监听系统,最终得到原录音信号中的语音段。对实验数据进行仿真和实验后,最终在第一部分中得到有声音频信号,在第二部分对音频信号进行分类和提取后得到其中的语音信号。与此同时生成相应描述性文件在其中记录每段语音信号的起止时间以及语音的类型参数方便进行数据查询。通过录制和下载各种类型的录音信号进行算法的验证,最终结果证明文章的算法简单容易理解,计算量小,检测结果效果好。