手机语音识别系统中语音活动检测算法研究与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:Henkel_liu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,语音识别系统开始被广泛地推广应用到手机等智能移动设备中,语音活动检测作为语音处理中的重要前端部分,可以在数字音频信号流中检测到语音部分。基于检测结果,抛弃非语音部分,仅将起止点准确的语音区间输入下一级处理,将有效地提升系统性能指标和降低整体资源开销。尤其在移动终端设备的应用中,算法应尽可能优化复杂度,同时兼顾低功耗、实时性强和检测精度可靠的应用需求。本文首先分析语音信号特征和分帧、预加重、语音增强三项的预处理步骤解决方案,成为提取语音特征并检测其语音活动性的基础;接着研究了多种经典特征和新兴特征的提取和参数优化,并结合基于门限比较法的平滑判决策略,设计了一套低功耗的语音活动检测解决方案,实验发现在高信噪比(≥10dB)的应用场景下具有实用意义。为了进一步提高抗噪声能力,本文继而提出了基于高斯混合模型的多特征混合改进算法,有效地处理了手机应用常见噪声的中低信噪比情况。本算法基于MFCC特征和高斯混合模型建模,并通过创新的多特征组合方式,将时域特征和频域特征相结合、短时平稳性和局部变化规律相结合,提高检测准确率。本文所设计的算法,与其他语音活动检测算法相比,尤其在环境中含有嘈杂语噪声时(如:办公室环境)性能较优。论文最后以所研究的算法为基础,在Android智能手机上设计实现了实例应用,开发了可供多平台多系统扩展复用的语音活动检测功能模块,并验证了本文提出的解决方案可以满足实际应用需求,具有较高的准确率、适应性和实用意义。
其他文献
<正>广西机场管理集团有限责任公司(以下简称集团)是广西壮族自治区人民政府直属国有大型航空运输保障企业,代表广西壮族自治区人民政府对区内民用机场的管理、经营进行统筹
<正>上期回顾:上一期介绍了呕吐毒素对营养素肠道吸收、对肠道通透性的影响和对紧密连接蛋白表达及其mRNA转录的影响。2.7呕吐毒素对肠道固有免疫反应的影响很早就发现局部免
目的探讨尿激酶溶栓疗法治疗急性脑梗死时血液流变学的变化 .方法对 42例急性脑梗死患者进行尿激酶 7日溶栓疗法 ,于溶栓前、溶栓后第 3~ 4d及第 7~ 8d分别检测血液流变学指标
目的提高对人类免疫缺陷病毒感染/艾滋病(HIV/AIDS)合并肺结核的认识.方法分析了12例AIDS合并肺结核患者有关资料.结果 12例AIDS合并肺结核者X线胸片显示病灶超过4个肺野9例,出
目的建立固相萃取-气相色谱/质谱法(SPE-GC/MS)测定血液和尿液中溴敌隆的测定方法。方法血液、尿液经乙酸乙酯提取、氮吹、加1 ml乙酸乙酯溶解,过OasisHLB固相萃取柱净化、
中共中央第十八届三中全会《中共中央关于全面深化改革若干重大问题的决定》提出要“积极发展混合所有制经济,推动国有企业完善现代企业制度”,混合所有制改革是国有企业转型
对中国银行和股票市场的功能指标与经济增长参数指标进行Granger因果检验,结果显示,银行的公司控制功能构成了储蓄率和储蓄-投资的转化比率提高的Granger原因,银行的储蓄动员