手机语音识别系统中语音活动检测算法研究与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：Henkel_liu

【摘要】

：

近年来，语音识别系统开始被广泛地推广应用到手机等智能移动设备中，语音活动检测作为语音处理中的重要前端部分，可以在数字音频信号流中检测到语音部分。基于检测结果，抛弃非语音

【作者】

：

姜楠

【出处】

：

上海交通大学

【发表日期】

：

2014年期

【关键词】

：

智能手机语音处理语音活动检测高斯混合模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来，语音识别系统开始被广泛地推广应用到手机等智能移动设备中，语音活动检测作为语音处理中的重要前端部分，可以在数字音频信号流中检测到语音部分。基于检测结果，抛弃非语音部分，仅将起止点准确的语音区间输入下一级处理，将有效地提升系统性能指标和降低整体资源开销。尤其在移动终端设备的应用中，算法应尽可能优化复杂度，同时兼顾低功耗、实时性强和检测精度可靠的应用需求。本文首先分析语音信号特征和分帧、预加重、语音增强三项的预处理步骤解决方案，成为提取语音特征并检测其语音活动性的基础；接着研究了多种经典特征和新兴特征的提取和参数优化，并结合基于门限比较法的平滑判决策略，设计了一套低功耗的语音活动检测解决方案，实验发现在高信噪比（≥10dB）的应用场景下具有实用意义。为了进一步提高抗噪声能力，本文继而提出了基于高斯混合模型的多特征混合改进算法，有效地处理了手机应用常见噪声的中低信噪比情况。本算法基于MFCC特征和高斯混合模型建模，并通过创新的多特征组合方式，将时域特征和频域特征相结合、短时平稳性和局部变化规律相结合，提高检测准确率。本文所设计的算法，与其他语音活动检测算法相比，尤其在环境中含有嘈杂语噪声时（如：办公室环境）性能较优。论文最后以所研究的算法为基础，在Android智能手机上设计实现了实例应用，开发了可供多平台多系统扩展复用的语音活动检测功能模块，并验证了本文提出的解决方案可以满足实际应用需求，具有较高的准确率、适应性和实用意义。

其他文献

从传统OA到协同管理平台的跨越——广西机场管理集团协同信息化实践

<正>广西机场管理集团有限责任公司(以下简称集团)是广西壮族自治区人民政府直属国有大型航空运输保障企业,代表广西壮族自治区人民政府对区内民用机场的管理、经营进行统筹

期刊

广西机场管理集团协同管理致远业务集成

饲料污染物呕吐毒素对单胃动物家禽和猪肠道的影响(续完)

<正>上期回顾:上一期介绍了呕吐毒素对营养素肠道吸收、对肠道通透性的影响和对紧密连接蛋白表达及其mRNA转录的影响。2.7呕吐毒素对肠道固有免疫反应的影响很早就发现局部免

期刊

呕吐毒素氧化应激GNB单胃动物猪肠道

尿激酶溶栓疗法对脑梗死患者血液流变学的影响

目的探讨尿激酶溶栓疗法治疗急性脑梗死时血液流变学的变化 .方法对 42例急性脑梗死患者进行尿激酶 7日溶栓疗法 ,于溶栓前、溶栓后第 3～ 4d及第 7～ 8d分别检测血液流变学指标

期刊

急性脑梗塞尿激酶溶栓疗法血液流变学Acute cerebral infarctionUrokinaseThrombolytic therapyHemor

艾滋病合并肺结核患者临床分析

目的提高对人类免疫缺陷病毒感染/艾滋病（HIV/AIDS）合并肺结核的认识.方法分析了12例AIDS合并肺结核患者有关资料.结果 12例AIDS合并肺结核者X线胸片显示病灶超过4个肺野9例，出

期刊

人类免疫缺陷病毒肺结核艾滋病HIV/AIDS

SPE-GC/MS法测定血液和尿液中的溴敌隆

目的建立固相萃取-气相色谱/质谱法(SPE-GC/MS)测定血液和尿液中溴敌隆的测定方法。方法血液、尿液经乙酸乙酯提取、氮吹、加1 ml乙酸乙酯溶解,过OasisHLB固相萃取柱净化、

期刊

固相萃取-气相色谱-质谱法血液尿液溴敌隆

民营企业参与国有企业混合所有制改革绩效分析

中共中央第十八届三中全会《中共中央关于全面深化改革若干重大问题的决定》提出要“积极发展混合所有制经济,推动国有企业完善现代企业制度”,混合所有制改革是国有企业转型

报纸

混合所有制国有企业民营企业财务绩效

经济增长与金融功能指标的关联度

对中国银行和股票市场的功能指标与经济增长参数指标进行Granger因果检验,结果显示,银行的公司控制功能构成了储蓄率和储蓄-投资的转化比率提高的Granger原因,银行的储蓄动员

期刊

金融功能经济增长参数Granger因果检验

手机语音识别系统中语音活动检测算法研究与实现

其他学术论文