嵌入式声控拨号器的设计与实现

来源 :清华大学 | 被引量 : 0次 | 上传用户:handsomeboywp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着无线通讯和个人数字助理(Personal Digital Assistant, PDA)的迅猛发展,语音识别技术在嵌入式系统和设备上的应用逐渐成为新的热点。但是,受PDA设备的存储空间和运算速度等因素的制约,语音识别应用的普及受到了限制,为此需要有针对性地改进语音识别技术。本文基于嵌入式操作系统PocketPC,以非特定人语音命令识别的声控拨号系统(声控拨号器)为研究平台,研究在不影响识别性能的前提下降低声控拨号系统时空复杂度的方法。论文工作包括如下方面:(1)研究了在不降低识别性能的前提下,选用合适的语音识别基元、选取较少特征维数进行声学建模的方法。通过实验比较选定扩展声韵母作为识别基元,并对PC上使用的多维特征进行压缩,提出一种把基于基元拼接、整词识别的声学建模技术用于嵌入式声控拨号系统的方案。(2)研究了正确候选搜索路径在Viterbi束搜索中的排名顺序随输入语音时间(即输入特征序列帧号)之间的动态变化关系,以及排序后相邻排名的搜索路径分数差值随时间的变化关系,提出了一种结合搜索路径分数差值进行调整的动态调整直方图剪枝的搜索策略,减少了搜索解码的计算量,提高了速度。(3)研究了搜索解码过程中的似然分重复计算问题,提出在Viterbi解码中利用速查表加速计算的方法,进一步提高搜索解码的速度。(4)研究了传统端点检测技术在实际嵌入式应用中出现的零漂移、开头纯零等问题,提出端点检测算法的改进方法以提高端点检测的准确性。在上述方法的基础上,设计并实现了一个非特定人的可定制词表的实用语音命令系统。在实际的PDA设备上的测试表明,当词表随机选取为200个中文人名时,识别正确率可达到98.70%,相对于基于标准算法的系统,识别速度可提高约80倍,而搜索存储空间可节省约30%。
其他文献
<正>目前商业银行合规工作的展开,应考虑从以下几个方面入手。一要充分认识合规管理的价值。如果对合规管理的价值没有正确的认识,倡导合规人人有责,主动合规就只能沦为空谈
宋太宗见徐熙的作品《石榴》后,感叹徐熙的绘画技艺高超,并"遍示群臣,俾为标准"。但实际上,北宋前期画院却是"黄氏体制"风靡朝野,并成为一时之标准,统治北宋前期近百年之久。
<正>随着市场环境日渐复杂,行业竞争日趋激烈,广告策略的重要性逐渐突显出来。广告运作的成败往往取决于策略的抉择与判断,广告策略不再是聊备一格的应景文章。“‘策略先行,
婚内强奸是在婚姻关系存续期间,丈夫违背妻子意志,强行与妻子发生性关系的行为。婚内强奸是客观存在的,但是其是否构成强奸罪需要慎重思考。主张婚内强奸构成强奸罪的观点存
互联网的发展,使人类进入了信息化时代。在这个崭新的时代中,网络购物逐渐走进人们的生活,并且成为人们生活中重要的一部分。网络购物改变了传统的消费方式和消费理念,以其特
随着GIS技术的不断发展和DEM的广泛应用,基于DEM的流域水文特征分析研究受到越来越多的关注。目前,基于格网DEM的水流方向算法,会因为地形的局限,无法准确地进行模拟分流,水
作为传递知识的基本形式,课堂教学具有不可忽略的作用,不管在课改之前,还是在课改之后,课堂教学都发挥着重要的作用。在传统的小学数学课堂教学过程中,教师扮演的是一个传授
<正>一、市场经济解放了生命个体建立社会主义市场经济体制,给我们的社会活动和人们的思想意识、行为准则、生活方式带来巨大的变化、对记者采访意识的生成,也带来不同的要求
本文以2004-2012年具有券商股权投资背景的IPO企业为研究对象,通过考察不同背景分析师在锁定期前后"乐观"倾向及预测准确性差异,探讨股权投资背景下券商潜在利益输送问题。研
近年来医院改扩建的现象越来越广泛,这也在很大程度上带动了多院区医院的快速发展。但目前多院区医院管理中仍存在诸多难点,本文主要针对多院区管理上的难点问题分析,总结相