基于wav文件的语音特征参数提取方法改进研究

被引量 : 0次 | 上传用户:cychenying2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别基本任务就是将语音转化为相应的命令或者文本,这项技术具有非常广泛的应用前景,同时作为一个交叉学科也有很重要的研究价值。在语音识别系统中,语音信号特征参数的提取是其中关键的一项技术,语音特征参数的选用对语音识别系统有着重大的影响,尤其是在非特定人的语音识别系统中,语音特征参数是否合适,是否能代表语音信号的特征并尽可能的去除人与人之间语调、语速、音量上的差异,对语音识别系统的运行效率和识别率都有着决定性的作用。本文对语音识别技术和语音特征参数的提取进行了研究。现有的典型的语音系统分为语音信号预处理、端点检测、特征提取、模式匹配和后处理几个环节,而在特征提取阶段,目前主要采用特征参数的是由基于声学模型的线性预测倒谱(LPCC)系数和基于听觉模型的Mel频率倒谱(MFCC)参数。本文通过对人耳听觉现象的观察,发觉语音信号在加速到一定速率内播放时依然能被人耳所轻易识别,而加速后的语音在波形和频谱上表现的更为简单,根据这种现象,本文就针对加速后的语音信号进行特征参数提取实验,并对提取到的语音特征参数进行实际的语音识别效果分析。本论文首先介绍了语音识别技术的概况和语音识别的应用及国内外研究现状,然后对语音识别的原理做了介绍,对语音信号的预加重、分帧加窗、端点检测都做了详细分析。由于本文要对语音识别中的特征参数提取方法做改进,接下来又对语音特征参数的提取做了深入的探讨,提出了对加速后语音信号进行特征提取的方案。然后又运用微软的DirectShow技术和VS2010集成开发环境设计了语音信号的加速变频工具,为后续的实验提供合适的原始语音信号,语音信号都保存为符合RIFF规范的wav文件格式,便于在windows环境下处理。在此之后,本文在Matlab环境下,运用DTW匹配算法做了孤立词语音识别仿真实验,对正常速度下的语音识别效果和加速变频后的语音识别效果分别做了实验分析,得出了实验结论。最后,本文对本次研究做了总结,对以后的研究做出了展望。
其他文献
现阶段就农业而言,构建基于互联网+的现代化农业产业经济发展形态已经成为必然趋势。文中以陕西省为例,对其农产品特征、营销现状以及互联网+对农产品营销的影响进行了分析,
子宫内膜异位症(Endometriosis,EMs,简称内异症)是一种常见的良性妇科疾病,约50%的内异症患者存在不育,但相关机制至今尚未完全阐明。除盆腔结构改变、免疫缺陷等因素外,卵巢
舒伯特的艺术歌曲感情真挚、内容丰富,形式多样。歌词、曲调、钢琴伴奏三者密切配合、水乳交融。特别是钢琴伴奏在对音乐形象的刻画上,对环境的描绘上,在以音乐语言进行人物
本文论述了企业薪酬设计的公平性,分析了影响企业薪酬设计公平性的相关因素,提出了解决企业薪酬设计公平性的对策:理顺薪酬体系,建立多元化分配机制;通过岗位评价,确定岗位工
结合近年来发表的文献和自己在该领域长期的研究,按照基于传统小波、Gabor小波、方向小波变换的划分,对小波变换在人脸识别中的应用做一详尽而深入的总结与展望。
本文以昆山持刀砍人案为研究对象,主要研究其所引发的法理思考。通过对其争议焦点的说明,以法理的观点对案件和公安、检察机关的处理决定进行评析并且通过法理思考对案件认定
针对目前各科技期刊对吸光度(光密度)的量符号的不同认识和不恰当表示方法,分析了吸光度(光密度)的含义,根据《量和单位》国家标准的规定,提出了吸光度(光密度)量符号的正确
本文阐述了电视选秀节目出现同质化的原因,分析了电视节目同质化现象的利与弊,提出了改变电视节目同质化的对策。要注重原创,做到形似更要神似;加强受众研究,注重品牌塑造;完
柑桔新品种"红美人"是从国外引进的新品种,品质优,产量高,效益好,栽培管理方便,在浙江黄岩已产生较高的经济效益,种植面积也在不断扩大。浙江黄岩地区非常适合柑橘的生长,本
核桃蛋白是优质的植物蛋白资源,但含有大量核桃蛋白的核桃渣粕大部分被丢弃或仅作饲用及堆肥用,不仅造成资源的浪费,还会污染环境。近几年研究发现核桃蛋白经酶解以后产生的