基于矢量量化和隐马尔可夫模型的说话人识别研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:wlh0403
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是指通过说话人的语音特征来自动识别说话人的身份,它在许多领域内都有良好的应用前景。本文通过分析说话人识别基本原理与系统结构,考察现有的说话人识别技术,研究线性预测倒谱系数及其差分、美尔倒谱系数及其差分特征参数相结合,矢量量化(VQ)与隐马尔可夫模型(HMM)相结合的方法应用于说话人识别,建立说话人识别系统。 本文首先从语音信号的预处理开始分析,对语音信号进行了端点检测,滤除了语音信号的无声段和噪声,为语音特征参数的提取提供了有效的语音段。本文还比较了传统的语音端点检测方法与基于LCP美尔倒谱特征的端点检测方法的性能,通过比较基于LCP美尔倒谱特征的端点检测方法能够更好地在高噪声环境下检测出语音端点来。 本文应用全极点模型提取语音信号的线性预测系数,并推导出其倒谱系数,获得线性预测倒谱系数及其差分,用以描述说话人声道的动态变化。选用美尔倒谱系数及其差分作为语音识别的特征参数,来描述人耳的听觉频率非线性特性。实验证明这种将倒谱系数与其一阶差分结合在一起形成新的特征参数与单纯的线性预测倒谱系数和美尔倒谱系数相比能有效地提高识别率。 识别算法方面,分析了目前常用的矢量量化(VQ)方法和隐马尔可夫模型(HMM)方法,介绍了矢量量化的基本理论及其LBG算法,还分析了隐马尔可夫模型的理论基础及其有关实现算法,研究了其在说话人识别中的应用。 最后用matlab软件仿真实现了一个说话人识别系统,该系统包括了说话人辨认模块和说话人确认模块。程序界面友好,操作方便。先对实验中的10个人进行声音采集,预处理,然后在仿真系统上,分别用VQ和HMM两种识别算法进行实验仿真。最后又提出了基于VQ和HMM的说话人识别系统,在隐马尔可夫模型前端采用矢量量化为每一说话人设计码书,避免了由于说话人使用同一码书带来的量化误差,接着将误差又带到下一级的HMM识别,引起误差积累效应。获得了很高的识别率。具有运算速度快,计算量小,差错率低等优点。
其他文献
光纤陀螺自问世以来,在短短30多年时间里取得了日新月异的发展。由于其自身独特的优点,目前光纤陀螺已广泛应用于航空、航天、航海及陆地的军用和民用的各个领域。本文研究了
相对导航技术是编队飞行、建立空间站、交会对接和空间攻防等航天器接近任务的一项关键技术。本文以空间攻防为课题背景,根据近距离非合作目标交会的特点,提出了将基于贝叶斯估
臭氧(O3)是一种极不稳定易分解的物质,工业上最常用的产生臭氧的方法是介质阻挡放电法,简称为DBD法。在臭氧发生器等效电路和电气参数一定的情况下,供电电源成为DBD法的关键。目前常用的臭氧发生电源中,逆变器主功率开关器件在运行过程中存在着不同程度的开关损耗,当工作频率越高时,开关损耗问题更为突出,严重影响了电路工作效率和开关频率提高。本文在分析臭氧发生电源提高放电效率方法的基础上,根据臭氧发生电源
混沌运动是非线性系统中一种非常复杂的现象,对初值极端敏感,具有遍历性,连续宽带频谱,类噪声等特性,是近年来非线性科学领域研究的热点。混沌现象大量地存在于实际工程之中,对其加
间歇过程作为一种典型的生产方式,广泛存在于钢铁冶金、化工制造、生物医学以及半导体等生产过程中。间歇生产过程存在着多变量、时变性、反应复杂、多工序等特性,使得人们难以根据机理来建立模型,而基于数据的软测量技术的出现、研究与发展,使其逐渐成为间歇生产过程中最有效的建模分析方法。其中,以主元分析(PCA)、偏最小二乘(PLS)为代表的多元统计学方法以其独特的核心技术,被广泛的应用于间歇过程的质量预报、在
智能推理作为人工智能的一个重要研究领域,一直以来都是一个研究热点,但尚需解决的问题或难点还有许多。有些实际问题,需要在信息量不充分的条件下进行数据处理,这方面的研究尤其
本论文是在“棉杆APMP制浆设备自动化控制系统的产业化研究”项目的资助下完成的。在对盘磨控制的分析过程中,针对其控制系统中门槛功率无法确定最优系数的特点,采用盘磨打浆专
蚁群优化是意大利学者M. Dorigo,V. Maniezzo和A. Colorni通过模拟蚁群觅食行为提出了一种基于种群的模拟进化算法,它具有多样性、分布式并行处理、自组织、自适应和鲁棒性等功
城市轨道交通车站作为乘客乘降的场所,是乘客与城市轨道交通发生联系的纽带。轨道交通线路、线网客流特征实质上是车站客流特征叠加及交换的效果体现。目前已有诸多关于轨道交
近年来,随着无限通信和计算机技术的迅速发展,室内定位技术受到社会各界的极大关注,人们对于位置服务的需求越来越迫切。如今WIFI热点在室内的部署广泛而密集,利用WIFI网络实