声纹密码识别的关键问题研究

被引量 : 0次 | 上传用户:mantou119119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声纹密码识别是文本相关的话者识别技术在日常生活中的一个具体应用。同时关注人的个性声音特征和语音内容信息的双重特点使得声纹密码识别成为有效的个人身份认证方式。然而在实际应用中,传统的声纹密码识别技术仍然受到了来自环境干扰、密码泄露、数据不足等多方面问题的挑战。如何能够化解这些问题的影响、提升声纹密码识别的性能,是本文重点关注的方面。传统的识别技术能够很好的辨识不同内容的语句,因此本文的声纹密码识别任务着重于研究极端的密码泄露问题(冒认和注册使用同样的语音内容)。针对以上在实际应用中将会面临到的种种困难,本文从多个方面展开研究,以提升声纹密码识别的可靠性。鲁棒性的活动语音检测以及特征参数提取,是声纹密码甚至是整个语音识别中的关键问题之一。本文在活动语音检测算法中提出了能量与模型参数相结合的端点检测算法,通过准确判定人声语音片段端点,得到更加有效的人声特征参数,相比基线系统,等错误率可以降低4.4%;另一方面提出基于声学特征的频率选择方法,降低了同样语音文本内容带来的不同的人声音区分度不高的影响,相对于基线系统,等错误率可以降低27.9%。这些新方法的提出较好的提升了前端特征的鲁棒性。针对声纹密码中文本内容的时序特性,本文引入帧间相关性概念,进一步提出N-gram的最近邻方法,很好地提升了系统识别率,等错误率相对于未采用N-gram方法的基线系统可以降低7.7%。本实验也从另一个角度验证了音素在声纹密码识别中的重要性。针对声纹密码的训练和测试语音数据长度很短的问题,本文提出了隐马尔科夫-通用背景模型算法。算法使用大量其他人数据先建立话者无关的声韵母HMMs作为通用背景模型,再根据最大后验概率准则,以通用背景模型为基础使用训练语音自适应获得话者模型。该算法一定程度上解决了训练数据不足的问题,等错误率为6.57%,表现出了较好的性能。进一步结合第三章提出的特征频率选择方法,等错误率还可以降低31.3%。
其他文献
在当今这个信息时代,网络已进入千家万户,信息技术更是日新月异。电子商务系统已逐渐成熟并不断地为用户提供更多的服务,但是其结构也变得更加复杂。用户经常会迷失在商品信
动漫是动画和漫画的统称。动漫作品中的出场形象,由于在实际生活中成为群众喜闻乐见的虚拟明星而产生了一种消费吸引力,许多精明的商家随之将其商业化开发,从而与原有的作品
张艺谋是我国第五代电影导演中的代表人物,他的多部电影在票房上取得了很好的成绩,并且受到广泛好评,同时,也对其他的华语电影和华语电影导演产生了重大影响。除了环环相扣的
《弱点》是美国好莱坞一部既叫座又叫好的温情励志片。英文原名直译为盲点,是橄榄球术语,指四分卫背后看不见的盲区。盲点在本片中包含了多重含义,既指橄榄球新星迈克尔·奥
环境问题既是可持续发展的缘由,也是可持续发展的核心。随着经济快速发展与人口迅速增长,能源危机日益临近,生态环境受到越来越多的破坏,区域可持续发展已经成为当前国际国内
不同的回指语为什么存在形式上和分布上的差异,这是回指研究所要解答的主要问题。以Ariel为代表的可及性理论将回指语彼此之间的差异归因于所指对象实体在心理空间中可及性的
针对一类由制造商、零售商组成的再制造闭环供应链系统,考虑政府奖惩激励措施,应用博弈论方法研究了新产品和再制造产品无差别定价时集中决策和分散决策模式下的定价策略,得
研究表明,词汇掌握的质量与听、说、读、写各项语言能力的提高有密不可分的关系,与高考能否成功息息相关。然而新课程标准中对八级词汇目标这样表述:“学会使用3300个左右的单
1928年的佩恩基金研究和1942年陆军实验,标志着两种与以往完全不同的受众观登上学术舞台。前者将受众置于美国式自由主义的解释框架之中加以理解,并通过效果研究展现受众权利
为实现加工过程中进给速度和加速度的平滑过渡,减小其突变时对机床的冲击,更好地保证加工精度,提出一种基于S型加减速的前瞻自适应非均匀有理B样条曲线插补算法。该算法根据