与文本无关的话者识别系统的研究与实现

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:kenching
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与文本无关的说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域有着良好的应用前景。 本文介绍了说话人识别系统中需要用到的理论和方法例如高斯混合模型等。利用微软的一些基础类库的框架(MFC)本文构建了一个说话人识别系统。主要提出了一些方法来提高系统的性能,如系统中的拒识策略,通过计算各个说话人的权值,设定一个阈值,将可能性非常小的识别结果给去除,这样可以有效的提高系统的识别率。另外本文提出了一种算法来提高在线识别的效率,它的主要思路是在系统识别过程中将可能性非常小的说话人去除掉以此来提高系统的响应速度。在离线识别方面本文对系统做出了一些改进以适应数据量非常大的情况。利用前人提出的特征分量的距离测算方法,本文提出了一种基于说话人分类的识别方法,用以减少系统的运行时间。 在随后的实验中,本文依靠所实现的系统做了一些实验,通过实验验证了系统中加入拒识策略的可行性,并对系统的响应时间做了分析等。最后本文针对论文完成期间所遇到的一些困难和问题作了一些总结并对以后的研究工作做了分析与展望。
其他文献
随着电子商务和网络的不断发展,大型商场超市业已进入网络会员时代,在网络与实体店铺同步进行销售,但与此同时,商品种类数量越来越多,在琳琅满目的商品面前,无论是从网络还是实体店
遗传规划是一种进化算法,遗传规划所操作的程序树既是问题的解也是对于问题的一种描述。只要提供了描述问题的“函数”和“终结符”,遗传规划就能自动将其结合成解决问题的树
数字曲线可视为一种离散的几何信号;图像可以在空间上进行离散化,成为数字图像;三维几何模型可看作一系列离散点组成的非平稳信号。因而数字曲线、图像和三维几何模型的处理
城市交通中行人交通安全问题逐年恶化。为了保障行人交通安全,减少交通事故,车载行人检测技术已成为目前国内外智能交通领域公认的一个研究热点。它是通过车载的自动监视系统
随着电信技术、IP网络的发展,下一代网络NGN(Next Genration Network,下一代网络)技术正在迅速发展,软交换设备为NGN提供了具有实时性要求的业务呼叫控制和连接控制功能,是NG
P2P网络中,基于半分布式拓扑结构的P2P系统,结合了全分布式和中心化的特点,既有Napster良好的管理功能,又有Gnutella的健壮性和支持复杂查询的特点,具有良好的管理性和扩展性
随着网络带宽和传输速率的日益增大,各种网络业务飞速发展,网络流量自相似性的研究也逐渐成为热点,广泛应用于路由器排队、路由策略选择、网络测量、网络协议性能分析和网络
随着无线网络技术与传感器技术的不断发展与进步,无线传感器网络作为一种结合两者的新型网络技术,正逐渐引起全世界的广泛关注。节点可通过任意方式随机部署,自动组织成一个无线
计算机的发展激起了人们对人工智能的渴望,互联网的飞速膨胀改变人们对信息的理解。人们希望计算机能和人类用语言交流,能读懂互联网上的信息,能帮助人们从海量的信息中准确
分片式处理器体系结构(TPA)能够很好地应对纳米工艺代的功耗、线延迟、设计和验证复杂度等一系列问题,是一种具有良好的性能扩展潜力的众核处理器体系结构设计方案。作为一种