基于集成学习的说话人识别研究

来源 :天津理工大学 | 被引量 : 0次 | 上传用户:LVBIN0077
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种仿生智能技术的发展,适用于特定场景的说话人识别系统也层出不穷。说话人识别技术作为生物仿生特征识别的重要研究分支,以其广泛通用性、长效稳定性和成本低等优势,在各个领域中获得了广泛应用。鉴于集成学习算法具备强大的非线性分类能力,目前已经被应用于说话人识别系统中并取得了一定的研究成果,但传统的集成学习算法依旧存在识别精度不足、效率低、鲁棒性差以及对不平衡数据分类能力弱等问题。本文针对传统集成学习算法的不足,围绕多场景语音识别需求开展深入的研究,基于生物免疫学理论提出了适用于多种实际情况的集成学习分类算法,推动了说话人识别技术在刑侦、身份确认、安保安防等领域的应用。本文主要研究工作和创新点如下:(1)针对传统集成学习算法处理不平衡数据时错分代价大、精度低的问题,提出了Bal-Adaboost算法并应用于说话人性别识别中。该算法受分类器评价标准的启发,在传统Adaboost算法的基础上,加入了可自适应调节的惩罚项,通过实现数据最优划分,有效解决了不平衡数据分类问题。基于公开不平衡数据集与说话人性别数据集对算法进行验证,结果表明Bal-Adaboost算法在两类数据集上都表现出更高的精确性,可实现待分类数据的最优划分。(2)针对传统集成学习算法分类速度慢、鲁棒性差的问题,提出了基于生物免疫特性的Immune Boost算法并应用于单类说话人识别中。该算法借鉴生物免疫特性,利用先天性免疫分类器与适应性免疫分类器的协同作用,解决了传统Adaboost算法存在的算法复杂度高、时间耗时较长、训练误差高的问题。本文通过大量实验对比了算法在不同数据集中的性能,结果表明Immune Boost算法在单类说话人声纹数据集、高斯数据集以及公开数据集上均表现出较高的分类准确率、鲁棒性与高效性。(3)针对传统集成学习算法处理多类分类任务时存在的精度低、运行速度慢的问题,提出了MC-Immune Boost算法并应用于多类说话人识别中。该算法以先天性免疫分类器的决策策略为出发点,提出了一种基于改进决策准则的MC-先天性免疫分类器,进一步提高了MC-适应性免疫分类器的有效性。实验证明,本文提出的MC-Immune Boost算法在多类说话人声纹数据集和公开数据集上取得了良好的识别性能。
其他文献
为提高无人车识别前方行人及车辆的识别速度和准确性,提出了一种激光扫描双目立体视觉成像方法。针对现有匹配方法抗干扰能力弱,不能快速高效的识别出物体的间距,并且误差太大等不足,提出了基于激光线的强特征点匹配方法。此方法模拟人的双眼观察车前环境。采用激光扫描模块和双目视觉结构构建双目立体成像系统;利用扫描到物体上的激光线作为左、右视图的强特征线索进行双目视觉匹配,从而进行物体的深度测量感知。本文选择张正
在工业生产以及日常生活中会产生大量含油废水,随意排放对我们所生存的环境造成了不可预估的危害。高效率、低能耗的油水分离技术是避免含油废水排放及对其进行有效回收再利用的重要手段。传统分离方法存在成本高、效率低等缺点。膜分离技术因为制造成本低、应用工艺简便等优点在油水分离方面受到国内外学者的广泛关注,如超疏水超亲油膜、超亲水超疏油膜。目前常用的超疏水超亲油膜适用于油重水轻的油水分离体系。然而大多数油的密
近年来,为了应对全球能源需求增加和环境污染问题,人们提出了一种智能窗的概念,用于节约建筑物用于空调制冷-制热调节室内温度所消耗的这一部分能源。热致相变智能窗可以在室内温度低时提高透过窗户进入室内的太阳光辐射量,在室内温度高时隔绝太阳光辐射进入室内,因此可以有效降低人们为了调节室温的能源消耗。二氧化钒(VO2)的相变温度在室温附近,且相变过程可逆,很适合用作智能窗的功能涂层。VO2在应用研究中的主要
当前,有机污染物造成的水污染问题亟待解决,作为典型的有机水体污染物,染料因其毒性高、色度强、难以生物降解而被广泛研究。与传统技术相比,光催化技术能耗低、反应条件温和、无二次污染,是环境治理领域最有应用前景的技术之一,作为新型的光催化剂,石墨相氮化碳(g-C3N4)与钨酸铋(Bi2WO6)的制备过程简单、化学性质稳定、禁带宽度适宜,广泛应用于光催化领域,研究人员为弥补单一光催化剂效率低的缺陷,开始对
情绪是当人受到外界刺激时所产生的适应性心理和生理表达。由于听觉能力缺失,使得聋人在成长的过程中容易出现社会适应能力差、情感表达障碍和情绪偏差等问题。本文提出了一种基于脑电信号的聋人情绪识别方法,主要研究内容如下:(1)设计了基于视频诱发的聋人情绪实验范式,采集了聋人在积极、中性和消极状态下的脑电信号,建立了一个包含15位聋人的情感脑电数据集。受试者在每个电影片段播放结束后根据SAM(Self-as
在常用的两级式光伏并网系统中,逆变器作为硬件电路与电网之间的桥梁,其控制性能的优劣直接关系到系统的发电效率和稳定运行。逆变器不仅负责调节和保护网侧电流,还应保证连接前后级的直流母线电压具备一定的强抗扰性。如果未能正确控制直流母线电压,会严重影响系统的可靠性,甚至触发相关的保护设备。因此,逆变器直流母线电压的鲁棒控制一直受到广泛学者的关注。考虑到并网系统运行条件的不确定性以及电力电子器件内部含有多种
当今能源格局正在发生重大变革,人们对低碳可再生能源的需求日益增大。以石墨为负极的传统锂离子电池,受到理论容量的制约,越来越不能满足人们的需求。急需开发高能量密度的电池,锂金属电池以极高的理论容量3860 m Ah g-1受到人们的关注,锂金属负极被认为是未来比较有潜力的负极材料。然而枝晶造成的安全问题和循环过程中的体积变化一直阻碍着锂金属负极的商业化。因此,寻找有效的保护策略来抑制枝晶的生长成为锂
随着智能设备数量的急剧增加,近年来物联网得到越来越多的关注,然而动态性、大规模的网络结构特点也给物联网系统带来了安全风险和挑战。访问控制系统是保护物联网设备数据隐私与安全的可靠手段,但是目前基于集中式服务器的访问控制框架仍存在单点障碍的风险,且难以应用于轻量级物联网设备,区块链技术的出现上述问题提供了一种可行的解决思路。本文对基于区块链的物联网分布式访问控制机制进行研究,主要工作及创新点包括以下几
通过二阶非线性波长变换获得的光波在全光通信网络、光存储、高清显示以及医学与军事成像等领域存在着诸多应用。为得到宽谱输出,本文采用了有效非线性系数模型、传递函数法与电光效应,从理论推导和数值模拟的角度进行研究,实现了宽谱输出,具体的研究内容包括:1.总结概括了波长转换技术的研究背景与意义,对比分析了几种相位匹配方式与常见的准相位匹配光栅结构,并具体分析了国内外研究现状和目前研究中存在的问题。对波长变