基于高层语义特征提取和数据集间不匹配补偿的语种识别方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:kingworsebest
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当代人工智能研究的蓬勃发展,自动语音识别及其相关技术的应用也越来越广泛。语种识别作为自动语音识别技术的重要组成部分,在包括自动语音转接等多个领域都有着重要的作用。近年来,关于语种识别技术的研究成果层出不穷,性能相比于上世纪已经取得了显著的提升,然而其目前仍面临着高层语义信息利用较少、短时语音处理效果差、易受不同数据集间差异影响等问题。随着语种识别技术重要性的日益凸显,该领域急需研究更为合适的处理方法。为了提升语种识别模型的性能,本文将对基于时序信息的长短时网络与高层语义嵌入向量的语种识别方法进行深入探索。在基于时序信息的长短时神经网络的识别方法中,首先阐述了这类网络对语种时序性信息的提取能力和对语种高层语义信息的概括能力,进而通过结合如瓶颈层特征等包含语音段高层语义信息的特征表达来构建新的网络结构,并以所提取出的反映高层语义信息的嵌入向量代替传统语种识别模型中的语种身份向量来构建新的语种识别模型,以提升语种识别的性能。实验表明,上述两种模型的性能与使用余弦距离分类的i-vector基线系统相比分别有30.07%和20.60%的提高。为了解决语种识别过程中遇到的数据不匹配问题,本文提出了使用基于隐变量子空间因子分析的方法。它的核心思想是根据输入语音段的相关信息,利用其矩阵分解在子空间上的表示方法,通过对长短时神经网络统计信息池化层的输出进行补偿修正,以达到提升语种识别性能的目的。该方法对基于时序信息的长短时网络与高层语义嵌入向量的语种识别方法在不匹配数据集上的性能提升比较明显,两种方法与采用原始模型的方法相比分别提高了约12.6%和23.0%,并且与基于径向基核函数支持向量机分类方法的i-vector基线系统相比性能分别提升了约10.10%和10.88%。
其他文献
青苗会是近代华北农村普遍存在的一种村落组织形式。本文运用20世纪40年代前半期满铁调查部惯行班在华北地区的调查资料,具体考察了其中记录的六个村庄的情况,通过上述文献材
新疆民众反帝联合会是盛世才在新疆创办的一个群众性政治组织,成立于1934年8月,解散于1943年8月。主要开展各种经济社会文化活动,以组织教育群众,宣传新政府政策,建设新新疆。1935年6月,俞秀松受联共中央的委派到新疆工作,改组新疆民众反帝联合会并担任秘书长。经过此次改组,新疆民众反帝联合会的章程更加完善、宗旨任务更加突出、组织机构更加健全,同时制定了对会员的惩罚规定,以整顿组织纪律。俞秀松在新
与外界通讯以及遥感探测等天线辐射特性往往会受到周围环境的影响,主要影响因素包括天线载体平台、天线舱、天线罩、高超声速飞行情况下形成的等离子鞘套等。这些因素可能会导致天线辐射场在空间分布发生改变、方向图的发生畸变、阻抗失配、回波损耗驻波比等性能参数改变等等,进一步会造成天线系统故障甚至更严重的事故发生,因此研究载体平台与等离子体鞘套对天线影响问题具有理论意义和实际价值。本文依据现有理论基础,在微波暗
由于现代科学技术不断完善,信息技术的发展需求电子器件尺寸小型化,以满足器件高度集成化的要求,因此对于制造器件的材料产生更多的限制。二维材料由于在电子和光学方面的独
传统的穿墙雷达成像方法在对墙体后隐藏目标进行探测时通常将探测环境的墙体位置作为先验条件并设定为固定值,实际上这种处理方式在工程应用中并不适用。在实际环境中墙体的
随着大数据时代的来临,数据规模日益变大,庞大的数据量不再适用于传统数据的展现形式。可视化技术是帮助人们理解和分析复杂网络最重要的手段,但信息的高速发展,复杂网络呈现
共形阵列是指天线依附在载体表面,与载体外形保持一致的天线阵,不仅具有良好的隐身性能、气动性能以及更广的估角性能,而且能够用于感知目标的角度域、极化域等多维域信息。因此,共形阵列在雷达、声呐以及无线通信等领域有着广阔的应用前景。在实际应用中,由于加工工艺水平有限,环境温湿度变化以及器件老化等多种因素使得阵列存在误差,导致基于理想阵列导向矢量的高分辨阵列参数估计方法性能恶化。对于平面阵列,我们可以采用
随着互联网时代的进一步发展,数据成为了一种新兴的生产资料。当前,各行各业的信息系统中包含了大量的数据,尤以关系型数据为主,这些数据往往存在错误,难以有效利用。因此,人们希望能够找到一些行之有效的策略对数据进行修复,而在关系型数据中,函数依赖扮演了数据修复的重要角色。函数依赖(Functional Dependency)是关系模型中的一个重要概念,可被用于模式泛化,数据清洗,数据修复,数据整合等。关
在党的十八大和十三届三中全会上,我党首次明确提出了“立德树人”的要求。为落实此要求,教育部一方面颁布实施了《关于全面深化课程改革落实立德树人根本任务的意见》,另一方面据此制定了核心素养体系,并相应修订了《普通高中课程方案和课程标准(2017年版)》,以强调课程教学必须基于学科核心素养培育。凝练了物理学科本质的学科核心素养,对学生的必备品格和关键能力以及正确价值观念提出了明确要求,即培育高中生物理观
随着物联网的发展,越来越多的移动设备通过无线连接到互联网,传统的集中式云计算无法满足爆炸式的数据增长,移动边缘计算(MEC)应运而生,同时5G通信技术的发展也大大方便了迁移计算。在MEC系统中,优化目标大多是最小化系统的能耗,而任务分发算法就起了很重要的作用,所以本课题主要研究MEC系统中的任务分发算法,并且针对已有的任务分发算法的缺点和不足,进行了补充和完善。在原有的MEC系统中增加了数据共享的