【摘 要】
:
语音识别是由声学模型解码与语言模型解码两部分共同作用下完成的,其中语言模型是语音识别一项重要的技术,也是语音识别当中的重要研究部分。传统的语言模型解码一般采用2-gr
论文部分内容阅读
语音识别是由声学模型解码与语言模型解码两部分共同作用下完成的,其中语言模型是语音识别一项重要的技术,也是语音识别当中的重要研究部分。传统的语言模型解码一般采用2-gram模型获取语言模型得分,缺乏更长距离的语义信息。本文采用基于改进的词激活力长距离语言模型获取自然语言中的长距离的语法知识和语义信息,通过实验证明了长距离语言模型所包含的长距离信息在语音识别解码过程中的有效性,同时也进一步探索了长距离的语言模型在语音识别后处理过程中的重要作用。本文的主要研究工作与创新包括以下方面:1.研究了基于改进的词激活力长距离语言模型构造并改进了传统的词激活力模型,使其在概率形式上与传统的n-gram语言模型更加一致,从而能够更好的与传统n-gram语言模型进行插值平滑。实验表明基于改进的词激活力长距离的语言模型既保留了邻近词对的关系,又加入了长距离的全局关系,有比较好的识别准确率。2.提出了基于长距离语言模型的语音识别解码算法把基于改进的词激活力长距离语言模型应用到语音识别的解码过程当中,利用更远距离的历史词与当前词的联结关系扩展传统2-gram语言模型信息。探讨了长距离语义信息与相邻信息不同的结合方式,并且考虑了解码中的历史词距离以及后验概率等影响因素。实验表明长距离语言模型在语音识别解码过程中有着重要的作用。3.研究了长距离语言模型在lattice重打分中的应用把基于改进的词激活力长距离语言模型修改成前向和后向两部分,并分别应用到语音识别的后处理过程中,利用长距离语言模型的长距离信息对lattice词弧上的语言模型得分进行扩展。结合词激活力和lattice本身的特性分别实现了前向、后向以及前向后向相结合的重打分过程。实验表明长距离语义信息的引入对重打分过程的识别率提高有重要的作用。
其他文献
随着无线通信技术的飞速发展、移动终端的快速普及和各类应用软件的层出不穷,基于位置的服务(Location-based Service,LBS)已成为日常生活中不可或缺的一部分。但是人们在享
磁共振成像(Magnetic Resonance Imaging,MRI)因其具有无电离辐射性、多参数成像、多方位成像等优点被广泛应用在医学临床研究中。然而成像速度一直以来都是制约MRI快速发展
面对如今半导体制造生产线复杂不确定的加工环境,开展数据驱动生产过程建模,通过对数据信息的有效提取挖掘和预测建模,指导生产过程并提供最佳的解决方案。考虑到许多实际调
随着社会经济的发展,大城市面临交通拥堵问题。发展公共交通是缓解城市交通拥挤的有效方式。公交车辆调度问题是公交运营过程中的重要问题。纯电动车因具有运输成本低、低噪声、零排放等特点,受到政府的关注,但因其续驶里程短,充电时间长,电动车辆调度问题更加复杂。多车场公交车辆调度能动态调配各线路上的公交车辆,节约公交运营成本,因而是当前公交车辆调度的研究热点。然而,当前多车场电动公交车辆调度研究还非常有限。本
随着互联网技术的发展和大数据时代的到来,数据量的爆发式增长和大数据分析技术的成熟使用户画像成为自然语言处理、数据挖掘等领域的重要研究课题。性别作为建立用户画像的
现今,随着移动互联网,物联网等以无线信息通信技术为基础的新兴行业的发展,频谱需求更胜从前,与旧有频谱管理模式的摩擦与碰撞也日趋显著。为保证通信产业持续,健康发展,需要
随着信息产业的兴起到蓬勃发展,软件开发的管理与协调已经逐渐形成了一门必不可少的开发技能,由多个单元协作来完成各个庞大的软件系统之间的协作显得越来越普遍,随之而来的,
随着移动互联网应用的普及,用户每天接触的信息量成倍增长,对信息的敏感度下降,这就导致商业服务机构精准地向用户发送用户感兴趣的营销信息变得异常困难。在商业信息服务领
CRAN(Cloud Radio Access Network)是由中国移动研究院从降低网络建设维护成本的角度出发而提出的一种新的无线网络架构方式。在这种架构中,基带处理单元进行集中式部署,形成
在移动互联网迅速发展的背景下,手机电视、视频会议等广播视频业务逐渐成为移动视频业务的新热点。传统数字视频编码中,由于信源信道编码相互分离,无法为不同信道状况、不同