面向服务机器人的口语对话系统和语言模型技术研究

被引量 : 0次 | 上传用户:jonquil1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音识别技术的日渐成熟,在各个领域的应用层出不穷。对于服务机器人领域,语音技术主要用于服务机器人上的口语对话系统,本文针对可佳机器人的具体应用场景,探究了应用于服务机器人口语对话系统设计与实现的过程。此外,本文还研究了与语音识别中语言模型相关的技术-联合无监督词聚类的递归神经网络语言模型。本文对面向服务机器人口语对话系统的研究主要涉及两个方面:一是语音识别,二是对话管理。在语音识别方面,先较为详细的介绍了语音识别相关基本原理,然后介绍面向可佳机器人应用的语料收集,随后对模块所需声学模型训练的完整步骤做了介绍,并对几种声学模型在本文提供的训练集和测试集下的性能做了实验和分析,实验表明,使用上下文相关的三音素模型具有最好的识别效果,最佳词识别率达到98.39%,对应的句子识别率为90.83%。针对机器人上机载计算设备计算能力有限和机器人在运行过程中能提供自身状态信息的特点,本文设计了可以压缩解码时搜索空间的动态改变语言模型机制,并对最后完成的语音识别模块做了实验和分析,实验中基于动态语言模型机制的语音识别模块最佳句子识别率为87.95%,比不采用动态语言模型机制的语音识别模块高出12.05%。在对话管理方面,针对服务机器人的特点,本文采用层叠状态机的设计方法并使用python语言实现了这一对话管理框架,接着介绍了我们对话管理框架中的多模态信息加入和验证与确认机制,并最后介绍了本文设计的对话管理在可佳机器人上具体任务cocktailparty上的应用。另外,本文还深入研究了无监督词聚类方法在递归神经网络语言模型上的应用。基于递归神经网络的语言模型被证明有领先的效果,研究表明,在递归神经网络语言模型的输入层加入词性标注信息,可以显著提高模型的效果。但使用词性标注需要手工标注的数据训练,耗费大量的人力物力,并且额外的标注器增加了模型的复杂性。为解决上述问题,本文尝试将布朗词聚类的结果代替词性标注信息加入到递归神经网络语言模型输入层。实验显示,在Penn Treebank语料上,加入布朗词类信息的递归神经网络语言模型相比原递归神经网络语言模型困惑度下降8-9%。
其他文献
王世杰是中国近现代史上“学人从政”的典型,幼年接受儒家传统教育,少年接受西式教育,青年留学英法,获得政治经济学学士学位、法学博士学位。收到蔡元培先生邀请,回国后先后担任北京大学法学教授、国立武汉大学首任校长,于1933年4月21日任命为南京国民政府教育部长,到1938年1月1日卸任,担任南京国民政府教育部长一职长达4年8个月,是民国时期任职最长的教育部长,任职期间对各级各类教育进行了大刀阔斧的整顿
随着全球化经济的到来,中国电子信息制造企业面临着巨大的竞争与挑战。这种挑战一方面来自于国内生产要素成本的上升,另一方面来自国际巨头对国内市场的抢占。面对来自国内外
当今社会,农村发展问题已然成为了我国社会发展中的重要问题,而想要实现农村经济的有效发展,要求能够为农产品的对外输出提供更好的物流条件,农产品物流问题是重点所在。对于
近年来随着国家对天然气在车用方向的鼓励政策趋向明朗和天然气汽车井喷式的发展,掌握天然气发动机的开发关键技术对于开发天然气发动机至关重要。天然气发动机开发的关键技术
表面等离激元光子学利用了光子学和电子学在纳米尺度结合在一起的奇特性质,在当今纳米光子学研究领域中分外引人注目。由于贵金属纳米颗粒具有表面等离激元共振效应,在光、热
在国内除了哲学史和相关论著之外,已经有一些博士论文和相关硕士论文讨论奥古斯丁美学思想了,但是他们的研究要么局限于基督教哲学之内,要么局限于一般的哲学史讨论,从美学角
泥石流灾害是一种发生频率高、分布范围广和活动时间长的地质灾害,在全球大约30%以上的国家和地区活动强烈,每年都有大量不同规模的泥石流灾害发生,随着山区经济的快速发展,对土
随着食品安全事件的逐渐增多,公众的目光逐渐聚焦到食品安全问题上。与此同时,食品安全治理中出现的问题也被纳入到理论研究范畴。2009年《食品安全法》颁布之后,食品安全问题也
水稻胚乳是植物繁衍后代时储藏氮源和碳源的主要场所,也是分子医药农业最为理想的宿主之一。在水稻胚乳中存在着四种储藏蛋白,谷蛋白glutelin,球蛋白globulin,醇溶蛋白prolam
在静态试验条件下,研究给水管网中3种常用的塑料管材,无规共聚聚丙烯管(PP-R)、硬聚氯乙烯管(U-PVC)和聚乙烯管(PE)总有机碳(TOC)的释放情况。结果表明:3种塑料管材中,U-PVC