【摘 要】
:
近年来随着人工智能的快速发展,自动问答系统备受瞩目且发展前景广阔。在生成式自动问答系统构建过程中,面临着由于知识匮乏而带来的生成不准确的问题。针对这个问题,本文将领域词典和知识图谱这两种不同形态的外部知识信息融合到深度模型中,增强对问句的理解,从而提高生成答案的准确性,研究内容如下:(1)针对生成式自动问答系统缺乏外部知识而导致的生成不准确问题,本文提出融合领域词典和拷贝机制的答案生成模型(LEP
论文部分内容阅读
近年来随着人工智能的快速发展,自动问答系统备受瞩目且发展前景广阔。在生成式自动问答系统构建过程中,面临着由于知识匮乏而带来的生成不准确的问题。针对这个问题,本文将领域词典和知识图谱这两种不同形态的外部知识信息融合到深度模型中,增强对问句的理解,从而提高生成答案的准确性,研究内容如下:(1)针对生成式自动问答系统缺乏外部知识而导致的生成不准确问题,本文提出融合领域词典和拷贝机制的答案生成模型(LEP-Transformer)。模型共分成两个部分:知识编码器和知识解码器。知识编码器包含拥有两个知识记忆单元的知识融合模块,可以使Transformer编码器能够有效处理不同文本粒度的长距离依赖问题;在知识解码器中使用Transformer的自注意力机制设计出的拷贝机制,可以使模型在生成答案时拥有再现事实细节的能力。在两种不同长度的问答对数据集上的实验结果说明了模型具备同时建模短文本和长文本序列的能力。(2)针对传统生成模型缺乏外部知识而导致的生成不准确问题,本文提出结合知识图谱的自动问答模型(KG-Transformer)。该模型由KGT编码器和KGT解码器两部分组成。其中KGT解码器直接使用Transformer解码模块,而KGT编码器设计为由检索知识图谱信息的检索模块和对知识信息与问句信息分别编码的双Transformer编码器组成的知识融合模块构成,通过在知识融合结构中使用软切换机制,灵活地在知识向量与问句向量之间进行切换,有效提取知识信息和问句信息并进行融合,能够提高答案生成的准确性和丰富生成答案的内容。通过将LEP-Transformer模型与KG-Transformer进行比较发现,KG-Transformer虽然生成的内容不够准确,但训练成本低且内容丰富。
其他文献
随着社会经济的不断发展,瞬息万变的外部环境对组织快速反应能力的要求越来越高,这导致以任务为导向的临时团队被越来越广泛的接受。由于临时团队大都是短期内组建的,团队中的成员多来自不同的组织或部门,彼此之间并不熟悉,因此临时团队成员之间往往缺乏信任。信任的缺乏会导致临时团队成员在共事时质疑他人的动机,在利益分配时又会针锋相对,这降低了临时团队的运作效率。由于临时团队的生命周期有限,临时团队成员无法像传统
目的:阿尔茨海默病(Alzheimer’s disease,AD)是一种神经退行性脑疾病,发病比较隐匿。因病因迄今未明,尚无有效治疗药物,给家庭和社会都造成巨大压力。本课题组前期研究结果显示,硒甲基硒代半胱氨酸(SMC)可显著改善AD模型小鼠的行为认知并减轻相关的病理指标,在此基础上本课题利用蛋白组学技术进一步研究了SMC干预AD发展的分子机制。同时本课题选取另外一种有机硒化合物Ebselen,研
人类视觉系统的注意力机制指出,人在观察和评估图像质量的过程中,是由自底向上和自顶向下两部分协同作用,来提取和注意到关键的区域信息。同时,我们观察到真实场景中的图像可能包含多种失真,即使只含有一种失真,其对图像各个区域的影响程度也不一样,因此针对关键的图像区域进行分析和评估对整张图像质量评估十分重要。在图像质量评估领域,直接对图像的失真区域进行标注是一项耗时耗力的工作。因此,现有的工作一般是在无参考
互联网时代下,传统行业的数字化转型步伐越发加快,传统数据管理中心已无法满足当前爆发式增长的数据存储需求。分布式存储系统因其低成本、高容错性、扩展性好、存储容量大等优势成为了当前存储技术的发展趋势。但分布式存储系统搭建在廉价的PC节点上,随着系统节点规模的不断扩大,节点失效问题也越发严重,因此如何高效地保障分布式存储系统的可靠性成为学术界和工业界重点研究的问题之一。当前主要的两种保障系统可靠性的技术
近年来,可视化成为了最为流行的数据展示及数据分析技术,广泛应用于各种领域。可视化就是将数据以视觉图像的形式呈现给用户,为了使用户更好的理解和解析数据,设计人员会通过调整不同的视觉通道来改善最后的可视化结果,例如对应的大小、位置、形状还有颜色等。而在这些视觉通道中,由于颜色本身的属性比较复杂,也是影响视觉效果的主要因素,所以其优化的效果非常需要重视和研究。对于颜色的优化效果,本文提出从感知性与和谐度
随着城市规模的不断扩张,城市社会经济的多样性和复杂性也随之增加。作为城市社会经济活动重要载体的城市空间,其形态和结构也在这个过程中变得错综复杂,人口和信息、能量、资金等要素在不同的城市功能区之间进行流动,城市规模的扩大,这些流动在强度上和复杂程度上都有显著的提高。如何科学的认识城市功能区之间的交互关系,并在此基础上合理地对城市中不同功能区在空间上进行安排,既有利于提高人口和信息、能量、资源等要素在
技术高度发展的今天,人们在生活、工作、学习、研究等各个领域中都会涉及布局设计,比如进度汇报、工作总结、商品展示、成果演示、海报制作等。用户在使用现有图形编辑工具布置元素时,常常希望得到协助,从而能够快速便捷的得到期望的元素布局。他们希望能被指导,而不是漫无目的在调整元素位置上浪费时间;希望可以直观比较,而不是在不同方案之间反复切换消耗时间;希望能够避免简单重复的实现工作,并且他们的设计意图能够被系
随着半导体技术的不断更新,物联网、人工智能和5G通信等应用领域的不断发展以及电子产品功能的不断复杂化,对电源管理模块最大电流能力要求也不断增加。对于在电源管理类芯片中应用最广的低压差线性稳压器(Low Dropout Regulators,LDO),由于芯片封装大小以及散热的限制,使得单个LDO芯片能提供的最大电流也受到限制。而LDO的并联方案是解决该问题、提高电源系统最大电流能力的有效途径,但简
当前,中国人口老龄化问题日益突出,持续的老年人口增长将大众的视野聚焦到了老龄化相关的社会问题上,其中老年人的社会交往问题是重要问题之一。老年人退休后的社交圈子从社会工作转向了家庭邻里,社会联系的减少使得他们从心理上更需要与人交流,社会交往活动能够帮助老年人重新建立新的社会角色,构建新的社交网络,有利于老年人身心健康。住区户外活动空间是老年人群体进行日常交往活动的主要场所空间,其空间环境品质直接影响
随着快速城市化进程的推进,深圳市率先遇到了土地及空间资源约束的瓶颈,空间资源难以为继成为推进城市建设的主要障碍。与此同时,城市建设吸引的人口迁移、城市更新引发人口结构的变化以及教育政策的不断放宽将会对教育资源产生巨大的新增需求。现有教育设施难以满足激增的人口规模需求,导致教育设施的供需矛盾日趋凸显。在土地稀缺和人口增长的双重压力之下,城市更新成为空间资源获取的主要途径,通过城市更新完善教育设施配置