【摘 要】
:
随着互联网数据的爆炸式增长,人们每天都能接触到海量的信息。但是通过搜索引擎搜索信息的方式是低效的。自动问答系统允许用户通过自然语言提问,直接向用户返回准确的答案。这样的信息获取方式相较于搜索引擎,更加贴近人类的生活习惯。自动问答系统根据知识领域的不同可以分为面向开放领域的自动问答系统和面向特定领域的自动问答系统。面向开放领域的自动问答系统是没有针对性的,已经有很多大型的公司和科研机构对其进行了研究
论文部分内容阅读
随着互联网数据的爆炸式增长,人们每天都能接触到海量的信息。但是通过搜索引擎搜索信息的方式是低效的。自动问答系统允许用户通过自然语言提问,直接向用户返回准确的答案。这样的信息获取方式相较于搜索引擎,更加贴近人类的生活习惯。自动问答系统根据知识领域的不同可以分为面向开放领域的自动问答系统和面向特定领域的自动问答系统。面向开放领域的自动问答系统是没有针对性的,已经有很多大型的公司和科研机构对其进行了研究。而面向特定领域的自动问答系统可以针对性地解答用户在该领域的问题,更加具有研究意义和实用性。为了更好地服务在校师生的学习生活,本文对面向校园领域的自动问答系统进行了研究。校园领域的知识多以表格或者文本形式存在,而之前的校园领域问答研究大多将研究重点放在了文本形式知识上,而忽略了对表格知识的研究利用。本研究除了对文本知识以外,还对表格知识进行研究。对于不同形式的校园知识,系统自动查询的方式不同,缺乏统一易用的查询方式。本研究的主要目标是构建校园领域知识库,并实现基于该知识库的自动问答系统。本文的研究内容主要分为以下三个部分。(1)数据库自然语言接口模型构建:校园领域知识中的表格数据适合存储在关系数据库中。为了实现对这部分知识的自然语言查询,本文提出了一个基于语法树的结合自注意力机制的数据库自然语言接口模型。实验表明,在校园领域关系数据库上,本文提出的模型是有效的。(2)基于知识库的问答处理方法:校园领域知识中的文本类数据可以通过构建知识图谱的方式进行整合。为了实现对这部分知识的自然语言查询,本文对知识库问答进行了研究。将知识库问答过程分为命名实体识别、属性映射和答案选择三个部分。研究并实现了基于BERT+Bi-LSTM+CRF的命名实体识别模型和基于Siamese+BERT+Bi-LSTM的属性映射模型。实验表明,在校园领域知识图谱上,本文提出的模型可以达到较高的准确率。(3)面向校园领域的自动问答系统设计与实现。基于以上研究构建了面向校园领域的自动问答系统,在网页上为用户提供服务。学校师生可以通过自然语言对系统进行提问,获得想要知道的信息。
其他文献
履带车辆行走或工作过程中,驱动轮所受振动易造成其与履带啮合脱离甚至断裂,剧烈振动会进一步上传至车身上,导致整车共振,严重影响零部件使用寿命及驾驶员身心健康。为缓冲振动冲击,常用的方法是进行阻尼处理。而过渡阻尼结构将“阻尼层”改为“阻尼层+过渡层”结构,在振动时,过渡层会起到类似于“杠杆”的放大作用,可增大阻尼层的剪切应变,从而增强整个结构的耗能效果。另外,在前期研究基础上,发现驱动轮原有减振结构仅
近年来,在经济全球化的国际背景下,中国资源型产业通过积极开展对外直接投资、参与国际分工等方式融入全球价值链,有力促进我国经济快速增长。然而,由于外部要素环境及技术“低端锁定”等一系列因素的限制,在产业转型升级过程中面临技术水平不高、产业结构不完善等问题的制约,仍处于价值链分工体系的中低端环节。因而,如何提升企业核心竞争力,有效改善中国资源型产业在全球价值链分工体系中的地位,快速适应当下新经济发展,
我国《劳动合同法》第八条规定了劳动合同订立时,用人单位的告知义务和劳动者的说明义务。这一规定是劳动立法进步的一个重要表现,标志着我国劳动立法不仅关注劳动合同订立后
随着电子、计算机和通信技术的飞速发展,汽车导航变得越来越重要。通过汽车导航,可以确定汽车的位置和目的地之间的方向和距离,确定最佳驾驶路线,为驾驶员提供道路状况等信息,解决拥堵并减少交通事故的发生率。当前,车载导航系统多采用全球定位GPS导航系统和SINS导航系统。单纯的使用GPS定位系统存在一定误差,导致精度降低。因此GPS/SINS二者进行组合具有一定的研究价值。在本文中,我们深入研究了GPS导
今年,为进一步做好北京市生态涵养区生态保护和绿色发展条例立法、乡村产业发展议案督办和低收入农户增收工作调研,市人大常委会深入本市10个区开展综合调查研究。在门头沟区
AP中文课程(Advanced Placement Chinese Language and Culture course and Examination)是中美政府协商,在美国《21世纪外语学习目标》(Standards for Foreign Language Learning on the 21st Century,5Cs standards for short)(简称“5C”标准)方案指导
Bad Call《误判》一书是英国科学社会学家哈里·柯林斯同罗伯特·埃文斯、克里斯托弗·希金斯三人联手创作的一部作品。尽管本书以足球为描写对象,但作者又同时把棒球、板球、田径等放在一起分析比较,该书观点新颖有趣,题材实用且具有前瞻性,因此译者选取前三章作为研究对象。译者所选的文本旨在介绍体育比赛中发生的误判现象以及如何解决这个问题,在对原文文本进行分析研究后,发现其具有简洁、严谨、感染力强等特点,
当今是数字化智能时代,大量的数字化数据的随之涌现,亟须新的高效的数据组织和管理方法。随着机器学习等相关技术的发展以及国家和人民对文化领域的不断重视,科技与文化领域的交叉学科研究也受到越来越多的关注。其中,传统民族纹饰是中国传统文化的重要组成部分,蕴含着丰富的艺术价值。由于用户对传统民族纹饰数据标注时使用自定义的标签,使得标签质量不高。为更好地对传统民族纹饰数据进行组织和管理,对标签优化研究成为一个