面向知识图谱和语义识别的高校迎新问答系统的研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:ytcxw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高校迎新工作内容来自不同部门,发布的信息渠道也多种多样,比如不仅有入学流程、助学贷款政策、学业教育、生活指南等文件,还有一些具体的生活指南、学校规范,它们也可以来自于校园网、互联网、邮箱、微信、即时通讯、论坛等各类众筹问答信息,这些信息来源多样、零碎、离散,其中一些信息还存在着专业性差、准确性低、数据零散、冗余度大、噪声多等问题。因此,传统问答系统常采用面向关键词模型或者简单的深度模型,轻视领域知识和语义识别技术,造成问答系统体验性差。为此,论文引入了高校知识图谱技术,以此增强问答过程中可靠性;同时,针对高校迎新问答系统相比较于开放领域的问答系统而言,其样本数据偏少、标注成本高、深度模型在小样本数据量情况下,所面临的训练难、效果差的问题,论文引入深度学习方法,预训练语言模型,最终使模型训练速度加快而且效果良好。综上,论文针对高校迎新应用场景,基于高校知识图谱,结合深度学习方法和自然语言处理手段,从以下方面,完成论文的研究内容:构建基于双流自注意力多有向图的命名实体识别模型。针对传统命名实体识别方法在中文环境中无法兼顾语义消歧和有效提取文本序列特征的问题,提出基于双流自注意力多有向图的命名实体识别模型。该模型首先在通用语料数据集上进行预训练,再通过模型迁移和参数共享,在少样本高校迎新问答数据集上进行精调。在文本嵌入阶段,将语料数据构成图形式,进一步丰富和优化相关实体字典,再利用改进的图神经网络,结合设计好的实体词典,对语料数据进行嵌入,从而有效降低中文分词的误差。在特征提取阶段,提出一种基于动态加权融合的双流自注意力机制,利用特征贡献值,以增强模型的语义识别能力。在模型输出阶段,将提取好的特征输入标准分类器,预估全局最优结果。通过上述工作,可有效、准确地抽出用户问句中与高校迎新业务关联性较强的实体,为下一步工作做好铺垫。提出融合多头自注意力机制的中文短文本分类模型。针对问答模型在问答过程中的中文短文本知识利用不足与中文短文本本身的语义模糊、特征稀疏等问题,论文构建融合多头自注意力机制的中文短文本分类模型:首先,借助预训练语言模型,利用动态文本表示方法,以提高语言模型的语义识别能力;然后,再通过迁移的多头自注意力机制,学习文本序列全局范围内的词依赖关系;最后,为进一步提高模型对问答语句文本局部特征的提取能力,通过增加卷积神经网络,得到能在不同粒度层面提取特征的中文短文本分类模型,以获取带有不同语义的高阶表示,从而增强对问答应用场景中的中文短文本问句的分类能力。开发高校迎新问答系统。首先,利用软件工程技术,提供系统结构;其次,构建高校迎新业务的知识图谱;然后,将上述研究成果通过深度学习框架与可进行人机对话的实体机器人优必选Yanshee等已有的成熟技术和产品,利用系统集成方法融入软件,开发完成论文的线上问答系统;最后,系统是测试,并应用了可视化技术,测试显示系统达到了较好的应用效果。
其他文献
退火窑主传动系统辊道是承载、拉引玻璃产品的关键部件,一旦出现轴承故障将使辊道丧失运转平稳性,对玻璃产品的成型质量造成重大影响,甚至导致整条生产线停产,给企业造成巨大经济损失。为了保障退火窑辊道的平稳运转,降低玻璃产品成型不良率,研究辊道轴承的故障诊断方法具有重要的工程意义。振动信号分析法是应用最广、也是最有效的机械故障诊断方法之一,具有可在线、非损伤检测等优势,非常适用于辊道轴承不停机拆检的诊断需
近年来,随着国内外汽车行业的快速发展,对汽车变速器关键零件花键轴的需求量也越来越大。对于载重汽车变速器花键轴,国内目前主要采用传统的切削加工,生产效率较低。本课题研究的载重汽车变速器花键轴冷挤压成形工艺,目前面临的主要问题是:载重汽车变速器花键轴的坯料在挤压过程中会承受较大的成形力,易出现镦粗失稳及弯曲变形等成形缺陷。因此,如何有效地减少花键轴冷挤压过程中产生的弯曲变形及减小成形力,是在冷挤压工艺
位移传感器是获取位移信息的重要媒介,应用领域非常广,例如数控机床、导弹、航天火箭等领域。位移传感器的发展决定精密位移测量的现代化程度,然而一个国家精密位移测量的发展程度也将影响位移传感器的创新,二者相互影响。传统的位移传感器以光栅为代表,其技术受制于人,价格普遍高昂,且均源于国外。而我国自主研发的直线时栅传感器(时间测空间)生产周期短,价格便宜,制作简单,但是目前直线时栅传感器的结构多数是单层的,
国务院建设知识产权强国的若干意见中重点强调,在2020年,我国必须达成知识产权创造、运用、保护、管理和服务能力的显著增强,在国际竞争中逐渐发展成知识产权上的优势,能够在一定程度上对创新发展起到促进作用,最终发展成知识产权强国。而在众创空间发展过程中,能够提供健全的知识产权服务内容和优质的服务质量,这对众创空间的发展具有重要的意义。伴随创客在依托众创空间知识产权服务体系的帮助和支持下,其创新成果得到
随着国际能源形势日益严峻,新能源替代的步伐不断加快,混合动力驱动形式的车辆越来越占据市场的主导地位。与传统动力驱动行驶的车辆相比,混合动力驱动行驶的车辆将多种能源动力耦合后输出,实现了多种动力源之间功率的合理分配和能量的转换回收,而混合动力耦合系统作为混合动力车辆传动系统的关键核心部件之一,其效率品质直接决定混合动力系统能否满足车辆的设计需求,影响整车的性能。因此,研究混合动力耦合系统的能量传递效
位移测量技术的精密程度决定了一个国家的工业发展上限,而除了传统的直线位移传感以及角位移传感,精密二维位移测量作为平面运动的一个重要反馈,可以运用于各种对平面定位要求较高的场合,比如PCB和芯片制造,所以现如今的工业发展中对二维位移传感器表现出来的需求越来越广泛,对二维位移传感器也提出了更高的要求。在目前,得到比较广泛应用并且发展较为成熟的二维位移传感器是光栅二维位移传感器和基于磁场原理的二维位移传
视频监控作为社会安全领域最重要的组成部分之一,每天都会产生海量数据,但使用人工方式处理大量数据的效率极低。行人重识别是一项利用计算机视觉技术自动在跨摄像头场景下检索特定行人的技术,该技术在刑事侦查、安防监控相关的领域中具有极高的应用价值。近年来,随着深度学习技术的飞速发展,如何利用神经网络模型完成行人重识别任务,实现对海量视频数据的高效处理和分析,对监控下的行人进行识别和跟踪,成为了热点研究问题。
2000年,中组部、人事部、教育部联合颁发了《关于深化高等学校人事制度改革的实施意见》,我国高等学校人事制度改革迈开步伐。各高校纷纷响应国家号召,进一步完善高校教师激励机制,充分调动教师的工作积极性,激励高层次人才为高校的建设贡献自己的一份力量,为学校跨越式发展提供强有力的人才支撑。本文以教师激励机制的构建为主题,对L大学现存的问题进行了剖析。作为一所具有一定建校历史的公办高等本科院校,在多次改革
随着人们对汽车要求的提升和新一代汽车发展的需要,NVH成为了多数消费者与车企关心的问题之一,发动机带来的振动是整车振动需要解决的主要问题。发动机振动首先由汽车悬置系统传递给汽车周围的连接紧固装置,再由这些装置传递给车身,引起一些主要的整车NVH问题。振动会影响人们的驾乘舒适性,同时还会影响车辆的操纵稳定性和车辆的内部结构。经过厂家和研究人员在实践中不断总结,利用悬置系统能极大地降低振动在车辆动力总
随着我国近四十年改革开放的全面推进,房地产行业在市场经济中愈发呈现不可或缺的作用。近年来,国家尤为看重房地产业的宏观调控,市场的供需关系也产生了细微的变动。由于行业大环境极不平稳,造成企业销售困难、业绩持续走低,使得许多房地产企业处于房价波动、资金缺乏的局面,因此整个行业的升级革新刻不容缓。而拥有其特有优势的轻资产运营模式的出现,为房企带来了长远发展的新机遇。2015年,RA房地产宣布企业将实施以