基于深度学习的高校招生问答服务系统的研究及实现

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:ken99win
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,在高校招生咨询工作中,随着咨询人数的增多以及各部门业务处理流程的各尽不同,在一定程度上造成工作量繁重、管理压力剧增。那么,如何为广大学生及时提供专业性、可靠性、实时性的帮助,这是招生场景中亟需解决的问题。因此,本文以高校招生为应用场景,构建一款初具智能化的招生问答服务系统,该系统将辅助工作人员为学生答疑解惑,这不仅能提高工作效率与满意度,而且对于医疗咨询、银行业务等类似需求场景同样具有积极的借鉴意义。本文的研究目标是构建一款面向高校招生限定领域的智能问答系统,该系统由问句理解模块、问句检索模块和答案生成模块组成,涉及的关键研究内容包含文本预处理、文本向量化、文本分类计算、文本相似度计算、文本交互匹配计算。对于该系统而言,如何提高系统问句理解模块归属查询语句类别的能力;如何提高系统问句检索模块度量语义等价的能力;如何提高答案生成模块中查询语句与候选答案集的文本交互匹配,这些是本文的研究重点。因此,本论文的主要研究工作及成果为,构建了一种基于词性特征的CNN_BiGRU问题分类模型;构建了一种基于注意力k-max池化BiLSTM网络的问句相似度模型;构建了一种基于attention_BiGRU交互匹配的答案置信度模型。(1)构建了基于词性特征的CNN_BiGRU问题分类模型。该模型包含了文本向量化技术、CNN、BiGRU。其中,针对传统向量方法辨别段落文本中多义词的不足,提出引入词性属性来辅助向量化文本。此外,鉴于CNN、BiGRU各自能捕获不同粒度的高阶特征,提出组合CNN与BiGRU形成CNN_BiGRU。该模型会在不同粒度层面抽取信息,以获取蕴含不同语义的高阶表示,从而增强分类能力。(2)构建了基于注意力k-max池化BiLSTM网络的问句相似度模型。该模型由CNN卷积、注意力池化、k-max池化、BiLSTM网络构成。由于传统相似度算法学习的语义信息较浅,导致语义相似性不佳,为此构建新的相似度模型。其中,针对CNN卷积时未能量化卷积表示的贡献度,于是,结合注意力池化与k-max池化共同来聚焦卷积表示,而后,利用BiLSTM的双向编码机制聚焦并捕捉表示的潜在信息,以便生成高级特征。实验分析表明,该模型可较为全面的关注并获取对应层级的语义表示,有效提升了语义相似性的准确率。(3)构建了基于attention_BiGRU交互匹配的答案置信度模型。此模型借鉴了Siamese Network结构框架与交互匹配模式,将attention机制、BiLSTM网络应用其中。对于语义匹配任务,若采用并列式匹配则会导致匹配的语义粒度较浅,为此,采用交互式匹配,以便能在不同匹配层面关注文本交互信息,并抽取深层交互语义。基于实验结果,该模型在评价指标上表现优异,证明具有出色的语义匹配能力。
其他文献
目的探讨神经外科术后颅内感染的防治方法。方法回顾性分析我科术后发生颅内感染的87例临床资料。结果 87例患者经治疗后83例(95.4%)治愈,2例(2.3%)死亡,2例(2.3%)自动出院。结论及
目的研究战斗机飞行员代谢综合征(metabolicsyndrome,MS)与血清尿酸水平的关系。方法对306名平均年龄(28.13±3.18)岁来我院行改装新机体检的战斗机男性飞行员临床资料依照国际
香茶菜为多来源药材,收载于多省地方标准。是胡庆余堂药业公司独家产品胃复春片的主要原料。本课题对香茶菜药材资源及使用的情况进行调研,根据调研结果以目前资源最多、最常
阅读与写作是互相促进的,阅读积累能够有效地转化成实际的写作能力,同时,写作的需要也会驱动阅读体验深入下去。在小学语文教学实践中,教师应立足于学生知识的积累与自我表达的进步,兼顾阅读与写作要求,构建读写结合的情境,实现语文素养的全面提升。一、仿写  仿写是写作训练的重要方式。仿写的过程,其实就是教师与学生共同分析文本结构,引导、鼓励学生进行结构模仿,提高写作条理性、逻辑性的过程。因而教师应从点到面,
疫情期间,首先要食不过饱,七八分就够了;其次饮食分配要合理:早餐要吃好,分配的摄入热能要占全天的30%,以豆奶蛋果蔬为主;中午要吃饱,摄入的热能占全天的40%,以肉鱼禽蛋豆为
我国经济不断发展,城市化进程逐渐加快,城市建设逐渐受到人们的关注。城市是人们生活和工作的重要场所,在城市建设的过程中要综合考虑各个方面的内容,公共服务设施是城市建设