面向问答系统的相似问题识别研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:bingke111888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网技术日益繁荣的今天,各种各样的信息呈现出爆炸性的增长态势,问答系统也不例外,积累了庞大的问题库。随着人工智能在现代社会如火如荼地发展,大数据给人们的工作和生活带来了越来越多的好处。因此,对这些庞大的数据信息进行合理有效地处理,从而为用户提供精确可靠的信息资源具有极其重要的意义。虽然现代搜索引擎帮助人们从扑面而来的信息中得到了一定程度的解脱,但是不难发现,在真正有用的信息中却夹杂着大量的噪声信息。如何避免这些噪声数据的干扰,提高用户搜索信息的质量和效率,问答系统在这方面起到了很大的作用。问答系统被认为是更高级别的检索系统,这是因为该系统一方面克服了搜索引擎难以理解用户意图的缺点,另一方面也避免了一些错误结果的返回。对于用户用自然语言提出的问题,问答系统往往能够给出简洁、准确、对用户友好的答案。问答系统是一个不断发展的研究领域,它融合了信息检索、自然语言处理和深度学习等技术,分为自由文本体系结构的问答系统和问题答案对体系结构的问答系统。本文主要研究基于问题答案对体系结构的问答系统,通过将用户提交的问题进行分析,进而与系统中的问题组数据库进行匹配,检索到与用户提交的问题语义最相似的问题,之后将类似问题的最佳候选答案推荐给用户,从而可以提高用户检索有效信息的效率。因此,为了更好地理解用户的查询意图,匹配到问答系统中最相似的问题,对问题对之间进行语义相似度计算就显得尤其重要。文本的相似度计算一般是从短语、句子、段落和文档这些层级进行衡量和分析,本文主要是针对问答系统问题对句子级别的语义相似性方面进行研究。受卷积神经网络在图像识别领域应用的启发,本文构建了基于孪生卷积神经网络生成自适应内容信息矩阵的深度学习模型,提出了将自适应近邻图和先验知识近邻图组合形成双通道近邻图的方法。文本近邻图能够表达文本样本的近邻关系,本文采用词嵌入的方式将文本转换为向量形式,通过构建文本相似度关系矩阵来获得文本近邻图。现有方法通常是构造静态的近邻图,这些方法一方面依赖先验知识,另一方面难以获得句子对的最优表示,针对这些不足,本文提出了利用孪生卷积神经网络学习更优的动态更新的近邻图方法,通过实验,该模型在Quora和MSRP两种数据集上的准确率分别是84.35%和75.65%,F1值分别是79.98%和82.97%,实验结果比其它方法表现要好,证明了本文提出的深度学习模型在短文本问题对的识别和匹配任务上具有可行性和有效性。
其他文献
近年来,有关中国民族音乐的传承与发展一直是学界热衷讨论的话题。例如,如何创作符合时代精神的民乐作品、如何传承民族音乐的精髓、民乐作品以何种形式立足于当代音乐之林等
研究了DNA序列高维空间数字编码的更一般的运算法则:充分利用陈惟昌等人提出的DNA序列高维空间的表观维数Nv,数值维数Nx以及差异维数Nd,讨论了当Nd=0,1,2,2n或2n+1(n=0,1,2,
在科技创新跨越式发展战略、科技创新人才战略和科技创新可持续发展战略的指导下,中国科学院(简称科学院)的科技创新工作业已取得阶段性成果.科学院中既有纯理论探索性质的基
采用Midas/Civil2006将全桥结构简化为三维空间模型结构,可实现桥梁从施工到成桥全过程的受力仿真分析.结合跨越既有线(70m+125m+70m)连续箱梁桥,介绍对其仿真分析的方法.计算结果表明
工学结合的人才培养模式对高职高专教育中专业建设的发展已产生了深远的影响,作为公共基础课的思想政治理论课也需努力实现适应新变化的教学体系的构建。论述了实践教学环节
该文提出一种单周控制的三相四线制有源电力滤波器.它不需要检测三相负载电流和三相输入电压,不需要繁琐的无功电流和谐波电流计算,也不需要任何乘法器.控制器结构简单,整个
简要介绍了MVC设计模式和UML技术,建立了基于Jsp+Servlet+JavaBean的MVC开发模式的某高校系部信息管理平台,并使用UML的扩展机制对该Web应用系统进行分析和建模.开发实践证明,应用M
基于分布式多转速传感器测量信号的冗余性和互补性 ,利用多传感器信息融合技术提出 1种估计刚性转速、实现扭振滤波的方法。基于模态分析理论提出 1种刚性转速的融合规则 ,由 1个极小极大问题确定最优的加权因子。通过对传感器故障的检测与分离 ,提高信息融合方法估计刚性转速的精度和容错能力。对 1台实际机组扭振试验的在线监测数据滤波处理的实践表明 ,多传感器信息融合刚性转速的滤波方法性能良好且易于实现 ,