面向智能问答系统的语义匹配技术研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:yanghao_haohao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义匹配技术备受关注,成为了当前自然语言处理技术应用领域热点话题之一,在问答系统以及信息检索等领域拥有着广泛的应用场景。目前,最热门的语义匹配模型为基于BERT的微调模型,但是大多数基于BERT模型的语义匹配技术由于采用统一注意力机制,对于句式复杂的文本语义信息抽取不够充分,导致对句子语义的理解存在偏差;同时,BERT模型规模庞大,计算量着实惊人,仅仅单个样本计算一次的开销动辄上百毫秒,在严格的延迟约束下达不到要求,很难应用到实际生产中。因此,针对以上所描述的缺陷,本文提出了两种不同的基于BERT微调模型的语义匹配模型。本文主要研究内容如下:1.针对BERT微调模型采用统一注意力机制未能充分考虑句子结构信息的问题,本文提出了一种基于Tree-LSTM结构的多种注意力机制语义匹配模型。该模型由三层结构组成:BERT模型、Tree-LSTM结构以及多种注意力机制。其中,BERT模型将输入文本转换为特征向量,为后续工作做好准备;Tree-LSTM结构将BERT模型输出的特征向量映射到树状结构上,并分布在树的各个孩子节点上;多种注意力机制将Tree-LSTM结构中的每个孩子节点赋予不一样的权值,使句向量的不同成分得到不一样的关注。最后,将本文模型应用于句子语义相似度计算环节,通过句子对的语义特征向量表示计算出句子对之间的语义相似度值。实验表明,在金融领域数据集上,本文模型比传统语义匹配模型的准确率更高。2.针对BERT模型过于庞大,导致做语义匹配任务时太消耗时间资源的情况,本文提出了一种基于孪生网络的多种注意力机制语义匹配模型。该模型由三种算法组合而成:BERT中文预训练模型、孪生网络和基于Bi-LSTM的多种注意力机制。在该模型中,首先通过BERT预训练模型分别获取两个输入句子的向量信息,并采取池化操作对句向量进行降维;然后通过基于Bi-LSTM的多种注意力机制对句向量的不同成分给予不同的关注,使句子结构信息更加清晰;最后使用孪生网络导出有意义且定长的句向量,并使用余弦相似度方法计算出句子对之间的语义相似度,再根据相似度分值选择最相似的一对句子。通过实验验证,在金融领域数据集上,本文模型的语义匹配速度更快。3.本文基于以上研究的两种语义匹配模型实现了智能问答系统。该系统通过可视化界面与用户交互,实现自动对用户所提问题进行回复,达到实际应用目的。
其他文献
医学图像分割在定量分析、临床诊断和治疗过程中扮演着重要角色,基于编解码器架构的分割模型被广泛应用到医学图像分割中。在实际分割中,由于编解码器架构的编码器、跳跃连接、解码器组件的设计不合理,会导致出现多尺度特征融合不当、相似特征不相关、特征通道直接拼接引起语义鸿沟、上采样过程抽象特征丢失而利用不充分以及网络参数量冗余问题。这些问题是医学图像分割中的重大阻碍,本论文针对编解码器架构在分割中关键技术进行
磁共振成像(Magnetic Resonance Imaging,MRI)技术自1973年成功显示图像以来得到了迅速发展,已成为最有价值和应用最广泛的诊断成像方式之一。核磁共振系统对于接收线圈的信噪比具有较高的要求,高温超导技术对于高灵敏度的接收核磁共振模拟通路的研制具有重大意义。本文以利用高温超导薄膜材料研制了在1.5T磁场中、63.5MHz的频段研制了一款高温超导核磁共振接收模拟通路,其结构主
深度学习技术的飞速发展,催生出了一系列诸如计算机视觉,自然语言处理,强化学习之类的实际应用场景及方向,同时在安防监控领域也借助深度学习的发展迎来了技术手段上的变革。但是当前应用于安防监控领域的深度学习算法大多只停留在实验室阶段,虽然针对常用的数据集,当前的算法都能取得一个较好的精度,但在真实场景下,算法的精度和实时性能都不能达到实际应用的要求,所以急需一套智能化人体行为检测系统去解决当前真实场景下
字符识别是受到学术界和工业界重视的技术,需要根据针对性的场景设定和模型设计来解决相关实际问题。芯片字符识别作为字符识别的一种特殊场景,可以解决工业缺陷检测、自动化配装芯片等广泛性的工业问题。早期芯片字符识别方法,例如模板匹配等,只能在固定字体和固定场景发挥效果,但近年来随着深度学习算法的扩展和显卡浮点性能的增加,深度学习模型能够识别更多相似字体和更多场景的芯片,但深度学习模型的高精度基本建立在大量
移动边缘计算(Mobile Edge Computation,MEC)通过将计算资源部署到网络边缘,在地理上缩短了与用户的距离,可以就近处理用户的请求,避免了漫长的网络传输,从而提高服务的响应速度。由于边缘节点部署在网络边缘,单个节点的覆盖范围相对有限,因此用户的移动就有可能导致用户离开当前节点的覆盖范围而进入另外一个节点的覆盖范围。当用户从一个节点的覆盖范围进入另外一个节点的覆盖范围时,为了保证
本文以舰船、飞机等大型复杂装备电磁干扰现场检测为背景,把现场检测中的电磁干扰信号分类识别作为研究课题。针对大型装备面临的电磁干扰现场检测与故障模块查找问题,设计了一套EMI信号分类识别系统,构建大型装备电磁干扰现场检测案例库,进行EMI信号采集与特征分析、故障模块定位。首先,介绍了该系统应用场景、技术指标和软硬件构成,对系统中涉及的虚拟暗室、特征提取、模板匹配等相关技术进行了分析。其次,针对系统中
基于参量阵原理的屏幕定向扬声器是一种能够同时呈现画面和产生高度指向性可听声的新型屏幕扬声器,它利用超声波在介质中自解调产生定向可听声。由于介质的自解调过程是非线性的,受温度、湿度、信号处理算法和屏幕定向扬声器本身特性等多种因素的影响,导致屏幕定向扬声器解调出的可听声存在失真,对设备的音质有较大影响,因此本论文主要围绕屏幕定向扬声器的谐波失真进行研究,为便携式设备的屏幕定向扬声器实现高保真音质提供一
随着人机对话技术的不断发展,各种各样的智能对话系统层出不穷,如:领域问答系统、闲聊机器人、终端导航机器人等智能产品,很大程度上方便了人们的日常生活。在各种类型的对话系统中,任务型对话系统是一个重要分支,主要通过多轮交互解决用户在某个领域遇到的问题,提高业务办理效率,减少人工参与。本文针对金融领域任务型对话系统的用户意图识别进行研究,包含领域分词优化、对话意图识别以及融合意图识别的智能对话系统的设计
矩阵积和式是一种常用的矩阵不变量,在组合计数、统计检验、无线通讯、统计物理、分子化学等领域有重要的应用。积和式的定义与行列式相似,但是它的计算复杂性远远高于行列式。英国理论计算机科学家Valiant在1979年证明积和式计算是组合计数中的#P完全问题,即其难度不低于组合优化中的NP完全问题。迄今为止,对一般矩阵最为有效的积和式精确算法是Ryser基于容斥原理所建立,其计算复杂性为O(n2n-1)。
随着互联网时代的到来与发展,为大数据、云计算、人工智能等新兴技术提供了肥沃的土壤,同时也为各行各业带来了新的变革与推动。教育作为民族振兴、社会进步的基石,一直是我国优先、重点发展的行业。长期以来,我国教育面临的突出矛盾是人们对高质量个性化教育服务的迫切需求与优质教育资源供给的严重不足,针对教育资源供给侧的创新和个性化教育服务新模式的探索是当前教育改革与发展所面临的重大课题。本文搭建支持矩阵自动推理