基于空间信息的表格文本联合问答研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:oolongge
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网的快速发展使存储在网络空间中的信息数量呈现了爆炸增长的趋势。这些信息中包含着丰富的人们感兴趣的知识,可以用来回答人们的日常问题。基于互联网信息的问答系统将互联网上的信息作为原始知识库,通过各类问答模型,可以自动为用户问题提供答案,得到了越来越多学术界和工业界的关注,并被应用于人工客服、语音助手等多类工业场景中。传统的问答系统通过语法或句法结构,依靠专家设计的规则,使用组合或映射方法为用户问题提供回答。但是,这些方法难以拓展到新领域,而且存在不能泛化等问题。近几年,深度学习已经被用于许多自然语言处理任务,包括问答系统,并且取得了良好效果。现有的基于深度学习的问答系统往往只基于单一的信息类型,如表格或文本。然而,在实际场景中,为了回答人们的问题,系统往往需要联合两种类型的信息进行多次推理,从而找到相关知识回答用户问题。根据现有的研究难点,本文选择基于表格及文本的联合问答方法作为研究内容。根据已有的方法分析,现阶段的联合表格和文本的问答推理有以下几个问题:(1)已有模型基于TF-IDF以及子字符匹配等浅层语义特征筛选与用户问题内容相关的文档及表格,忽略了用户问题与表格及文档的深层语义相似性。(2)表格中相同行或列的内容往往隐含着时序、排列等重要关系,而已有模型基于单纯的文本信息对用户问题进行推理,忽略了表格的空间信息。(3)用户问题包含多种问答类型,如二选一、三选一、比较大小及生成问答等类型。已有的问答模型使用的基于语义匹配的阅读理解方法对各类问题的表现不一。针对以上问题,本文提出一种基于空间信息的表格文本联合问答方法,研究内容包括:(1)提出引入Poly-Encoder作为文本相似度匹配的基模型,通过捕捉用户问题的多维度细粒度特征,实现对相关表格、文本的深层语义相似度匹配,获得最优的上下文信息。(2)提出结合空间信息的注意力机制,结合图网络将空间信息与表格及文本信息进行融合,帮助模型进行表格和文本的联合推理。(3)针对不同类型用户问题提出级联式的阅读理解模型,通过对不同类型问题分流后设计相对应的预测方法,实现对不同类型问答的准确输出。(4)相比于基准模型,本文设计的模型在Hybrid QA上得到了2%的效果提升。充分的定量和定性实验证明了本文提出的空间信息的表格文本联合问答方法的优越性。
其他文献
目前人工智能、大数据、算法等智能技术加速了新闻传播领域的智能化趋势,并且智能技术已然深入与参与到新闻生产环节中。将新闻伦理置于智媒背景下新闻生产中进行全面动态地剖析与总结,结合文献研究和案例研究方法,在已有的研究成果和实践的基础上,明晰新闻生产在智媒背景下的动态演变,深化运用“工具理性与价值理性”探索新闻伦理问题,准确全面地认识其伦理问题成因,从而为新闻伦理在智媒背景下新闻生产实践中更好地运用与发
随着2013年国家提出精准扶贫后,各个地区聚焦于适合自己的脱贫道路建设,如今已是第六个年头。要实现脱贫的可持续性,不仅要做好当下,更要放眼于未来。已经实现脱贫的地区,如何能更好更远的沿着致富的道路走下去;这条路上有着怎样的艰难险阻;又要如何跨过这些障碍实现真正意义上的脱贫不返贫本文以宁夏盐池县作为研究对象,分析盐池县返贫风险,并对盐池县后续发展问题及政策选择给予一定意见。本文认为盐池县主要存在我国
家谱是记录血缘关系相连接的一家一族的集体生活的文本,是公众的历史意识与实践的产物。20世纪50年代的家谱编修活动由于政治原因被限制,20世纪80年代后逐渐复苏。时代的创新催生了家谱的创新,其内容、体例与形式呈现出与当代社会环境相适应的新的特点。历来家谱作为档案史料被研究者利用甚多,而对其本身的编修和生产过程研究则甚寡,且谱牒史研究者对当代家谱的研究重视程度远低于对传统家谱的研究。因此,本文以近三十
河流污染状态一般采用化学水质或生物等指标单独描述,目前尚缺少简便易行且可同时从化学与生物角度进行定量描述的指标。河流自净能力是一种笼统的说法,目前尚无定量描述方法,在执行一级A排放标准的条件下,污水处理厂排放水存在污染物浓度低,残留物可生化性差等特点,光谱法虽可获得良好的效果,但难以与生物学过程建立联系,从河流微生物的生理状态的角度分析河流的自净能力鲜有研究,采用呼吸图谱技术有望解决这一难题,但同
目的:脑瘫是最常见的儿童致残性疾病,给患儿家庭和社会带来了沉重的精神和经济负担。独立行走是脑瘫康复的主要目标之一。步行能力受限会导致跌倒风险增加和对他人的依赖程度高,将在很大程度上影响患儿的正常生活,也会影响他们的人际交往、情绪状态以及自尊。本课题旨在观察治疗全身振动刺激及运动平板训练改善痉挛型双瘫儿童步行能力的临床疗效,以期为痉挛型双瘫儿童寻求一种简单易行、安全可靠且疗效显著的康复治疗方法。方法
在被子植物的生活史中,孢子体世代(二倍体世代)与配子体世代(单倍体世代)交替出现,这种现象被称为世代交替。孢子体生长发育形成配子体。雌雄配子体发育成熟后,通过双受精作用,来自花粉中的两个精细胞分别与卵细胞和中央细胞结合,形成受精卵(合子)和初生胚乳细胞,进入孢子体世代。合子经过一系列的分裂与分化最终形成成熟胚胎,而初生胚乳细胞经过一系列分裂形成合胞体胚乳,经细胞化产生胚乳,在拟南芥中,当胚胎发育至
随着全球化不断推进,世界各国贸易往来不断加强,营商报告作为贸易的重要组成部分,在经贸领域起着不可或缺的作用。本报告选择Doing Business in the Czech Republic 2017中的第一至二章为翻译源文本,结合文本类型理论,分析和总结在翻译实践过程中所遇到的问题及处理方法。翻译实践报告主要由源文本背景、源文本语言特色、各类翻译策略运用、翻译总结四部分构成。实践报告主要在文本类
在公安机关执法办案中,由于治安传唤的滥用,侵犯违法嫌疑人的人权现象频发。本文针对治安传唤中违法嫌疑人的人权保障问题开展相关的研究,共分三个部分:第一部分明确治安传唤的法律属性与自由裁量性。首先,对治安传唤的概念及属性进行了阐述,并对治安传唤和其他相关强制措施作了比较。其次对治安传唤的启动、时间、方式的自由裁量性予以论证。第二部分分析治安传唤权的滥用造成人权侵犯的情形。一是治安传唤权滥用对人身自由权
仿真可信度的评估对仿真的应用以及基于仿真的决策具有重要意义,可信度评估是指决策者/仿真用户对应用仿真模型解决所定义的目标问题的可信程度的量化。网络仿真是建模仿真研究的一个具体的领域,基于已有成熟的网络仿真建模工具进行网络建模是其目前的主流形式。因此,目前网络仿真的应用主要是在用户的角度,仿真程序对于用户是一个灰盒。因此在网络仿真可信度评估时,在用户的视角下需要考虑哪些方面的内容,以及在各个方面如何
光化学的研究对象包含分子的激发态构型及其物理化学性质。固态下具有刺激发光响应性质的材料将可为人们日益精细化的应用需求提供解决方案。纯有机的刺激发光响应材料由于其低毒性、低成本性以及易修饰性而备受关注。因此,对纯有机发光分子的光化学性质研究显得格外重要。有机分子固态下的光化学性质除了与其自身结构有关外,也与其固态下的堆积方式,尤其是晶体的堆积模式密切相关。研究有机分子的结构、分子排列与其发光性能之间