基于勘探知识图谱的推理问答系统研究和设计

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:liweibin522
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
勘探开发领域的工作结果往往以论文、报告等非结构文档的形式进行展示,而勘探开发知识图谱是其知识提纯的产物。实际的勘探开发工作往往需要文档或知识图谱中的知识,但是由于全文检索与传统问答系统的方式停留在浅层的关键字和语义匹配层面,现有的系统无法从中得到深层次的知识与答案。为了满足勘探开发专家对于复杂知识的内容查询要求,需要利用生成式的方法与基于知识图谱的关系推理方法完成复杂答案生成与隐含关系推理工作。为完成以上工作,本文研究并设计了基于勘探开发知识图谱的推理问答系统,其主要包括以下三部分内容:(1)设计并实现从输入问题到得到答案的完整问答系统,包括文档与知识库检索查询方式的探索与应用,并在此之上进行相关算法的优化与改进,以提高系统的正确率与查全率。(2)针对答案来自多个段落内容的复杂问题,提出了一种面对多段落问答的生成式模型。该模型将知识图谱信息融入到文档表示中以增强语义信息,并运用指针生成网络生成最终答案。该模型能够将答案内容从多个有关段落内进行匹配并进行总结生成综合性答案。(3)针对包含隐含关系的问题,提出了一种跨段落推理的问答模型。该模型将文档、知识图谱中与问题相关的关系构建为统一的推理图,利用推理图构建实体间关联,并通过图神经网络对推理图进行表达与推理计算,以得到最终的答案。本文设计并实现了基于勘探知识图谱的推理问答系统,在公开数据集与勘探开发数据集上均有一定的正确率,对实际的勘探开发工作有着应用价值。
其他文献
近年来,天然气越发在国民经济中占据重要地位,然而,从理论研究出发继而推导出相关结论再应用于实践指导这样的传统思路,越来越跟不上行业的发展步伐,严重制约了气田和气井的开发。本文应用先进的大数据技术,让数据指导实践,通过对石油天然气勘探开发过程中产生的大量数据进行分析,可以为实际勘探开发提供快速指导和决策支持。研究中采用Python语言结合机器学习技术对实际气田的大量数据进行了提取、处理、建模、分析和
卫星图像语义分割是指将卫星图像中有价值的信息进行标注。由于卫星图像的规模庞大,其中包含的信息也很丰富,需要通过图像分割算法从这些大规模卫星图像中快速提取出有效信息。然而现有的图像分割算法仅支持小规模图像分割,无法对大规模图像直接进行分割。为了解决大规模图像分割问题,本文研究并设计了大规模卫星图像语义分割系统,并且从以下三个方面进行了研究与探索。首先将大规模图像裁剪成若干张符合图像分割算法输入要求的
水下油气生产过程虚拟现实仿真平台应用虚拟现实技术通过水下动力学仿真与多个仿真系统之间的集成,实现对工作人员的虚拟操作培训。针对该平台中数据难以有效管理的问题,在本文的研究中首次将时空数据库技术应用于虚拟现实仿真系统,开发了一套适用于该虚拟现实仿真平台的数据管理系统,主要研究内容如下:(1)对水下油气生产过程虚拟现实仿真平台进行了数据流分析。对数据管理系统进行需求分析和基于C/S架构的总体设计,构建
石油勘探领域的现场报告和科研文献等研究资料极具科研价值,将其共享至网络平台供科研人员使用,有助于提高资料利用率。随着研究资料的逐年增加,本文关注信息获取,开展个性化推荐系统研究,实现资料的筛选和过滤。针对协同过滤推荐方法中存在的稀疏性、冷启动和样本不平衡等问题,提出改进协同过滤方法和正例样本填充方法,并应用于实验检测网络交流平台,设计实现研究资料推荐子系统。首先,针对FML(Factorized
速度在地球物理勘探中扮演着十分重要的角色。精确的速度模型不仅是偏移成像和其他高分辨率勘探方法的前提,也是进行地震数据时深转化所必不可少的重要因素。在常规方法中可以使用全波形反演或者其他的层析成像技术获得地质体速度。但是这些常规方法存在计算成本高,大量耗费人工的缺点。并且严重依赖于人工交互。针对这一问题,本文提出一种基于监督机器学习的速度模型建立方法来实现地震数据从时间域到深度域的精确转化。机器学习
基于STM32F407芯片设计实现了地面遥测板和井下遥测板的通信功能,通过单芯电缆作为传输媒介实现井下数据的上传和上位机指令的下达。使用编码程序依照差分曼码的编码规则完成有效数据的编码工作,编码后的曼码数据使用SPI+DMA的方式发送,并通过驱动电路加载到电缆上进行传输,驱动电路由AD847运算放大电路和TD823功率放大电路组成。接收端将从电缆上接收到的曼码信号送入两级放大电路和比较电路处理后输
原油含水率的获取对油田的实际开发生产、油质提高和成本控制有着极其重大的意义。目前,市场上主流的含水率测定仪很难在精度、成本、实时以及维护等方面满足油田实际生产的需求。因此,设计实现一种高精度、低成本、快响应、易维护的原油含水率在线检测系统具有重要的实际意义。本文首先研究了电容法、微波法、近红外光谱法、密度法以及同轴相位法等多种含水率测定方法,并对基于这些原理的国内外多种原油含水率获取系统的优缺点进
目前,我国大部分油田都已进入高含水、高采出程度的“双高”阶段,油藏剩余油高度分散、开发难度大。随着人工智能的发展,利用大数据技术充分发挥中国石油多年来积累的海量数据的优势,挖掘数据中隐含的潜在价值,实现从传统的业务模型驱动转向数据驱动,具有重要的意义。但是,由于石油数据的复杂性为石油数据构建带来了严峻的挑战;同时,油藏开发人员在数据科学领域的局限性也导致了机器学习技术很难在石油领域高效普及。针对这
云平台中系统架构复杂且服务类型繁多,一旦发生异常导致系统崩溃,将会造成不可估量的损失。为了保障云环境的安全运维,需要对日常监控的KPI数据进行有效的异常检测。然而,KPI时间序列数量大、标记少以及其时序的特性都造成异常检测困难重重。本文以云环境自动运维监控为研究背景,以适用于云环境中KPI时序数据特性的异常检测算法为研究内容,最终实现KPI时序数据的自动化异常检测。主要工作如下:(1)提出基于ts
图像超分辨率是使用低分辨率图像生成同场景高分辨率图像的过程。传统超分辨率多采用插值算法,对重建图像质量的提高有限。基于深度学习框架的图像超分辨率是当今研究的热点,取得了一定成果。然而将基于深度学习框架的超分辨率算法应用到文本图像时,重建图像存在边缘模糊、字迹粘连导致图像中文字可识别性较差的问题。针对这一问题本文根据文本图像的特点,提出一种边缘特征融合的文本图像超分辨率算法,并对该算法的实现与应用进