植物知识图谱PlantKG的构建研究及应用

来源 :贵州大学 | 被引量 : 0次 | 上传用户:holy1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱作为人工智能的一个分支,在智能问答、专家系统和推荐系统等多个应用场景中提供数据支撑。典型的通用知识图谱有谷歌的Google knowledge graph、DBpedia、百度知心等,在领域知识图谱构建方面,有生命科学领域的Bio2RDF以及医学领域的中医药知识图谱等。在植物领域,北京林业大学构建了植物知识图谱,但是在数据源和构建规模方面尚不够丰富,不能很好地服务于知识图谱应用。本文针对植物知识的多样性以及植物知识图谱构建规模有限无法满足语义检索的要求的问题,研究从多个专业植物知识数据源系统化构建植物知识图谱PlantKG,从知识图谱的构建方法、命名实体识别、知识融合和基于知识图谱的知识问答等方面展开工作。主要研究工作如下:(1)植物知识图谱构建方法研究。根据植物知识的结构构建了PlantKG的概念层,然后从中国植物志、植物网、互动百科和维基百科网站的结构化、半结构化和非结构化数据中通过爬虫和深度学习方法抽取植物知识构建了PlantKG的实例层。将概念层的体系结构导入图数据库Neo4j中,然后将实例层的数据映射到概念层构建了植物知识图谱PlantKG。(2)融合注意力机制的BERT+BiLSTM+CRF药用植物文本疾病命名实体识别模型的研究。在非结构化数据中获取植物知识方面,针对药用植物文本存在长序列语义稀疏的问题,提出了一种基于BERT+BiLSTM+ATT+CRF模型的BAC方法;通过对药用植物文本进行预处理和半自动化标注构建了实验数据集。实验结果表明,BAC方法的疾病命名实体识别效果较传统方法更优。利用训练好的模型从药用植物文本中抽取出疾病实体并与植物名称匹配得到三元组数据。(3)植物知识融合以及知识问答的研究。利用Limes框架和设定融合规则的方法对不同来源的植物知识进行融合,并对融合后的植物知识存储于图数据库Neo4j。构建的PlantKG规模有7.4万多个实体,64.1万多条实体关系和属性。基于模板和PlantKG实现的植物知识问答的正确查询结果(至少部分)表明该植物知识图谱是有效的。构建的PlantKG已共享于Git Hub1,它可以直接为用户提供药用植物等相关知识的知识检索,也可以融合更多植物领域知识,为植物领域的知识检索、知识推理等应用提供更好的知识服务。
其他文献
I-TASSER(Iterative Threading ASSEmbly Refinement)是一种用于蛋白质结构和功能预测的迭代线程组件细化算法,在根据此算法编写的I-TASSER Suite软件中,蛋白质结构的预测过程被分解为一步步运行、形成相互依赖但又可以单独运行的小程序,通过脚本进行依次调用。I-TASSER Suite通过作业管理系统和GNU Parallel多线程的方式实现了多任务
油井动液面深度计算是油田行业关注的重要课题,展开其研究不仅对实时获取井下油量储存信息、生产制度的制定具有重要作用,而且对及时了解油井作业状况,加大安全生产管理力度均具有重要的现实意义。为此,针对油井动液面深度检测与预测问题,围绕动液面位置确定、动液面深度计算、多层感知器与线性回归预测模型的比较性研究,以及基于遗传算法的梯度提升决策树模型优化等展开算法研究,并借助声波法的测井数据,开展算法的实验性比
随着人工智能技术的发展,对话系统的应用越来越广泛。任务型对话系统作为对话系统的一个重要分支,可以完成许多基本任务,为企业节省人力成本。自然语言理解(NLU)是任务型对话系统必不可少的核心模块,包括意图识别和槽位填充两个关键子任务,通常基于神经网络模型实现。鉴于任务型对话系统广泛的应用价值以及自然语言理解在任务型对话系统中的不可或缺性,提出了一个自然语言理解模型训练系统,以提高自然语言理解模型的开发
如今,大多数企业已开始使用云平台托管其软件应用。云平台是共享资源,可提供各种服务,例如基础设施作为服务(Iaa S)。这些云服务能以虚拟机(VM)的形式提供给用户,用来处理用户自己的业务。而在云平台中,一个物理机通常可以分为几个VM,对VM的管理十分方便,还可以轻松启动调整大小。因此借助虚拟化技术,可以在云环境中动态部署Web应用,而部署于云平台的Web应用经常面临负载变化,面临负载急剧上升时需要
随着能源短缺和环境污染问题的日益严峻,对于可再生能源的研究和利用的重要性与日俱增,越来越多的新能源通过微电网系统参与到电力系统中。但与此同时,由于新能源的间隙性和可变性,对微电网的经济平稳运行带来了新的挑战。为解决这一情况,本文针对一个由对风电、电解水、氢氧燃料电池及微电网负荷组成的微电网,围绕基于需求侧响应的微电网关键技术展开研究。具体工作如下所示:首先,分析微电网中各系统单元运行特性,并在此基
咽部是人体的重要器官之一,病毒进入口腔时会导致咽部感染,也会因外界因素引起外伤,严重时会威胁到患者的生命,所以咽部医学检查非常重要。因患者咽部不适造成的检查不配合,或医务人员疲惫误判,致使耽误治疗或误诊。为了有效解决这一问题,本文开发咽部图像采集仪及其图像辅助诊断系统,该设备通过手持操作对患者咽部进行摄像或拍照,数据通过无线网络传输,可即时由专业口腔医生进行远程会诊,也可将数据传到云端服务器,通过
贵州省地属西南,为西南高原山地,境内山脉众多,沟谷纵横,地形陡峻,存在各种不良地质现象,这使得无论是在地质灾害防治还是公路建设过程中,都存在着严峻的挑战。在特大桥建设中,对岸坡的稳定性进行评估,是复杂地质条件下在峡谷地带修建特大桥的关键性技术。开州湖特大桥是江口至都格高速公路的组成部分,跨越U型峡谷。两岸岸坡均为一级,两岸基岩为上硬下软的结构,开阳岸桥位处不良地质发育,主要有堆积体和危岩体,对主墩
抗菌药对人类医疗及动物生产有着重要的作用,不仅提高了人类疾病的治愈率,也大大增加了养殖业的经济效益。随着工业生产、人类及养殖业对抗菌药的滥用,大量抗菌药排放入环境中,由此产生的耐药菌及抗性基因的广泛传播,给人类和生态环境造成严重威胁。磺胺和四环素类抗菌药物因价廉、抗菌活性高广泛被养殖业用于疾病预防、治疗,造成大量的药物以原型和代谢产物的形式通过粪尿排入环境中,给生态系统带来危害。本文研究以紫花苜蓿
随着计算机科学技术的发展,计算机图形图像学和计算机视觉技术已渗透到人脸识别、无人驾驶等研究领域。基于计算机的三维建模技术是利用计算机构建物体的三维模型,表面重建是三维建模的核心技术,一直是研究的热点和难点,该技术已广泛应用于自动驾驶、机器人领域、工业制造和检测、考古及三维城市建模等领域。目前,对于表面重建所涉及的算法中,存在非封闭曲面重建效果差,效率低和光顺性差等问题。针对上述问题,论文选择有依据
随着区块链技术在电商交易中的快速发展和应用,用户隐私信息泄露等安全问题逐渐凸显,如何在交易者不匿名的情况下保护交易敏感数据一直是区块链电商交易隐私保护的研究热点。然而,电商交易中隐私程度的加强导致监管机构难以建立,交易隐私保护与安全监管之间无法平衡。为此,本文通过分析区块链电商交易场景,利用椭圆曲线同态加密特性、PVC数字承诺、安全双方乘法计算以及属性加密技术对区块链电商交易的隐私数据保护和监管进