【摘 要】
:
近年来,知识图谱在越来越多的领域上得以应用,而知识图谱的构建与完善需要多源知识的融入。不同的知识源对知识的定义有着各自的标准,因此在多源知识融合过程中,存在知识近似冗余或者知识冲突的问题。为消除这种矛盾和歧义,本文设计并完成了基于主动学习的知识融合系统。知识融合需要解决模式层融合和数据层融合两个问题。模式层定义了知识图谱的顶层结构,是图谱的元数据。因为这部分数据规模可控且非常重要,因此使用人工的方
论文部分内容阅读
近年来,知识图谱在越来越多的领域上得以应用,而知识图谱的构建与完善需要多源知识的融入。不同的知识源对知识的定义有着各自的标准,因此在多源知识融合过程中,存在知识近似冗余或者知识冲突的问题。为消除这种矛盾和歧义,本文设计并完成了基于主动学习的知识融合系统。知识融合需要解决模式层融合和数据层融合两个问题。模式层定义了知识图谱的顶层结构,是图谱的元数据。因为这部分数据规模可控且非常重要,因此使用人工的方式进行融合。数据层融合的核心是实体对齐,即发现两个实体描述的是否为同一客观事物。对此设计了基于属性的实体对齐算法以及基于属性和关系的实体对齐算法,这两种算法都使用主动学习的方式完成训练。本系统的图谱数据管理模块和图谱可视化模块是对系统数据的管理和展示,外来知识融合这一任务使用四个模块完成。数据预加载模块是对数据源的配置,把外来数据转换为与系统相同的数据存储结构。图谱模式层对齐模块是完成外来数据和系统数据的模式层的统一。图谱数据层对齐模块完成实体和关系的对齐以及数据的合并导入,此模块的实体对齐只使用了属性信息。图谱数据层去重模块是对图谱数据层对齐模块的完善,在实体对齐时可使用实体在图谱中的关系信息,同时解决数据导入时没有经过实体对齐就直接导入系统而造成知识冗余的问题。本系统采用Spring Cloud框架,主要功能模块使用Java实现,算法使用Python实现,通过RabbitMQ完成主动学习需要的数据通信。数据存储使用My SQL和HugeGraph。通过本系统能够从不同的数据源获取知识到系统知识图谱中,去除知识冗余,提高知识的覆盖程度。
其他文献
目的探讨重组人源胶原蛋白局部应用对绝经后阴道壁组织病理学的影响。方法选取绝经后盆腔脏器脱垂需行手术治疗的患者50例,随机分为对照组25例和实验组25例。对照组术前不使用激素类药物和非激素类润滑剂或保湿剂;实验组于术前阴道内给予重组人源胶原蛋白均匀涂抹,隔天1次,每次2 g,术前至少使用10次。术中留取阴道前壁组织标本。用HE染色法观察阴道壁上皮厚度,Masson染色法观察阴道壁肌肉和胶原纤维的分布
随着通信技术的发展,各种数据爆炸式增长。新闻、报刊等非结构化的长文本中含有大量有价值的信息,如何自动地抽取出这些信息成为了一个亟待解决的问题。文档级别关系抽取作为信息抽取的关键任务之一,旨在抽取长文本中众多实体之间的句内和跨句关系。本文针对文档级别关系抽取任务进行了以下研究:(1)基于上下文语义的文档级别关系抽取探究文档级别上下文语义抽取方法,及其对文档级别关系抽取性能的影响。首先,以实体为节点,
随着互联网的迅速发展,网络教学模式开始兴起,越来越多的高校已经开始逐渐从传统的教学模式向线上教学转变,许多高校都陆续推出了自己的网上教学系统。而线上教学模式在给教学工作带来便利的同时也成为了抄袭行为滋生的温床,由于电子形式的信息具有易复制易传播的特点,使得本就屡见不鲜的抄袭现象进一步加重。而人工判别的方式工作量极大,因此使用计算机进行抄袭检测就显得尤为必要。本文在研究了传统的抄袭检测技术以及近年来
鼻咽癌是常见的癌症之一,其治疗手段主要是通过放射治疗杀灭靶区癌细胞。放疗过程中容易危及周边的正常器官组织,因此需要有一定经验的医师通过精准勾画病人计算机断层扫描(CT)图像中的危及器官来制定放射治疗计划。为了提高放疗计划的制定速度,减轻医师的工作负担,本文提出了基于平衡采样和多任务学习的CT图像危及器官分割模型,以实现在CT图像上针对特定器官的自动分割工作。目前现有头颈部危及器官分割方法欠缺通过采
图像去噪作为计算机视觉领域内重要的研究方向之一,在军事、民生等各个领域具有广阔的应用场景。数字图像由于成像系统、传输媒介等因素的影响,在采集、压缩和传输过程中可能被噪声破坏,进而导致图像信息的失真或丢失,使图像质量发生退化。因此,对带噪图像进行降噪处理是十分必要的,图像去噪效果优劣将直接影响到后续处理能否顺利进行。本文以深度卷积网络为基础,提出了基于深度卷积网络的图像去噪算法。为在降噪过程中充分利
国家体育队伍越来越重视将最新的计算机技术与传统的体育项目相结合,以便提高运动员训练和分析水平。目前,在针对排球的体育训练中,仍然主要依赖教练的个人经验,训练成本较高,质量难以保持稳定。对此,国内有体育单位引进DataVolley等专业软件辅助训练,但其需要人工录入复杂的动作记录描述;也有研究机构依靠人体传感器获取运动参数的方法,但其会对运动员的活动造成不便。发球是排球基础且重要的技术动作之一,其动
目的探讨绝经后女性2型糖尿病伴骨质疏松患者骨密度与N-端骨钙素(N-MID)、总Ⅰ型胺原氨基端延长肽(T-P1NP)、G-胶原特殊序列(β-CTX)、胰岛素样生长因子-1(IGF-1)的相关性研究。方法选取2017年3月—2019年8月该院收治的绝经后女性2型糖尿病伴骨质疏松患者321例,根据骨密度水平将其分为3组,分别是:骨量正常组107例、骨量减少组107例及骨质疏松组107例。比较3组一般资
海岸侵蚀是受海水动力冲击影响,形成的岸线后退和海滩下蚀的现象。海岸侵蚀的诱因可分两种:一种是自然原因(河流改道、海面上升和海洋动力作用加强等);另一种是人为原因(拦河坝的建造、大量开采海滩沙和滥伐红树林等)。近年来,经济迅速发展,生态修复工程也日益增多,准确的波浪、砂质海岸侵蚀数值模对工程设计和优化具有重要指导意义。波浪数值模型SWAN和泥沙输运模型XBeach在学术研究中广泛应用。由于模型缺少用
近年来,互联网领域呈现爆炸式的发展,每天都有成千上万的网页数据在不断更新,在每个网页文本中通常蕴藏着数以百计的知识等待着人们去发现挖掘。为了能够有效地将这些信息利用起来,国内外科研人员对此做了大量研究工作。其中,知识图谱构建就是其中最重要和热门的研究方向之一。本文就如何实现完备的医疗知识图谱以及基于该医疗知识图谱实现医疗知识问答等工作展开了分析和研究。本文的主要创新和改进有以下几点:(1)本文发现
本文提出了一种基于解剖学先验知识和计算机视觉方法的综合框架,用于自动定位和分割胎儿脑部超声图像中的“胼胝体和透明隔腔复合体(CC&CSP)”和“小脑蚓部(CV)”。该框架旨在获得胎儿脑部正中矢状面的CC&CSP和CV的面积和位置信息,以协助医生进行产前检查。目前还没有专门解决这个问题的研究,这项研究对人类胚胎的产前诊断有重要的临床意义。本文提出的框架实施如下:首先,从胎儿脑部正中矢状面上手工切割出