基于现代中医教学视角下知识图谱的构建方法

来源 :企业文化·下旬刊 | 被引量 : 0次 | 上传用户:happer34
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  自从Google公司于2012 年5月发布知识图谱(Knowledge Graph)技术以来,人们从谷歌精准快速的搜索技术中看到了知识图谱所蕴含的巨大科学的力量,因此在各个领域都引发了一股研究知识图谱的热潮。国内外的各大公司纷纷推出自己相应的产品,例如:微软的Sator,百度的“知心”、搜狗的“知立方”等产品。
  一、将知识图谱引入中医的教学工作
  作为一名在中医药教育领域的从业者,笔者认为,中医发展到现在,已经积累了大量珍贵的临床经验,形成了无数经典理论。如何借助先进信息科学与技术来对中医药理论和知识体系进行整理和分析,从而有助于教学工作是值得中医教育工作者探索的一个重要问题。随着知识图谱的出现,这个工作的可能性和是实用性越来越重要。
  知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系。其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性-值对,实体间通过关系相互联结,构成网状的知识结构。它本质上是语义网络。
  针对知识图谱这一特点,引用知识图谱解决中医学在知识表达、共享和应用方面的问题也受到中医界的重视。在中医学中的本体可以易经和阴阳五行学说为指导,从认识、生理、病理、辨证论治基本部分开始构建。
  整个中医的概念体系中,类关系、整体与部分的关系是概念体系的主要关系,所以中医知识图谱的结构分为了两大类关系,一类是概念层级关系、一类是实体关系。
  二、知识图谱的逻辑架构
  知识图谱的逻辑架构,分为两个层次:数据层和模式层。知识图谱的数据层是指:知识以事实(Fact)为单位存储在图数据库.例如谷歌的Graphd和微软的Trinity都是典型的图数据库。存储在图数据库中的所有数据将构成庞大的实体关系网络,形成知识的“图谱”。
  知识图谱的模式层在数据层之上,是知识图谱的核心。在模式层存储的是经过提炼的知识,通常采用本体库来管理知识图谱的模式层,借助本体库对公理、规则、约束条件来规范实体、关系以及实体的类型和属性等对象之间的联系。
  三、知识图谱的逻辑构建方法
  知识图谱的构建主要有自顶向下和自底向上两种方法。所谓自顶向下的方法是指首先為知识图谱定义数据模式(即为其定义本体),在定义本体的过程中,首先从最顶层的概念开始,然后逐步进行细化,形成结构良好的分类学层次结构;在定义好数据模式后,再把实体一个个往概念中添加。自底向上的方法则刚好相反,首先从实体开始,对实体进行归纳组织,形成底层的概念,然后逐步往上抽象,形成上层的概念。两种方法在具体的构建过程中通常都不是从零开始的,前者可以利用一些现有的结构化的知识库,而后者则可以从开放链接数据或在线百科中得到很多实体。在实际的构建过程中,通常采用两种方式结合的方法。
  本文接下来把知识图谱的构建分成两步,数据模式层的构建(本体定义)和实体层的构建。
  (一)数据模式层的构建的过程
  本体的构建步骤通常都是依据图中的层次结构来进行的,自底向上依次实体抽取、概念抽取和关系抽取
  实体抽取,也称为命名实体识别是指从文本数据集中自动识别出命名实体。这是本体构建的基础工作,语抽取通常釆用基于语言学规则的方法和使用统计的方法,实体通常是单字或多字的组合,它们在特定的领域或上下文环境中有特定的含义。
  概念抽取,作为概念,通常需要具备如下三个层面的信息,内涵、外延和词汇实现。概念抽取的常用方法包括基于语言学的方法、基于统计的方法和混合方法。基于语言学的方法通常依据特定的词法结构或模板,因此基本是与语言相关的。基于统计的方法主要依据概念与一般的词汇之间不同的统计特征,区分概念和普通术语。
  关系抽取,其中包括同义关系抽取和分类关系抽取。同义关系抽取的目标是寻找那些代表同一概念、实体或属性的术语。分类关系抽取指分析概念之间的层次关系。通常采用的方法有:基于词法模式的方法,基于共现分析的方法,基于语言学的方法,以及近年来兴起的基于开放链接数据和在线百科的方法。
  (二)实体层的构建过程
  实体填充,对于一个实体,如果仅拥有实体名称,该实体的意义则非常有限;通常需要通过一定的方式来描述实体,使得实体可以被人和机器理解。描述实体的数据包括实体的描述,图片,同义名称,以及属性等。同义名称学习的相关研究通常被称为同义关系学习,而实体属性学习的相关研究通常被称为实体属性关系学习。
  构建实体链,实体链接(entity linking)是指对于从文本中抽取得到的实体对象,将其链接到知识库中对应的正确实体对象的操作。实体链接的基本思想是根据给定的实体,从知识库中选出一组候选实体对象,然后通过相似度计算将其链接到正确的实体对象。
  四、应用和展望
  知识图谱是一个新概念,从2012年提出到现在不过5年时间,然而通过对知识图谱构建技术体系进行深入观察和分析,可以看出它事实上是建立在多个学科领域研究成果基础之上的一门实用技术。尤其结合中医學之后,有着实际的应用场景:
  中医知识检索,作为中医知识图谱的基本检索服务,关于中医单个术语、多个术语、术语间关系、术语间指定关系的路径查询等基本的知识检索服务。
  辅助诊断教学,根据症状信息,基于知识图谱,结合多种中医辨证方法,进行辨证论治策略的推荐和分析,可以实现学习实践模拟。
  同时我们也要看到构建知识图谱目前也面临一些挑战。如面向开放域的信息抽取方法研究还处于起步阶段,技术不太成熟。 存在多种数据源,每个数据源的数据格式多种多样,知识的融合比较困难。
  尽管面临这些困难,知识图谱在中医教学方面的发展和应用的前景还是很广阔的。
  参考文献:
  [1]韩轶,李鹏.试论中医教学方法与内容的与时俱进[J].新疆中医药,2013,31(04):78-80.
  [2]孙保木,罗明.多媒体技术在中医教学中的应用[J].解放军医院管理杂志,2013,20(06):578-580.
  [3]姜德友,鲁美君.案例式教学在中医教学中的应用研究[J].中华中医药学刊,2010,28(08):1582-1583.
其他文献
补气方rn气虚的人通常会感到非常疲倦、身体乏力、容易气短,面色看上去非常苍白,妇女经期经血量很多,颜色淡,还有脉细舌质淡等证.rn西洋参燕窝汤 西洋参 3克,燕窝 3 克,置碗
期刊
2008年,对中国人来说,注定是不平凡的一年.过去,它承载了我们太多的期待;现在,它又给了我们太深刻的记忆.rn5月,在大灾面前,中国人的坚忍和顽强让曾经敌对的人都肃然起敬;8月
【摘要】企业成本的组成是多种因素构成的,各种不同的因素结合在一起才能构成活动的成本,所以要想控制企业成本,那就要把构成的因素要分析清楚,变化方式分析清楚,才可以最终控制企业成本。  【关键词】企业成本;因素;分析  一、对结构性成本进行因素分析  成本动因的具体含义主要是:经济有关的规模、学习的模式、因素之间关系、地理和机构性因素。结构性成本动因,它的作用和地位在企业成本构成当中很是重要,而且从深
摘要:在新形势下,如何围绕医院的中心工作,研究基层团建工作的新方法、新途径,从而创建适合基层医院共青团组织自身建设、有利于促进医院发展的新的运作机制,是新时期基层医院团建的重要努力方向。  关键词:基层医院;共青团;新局面;思考  一、基层医院共青团工作中存在的问题  (一)对共青团工作认识存在误区,组织开展活动缺乏创新和活力  在基层医院团建工作开展过程中,主体工作依然停留在传统工作模式上,主要
摘要:国企党建工作是国有企业管理工作的重要组成部分,将企业理论实践和思想政治结合起来,有利于巩固我党的执政地位。随着全球化经济的发展,国企党建工作也增添了新的活力,迎接新机遇的同时也面临新的问题和挑战,需要深入改革党建工作以适应经济新形势的发展需要。  关键词:国有企业;党建工作;完善机制;作风建设  国有企业控制着我国的经济命脉,对整个经济发展起主导作用,是我们党执政的重要基础,也是国企管理工作
秋冻养阴又养生rn用正确的方法进行秋冻是秋冬养阴的方法之一.中医理论认为“天人合一”,即人体与大自然是一个统一的整体,人体的动态变化规律应与大自然的变化规律保持一致
期刊
摘要:大学生的价值取向决定了未来整个社会的价值取向,而大学生又处在价值观形成和确立时期,抓好他们价值观的养成就显得尤为重要。中国传统文化具有深厚的理论价值和价值内核,与核心价值观具有内在联系,充分将大学生价值观教育融入中国传统文化,对大学生的核心价值观的培育提升无疑具有重大的牵引和助推作用。  关键词:大学生;核心价值观教育;中国传统文化  当代大学生作为祖国的未来,民族的希望,他们拥有什么样的价
用算术进行英语启蒙的理由rn1.当当很喜欢算术rn这是最根本的理由.与学珠心算的孩子相比,当当的口算能力或许略有差距,但由于我之前很强调学习的乐趣,当当是很喜欢算术的,而
【摘要】随着苏东剧变,世界社会主义运动跌入低谷。资本主义生产力虽仍然得到一定程度的发展,但其制度无法克服生产社会化与生产资料资本主义私有制之间的矛盾。社会主义必然代替资本主义仍然是客观真理、科学理想。其不会动摇,必然实现。  【关键词】社会主义;代替;资本主义  一、科学认识资本主义、社会主义及其关系  1.资本主义国家的优势及其改革。当今国际形势下,资本主义的科技优势、产品优势、管理优势等总体上