面向中文自然语言Web文档的自动知识抽取和知识融合

被引量 : 0次 | 上传用户:wy299
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从Web文档中自动抽取出与领域本体匹配的事实知识不仅可以构建基于知识的服务,而且可以为语义Web的实现提供必要的语义数据。中文语言的特点使得从中文自然语言Web文档中自动抽取知识非常困难。本文研究了面向中文自然语言Web文档的自动知识抽取和知识融合方法。主要研究内容包括:(1)分析和总结了自动知识抽取和知识融合的研究现状及存在的问题;(2)提出了系统化的领域本体定义方法,用聚集体知识概念刻画N元关系并且强调了要为本体概念指定必要的属性约束;(3)研究了面向中文自然语言Web文档的自动知识抽取方法。针对自动知识抽取的三个步骤:知识三元组元素的识别、知识三元组的构造和知识三元组的清洗,分别提出了基于本体主题的属性识别方法、基于本体属性约束的三元组元素识别方法、基于启发式规则的三元组构造方法、基于句法分析的三元组构造方法和基于本体属性约束的知识清洗方法。与已有方法相比,该知识抽取方法能够在不借助大规模的语言知识库或同义词表的情况下对中文自然语言Web文档进行自动知识抽取,能够处理文档中的N元复杂关系,适合于一般内容的中文自然语言Web文档,具有较好的可移植性;(4)提出了基于本体属性约束的知识融合方法,能够在实例化领域本体过程中识别等价实例、冗余知识和矛盾知识,保证了知识库知识的一致性;(5)分析了传统搜索引擎存在的问题,设计并实现了一个基于语义的智能搜索引擎系统CRAB,该系统能够为用户提供基于语义的知识检索并且生成直接包含查询结果的图文并茂的检索结果报告。本文在面向中文自然语言Web文档的自动知识抽取、知识融合和基于语义的智能搜索引擎等方面的研究具有一定的理论意义和应用价值,丰富了对中文自然语言Web文档的自动知识抽取问题的研究。
其他文献
在压力容器的设计中,对于壳体的开孔补强,常用的有等面积法、分析法和压力面积法这三种方法,从每种方法的适用范围与出处进行比较区分,以明确各种方法的应用场合及内在的区别
基于运动员的视角对运动员寻求运动心理咨询态度的测评、约束因素(个体与环境)和运动心理咨询的提升策略进行归纳与分析,研究认为,性别、种族、人格以及先前的运动心理咨询经
黄秋葵[Abelmoschusesculentus(Linnaeus)Moench]为锦葵科秋葵属一年生草本植物,是一种花、菜、药兼用型植物,用途广泛。但是,其蒴果的成熟期短,若采收不及时,肉质将迅速老化
<正>"团体心理咨询"的关键之处就在于"团体"二字,这种心理咨询之所以能够区别于一般的心理咨询,是因为它是建立在一种互动的模式之下进行的。在这个过程中进行一系列心理机制
1928年5月至1931年7月,宋庆龄流亡德国的生涯在她一生的革命史中占有十分重要的地位。在德国期间,宋庆龄潜心研究政治与历史,广泛结交当地的中外左翼人士。在国民党左派中,她
目的了解我院抗消化性溃疡药的应用情况与发展趋势,为临床用药提供参考。方法采用回顾性分析法,对2012-2014年我院抗消化性溃疡药的销售金额、用药频度(DDDs)、日均费用(DDC)
柑桔的日灼病又名日烧病,多发生在近成熟的果实上。是夏秋伏旱高温季节强光直射烧伤果皮引起的生理性病害。急性日灼病在雨天易感染炭疽病菌,引起腐烂落果。不脱落的果实,由
城市交通拥堵的加剧导致了车辆延误增加、交通事故频发、环境恶化等诸多问题,已成为世界各国城市发展共同面临的社会问题。智能交通系统是解决交通拥堵问题的重要途径,城市交
导电纤维作为柔性传感器的主要材料之一,在生物抗菌、电磁屏蔽、抗静电、智能服装等领域有重要的应用。本文主要研究了一种在棉织物、氨纶丝表面进行聚多巴胺改性的化学镀前