【摘 要】
:
Internet的飞速发展以及它开放式的特点使得网上的信息不断的膨胀,Web已成为人们不可缺少的信息源。Web中存在着大量的描述实体间相互关联的信息,与此同时实体之间的相互关系
论文部分内容阅读
Internet的飞速发展以及它开放式的特点使得网上的信息不断的膨胀,Web已成为人们不可缺少的信息源。Web中存在着大量的描述实体间相互关联的信息,与此同时实体之间的相互关系隐藏着非常丰富的、有价值的信息。而目前的搜索引擎依靠关键字匹配的方式查找信息,缺乏知识处理能力和理解能力,从而无法对Web中的关系信息进行识别。 本文以Web中信息发布与交换的新标准XML作为研究对象,提出了一种从Web上发布的XML文档中识别和抽取关系信息及其出现模式的方法。该方法按照用户的挖掘请求搜集XML文档;通过计算XML文档的相似度来识别包含了用户需求的目标文档;建立用户挖掘模式并与目标文档进行模式匹配实现关系数据的抽取。 实验结果表明本文提出的XML相似度计算方法能较好的实现目标文档的识别,同时本文采用的模式表达和匹配方式也能较准确地从目标文档中抽取出用户所需的关系数据。
其他文献
软件设计模式是可复用面向对象软件的基础,它以系统化和规格化的方式记录了可重复使用的软件设计方案和经验,能够很好地指导软件设计过程,对提高软件设计的质量具有重要意义。 本文对 J2EE 平台下的 MVC、Service Locator 和 ValueObject 等模式进行了较深入的研究,对 ValueObject 模式进行了改进,并将这些模式应用于 J2EE平台下人力资源管理系统的设计与开发中,很
最近十年来全世界网民的数量呈现快速增长的趋势,截止2011年1月全世界网民的数量已经超过了20亿。在线用户规模的急剧扩大使得用户在线行为分析在很多研究领域的意义显得越来
本文在分析国内电力企业深化改革以及国内外电力管理信息系统(Management Information System,以下简称MIS)应用现状的基础上,结合杭州市电力局生产运行管理的实际情况(电力
本文给出了一个知识推理的框架-知识框架,在该框架下变量忘记作为一基本操作,智能体可用其来对自己或其他智能体的知识进行推理.在该框架下,最弱充分条件起作重要作用.给定一背
近些年来3D数据的应用得到了极大的发展,尤其是像游戏、计算机辅助设计等应用的普及使得人们在享受这些应用来到的方便绚丽的同时也开始慢慢关注这些3D数字技术背后的支撑技术
在因特网发展的初期,网络应用主要集中在电子邮件、文件传输等传统应用,它们对服务质量QoS(Quality of Service)不敏感。随着因特网中各种技术的迅猛发展,一些新型移动业务不
随着网络的发展,网络复杂性和异构性的特点日益突出,网络管理已成为网络系统运行好坏的关键,而网络的拓扑结构发现是网络管理的基础。传统的子网拓扑发现主要依赖于ICMP协议
本文以供应链管理软件的研究开发为背景,从中抽象出面向构件的软件开发的一般过程、原理和方法。首先介绍构件化软件开发的思想,阐述了基本概念以及建模机制;接着,阐述模型驱
全文检索式搜索引擎越来越成为用户使用互联网的重要工具,它的技术直接来源于信息检索领域,并根据互联网的特点进行了大规模的改变。然而由于互联网本身的涉及学科众多,用户
信息检索模型的研究和发展已经历经70余载,在过去相当一段时间里,信息检索还只限于专业人员使用,模型的实现原理也比较简单,人们获取信息的途径并不依赖于信息检索,因此用户对于信