基于XML的Web挖掘研究

来源 :石油大学(华东) 中国石油大学(华东) | 被引量 : 0次 | 上传用户:blackhorse1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本课题的研究内容是基于XML的Web挖掘技术,主要工作是研究如何集成分布的、异构的、半结构化的Web数据,以便于进行Web资源和知识发现.首先,针对Web数据异构、半结构化的特点,我们使用XML作为描述Web原始数据的描述语言,将异构的、半结构化的Web数据转化为结构化的数据——XML数据.然后针对分布数据源中XML数据存在的语义异构的问题,我们引入本体来赋予XML数据领域共享的语义.具体方法是在XML数据之上添加了一层RDF元数据,用RDF Schema编码本体信息,通过RDF元数据建立XML数据与本体中概念之间的对应关系,赋予XML数据领域内共享的语义.最后收集RDF元数据,建立元数据库,在元数据库中进行Web资源和知识的发现.
其他文献
当前,随着人们对教育终身化、全球化的需要以及计算机、通信技术的飞速发展,网上学习正逐渐成为人们乐于接受的学习方式,基于计算机网络的远程教育系统开始在现今和未来教育中扮
VPN是指将物理上分布在不同地点的网络,通过公用骨干网联接成逻辑上的虚拟子网.为了保障信息在Internet上传输的安全性,VPN技术采用了认证、存取控制、机密性、数据完整性等
机器人技术体现了当代科学技术的发展程度,被誉为“当代最高意义的自动化”,其研究涉及多门学科,涵盖了众多的研究领域。随着应用领域的不断深入,对移动机器人的智能性要求也
在总结分析三种认证电子邮件协议模型——无需可信第三方介入的协议模型、基于在线可信第三方的协议模型和基于离线可信第三方的协议模型的优缺点的基础上,针对现有协议方案
随着网络,尤其是网络经济的发展,企业规模日益扩大,客户分布日益广泛,合作伙伴日益增多,传统企业内部网络基于固定地点的专线连接方式,已难以适应现代企业的需求.于是企业在
该文介绍了我们从编程语言的角度为解决移动代码安全问题所做的研究工作,主要内容包括:1.我们阐述了这种方法的基本原理:就是利用编译手段搜集到程序的类型、结构等信息,在客
近年来,随着MANET民用步伐的加快,人们对不受时空限制,在任何时间、任何地点访问基础设施网络资源的要求越来越强烈.人们期望通过MANET和Internet的互联,来拓展Internet的无
从小额支付系统的需求出发,首先分析了PayWord这种小额支付协议.PayWord协议可以有效防止伪造和重复消费,但不能保证交易的原子性,也不能防止透支和抵赖,并且在多商家的情况
随着Web信息的激增,越来越多的信息开始由静态网页存储的方式向Web服务器维护的数据库即Deep Web转移。与Surface Web相比,Deep Web包含的信息具有数量大、质量高、增长快等特