【摘 要】
:
随着计算机和网络技术的快速发展,信息系统的数量和规模越来越大,这些信息系统数据的分布性、异构性及大规模的特点使异构数据整合成为一个挑战性的问题。web数据的管理和处
论文部分内容阅读
随着计算机和网络技术的快速发展,信息系统的数量和规模越来越大,这些信息系统数据的分布性、异构性及大规模的特点使异构数据整合成为一个挑战性的问题。web数据的管理和处理面临着半结构化数据、数据量大、查询速度缓慢,检索效率低下、可扩展性、普适性等主要问题。为了满足非关系型数据和异构型数据的存储和处理需求,本文针对RDF数据管理及处理进行了研究,提出了基于图拆分的RDF数据存储及优化查询方法,改善RDF数据存储及查询效率。首先,本文研究基于超图拆分的RDF存储方法,针对RDF数据的数据特征,提出采用基于超图超点(包括超点和超边)权值生成策略,根据权重和最小的边割集,划分RDF数据图,并针对经典Metis算法和哈希算法进行了实验比较,分析提出方法的优势。其次,研究了面向SPARQL优化的查询计划生成方法,根据统计代价模型的统计,SP索引机制和数据存储方法,对查询进行优化排序,使每次查询的中间结果最小,提高查找速度。最后根据提出的方法,实现了基于HBase/Hadoop的RDF数据的分布式存储、查询、处理系统,并进行了系统实验验证,对比开源RDF系统Sesame,提出的方法更有效改善了RDF数据查询效率,为RDF数据的处理提供较好的系统和方法上的支撑。
其他文献
三维表面重建是计算机视觉领域的重要研究方向,其目的是从二维信息中恢复重建对象的三维特征,建立对象的几何模型。本文深入研究了基于目标物体的轮廓信息进行三维表面重建的
伴随着物联网技术的发展和宽带速率的提升,具备远程监控功能的IP摄像机产品在市场上得到应用普及。研发出一套B/S架构下以在线视频监控显示为核心的管理信息系统,将会极大满
嵌入式系统从出现至今已有30多年。随着以计算机软硬件为核心的数字化技术的迅速发展,多媒体技术与互联网应用的广泛普及,嵌入式技术再度成为一个研究热点,许多嵌入式网络应
分类挖掘是数据挖掘的重要研究内容之一,现有的分类规则挖掘算法所得到的规则集中存在大量的冗余,严重影响了分类规则的分类效率与可理解性,因此对挖掘出的冗余分类规则集进
个性化的情感机器人是指在拥有情感的前提下,再加入个性这一特定情感属性的机器人。不同个性的机器人具有不同的行为模式,个性的加入使机器人的情感智能得到进一步的提升,同
随着Internet的快速发展,各种网络服务层出不穷,网络流量不断增大,使得实时在线的流测量变得更困难。为了解决这一问题,人们提出了抽样测量技术,即抽样测量部分流量,然后从统
非负矩阵分解方法是一种近年来被广泛研究的降维方法,现有的非负矩阵分解算法在应用于问题规模逐渐增大的情形时,运算规模随之增大、空间和时间效率不高。本文对此提出一种增
安全,是社会发展和经济建设的永恒主题,良好的安全生产环境和秩序是经济快速发展的重要保障,所以必须重视安全工作。而对重大危险源的辨识和事故隐患的监控是实现安全目标的基础
内容计费(Content-based Charging)是一种新的计费方式,它对网络上的数字信息产品按其内容的不同而进行有区分度计费,尤其适用于业务种类繁多的3G网络的计费需求。3G业务的计
随着无线网络的迅速扩大和配置管理复杂度的提高,一次只能配置一个网元的配置管理系统已经不能满足通信运营商的需求,必须提供统一的全网络配置管理解决方案实现配置管理效率的