基于Redis的RDF数据存储及性能分析

来源 :云南大学 | 被引量 : 0次 | 上传用户:ab888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RDF(Resource Description Framework,资源描述框架)数据存储作为知识图谱领域中的重要存储框架,广泛应用于生物、医学、地理等多领域中,是目前研究热点之一,而知识图谱作为语义网的现代演化,对RDF数据存储的研究有着更为广阔的应用前景。但随着大数据时代的到来,网络数据规模日渐扩大,如何对海量数据进行有效和高效地存储成为了对当今语义网研究的一个巨大的挑战。对语义网而言,使用传统HTML文档和XML文档解析语义网已经很难满足目前海量数据存储和处理的要求,业界各大互联网公司和研究机构纷纷投入对这方面的研究,其中使用非关系型数据库(NoSQL)存储RDF数据最为广泛。所以利用NoSQL存储RDF数据是目前语义网研究领域中的主要研究方向之一。针对上述挑战,本文研究了非关系型数据库中具有代表性的基于内存存储的键值对存储模型——Redis图数据库,以及传统存储RDF的数据模型,主要工作分为以下三大块。首先针对当今语义网领域面临的海量RDF数据存储的挑战,本文设计了基于Redis图数据库的RDF分布式数据存储方案。利用RDF数据图结构的特性,将RDF三元组映射成Redis数据库中的key-value键值对,而键值对存储模式利用了内部数据结构ziplist,将相同主体的所有属性和属性值进行汇总并打包成一条键值对数据。该方案相比于其他传统存储模型,使RDF数据更简洁和灵活地存储在数据库内,并且可以利用Redis数据库做分布式存储。其次为了检验提出的基于Redis数据库的RDF数据存储方案的正确性和高效性,本文结合现代分布式性能分析工具,设计了一套基于Redis图数据库分布式性能测试方案。方案的核心思想是将资源尽量均匀分配到各个结点,利用负载调控模块的SOA(Service-Oriented Architecture)框架,使各个模块在测试框架中发挥不同的作用。最后为了让性能测试工作顺利进行,对Redis数据库的源码进行了部分修改和增加,增加了对RDF数据的增删改功能,使实验操作更为便捷。
其他文献
在全球治理格局重塑与我国治理结构转型的大背景下,基层治理改革由政府单一主体治理朝着多元参与治理的方向发展,“政社互动”成为地方特色的社会治理新模式进入实践与研究领
猪传染性胃肠炎(Transmissible gastroenteritis,TGE)是一种高度接触性肠道传染病,主要特征是引起仔猪呕吐,严重腹泻和致两周龄以下仔猪100%死亡率,给养猪业带来了巨大的经济
进化树的重建问题是进化生物学中的一个基础问题,也是一个生物学与计算机学相结合的生物信息学问题。进化树的重建问题旨在重建出一棵能够最真实描述物种间进化关系的进化树
信息加密是计算机网络安全研究中的重要内容之一,而密钥是加密算法中的可变部分,它很大程度上决定着.保密通信的安全。所以,通信双方如何在确定对方身份的同时达成会话密钥,
本论文从研究背景、项目的现状等对蔡李佛狮艺社管理系统进行分析,确定了论文的研究方向和研究工作;从业务分析中对系统问题的存在和狮艺社内的组织结构进行了分析,使用活动
纠错输出编码(ECOC)是一种多类分类的集成学习方法框架,比单个分类器具有更好的分类效果。ECOC算法的研究至今仅有二十年时间,但已广泛应用于人脸识别、交通信号识别、微阵列
抑制素α亚基与βA亚基异构化形成抑制素A,而α亚基与βB亚基形成抑制素B,且抑制素α亚基上存在糖基化位点,因此抑制素α亚基是形成抑制素的关键因子。抑制素A是TGFβ家族成
随着信息技术的高速发展,人类社会正在从工业社会向信息社会迈进,信息化是当今世界发展的必然趋势。而信息化时代,企业的信息化建设在现代企业的生存、发展过程中有着重要作
研究背景:口腔鳞状细胞癌(oral squamous cell carcinoma,OSCC,简称口腔鳞癌),是口腔最常见的恶性肿瘤,占口腔恶性肿瘤的90%,其恶性程度较高,五年存活率仅为50%左右,严重威胁
湖羊是我国优质的地方绵羊品种,具有多胎、生长快、耐湿热等诸多优点,其中多胎性能尤为突出,因此多胎机制一直是湖羊特色性状研究和应用的热点。FSHR是哺乳动物多胎性状的主