论文部分内容阅读
随着云计算的广泛运用,越来越多的数据拥有者选择将本地上复杂的数据管理托管到云平台。公有云上数据的隐私信息会受到多方面的攻击,出于对数据隐私的保护,发布到公有云上的数据需要进行噪音扰乱或加密处理。目前的研究成果主要集中在对数据的加密处理,但加密技术的系统开销太大,而且只有授权用户才能够访问数据,这将导致用户查询的响应时间过长以及数据的共享程度过低。 针对上述问题,采用了噪音扰乱技术,在保护数据隐私的前提下构建了PR-CAN索引,加快了用户查询的速度。首先应用数据被平行分割于若干台服务器上,在每台服务器上针对本地数据建立基于隐私保护的PR-tree索引,同时服务器之间自组织成CAN覆盖网络。为了使本地索引都能满足差分隐私的要求,提出了R-tree划分算法,R-tree中所有有重叠区域的叶子结点被重新划分成不相交的区域。针对区域彼此互斥的叶子结点,独立的噪音添加机制使得PR-tree满足了差分隐私。然后,通过索引选择算法挑选部分PR-tree结点构建上层全局索引,并采用索引映射算法将每一个选取的PR-tree结点映射到相应的CAN服务器上。最后用户发起查询,通过PR-CAN索引,用户查询能够高效并行地进行。 实验结果表明,云平台上基于数据隐私保护的高效索引PR-CAN不仅能够在不同程度上保护用户隐私安全,而且有效地加快了用户查询。实验中,通过计算查询吞吐率来衡量PR-CAN索引的查询性能。通过与现有Quad-opt方法的比较,在相同隐私条件下,数据可用性提升了将近20%。