论文部分内容阅读
作为云计算中最典型的服务之一,云存储能使云租户将数据外包到云服务器,从而减轻租户本地数据维护和计算负担,但带来便利的同时,也使隐私数据脱离了租户的物理控制,导致数据泄露的问题。为了保障云数据安全和隐私,常规方法是将敏感数据加密存储,但复杂的加密会使对数据的检索变得极其困难。因此,实现云租户高效地有选择地检索加密文档引起了工业界和学术界的极大关注。在动态且海量的数据环境下,已有的可搜索加密方案存在搜索效率和精度低、安全性差等问题。因此,在确保数据隐私前提下,如何提高密文检索的精度和效率成为当前要解决的关键技术问题。针对上述问题,主要研究工作如下:1.为了提高密文检索的效率和精度,给出基于聚类索引的多关键字排序密文检索方案。首先,利用改进的Chameleon算法对文件向量聚类,聚类过程中利用记录关键字位置对文件向量进行降维处理,减少不必要的计算消耗。其次,在聚类过程中引入杰卡德相似系数来计算降维后文件向量之间的相似度以及设定合适的阈值提高聚类质量。最后提出适合聚类索引的检索算法,使得在查询过程中可以排除大量与查询向量无关的文件向量,提高检索效率。在真实数据集上进行了反复实验,实验结果表明该方案在保障数据隐私安全的前提下,较传统的密文检索方案有效地提高了密文检索的效率与精度。2.为了提高密文检索方案的安全性,给出基于倒排索引的可验证混淆关键字密文检索方案。首先,在构建陷门时利用加密的标志位插入混淆关键字,隐藏关键字搜索频率,抵抗恶意云服务器的关键字攻击。同时引入数据缓存区,利用Pailliar加密技术对包含混淆关键字搜索结果进行盲计算,过滤掉包含混淆关键字的密文数据,减少通讯开销和用户的计算负担。最后,利用双线性映射生成标签验证搜索结果,并对方案的正确性、安全性和可靠性进行了验证。理论分析和实验结果表明,该方案在保证检索效率的同时,较现有的密文检索方案有效地提高了密文检索的安全性。