论文部分内容阅读
数据挖掘致力于从大量数据中寻找有用的知识,数据挖掘的强大功能,能帮助人们更透彻地理解数据,从数据中获取更深层次的信息,从而产生巨大的生产力,已经在电信、银行、保险、证券、零售、生物数据分析等领域得到了广泛的应用。同时,数据隐私技术对数据隐私的威胁也日益引起人们的关注,或担心其数据被误用,或顾虑某些隐藏于数据背后的敏感信息被“挖掘”出来,人们往往不愿意提供数据参与数据挖掘工作。研究如何在保持数据隐私的前提下进行数据挖掘,是一件非常有意义的工作。
隐私保持的数据挖掘研究致力于在确保高质、高效地进行数据挖掘的同时有效地保护数据隐私,这类研究对保持数据挖掘的生命力有重要作用,是近年来学界的一个研究热点。本论文基于安全多方计算理论,研究多方参与情形下,如何在保持数据隐私的基础上做数据挖掘。具体内容如下:
1.首次把安全多方计算理论应用于参与方大于2的分布式数据存储的隐私保持协同过滤推荐,设计了一个安全协议,协议在保证准确地进行协同过滤评分的前提下,确保各参与站点评分数据不被泄漏;并给出了利用安全多方计算理论和模拟范例形式化证明协议安全性的方法,分析了协议的时间复杂度和通信耗费。
2.首次以安全比较计算和安全点积计算为基础安全设施,设计了一个数据挖掘安全协议,解决参与方是2的情况下对指定项进行隐私保持的评分问题,从而解决了隐私保持的两方协同推荐问题:预测准确度与数据集中存放一样,证明了协议的正确性,并基于安全多方计算理论和模拟范例,证明其安全性,分析了时间复杂度和通信耗费。
3.基于概率公钥加密系统,进行安全的点积计算,然后应用于参与方大于2的分布式数据情形下隐私保持基于距离的离群点检测,协议思想清晰简洁,计算时间和通讯耗费均令人满意。
4.针对参与方大于等于2的分布式数据隐私保持基于距离的离群点检测,引入不经意第三方,设计了两个协议,分别针对数据水平分割存储和垂直分割存储的情况进行隐私保持离群点检测,证明其安全性,分析了时间复杂度和通信耗费。