【摘 要】
:
在现代信息社会中,网络的快速发展使得越来越多的数据实现了共享,其中很多数据含有用户的隐私信息。信息的增长为人们的工作和生活提供了便利,也对个人隐私造成了威胁。在数
论文部分内容阅读
在现代信息社会中,网络的快速发展使得越来越多的数据实现了共享,其中很多数据含有用户的隐私信息。信息的增长为人们的工作和生活提供了便利,也对个人隐私造成了威胁。在数据发布的过程中,常常会出现用户隐私信息泄露的问题,隐私保护已成为一个重要的研究领域。k-匿名是保护隐私信息的重要方法,它能够简单有效地对发布数据进行隐私保护。近几年,很多学者又将微聚集方法与k-匿名技术相结合,以达到更好的匿名效果。本文主要针对隐私保护中的微聚集方法进行研究,具体工作如下:(1)研究了隐私保护的相关技术,重点分析了k-匿名模型和l-多样性模型,通过对各种k-匿名算法的比较,明确了各算法的优缺点,并对算法的不足之处提出了改进。(2)对隐私保护中的微聚集方法进行了深入研究,总结了微聚集匿名技术的发展动态,分析了微聚集算法的评估模型。针对现有微聚集算法在处理大样本数据集时耗时长、效率低的问题,提出了改进方法。通过引入分治法思想,对大数据集进行聚类预处理,能够缩短算法执行时间,提高算法运行效率。(3)分析了初始聚类对数据集敏感属性分布的影响,针对现有微聚集算法在处理敏感属性多样性问题时的不足,本文在聚类基础上提出了一种MKL算法。该算法在初始聚类的过程中按比例划分,然后再对各个子数据集进行l-多样性处理,从而使得匿名数据既能满足可用性,又不会造成过高的信息损失。最后对算法中m值的取定给出了有效评估方法。(4)利用加利福尼亚大学机器学习中心的Adult数据库对算法进行了相关实验,并对实验结果进行了分析。通过比较算法的执行时间、信息损失度及隐私泄露风险,对算法性能作了评估。实验结果表明, MKL算法不仅能够提高运行效率,而且在聚类中实现了l-多样性,使数据的安全性得到了提高。
其他文献
互联网新型应用的不断涌现,使得互联网的拥塞状况日益加剧。为了监测网络是否安全、高效、稳定地运行,确保各单位机构局域网中有足够的带宽,使得对网络流量进行准确的识别变
遗传算法是最早的进化算法之一,它具有良好的稳定性和全局寻优能力,广泛的应用于实际问题中。相比于现今粒子群,差分等进化算法,它的收敛速度相对很慢,在局部寻优上存在不足
近年来,国民经济的快速发展带动电力产业的大规模建设。与此同时,如何能够在电力供给与电力消耗之间达到相互协调,合理利用电能的问题日益凸显。要解决合理利用协调配比电能的问题,用电量预测是这个问题的关键。如何对用电量进行预测以及如何保证预测精度则是近些年的一个热点研究领域。用电量预测是基于数理统计的数学建模研究,是通过对历史用电量数据进行统计分析,找出其中蕴含的规律,获得其影响因素,利用现代仿真和计算机
视频监控系统的广泛运用,为人们在交通管理和安全监督提供了很大的便利,然而这种便利需要耗费巨大的人力物力去干预和监督。随着科学技术的发展,视频监控系统智能化成为解决该问
在传统的网页分类中,通常采用有监督学习,通过对大量有标记(labeled)的网页训练集进行学习来预测未标记(unlabeled)网页的类别。但是,获取大量有标记的实例需要花费大量的人
作为一种重要的群体智能算法,PSO算法具有易于实现,需要调整的参数比较少,收敛速度快以及通用性强等特点。因此,它一直受到很多学者的关注。本文在研究PSO算法基本原理和研究
随着互联网发展和电子商务规模不断的扩大,信息过载问题日益的严重。个性化推荐系统是一种解决信息过载问题的有效方法,它能够主动的去为用户推荐个性化信息并动态的根据用户
随着数码设备和图像处理软件的快速发展,人们可以非常简单地修改数字图像。如果重要的图像被恶意篡改,那么将会对社会产生不良影响。数字图像被动认证技术相对于数字水印等主
近几年,随着计算机科学与技术的发展,在云计算领域中形成了一种用时付费的生产者-消费者资源交付和使用模式。由于这种使用模式具有良好的效益成本[1],它被越来越多的企业和