面向实时数据流的匿名化隐私保护发布技术研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:A88833238
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据发布中的隐私保护是将数据发布与隐私保护技术相结合,在保护隐私的前提下,发布较为准确的数据,提高信息的利用水平。匿名化限制发布是其主要的技术实现手段。当前以数据流形式呈现的数据信息大量涌现,数据流环境下的隐私保护发布问题成为学术界的研究新热点之一。CASTLE算法是第一个完整提出的数据流隐私保护发布框架,本文在该算法的基础上,设计并实现了一种基于均衡思想的数据流匿名化隐私保护发布算法:B-CASTLE,同时,将Anatomy发布方法扩展至数据流环境下,称之为SAnatomy。本文的研究内容依次包括了隐私保护发布过程中的三个阶段:第一,研究了混合属性的同一度量映射问题。混合属性的同一度量映射是数据流隐私保护发布的基础,本文对三种不同类型的准标识符属性进行同一处理,在范畴属性语义泛化树的基础上,给出了一种语义距离的计算方法,为聚类提供了良好的度量准则,提高了聚类簇的内聚性。第二,研究了待发布等价类的动态调整和更新重组问题。本文在CASTLE算法的聚类簇调整模型基础上,构建面向数据流的动态聚类和实时调整算法模型,对单个聚类簇的元组最大数目进行了控制,同时调整了元组重聚类的策略,通过“部分合并”的方式产生符合要求的等价类,从而提升算法的整体效率。第三,研究了等价类和元组的预处理与发布问题。首先介绍了CASTLE算法的泛化发布策略,然后对B-CASTLE发布算法进行了改进和优化,并给出了相应的实验对比结果。此外,由于泛化技术会损失较多的分布和关联信息,本文给出了一种数据流的Anatomy发布方案:SAnatomy,在提高数据精度的同时对敏感数据提供了较好的保护,最后通过实验验证了SAnatomy的可行性和有效性。本文的主要贡献是给出了基于语义泛化树的同一度量映射方法和数据流的B-CASTLE发布算法,它们对提高数据流隐私保护发布的效果和效率具有重要的意义。另外,本文给出的数据流Anatomy发布方法也为其它方面类似的应用提供了借鉴。
其他文献
无线传感器网络以其低耗自组、容错性好、易于大规模部署等优点,被广泛应用于军事、环境、工业和农业监控等领域。在无线传感器网络的应用中,节点的位置信息起到至关重要的作
随着科技的发展,视频图像的应用越来越广泛,视频图像中运动目标的分割是所有数字图像处理的重要环节,也是后续高级处理的基础,因此有关运动目标分割的研究就显得十分必要。运动目
随着Internet技术的飞速发展,隐藏在Web后台数据库中的信息资源因为其数据量大、结构完整受到了广泛关注,这些信息资源通常是由用户在Web查询页面提交查询请求后,以HTML页面
随着无线传感器网络(Wireless Sensor Network,WSN)在多领域的深入应用,WSN的重要性和前景变得越来越明确。WSN节点有限的运算能力和有限的能量等问题,吸引了来自不同学科的科研
随着Internet的迅速发展与普及,网络上出现了越来越多的主观性言论。对于这些主观性文本的分析和挖掘,传统的基于主题的文本分类方法已经无法满足需求。因此,人们开始关注并
指纹识别算法是目前高效、应用广泛的识别算法之一,是生物特征识别领域的研究热点之一。在公安、金融电子商务、政务、司法等领域有着广泛的应用。指纹识别具稳定性,唯一性,安全
随着计算机和通信技术的迅猛发展,网络也正朝着大规模、高度分布式的方向发展,同时计算机系统及其网络的被入侵行为也朝着规模化、分布化、复杂化等方向演化。由于各种网络安
车牌识别系统、(License Plate Recognition System,LPRS)是智能交通系统(Intelligent Transport System,ITS)一个重要组成部分。随着我国经济的飞速发展,汽车的总量也大幅度
k-近邻(KNN)算法是一种简单而有效的分类算法。传统的KNN分类算法存在着参数k难以确定以及分类新数据时间耗费大的两个缺陷。kNN模型算法(简记KNNModel)是一种基于KNN原理的
某眼镜连锁销售店在日常销售中应用连锁零售销售系统,积累了大量的销售数据,但该系统只支持极其简单的统计查询,无法进行商品关联性、销量和利润预测等分析。因此,本文对该企业原