基于隐私保护的分布式聚类算法折研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:quindavid
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术正受到人们越来越多的关注,与此同时隐私保护问题也日益受到广大人们的重视。如何在保护自身隐私的同时进行充分的合作和数据的共享,已经成为人工智能领域的一个研究热点。  本文主要针对多方合作计算问题展开了研究,目的在于使参与各方能在很好的保护自身敏感数据及数据分布情况等知识的前提下,能很好的进行相互间的协作,挖掘出基于整体数据集的知识作为参与者的共同财产。通过将数据流当中的微簇概念引入到分布式的环境中,并加入多方安全协议,我们提出了基于隐私保护的分布式聚类算法。该算法具有很小的通信消耗,较低的计算时间复杂度,然而却具有很好的安全性以及较高的准确率。  考虑到信息飞速增长,各个行业内部合作逐步扩大的现实背景,文章在之前提出的基于微簇的聚类算法基础上进行了扩展,提出了增量式的隐私保护聚类算法IDPPKMeans(Increment Distributing Privacy Protect K-Means),避免了由于新的数据集加入到合作系统中而引起所有数据进行重新聚类的问题。最后通过实验证明该算法具有较高的准确度,并能很好的保护数据的安全性。
其他文献
对于运动目标跟踪系统,其核心主要包括两个部分:一是运动目标的检测与提取;二是运动目标的跟踪。运动目标的提取是目标跟踪任务最为关键的部分。在运动目标检测方面,主要包括
随着因特网的不断发展,网络信息资源也与日俱增。面对内容冗余、结构复杂的知识海洋,如何准确、及时、全面的获取所需要的信息,成为人们所关注的焦点。传统基于简单关键字匹
无线传感器网络,作为一种全新的信息获取和处理技术能够广泛地应用于多个领域,近年来成为国内外传感器技术领域的热点研究课题。它是在特定的背景下以一定的网络模型规划的一
近些年,随着大量的医学辅助手段如CT、MRI在临床诊断的应用,对心脑血管疾病的诊断状况已经有所改善。这些诊断方式只是以二维切片的方式显示人体组织和器官,诊断时常常依赖较
炼钢-连铸生产调度水平是衡量钢铁企业生产管理水平的重要指标之一。合理安排炼钢-连铸生产作业计划与调度是确保钢铁生产物流通畅、资源合理利用,提高设备利用率,提升生产系统
随着Internet的迅猛发展,Web服务的数量日益增多,如何从庞大的服务群中选择所需的服务成为繁重的工作。在选择服务时,人们不仅关心服务的功能,也关心服务的非功能因素,尤其是
XML自1998年由W3C提出之后,已经成为数据表示和数据交换的新标准,各行各业都在使用XML用来描述本领域信息,随着XML文档的增加,如何有效存储、管理和查询这些数据成为当前XML
互联网高速发展与信息技术高度进步的今天,数据与信息成倍地增加。而计算机与计算机之间为了达到资源的共享,大都采用分布式结构进行互操作。分布式的访问为资源的有效利用和
随着嵌入式技术的不断发展与进步,对MP4行业也同时产生了巨大的影响。伴随着市场对支持多格式尤其是RMVB格式的MP4的需求,目前也出现了一些支持RMVB格式的MP4。但是国内生产
本课题源自青岛市科技局发展计划项目《可移动高性能电脑加密机的研究与设计》,本文主要研究并实现可移动高性能电脑加密机的核心部件- RSA密码芯片的硬件实现。本文根据项目