一种面向隐私保护的分布式数据流挖掘算法

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:weiwen2100000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展,大规模分布式计算及数据共享技术的进步,分布式数据流已经广泛存在于金融风险分析、无线传感器网络、网络入侵检测等应用中,发现其中蕴含的知识是目前国内外数据挖掘领域研究的一个热点。然而,数据挖掘在揭示模式或者知识的同时,也越来越对隐私和信息安全构成威胁,因此,如何在高效的挖掘过程中有效的防止隐私泄露,对分布式数据流挖掘技术提出了新的挑战。本文主要是针对当前分布式数据流挖掘应用中存在的隐私泄露问题,结合已有的数据挖掘技术和模型对数据流挖掘及隐私保护技术进行研究。首先,定义一种面向双重隐私保护的分布式数据流挖掘模型,重点关注最近到来的数据;给出一种分布式安全传输策略,采用远程站点、主站点和协调站点通信的结构,在取得隐私保护效果的同时,能较好的满足分布式数据流实时、高速的传输特点。其次,提出一种面向隐私保护分布式数据流挖掘的算法,采用随机干扰技术,结合集中式数据流挖掘算法,发现能够完全代表频繁项集并且数量级更小的闭合频繁项集,从而有效保护原始敏感数据,同时以时间戳为标志,将远程站点的临界闭合频繁项集及子集通过安全性较高的加密协议,增量更新至主、协调站点,有效降低通信负载并实现对原始数据和局部敏感规则的双重隐私保护。最后,通过仿真实验对本文的算法进行分析和讨论,结果表明算法是可行和有效的,能够较好的适应分布式数据流分布、动态的特性,在取得较好隐私保护效果的同时,有效地降低了通信负载。
其他文献
区域医疗协同是卫生信息化经过医院管理信息化、临床管理信息化两个阶段后新的发展需求,其目的是使分散在区域内不同医疗机构的卫生数据得到充分的共享,有效的整合数据资源,
学位
无线传感器网络由大量的微型、廉价、低功耗的传感器节点组成。这些传感器节点不仅能够探测包括地震、温度、湿度、噪声、光强度、压力、土壤成分、移动物体等多种多样的现象
交通系统智能化的快速发展,设施设备特别是卡口数量的快速提升,使得过车记录飙升,形成大规模数据。卡口系统中,用户常常需要对车牌号进行精确或模糊查找,同时要求数据检索系
机器视觉是用计算机来模拟人的视觉功能,其中非常重要的一环就是图像处理。特征提取是图像处理中的一个重要研究方面,而角点是图像中非常重要的特征,包含丰富的图像信息。角
H.264是由ISO(国际标准化组织)与ITU(国际电信标准化部门)联合制定的新一代视频编码标准。H.264具有较高的压缩率、较好的图像压缩质量以及网络亲和性,因此在存储和网络传输
在互联网技术飞速发展的今天,Web服务在Internet上的应用不断扩展,电子商务等Web服务应用已经被广大用户所熟知,成为了大家日常生活的一部分。Web服务在给使用者带来很多便利
在当今社会中,教育伴随着人的一生。随着现代网络技术的发展与信息技术的应用普及,计算机教育信息系统的可视化研究成为当前教育的一个热点。教育信息系统层面很多,我们主要
学位
网络入侵检测是保障计算机网络安全的重要技术,现行的入侵检测主要是依靠领域专家的经验和知识,难以应对各式各样的网络攻击。本文在对网络入侵检测的研究现状进行分析之后,
氧气在医疗、冶金和化学工业等领域有着广泛的应用,而这些应用,对氧气的浓度都有着严格的要求。因此,以一种便于使用的方式,精确地测量氧气浓度,对提高产品质量、保证生产环
问答系统是目前自然语言处理领域中的研究热点之一,它以精准的答案直接回答用户以自然语言方式表达的问题。在问题分析时,提取问题中的关键词对于理解其语义至关重要;在问题