基于差分隐私保护的集成分类方法研究

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:wang605631496
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅猛发展以及大数据时代的到来,数据挖掘技术得到了极大的促进与发展。然而,在训练数据挖掘模型的过程中可能会涉及到用户的个人信息,对这些数据的不当使用容易带来严重的隐私泄露问题,对个人乃至社会造成不良的影响,同时也极大的阻碍了数据的共享和挖掘技术的发展。目前,具有隐私保护的数据挖掘算法成为了一个热门的研究方向,其核心任务在于如何平衡隐私保护和模型准确性之间的矛盾。差分隐私技术提供了一种具有严谨数学定义且可操作的隐私保护机制,为具有隐私保护的数据挖掘算法提供的新方向。在本文所涉及到的集成分类算法中,研究与分析了将差分隐私应用于相应数据挖掘算法的实现机制和设计重点,以及算法实现中的隐私预算分配问题。实现了所提算法的隐私性和模型可用性之间的平衡。本文主要的工作可以归纳为以下几个方面:(1)为了提高满足差分隐私保护的决策树算法的可用性,本文提出了一种基于深度的隐私预算分配方法,该方法能够把隐私预算尽量预留给决策树的叶子节点。避免了传统的层次均分策略中随着层次的增加累计的噪声量越大的问题。此外,分析了构建满足差分隐私保护的决策树时不同节点的实现机制。(2)在前一研究的基础上,提出了一种满足差分隐私保护的随机森林构造算法。并通过基于选择集成的方式,改进模型集成的方案,提高了随机森林模型的可用性。(3)为了解决分布式数据挖掘中的隐私保护问题,提出了基于差分隐私保护的分布式决策提升树算法。该方案通过分布式集成的思想来加强参与者的数据分布,并设计了一种自适应的模型集成机制,使得算法在满足差分隐私保护的前提下,提高了模型分类的准确性。最后,通过理论分析和实验验证了所提算法能够在满足隐私保护的前提下,保证一定的算法结果的准确性和可用性。
其他文献
随着移动互联网的快速发展,基于Android系统的终端在企业办公以及移动作业中越来越广泛的使用,其中一个重要的应用场景就是终端远程接入企业内部网络进行远程作业,如何安全地接入企业内网是一个非常重要的问题。在国内外网络环境安全日趋严峻的形势下,国产密码算法的应用也迫在眉睫,国内一些重点领域如国家电网等对网络信息传输安全提出了国产化的特殊需求,因此,研究基于Android的国密SSLVPN终端是十分必
在如今互联网技术尤其是5G技术快速发展的大环境以及科技兴国国策的大力推动下,促使一个企业不断向前发展的源动力之一必定是其对生产过程的智能化、自动化的无限趋近。由于运维人员如今所面临的运维场景和系统架构愈发复杂以及多种生产要素之间的关联度越来越高,传统的、被动的、人工干预的运维方式已经无法满足企业的数字化转型需求。运维系统的好坏,虽然不会直接对效益产出有直接影响,但它会对团队运营的效率,系统运转的可
随着通信技术的飞速发展,客户的业务请求趋于多元化且呈现爆炸式增长,这对网络规模提出了更高的要求。传统的互联网架构由于缺乏灵活性,难以在服务差异化的业务请求时实现网络资源的共享,因此需求大量的硬件资源成本。在此困局之下,网络功能虚拟化(Network Function Virtualization,NFV)技术应运而生。该技术能够实现软硬件的解耦,使传统硬件上的网络功以虚拟网络功能(Virtual
能源系统和互联网技术相结合催生出了能源互联网这一概念,为多能互补运行与协调优化提供了可能性。综合能量管理系统主要利用不同能源之间的相互转换实现综合能源系统的协调优化,目前面临着诸多问题与挑战,例如综合能量管理系统的功能需求尚不明确;存在重复开发问题,需要高兼容性平台整合现有功能,打破数据信息壁垒。为解决上述问题,本文研究了基于微服务架构的能源互联网综合能量管理系统,利用微服务架构所具备的服务松耦合
伴随着互联网技术的高速发展,服务计算成为了一个研究热点。而服务计算的基础与支撑技术即为面向服务架构。面向服务架构将一个应用程序中不同的功能模块封装为服务,并为服务定义独立于底层操作系统与硬件的调用接口,从而使得用户能够忽视服务的编程语言、服务部署环境等问题,更为高效地实现用户需求。其中Web服务是实现服务提供商向用户提供可信服务的一种重要技术手段,该技术是综合计算机通讯、应用系统设计与实现、网络信
网格作为一种新兴的互联网技术,其根本目的是对广域计算资源进行聚合以及对广域信息资源进行共享。在开放网格服务体系结构中,强调以服务的形式封装和提供各种资源,而网格的强动态性导致网格服务不断地进行创建和删除,海量的临时性短暂服务与服务请求聚焦在整个网格系统,对服务进行高精度、高响应和高效率发现的难度也在不断上升。传统模式的网格技术常采取集中式的注册中心或聚合目录进行服务资源的注册和发现,但随着时间推移
与访问控制模型相关的安全性问题发现,随着有关人员和组织的更多数据被放入云中,人们对信息安全性问题的关注开始逐渐增长,确切地讲域的安全性。不管围绕云的所有构建如何,努力的客户仍会毫不犹豫地在云中传达其业务。安全性是减少云计算发展的现实问题之一,数据安全性和保险带来的不便一直困扰着市场。许多访问模型都是可访问的,但是这些模型不能满足安全性要求,因为每个服务提供商都必须这样做,并且云计算始终受到黑客的攻
精准的定位与对环境的感知是智能移动机器人正常工作的前提条件,随着研究的深入,SLAM技术应运而生。使用单一传感器对机器人进行定位难以保证其在各种环境下长期稳定工作,越来越多的多传感器融合的定位方案正在被研究与应用。视觉传感器在短时快速运动或无纹理区域易发生特征点的缺失,无法保证良好的特征跟踪和位姿估计性能,惯性测量单元(IMU)能很好的弥补该不足,而视觉传感器信息也恰好能对IMU漂移的影响进行校正
在数字图像编辑中,图像通常由图层构成,图层则用于分离和表示图像的不同部分。图层方便了对图像的操作,例如用户可以增加或删除图层,也可以对图层进行色调的变化、图层的替换等操作,方便实现图像的编辑。然而图像一旦栅格化后,图层就不复存在。在本论文中,图层被定义为颜色近似均质的图像段。论文针对颜色层分解技术进行研究,旨在将给定的图像分解为多个高质量的颜色图层,从而方便图像编辑。论文主要工作有:(1)针对分层
如今软件技术的发展已经十分迅速,软件产品的功能和结构变得越来越复杂,并且软件的迭代周期也越来越短,可是传统的软件开发模式效率不高,不仅需要频繁的重复操作,而且容易积累较多问题,使得产品的发布时间被延迟,于是就需要一种效率更高更方便的软件开发方式。持续集成作为一种高效的敏捷开发实践,已经被广泛的使用,持续集成通过频繁的获取最新的代码并且进行构建,帮助开发人员及时的发现开发中出现的问题,从而保证开发项