基于改进贝叶斯网络的高维数据本地差分隐私方法的研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:new_fisher
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据发布时的隐私保护问题以及如何防止用户隐私泄露已成为网络空间安全领域的研究热点。目前,该问题的最新解决方案是使用差分隐私机制,差分隐私是一个评估和保护数据隐私的严格数学框架,它具有更高的性能和坚实的理论基础;然而,使用差分隐私的现有技术无法有效地处理高维数据的发布问题。高维数据由于其数据量大而且相关性高的特点,在使用差分隐私机制发布数据时,数据的实用性比较差;特别是当输入数据集包含大量属性时,现有的方法需要注入大量的噪声,这使得发布的数据由于过度失真而几乎变得毫无用处,对发布数据的准确性和可用性造成很严重的影响。因此,尽管目前的高维数据发布方法可以解决高维数据发布的问题,但是大部分发布方法并不能有效平衡高维数据之间复杂的关联性和不可信第三方的隐私威胁问题,导致最终所发布的合成数据的实用性较差。针对上述问题,本文的主要工作如下:(1)针对高维属性集之间的相关性问题,提出高维数据改进贝叶斯网络本地差分隐私数据发布算法(Normalized information entropy Priv Bayes,NE-Priv Bayes)来构建质量更优的贝叶斯网络。该方法采用最大期望算法计算高维数据集的联合概率分布,基于归一化信息熵和互信息的方式构建贝叶斯网络,使构建的贝叶斯网络能在很大程度上还原原始属性集的相关性。(2)针对现有的构建贝叶斯网络算法中没有考虑度值k以及初始节点一旦选定无法修改等问题,提出基于改进离散蜂群算法的贝叶斯网络搜索算法(Improved DABC-based Bayes Network Searching algorithm,IDBNS),使其在有限的复杂度下,搜索质量更优的贝叶斯网络结构。该方法使用离散人工蜂群算法构建贝叶斯网络,对贝叶斯网络结构进行学习,其目的主要是从搜索空间中按照BIC评分标准找到一个全局最优的食物源。在Adult数据集上进行实验并与Priv Bayes方法进行比较。仿真实验表明NEPriv Bayes方法在数据实用性方面具有优势,而且IDBNS算法得到的贝叶斯网络结构的收敛性更好。
其他文献
近些年,我国汽车产业发展迅速,汽车产销量连续十二年位列世界第一,汽车包括乘用车和商用车两类,乘用车占汽车产销量的比重较大。随着人们生活质量提高以及购买能力提升,消费者对不同车型的需求量和购买量越来越大,乘用车企业之间的竞争愈发激烈,乘用车物流成本制约着企业的发展。乘用车制造企业往往具有多个整车制造厂,不同整车厂对不同车型的供应能力不同,在产能限制的基础上,构建合理的乘用车物流网络有助于企业降低成本
钙钛矿材料由于其本身制作工艺流程简单、色纯度高和荧光量子产率高等优点使得这种材料在发光二极管(Light-Emitting Diode,LED)领域有着广阔的应用前景。关于红光和绿光钙钛矿LED方面的研究不断发展,最高外量子效率(External Quantum Efficiency,EQE)都突破到20%以上,EQE的水准已经接近商用LED的水平。然而在蓝光领域,钙钛矿LED一直存在着效率低下、
近年来,同城快递领域市场发展迅速,客户对同城产品时效感知也愈发明显,随着新零售业态的不断升级,未来将催生出更多的同城寄件需求。当前,各大快递公司均积极把握市场机遇,布局同城快递。然而,以地面交通工具为主的配送模式已显现出时效差、易受城市道路交通影响等弊端,兴起的地下物流系统为解决此类问题提供了新思路。本文以J公司同城快递为研究对象,构建了基于地铁网络的“地面末端取派+地铁干线运输”的新型同城快递配
随着城市轨道交通不断发展,如何降低列车牵引能耗问题逐渐成为研究重点。列车运行曲线优化是降低列车牵引能耗的主要方法之一,其本质是一个多目标优化问题。传统解析和数值方法存在求解困难,计算时间长等缺点,智能优化算法建模相对简单,对数学模型要求不高、适应性强,在求解列车运行优化曲线的问题上取得了不错的优化效果。现有研究多数直接将智能优化算法应用于求解列车运行曲线,缺少对智能优化算法性能评价指标的梳理和对算
在线手写签名鉴别作为一种个人身份认证技术得到了社会和法律的双重接受,该技术已被广泛应用于信息安全、法医学和金融学等领域。在线手写签名鉴别算法也是模式识别领域中的热门研究课题之一。受到手写环境、签名者心情等因素的影响,真实笔迹会产生较大差异。此外,经过长时间训练模仿的熟练伪造签名也常常与真实笔迹难以区分。因此,对于熟练伪造签名的鉴别是在线手写签名鉴别中的一个难点。本文主要基于函数特征和全局参数特征对
车联网是融合了通信、汽车、交通等行业的新兴智能战略产业,用于应对交通设施日益增多的通信问题,为多样化的立体交通网络提供有效的通信服务。频谱资源管理技术是分配频谱资源、保证频谱利用率的重要手段。当前频谱资源管理技术存在计算复杂度高、频谱共享效率低、通信代价高等问题,严重限制了车联网的发展。因此为了提升车联网的频谱利用效率,本文研究了车联网动态频谱分配方案,主要研究内容有以下四点:(1)建立了车联网分
随着大数据时代的到来以及深度学习技术的蓬勃发展,目标检测与定位取得了跨越式的进步,性能不断提高。但是,目前深度学习的成功需要依赖大量的标注数据,而海量数据的标注费时费力,准确度也难以保证,限制了目标检测在实际任务中的应用。为了减轻对海量数据标注的依赖,研究人员开始关注弱监督目标定位方法,仅用图像类别标签训练来实现目标定位。目前的弱监督学习方法主要利用分类模型进行目标位置信息的挖掘,而分类模型仅关注
现如今,网络借贷业务飞速发展,据统计,截止2020年12月份,京东金条的用户数超过7000万,而京东白条的用户数更是突破2亿。随着借贷用户数量的飞速增长,逾期用户的数量也正在以极快的速度上升,因此如何有效地对逾期用户进行催收便成为现在急需解决的问题。目前,主要的催收方式还是依靠催收员对逾期用户进行催收,然而,由于许多催收人员缺乏专业的催收技巧,导致部分逾期用户拒绝还款,更有甚者还产生语言上的冲突。
地铁是最方便与经济的城市交通设施与出行方式。考虑其在城市的日常交通中的重要性,地铁车辆关键结构的可靠性与安全性方面皆有极高的要求。转向架构架是地铁车辆零部件中最为重要的结构之一,是轨道车辆的主要承载部件,为满足车辆的可靠性与安全性,对于转向架构架的疲劳寿命研究十分必要。本论文的主要研究内容如下:(1)选定某地铁动车转向架构架作为研究目标,根据标准U615-4计算构架分别在静强度加载与疲劳强度加载情
网络中的社区检测由于能够发现隐藏在网络中的一些有用信息而受到广泛的关注,识别网络中的社区也有助于有效地理解和利用网络,例如检测引文网络中的社区可以找到相关主题的文章,检测购物网络中的社区帮助构建推荐系统等。在当今时代,现实世界由各种各样的网络构成,因此利用网络中的社区来发现有价值的信息已经成为了研究的热点问题。检测网络中的社区是一个NP-难问题。目前已经有许多学者设计了不同的社区检测算法,并且现有