【摘 要】
:
随着互联网的高速发展,计算机技术在人们生活中的应用越来越广泛,已经成为人类生活不可或缺的一部分。在大数据时代背景下,海量的数据中蕴含的是现实世界中各个领域的碎片化的信息,具有不可估量的潜在价值。随着大数据中巨大的潜在价值被挖掘,为人类的生活提供了便利。偏好分析,精准推送让人们的选择变得方便简单。然而,近年来隐私泄露及大数据杀熟事件层出不穷,为基于大数据发展的技术产业敲响了警钟。出于保护用户隐私的目
论文部分内容阅读
随着互联网的高速发展,计算机技术在人们生活中的应用越来越广泛,已经成为人类生活不可或缺的一部分。在大数据时代背景下,海量的数据中蕴含的是现实世界中各个领域的碎片化的信息,具有不可估量的潜在价值。随着大数据中巨大的潜在价值被挖掘,为人类的生活提供了便利。偏好分析,精准推送让人们的选择变得方便简单。然而,近年来隐私泄露及大数据杀熟事件层出不穷,为基于大数据发展的技术产业敲响了警钟。出于保护用户隐私的目的,业内研究者提出了差分隐私的保护模型。差分隐私使得攻击者无法准确辨别被攻击者的信息具体来自于哪一条记录,是有效的隐私保护模型。根据以上背景,本文使用本地差分隐私保护模型,实现了基于RAPPOR思想的本地差分隐私保护,并且在实现本地差分隐私模型的同时探究数据属性域的大小分布与不同的哈希函数间的选择组合关系。对于不同特点的数据集来说,选择使用冲突最小的哈希函数组合,其中当哈希函数的数量为2,使用mmh3和FNV函数时,对于数值型的数据冲突最小,在添加扰动的过程中减少了随机性扰动的产生,既实现了隐私的保护又保证了数据的可用性。同时由于海量数据的发展不仅体现在用户数量上,也体现于用户数据属性的增多,而数据的高维度会带来维度灾难,给之后的数据还原以及数据挖掘增加了难度。出于这样的考虑,本文在实现本地化差分隐私的同时,实现了一种基于联合概率分布估计的降维算法,以减少维度灾难带来的影响。并且对比了当下机器学习中效用性较强的主成分分析方法、线性判别式分析、因子分析、贝叶斯网络四个方法,通过多个方法的多组对比试验,探究在不同的降维方法下,经过本地差分隐私处理后数据的可用性,并分析了在本地差分隐私保护后对数据进行降维时不同方法的优劣。实验结果表明了基于概率分布估计的降维方法同差分隐私结合后,实现了对数据的隐私保护,通过与其他方法的对比实验验证了数据的可用性,证明了本文使用方法可行有效。
其他文献
阐述了一种具有灭菌通道可自由弯曲成型的烧结过滤网的制作方法。过滤网为前后呈W形状的V型结构,便于根据中央空调进、出风口及新风系统净化箱内流体力学的轮廓线条作任意弯
一直以来,中国与非洲各个国家和地区都保持着浓厚的传统友谊和良好的合作伙伴关系。非洲第一个与中国建交、且同样作为四大文明古国之一的埃及,也与中国有着密切来往,加上中国“一带一路”倡议的推进,中埃两国之间政治、经济和文化等的交流与合作将持续深入。埃及政府一直非常重视汉语人才的培养,埃及汉语教学的历史可以追溯到20世纪50年代,埃及艾因夏姆斯大学开设中文系,至今已有60余年的历史。近年来随着孔子学院事业
采用大豆卵磷脂、胆固醇为壁材,通过薄膜-超声分散法制备了表没食子儿茶素没食子酸酯(EGCG)脂质体(EGCG Liposome,EL),研究了胆固醇用量、水化温度、超声时间、EGCG添加量对E
针对考虑生产多于需求或少于需求的情况下多设备系统的维护问题,建立了状态维护策略模型。首先将设备退化过程分为三个状态,构建状态的转移概率模型,并且针对不同状态采取两种维护策略;其次,基于半马尔可夫模型以损失成本和超额利润、检测成本、维修成本为优化目标,建立在不同策略下维护费用模型,采用策略迭代算法求解不同状态下的维护策略。最后,通过算例分析验证模型的有效性,并对相应的参数进行了灵敏度分析。
以重庆市为例,采用中国2002-2010年省际面板数据对中国西部地区承接产业转移力度的影响因素进行了空间计量研究。结果表明:成本因素中税收竞争是影响产业转移的关键;投资环境
尽管国内对于旅游形象方面的研究不少,但缺乏对世博会旅游形象的探讨。文章以重庆市民为例从旅游形象三个连续链的角度探讨世博会的完整旅游形象。研究结果表明:重庆市民对世
<正>在创新形势下,坚决守住合规底线,保持创新发展和合规管理的动态均衡,是中国证监会反复强调的基本原则。越是推进创新发展,越要强调合规。合规底线守住了,创新发展才能走
在信息社会下,云计算及大数据的飞速发展使得智能图书馆建设成为可能,尽管高校智能图书馆有助于解决传统图书馆诸多弊端,为读者提供高效、优质的个性化服务;但其存在问题不容