空间数据隐私保护方法研究

来源 :陕西师范大学 | 被引量 : 1次 | 上传用户:sheabc000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的飞速发展,全球定位系统的迅速普及,使得针对空间数据的查询、挖掘技术都变得越来越成熟。空间数据作为当前最为普遍的数据类型之一,因其数据量庞大、数据不断集成和随时间不断变化等特点被广泛地运用到地理信息系统、多媒体系统、航天航空系统等领域当中。然而对于空间数据进行查询挖掘,在获得到有利信息的同时,随之而来的隐私安全问题也不容忽视。如近来颇受关注的谷歌搜索窃取用户位置隐私数据等重大事件已经成为全球人民议论并持续关注的重要问题。差分隐私作为当前一种新型的隐私保护模型,因其严格定义了攻击者的背景知识,拥有严谨的统计学模型,并提供了定量地数学理论分析与证明等特点,被广泛运用到数据查询和数据挖掘当中,但目前国内外针对空间数据与差分隐私结合的学术研究还相对较少。因此,本文旨在利用差分隐私技术解决空间数据查询和挖掘方面的隐私安全问题,对查询和挖掘算法进行保护的同时提高数据可用性。本文利用空间数据的索引代表结构四叉树,围绕四叉树在查询和挖掘算法中存在的隐私问题展开研究,凭借四叉树的范围计数查询及四叉树索引距离算法的概念,结合不同的差分隐私预算分配方式,设计了面向查询的四叉树差分隐私混合分解算法和面向挖掘的差分隐私四叉树密度聚类算法。本文的主要工作如下:(1)针对空间数据查询和挖掘过程中可能存在的隐私泄露风险,分析了典型的隐私保护方法的优缺点,并基于四叉树结构,研究差分隐私和空间数据算法的结合,实现隐私保护和数据效用性之间的平衡。(2)针对空间数据查询过程中带来的隐私安全问题,首先采用分层思想将查询区域划分为稀疏区和密集区,针对密集区域提出了基于四叉树的优化算法,并基于不同层次下的阈值区域采用了与之相应的差分隐私预算分配。由于四叉树优化算法会受输入参数递归的影响,故提出偏差计数的形式,减少了输入参数依赖的同时提高了算法精度。四叉树递归深度越深则意味着数据越敏感,故针对密集区域内不同深度的四叉树采用几何分配的隐私预算方式使敏感数据的保护进一步加强。针对两组社交网络的真实数据集,通过相对误差分析表明,所提算法与AG算法、UG算法以及统一预算分配下含递归深度的四叉树分层算法相比,在增强了区域计数查询准确性的同时也对隐私起到良好的保护作用。(3)针对空间位置数据挖掘过程中因测量距离方式不够精准带来的误差影响及距离信息泄露造成的隐私安全等问题,提出依据维度划分的基于差分隐私的四叉树索引距离算法,由于密度聚类算法受输入参数影响较大,故在四叉树索引距离算法上提出改进的DBScan密度聚类方法。四叉树递归深度越深则意味着数据越敏感,故针对深度较大的数据节点采用斐波那契的预算分配方式使对敏感数据的保护进一步加强。利用三组真实数据集和一组合成数据集,通过F-度量和CH指标分析表明,所提算法与基于差分隐私的DBScan密度聚类算法相比,在满足数据隐私安全性的同时进一步提高了算法的聚类准确度。
其他文献
砷(arsenic)和锑(antimony)是环境中广泛存在的亲硫元素,具有相似的化学性质、毒理学性质以及地球化学行为。砷、锑的共同污染在矿山周边很常见,近年来,环境中砷、锑共同污染的现象已经得到众多学者的广泛重视,成为环境科学领域的一个研究热点。黔西北是中国典型的土法炼锌区,多年的的金属矿产开发活动产生的大量废渣堆存在矿山周边,人为加快了砷、锑进入周边环境的速度,对周边居民的身体健康和生态环境产
学术知识图谱可以应用于科学语义检索、文献推荐和学术知识问答等场景。本文采取自底向上的方式构建了学术知识图谱SchKG(Scholar Knowledge Graph),SchKG结构上是一种异构网络,节点表示文献、作者、关键词短语等多种类型的实体,边表示实体之间的关系。学术知识图谱的构建需要解决信息抽取、作者消歧、指代消解等问题,本文侧重逻辑架构设计、学术信息抽取和学术知识推理。首先设计图谱的逻辑
背景纹影技术(Background Oriented Schlieren,BOS)是在传统纹影技术上发展出来的一种新型流动显示技术,因具有装置结构简单,视场范围大,和时空分辨率高等优点而得到广泛应用
煤炭在我国能源结构中处于主导地位,我国经济的发展十分依赖煤炭资源,因此,煤炭的安全开采是我们长期研究的课题。当前,科学技术的飞速发展极大减少了提升系统过卷事故发生,但是立井摩擦提升系统过卷事故仍时有发生。本文以多绳摩擦提升系统为例,从运动学和动力学的角度出发,对于摩擦提升系统过卷保护过程中提升系统运动状态进行安全性分析,针对过卷保护过程中松绳和滑绳的特殊情况进行分析和研究,并对钢带式过卷保护装置钢
脉冲功率电源是电磁发射系统的重要组成部分,脉冲功率源中使用的半导体器件的性能对脉冲功率电源的性能产生直接影响。目前电容储能型脉冲功率源中常用的半导体器件有大功率
内存重复数据删除是一项消除冗余数据、节省内存空间、提升整个系统性能的技术。经过页内容的比较,识别出来的重复页通过写时复制的机制进行合并,只需保留单个备份。目前有许
随着信息的增量爆炸与智能化的技术革新,“协同交互”逐渐成为新时代背景下用户信息搜索行为的重要特征,具有一定的普遍性和必要性。本研究将团队认知纳入到协作信息搜索研究中来,有助于更好的揭示和理解协作信息搜索活动中团队成员的行为特征、行为演进和交互模式。本文研究对象为协作式信息搜索中的团队认知机制,即以共享心智模型表征团队认知,探究不同协作搜索任务过程中团队共享心智模型的形成演进及相关影响因素。本研究采
本文针对光电混合数据中心网络中的突发流量卸载问题进行了研究,提出了基于缓存阈值监控的流量卸载策略。我们把光电混合数据中心网络的流量卸载过程建模成一个流模型,推导了
集数据采集、处理和传输功能于一体的无线传感器网络具有大规模、低成本、自组织、可靠性强以及高度集成化等特点,其应用也已经从最初的军事领域逐渐拓展到包括智慧农业、智慧城市、环境监测、交通导航、海洋资源勘探等众多民用领域。而目标的定位和跟踪作为无线传感器网络的一项关键技术,融合了传感、网络通信、信息处理、概率统计等众多学科,在智能监控领域有着广阔的应用前景。为了满足系统低功耗和分布式的要求,针对以下三种
以农业为依托,发展农业特色小镇是实现贫困农村造血式扶贫的现实出路。土地是农业特色小镇发展的核心问题,土地入股是盘活农村资源、促进农民共享项目收益、缓解企业资金压力的主要流转方式。鉴于此,文章提出贫困地区可利用土地入股方式,吸引外来企业发展农业特色小镇,实现项目利益共享。合理的收益分配机制是各参与方合作的基础,更是农村土地入股流转的关键。针对贫困地区农业特色小镇土地入股合作模式特点,建立合理的收益分