论文部分内容阅读
近年来,移动互联网技术和信息技术的高速发展,移动智能终端普遍配备了GPS定位功能,利用用户的位置信息提供针对于不同应用程序的个性化服务。其中,基于位置服务是移动互联网中最为普遍以及流行的服务类型之一,为用户提供了丰富且精细的服务信息,使得用户的生活变得方便、快捷。然而,用户在享受基于位置服务所带来便捷的同时,需要将自身的隐私信息发送给相应的位置服务提供商来换取服务信息。服务提供商在提供服务的同时,收集到了用户的请求信息,进行分析、推断得到用户的个人隐私,例如,用户的身份、兴趣爱好、职业、身体状况等。如果服务提供商的服务器被恶意用户或者恶意服务器所攻破来谋取利益,用户在移动互联网中将成为一个透明人,毫无隐私可言。对个人而言,隐私泄露会导致用户的利益损失,甚至人身安全问题,对于组织和国家而言,隐私泄露危及社会安全。故而,不论从用户个人的角度而言还是从国家的角度而言,保护用户的个人隐私在互联网发展中不容忽略,且刻不容缓。在移动互联网中基于位置服务在网络服务中扮演了必要的角色,保护用户在位置服务中的位置隐私、查询隐私等隐私信息成为了当下移动互联网发展中必不可少的一个环节。为了实现在基于位置服务中保护用户的个人隐私,本文首先对基于位置服务的隐私保护架构进行了介绍,分析在系统架构中存在的隐私威胁,并对现已经提出的隐私保护方案进行了介绍和分析。根据现有的隐私保护方案中存在的问题,本文分别从服务质量、时间敏感度、时空关联性、属性感知和查询范围五个方面出发,设计并实现了一系列基于移动智能终端的隐私保护方案,保证用户在使用移动智能终端享受在基于位置服务的同时,自身的隐私信息不被泄露。本文的主要研究内容如下所示:(1)现有的基于位置服务隐私保护方案中,为了最大限度的保护用户的隐私信息,忽略了用户所享受到的服务质量,该策略从用户所享受的服务质量出发,设计实现了一个服务质量感知的隐私保护策略,该策略分别从用户角度和攻击者的角度出发,提出了两个隐私度量,即双重隐私度量(Dual-Privacy Metric)和服务质量度量(Service Quality Metric)。其中,双重隐私度量对用户的位置隐私和查询隐私进行了量化和衡量。服务质量度量对应的是量化和度量服务质量的损失比重,并设置了服务质量损失的上线阈值。基于现有隐私保护方案中的背景信息,本方案进一步分析提出了细粒度的背景信息(Fine-Grained Side Information),通过设计的隐私保护策略分析框架,为用户提供相应的隐私保护方案来保护用户的隐私信息。(2)基于位置服务中,在设计实现隐私保护方案中通常会考虑背景信息中位置单元的历史查询概率,却忽略了在不同的时间点用户发送请求的可能性。本文基于背景信息中位置单元的查询概率,对不同时间点发送请求类型的不同,定义了时间敏感的背景信息(Time-Sensitive Side Information)。在设计实现隐私保护策略时,兼顾了查询概率和时间因素对背景信息的影响,通过分析模型保护用户的位置隐私和查询隐私。(3)利用时空关联性,提出了基于伪位置生成的隐私保护方案,在保护用户位置隐私的同时,考虑到空间和时间之间的关联性,选取了与伪位置关联的伪查询内容。时空关联的隐私保护方案包含了地图分割算法和伪内容生成算法。其中,通过地图分割算法将地图划分为离散的位置单元,保证每一个离散的位置单元互不相邻。伪内容生成算法利用了用户在下一时刻将要前往的位置作为前一时刻的查询内容,从而很好地避免了攻击者根据时间和空间的关联性来推测用户的真实信息。(4)本文在考虑到背景信息的前提下,分析背景信息之后每个位置单元的属性,设计了属性等级树(Attribute-Based Hierarchical Tree,A-tree),对位置单元的属性进行划分。现有的隐私保护度量通常采用概率和信息熵对隐私保护方案进行衡量,却对位置单元的属性信息无法评估和度量,第六章利用方差的概念设计了隐私度量(Privacy Metric),分析选取的伪位置单元属性彼此之间的偏离程度,偏离程度越高则表示属性之间的关联性越小,则安全性越高,反之,安全性越低。基于设计的属性等级树和隐私度量,提出一个基于伪位置生成的属性感知的隐私保护方案(Attribute-Aware Privacy-Preserving Scheme,APS),其中包含了地图分割算法和伪信息选取算法,其中地图分割算法利用图论中的泰森多边形对地图进行划分,伪信息选取算法通过四色定理对地图进行染色,选取互不相连的位置单元作为伪位置单元。最后利用属性树为伪位置单元选取伪查询内容,在保护用户位置隐私的同时保护用户的查询隐私。(5)在移动社交网络中,用户在查询当前位置单元附近的兴趣点时,需要对所查询的范围进行选择,然而,现有的基于k匿名技术的隐私保护方案中,生成的伪请求中对用户的位置信息进行了保护,却忽略了每个伪请求中的查询范围。攻击者可利用查询范围和查询的位置单元的可能性进行分析推断,从而降低k匿名所提供的保护程度。本文从用户的查询范围出发,提出了一个个性化的范围感知的隐私保护方案(Personalized Range-Sensitive Privacy-Preserving Scheme),包含了地图存储算法、个性化查询范围预估算法和伪请求生成算法。其中,地图存储算法利用四叉树降低地图的存储代价,提高遍历效率,个性化查询范围预估算法为伪位置单元选取合理的查询范围,最后通过伪请求生成算法构造发送给服务提供商的请求。(6)第八章总结本文,并提出未来研究的可行性方向。