面向数据发布的敏感属性识别方法研究与应用

来源 :成都理工大学 | 被引量 : 0次 | 上传用户:lovecat_fish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,数据已经成为社会活动的重要元素和推动社会发展的一种新型生产资料。政府部门、研究机构等数据收集者,为了信息共享、政务公开、科学研究等目的,将收集到的数据发布到大数据平台中进行分析和共享。由于发布的数据可能涉及个人隐私,因此数据发布者会在发布前对数据集进行隐私保护处理,但处理后的数据中仍可能存在一些敏感数据,这些敏感数据在与外部数据库关联后会还原出个人隐私信息。如果不对敏感数据进行准确识别和保护,数据集在遭到背景知识攻击、链接攻击等隐私攻击后,就存在着个人隐私信息泄露的风险。面对频发的信息安全事件和愈发严格的信息安全保护要求,保障个人隐私信息安全已经成为重中之重。但随着数据集种类的增长,数据之间的关系愈加复杂,如何实现面向数据发布的敏感数据识别,已成为一个亟待解决的问题。针对这一问题,本文结合信息熵和关联挖掘提出一种面向数据发布的敏感属性识别和分级分类的方法。本研究完成了以下研究内容并取得相应成果:(1)本文提出了一种面向数据发布的敏感属性识别方法。利用信息熵和极大离散熵量化属性的敏感度,通过对敏感度聚类建立敏感特征属性集。采用Apriori算法和互信息理论分析属性间的相关性,构建属性依赖图,挖掘敏感特征属性的关联属性,实现敏感属性的识别。实验表明,该方法可同时适用于信任模式和非信任模式下数据发布中的敏感属性识别,无需建立敏感数据字典,且兼顾了属性间的相关性。(2)本文提出了一种面向数据发布的敏感属性分级分类方法。基于属性敏感度和属性间的相关性,提出了一种敏感等级评价方法,实现了敏感属性的分级。收集个人隐私相关的数据表,定义敏感属性的类型及其元素空间,使用Jaro-Winkler距离算法比较属性与元素之间的相似度,实现敏感属性的分类。(3)基于本文提出的敏感属性识别和分级分类方法设计并实现一套敏感数据识别系统,从需求分析、概要设计、详细设计、系统实现和测试等方面对系统进行了详细的阐述。通过测试,本系统可实现面向数据发布的敏感属性的识别和分级分类,并以图表的形式对敏感属性进行展示和统计。
其他文献
随着人们对环境和食品安全问题的日益关注,可食用和环境友好的材料逐渐成为了研究热点。为了开发一种可用于食品保鲜的绿色制剂,我们采用微波/超声波辅助共沉淀法制备了对茴香醛(PAA)/β-环糊精(β-CD)包合物,并对其物理性质包括水分含量,堆积密度,吸湿性,包封率(EE)和负载率(LC)进行了测定。利用扫描电子显微镜(SEM)、粒度分析、傅立叶变换红外光谱(FT-IR)、X射线衍射(XRD)、热重分析
光纤传感技术近些年取得了飞速的发展,利用光纤作为传感和传输介质,可以实现对于整条光纤上物理量的测量。本文对基于Φ-OTDR的分布式光纤振动传感系统进行了研究,其具有成本较低、抗电磁干扰、耐腐蚀、耐高温等优点,在资源勘探、石油和天然气管道安全监测、微弱水声信号检测、威胁分类、周界安防、列车实时定位、军事国防等领域都有着广泛的应用。振动信号定位和相位解调技术对于本系统来说是必不可少的,其中正交解调方法
由于工业发展和人类活动,大量含有重金属的污水、废水排放到环境中,对水源造成严重污染。重金属污染通常范围广、不易察觉,然而会通过食物链在人体内累积并产生危害。因此重金属污染的快速准确监测对人类健康具有重要意义。比色阵列是一种快速分析技术,通过模拟动物的嗅觉,利用多个传感元件的响应模式来判别目标物,结合数字化图像方法技术,广泛应用于复杂成分的分析,在食品安全监测方面表现出明显的优势。然而比色阵列仍存在
研究背景与目的:未足月胎膜早破易引起早产、难产、新生儿呼吸窘迫、母婴感染等不良妊娠结局,甚至导致胎儿死亡。目前对胎膜进行修补是治疗未足月胎膜早破的理想方法,但该方法技术尚不成熟,修补材料的选择也尚无定论。光敏水凝胶是一种能在光照射下固化的生物材料,是一种潜在可用的生物密封材料。本课题拟利用光敏水凝胶进行对胎膜早破修复的体外研究,探索不同光照时间、不同大小的胎膜破口及不同羊水量形成的压力对光敏水凝胶
研究背景与目的骨肉瘤是最常见的原发性恶性骨肿瘤,好发于儿童和青少年,具有快速浸润性生长、早期肺转移和高复发率等特征。局限性骨肉瘤患者的五年总体生存率为65%-75%,而复发性或转移性骨肉瘤患者的五年总体生存率仅为20%。目前,骨肉瘤仍缺乏特异性的诊断和治疗靶点,迫切需要开展更多的分子研究以寻找具有应用前景的生物标志物。环状RNA(circular RNA,circRNA)广泛表达于真核生物,通过海
本文研究的外部加强方钢管节点是一种改进型钢框架梁柱节点,通过在相邻H型钢梁上下翼缘之间增设T型部件对节点域进行加强。目前关于节点及框架结构的力学性能研究大多集中在平面内,很少考虑节点和结构的空间受力特性,但由于地震作用方向的不确定性,钢框架梁柱节点表现为空间受力特点尚未广泛研究。因此本文分析了外部加强方钢管空间中柱节点在平面荷载和空间荷载作用下的静力性能。通过改变方钢管柱板厚度、梁柱线刚度比、T型
图像修复与分割是计算机视觉与图像处理领域的研究热点。结合对应图像的深度信息会使得彩色图像分割的准确度得到更大的提高。但是,基于深度的彩色图像及其分割算法上也存在一定的不足,表现在(1)由于深度摄像机物理结构上存在的问题以及外界条件影响,使得深度图的部分区域存在错误的深度值;(2)使用体素化网格对结合深度信息的图像分割问题处理的传统计算方法具有较高的冗余度且计算复杂;(3)目前的卷积神经网络只能处理
近年来,中国的综合国力正在逐步增强,出国留学人数也相应增多。留学咨询机构大量招聘外籍员工以提高服务质量。与此同时,为了使外籍员工更好地结合学生的自身情况为学生提供院校选择和文书指导等服务,留学咨询公司积极开展岗前培训工作以增强外籍员工对中国留学生的了解。2018年9月,新东方前途出国公司举办了一场外籍员工岗前培训讲座,作者担任了此次讲座的译员,进行了时长约两小时的汉英交替传译,按照讲座口译项目的总
拟建交通工程昌都至林芝段的跨怒江特大桥为线路控制性桥位,其桥位选取以地质条件为基础,受控于岸坡位置和隧道洞口位置。为此,本文针对怒江特大桥选址,进行工程地质定性分区研究,并采用模糊综合评判法、信息量法、修正灰色聚类法并基于python语言和Arc Gis软件进行量化选址研究为确定怒江特大桥进出口位置提供重要依据。主要成果如下:(1)查明了研究区工程地质条件和自然地理条件。以地形地貌和地层岩性为主要
人脸关键点检测和三维人脸重建是计算机视觉领域的研究热点,然而在大姿态或遮挡情况时,会出现建模不稳定以及定位不准确的困境。本文主要使用基于图像序列的三维人脸重建和关键点检测技术,研究如何对摄像机拍摄获取的视频进行三维人脸重建和人脸关键点检测,并降低人脸关键点检测结果的抖动问题。本文的主要工作如下:(1)基于知识蒸馏的2D人脸关键点检测方法。准确且快速的处理2D关键点坐标,是3D人脸重建和关键点定位的