基于隐私保护技术的支持向量机研究

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:yixiangren1976
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machine, SVM)是基于统计学习理论的一种数据挖掘新方法。它建立在结构风险最小化原则的基础上,能够有效地解决分类问题,使统计学习理论对实际应用产生重大影响,具有较高的实际应用价值,被广泛地应用于文本分类、手写字体识别、图像识别和医学辅助诊断等多个领域。关于隐私保护支持向量机的研究,是在支持向量机实际应用中遇到隐私保护的新问题而提出来的,它力图解决在保护数据隐私性的同时,又能够保证分类算法的预测准确率。本文以垂直分布数据的隐私保护支持向量机为研究对象,对有监督分类问题和半监督分类问题的隐私保护中心支持向量机进行了深入的研究和探讨,主要工作如下:1.针对大规模数据的隐私保护分类问题,提出了一类带有扰动的隐私保护中心支持向量机(Privacy Preserving Proximal Support Vector Machine,P3SVM)。该方法以具有速度优势的中心支持向量机为原型,引入了带有扰动的约简核,构建了隐私保护中心支持向量机,不仅隐藏了原始数据,而且提高了分类精度和训练速度。2.从Johnson-Lindenstrauss (JL)变换理论出发,针对以往方法的理论支撑不足,提出了一种基于JL变换的隐私保护中心支持向量机(Privacy Preserving PSVM Based on the Johnson-Lindenstrauss Transform, P3SVM-JLT)。首先,用马尔科夫不等式证明了基于JL变换的全局安全核具有保持距离近似不变的性质。进而基于该全局安全核,构建了隐私保护中心支持向量机。该方法不仅保护了原始数据,而且在理论上更加完整,具有更好的分类性能。3.针对P3SVM-JLT方法中的相同维数限制,基于几变换理论,提出了一种保持垂直分布的P3SVM-JLT (Vertical P3SVM-JLT, VP3SVM-JLT)。该方法构造了一种新的全局安全核,不仅能够保持垂直分布的形式,而且不受相同维数的限制,具有更高的灵活性。4.针对实际应用时存在的标签不一致或无标签的情况,提出了半监督隐私保护中心支持向量机(P3SVM for Semi-supervised Classification, P3S3VM)。将协同训练的Tri-training重要思想引入到隐私保护中心支持向量机的构建中,分别以P3SVM、P3SVM-JLT和VP3SVM-JLT为基分类器,利用有标签和无标签的样本共同训练。该方法能够有效利用无标签数据潜在的有用信息,使其在半监督学习过程中传递到最终分类器的设计中,取得了较好的分类效果。
其他文献
随着变频器应用范围的扩大,运行中出现的问题也越来越多,主要表现为:高次谐波、噪声与振动、负载匹配、发热等问题,针对变频器运行中存在的以上问题提出了相应的解决措施.
在纸浆悬浮液中分别加入3种阳离子定着剂A159、A160和A169,并分别采用浊度法和流式细胞仪测定了纸浆悬浮液中溶解和胶体物质(DCS)的含量。结果表明,在3种定着效果完全不同的阳
水灯心又名野灯草、野席草、龙须草,为灯心草科灯心草属植物野灯心草Juncus setchuensis Buchen.的干燥全草。具有清心热、利小便的功能,用于心烦不眠,小便不利等症。在我国民间
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
通过改变热分散系统的处理温度、齿盘间隙以及进浆浓度,研究了废纸脱墨浆中溶解和胶体物质(DCS)以及悬浮固形物(SS)的含量及其变化,讨论了随后的后浮选过程对这些成分的去除效果
目的:研究民间草药箭叶橐吾根及根茎的化学成分。方法:乙醇总提物经反复硅胶柱色谱,Sephadex LH-20柱色谱纯化,根据理化性质和光谱数据鉴定化合物结构。结果:分离鉴定了7个萜类化
有过乘车经验的人都知道。要想保证列车高速、正常地运行,仅靠火车头的牵引和带动.是远远不够的。车头与车厢、各个车厢之间,还要充分发挥联动效应。才能走得更平稳更长久。同样