论文部分内容阅读
随着大数据时代的到来,数据在带来价值的同时,也损害了隐私。文章主要对关系型数据发布时的隐私保护模型进行了研究,针对K-匿名算法导致分类挖掘性能下降的问题,提出了基于极端梯度提升特征重要性的k-匿名特征选择算法XGB-KA,对满足k-匿名的特征子集进行了优选。通过与Greedy-Hamdist算法进行对比实验,验证了XGB-KA算法的有效性。