论文部分内容阅读
由于不平衡数据集本身拥有的复杂特性,标准的机器学习算法在不平衡数据集上的分类存在明显的性能缺陷,由此引发的不平衡问题遍布于现实世界诸多重要领域.为了试图解决这一问题,提出一种新的少数类边界过采样方法EBOR.在EBOR 中,新的K 广义Tomek 连接(简称K 连接)概念用于帮助定位少数类边界样本,进一步,基于边界样本的K 连接数目实现自适应合成过采样.