基于支持向量机混合采样的不平衡数据分类方法

来源 :数学的实践与认识 | 被引量 : 0次 | 上传用户:wangxinjia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用传统支持向量机(SVM)对不平衡数据进行分类时,由于真实的少数类支持向量样本过少且难以被识别,造成了分类时效果不是很理想.针对这一问题,提出了一种基于支持向量机混合采样的不平衡数据分类方法(BSMS).该方法首先对经过支持向量机分类的原始不平衡数据按照所处位置的不同划分为支持向量区(SV),多数类非支持向量区(MNSV)以及少数类非支持向量区(FNSV)三个区域,并对MNSV区和FNSV区的样本做去噪处理;然后对SV区分类错误和部分分类正确且靠近决策边界的少数类样本重复进行过采样处理,直到找到测试结果最优的训练数据集;最后有选择的随机删除MNSV区的部分样本.实验结果表明:方法优于其他采样方法.
其他文献
区域经济协调性是区域经济协同发展和可持续发展的基本保障,也是区域间经济合作和贸易的基础.以区域经济系统为研究对象,利用可变模糊识别模型对中俄豫伊两地2013-2019年的经
构造了逆高斯分布中变异系数的广义枢轴量,给出了一种参数的区间估计方法,并与MOVOER(method of variance of estimates recovery)和Bootstrap 方法进行比较;给出了多总体下