基于NKSMOTE算法的非平衡数据集分类方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:bjzcha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SMOTE(Synthetic Minority Over-sampling TEchnique)在进行样本合成时只在少数类中求其K近邻,这会导致过采样之后少数类样本的密集程度不变的问题。鉴于此,提出一种新的过采样算法NKSMOTE(New Kernel Synthetic Minority Over-Sampling Technique)。该算法首先利用一个非线性映射函数将样本映射到一个高维的核空间,然后在核空间上计算少数类样本在所有样本中的K个近邻,最后根据少数类样本的分布对算法分类性能的影响程度赋予
其他文献
现有人工蜂群算法的收敛性分析多是基于整体收敛性的分析方法,这些收敛性分析无法展现出人工蜂群算法在收敛过程中的收敛变化。文中采用数形结合的方式,结合目标函数图像,用
通过对数据集进行网格划分来降低聚类过程中的计算复杂度,提出了一种基于网格数据中心的密度峰值聚类算法。首先将数据集进行网格化,形成若干网格对象,以落在网格内的数据点
文中提出了一种在手语动作中提取关键动作的算法。在连续复杂的手语动作中,关键动作数量少且状态相对稳定,因此利用关键动作构造手语的数据模型,将会减少不稳定因素,提高准确率。因此文中提出了一种自适应的分类算法,利用关键动作之间时间的先后关系,以及动作上的不相关性,逐步提取关键动作。实验证明,该算法不仅可以面向非特定人群,而且无论是对单独的手语词汇,还是连续的手语语句,均可以提取到全部的关键动作。关键动作
为了使SM4分组密码的差分故障攻击在现实条件下更容易实现,文中深入研究并分析了可用于SM4差分故障攻击的各种方法。在现有的故障攻击方法基础上,提出了一种将故障注入的范围
热风炉自动烧炉对于节约能源、降低人力劳动强度、延长使用寿命十分关键:针对某钢铁企业热风炉检测设备简单、易损坏的特点,通过热风炉燃烧的特性分析.建立了燃烧控制专家决策模
在高光谱图像中混合像元普遍存在,这极大地阻碍了高光谱遥感技术的发展进程,因此,在利用光谱图像的过程中,如何准确高效地进行混合像元解混是一个关键问题。对于高光谱图像混合像元分解,使用原始的非负矩阵分解(Nonnegative Matrix Factorization,NMF)算法面临一些困难:首先,其目标函数为非凸函数,难以求解得到全局最优解;其次,混合像元中并不存在纯像元。为了解决这些问题,文中提
针对目前基于稀疏表示的显著性检测算法中存在的边界显著性检测不足、字典表达能力不够等问题,提出一种基于稀疏恢复与优化的检测算法。首先对图像进行滤波平滑和超像素分割,并从边界与内部超像素中挑选可靠的背景种子构建稀疏字典;然后基于该字典对整幅图像进行稀疏恢复,根据稀疏恢复误差生成初始显著图;再运用改进的基于聚类的二次优化模型对初始显著图进行优化;最后经过多尺度融合得到最终显著图。在三大公开测试数据集上的
针对不完备、不一致性数据的属性约简是数据挖掘研究的一个重要内容。将信息增益,不一致度相结合,提出一种面向不完备不一致性数据的属性约简算法。首先,介绍了信息增益,定义了不
针对全国各省份垃圾处理方式的数据,提出一种混合可视分析方法。为了从多角度分析数据,混合U矩阵、平行坐标以及Small-Multiple3种可视化技术,设计并实现了3种可视化视图的交