非平衡数据集相关论文
随着互联网技术的快速发展和大数据时代的到来,企业得利于网络和科技的发展,获得和收集了大量用户的数据和信息。然而企业面对海量......
电子病历是临床医疗活动最详实、直接的记录形式,是进行智能诊断的数据基础。电子病历的诊断结果是多病种的,包含正常诊断、病理诊......
作为一种脑部疾病,脑卒中是当前临床医学上最常见的疾病之一,具有高致死率和致残率等特点。引发脑卒中的风险因素众多,发病前高效......
支持向量机作为现今最流行的分类算法之一,已经被广泛地应用于生活中的各个领域。它不仅有着较为完善的理论背景,在数据分类时也有......
半监督学习已经成功地被运用于基于动态数据分析的数据挖掘和机器学习等研究领域之中。非平衡类的学习是分类问题中最具挑战的问题......
由于航班延误数据集类别分布不均,传统分类器的性能受到一定程度的制约.为了能够对到港航班延误情况进行精准预测,提出了一种基于......
针对小规模和非平衡的训练数据集下的目标分类问题,本文提出了一种新的目标分类学习算法gentleBoost-BFKO(Balance Feature Knock ......
非平衡数据集是指同一个数据集中某些类的样本数远远少于其他类的样本数,它广泛存在于现实生活中.利用传统的机器学习方法分类,对......
现在每天都有大量数据需要提取和分析,数据挖掘技术在许多实际应用中获得巨大成功,分类模型已经在许多应用场合得到广泛应用,如原......
合成孔径雷达(SAR)是一种不受天气、光照等各种外界环境影响,并可以对感兴趣的区域进行全天候、全天时侦查的微波探测传感器。自SA......
蛋白质需要与配体相结合才能执行其功能,所以预测蛋白质与金属离子配体结合位点是当前重点研究课题且富有挑战性.本文选取碱土金属......
不平衡数据集的特征是不同类的样本数量存在着显著的数量差异。从不平衡数据集学习到的基本分类器的预测结果通常会偏向于多数类。......
非平衡数据集的分类问题是机器学习领域重要的研究课题。一般地,少数类样本在数量上比多数类样本少且空间分布不均匀,但信息价值却......
邮件识别问题的本质属于数据挖掘中的分类问题。在现实生活中,经过邮件的过滤和屏蔽处理之后,不可避免地有部分垃圾邮件没有被滤掉。......
针对非平衡数据集分类中“少数类样本精度难以提高”这一瓶颈问题,提出了一种基于协同进化机制的欠采样方法.此方法将少数类样本与......
案例推理(Case-Based Reasoning, CBR)是商业预测领域的预测方法之一,它在保持较好预测性能的同时可对预测结果做出解释。企业经营......
不平衡数据集是指在构成数据集的不同类别的样本中,某一类样本的数目远大于其他类别样本的数目,不平衡数据集广泛存在于现实生活中......
由于类分布的不平衡性,很多传统的分类方法在非平衡数据集上的分类效果不好.与传统的方法不同,论文从组合选择的角度考虑不平衡类......
通过学习特征变换矩阵,可以将样本映射到新的空间,以适应给定的样本距离测度方法.基于此,提出一种面向k近邻的特征变换方法用于提......
化学样本数据常为非平衡,用传统方法分析这些数据集时,对于需特别关注的少数类数据,识别能力往往较差。因此,提出建立基于粒计算的......
为了提高育种领域选种的准确率同时缩短品种培育年限,利用改进的随机森林算法根据小麦育种历史数据构建评价模型. 在训练分类器之前......
随着网络上非平衡数据的大量涌现,使得对非平衡数据分类的研究成为一个新的研究热点.根据特征在类别中的分布特点,提出了基于类间......
针对传统的过采样算法在增加样本的同时可能使决策域变小和噪声点增加的问题进行了研究,提出了一种基于错分的混合采样算法。该算......
针对传统的特征选择方法在非平衡数据集中分类效果不理想的问题,提出了一种适合非平衡数据分类的改进特征选择方法.该方法将集中度......
将线性尺度空间的特征点扩展问题转化为多尺度数据集的同尺度内分类问题,该问题属于尺度不变的非平衡数据集分类问题。提出了一种......
针对分类算法在非平衡数据集的情况下分类性能不理想的问题,总结了常见的数据平衡化方法,包括改造数据集与改进算法,提出一种全新的基......
CBES是面向非平衡数据集分类的组合选择方法。相关的实验表明,CBES方法能大幅度提升基分类器的泛化能力。已有研究表明,抽样方法能有......
针对传统的SVM算法在非平衡数据分类中分类效果不理想的问题,提出一种基于分类超平面和SMOTE过采样方法(HB_SMOTE)。该方法首先对......
非平衡数据集的分类问题是数据挖掘领域的一个研究热点.针对非平衡数据集分类困难的问题,特别是由于非平衡分布引起的少数类识别能......
电力行业在放松管制、引入竞争机制、提高效率的同时,也带来了电价的剧烈波动问题。成为威胁电力市场稳定安全经济运行的一个重要方......
用深度学习(DL)的方法对蛋白质O-糖基化位点进行了预测。首先用SMOTE方法处理非平衡数据集,对较少一类的样本用“近亲繁殖”的方法......
非平衡数据集在金融、商业以及学术的研究等诸多的领域有着广泛的应用,主要研究的是对于非平衡数据集的处理和分类问题,首先使用了......
动态数据存在数据量动态改变,数据类别分布非平衡、不稳定等问题,这些问题成为分类的难点.针对该问题,通过对在线极端学习机模型进......
在机器学习及其分类问题时经常会遇到非平衡数据集,为了提高非平衡数据集分类的有效性,提出了基于商空间理论的过采样分类算法,即Q......
非平衡数据是指两类问题中正类样本与负类样本个数不相等,甚至相比悬殊.非平衡数据集会导致许多分类器的性能下降,这与分类器的构造原......
提出一种基于核学习的采样算法来处理支持向量机(support vector machine,SVM)在非平衡数据集上的分类问题,其核心思想是首先在核空......
近年来,随着互联网的普及以及信息化程度的提高,各行业数据呈现快速增长趋势,对这些数据进行快速分类和识别,是有效提高各行业智能......
随着科技的不断进步,民航新科技不断在大型枢纽机场成功应用。为保障飞机安全进近和着陆,民航近年来投入大量资金建设机场盲降设备......
脉冲星是高度磁化的旋转中子星,具有体积小、密度大等特点。脉冲星的发现在物理和天文学领域都有着重大的意义。随着人工智能技术......
在进行煤层底板突水预测时,水害状况一般分为安全和突水2种状态,状态数据具有非平衡特点,而已有的煤层底板突水预测模型主要适用于......
非平衡数据集分类是指在数据集中各类样本数目不相等的分类问题。传统的分类算法大多是建立在样本分布均等或者样本错分代价相同的......
非平衡数据集分类是机器学习和数据挖掘领域的一个重要研究方向。所谓非平衡数据集,在二分类问题中,即是在数据集中一类样本数量远远......
非平衡数据集的不均衡学习特点通常表现为负类的分类效果不理想。改进SMOTE再抽样算法,将过抽样和欠抽样方式有机结合,有针对性地......