【摘 要】
:
针对非均衡数据分类效果差的问题,提出一种新的基于边界混合采样的非均衡数据处理方法(BMS).首先通过引进"变异系数"找出样本的边界域和非边界域;然后对边界域中的少数类样本
【机 构】
:
西北大学信息科学与技术学院; 西北大学经济管理学院; 西北大学数学学院;
【基金项目】
:
陕西省教育厅科学研究计划自然科学专项项目(15JK1738);陕西省自然科学基金项目(2014JQ8367)
论文部分内容阅读
针对非均衡数据分类效果差的问题,提出一种新的基于边界混合采样的非均衡数据处理方法(BMS).首先通过引进"变异系数"找出样本的边界域和非边界域;然后对边界域中的少数类样本进行过采样,对非边界域中的多数类样本进行随机欠采样,以期达到训练数据基本平衡的目标.实验结果表明,BMS方法比其他3种流行的非均衡数据处理方法在对7个公开数据集的分类性能上平均提高了5%左右,因此,该方法可以广泛应用于非均衡数据的处理和分类中.
其他文献
装卸工问题是一个新的NP困难的组合最优化问题,寻找其性能优良的近似算法是有重要的理论意义和实用价值的.相同装卸工情况下装卸工问题的系数矩阵是全么模矩阵,利用全么模矩
在宋初词坛上,文人士大夫词作仍以晚唐五代小令为主,慢词也在逐渐发展。张先是北宋初期承前启后的过渡性词人,他以小令入慢词,创造一种新颖的慢词体制,在追求清丽淡雅的同时
几乎所有的人都知道,中国人民解放军的前身是中国工农红军和八路军。很少有人了解,在这三个世人皆知的称谓之间,还有过两个鲜为后人所知的带有过渡性的番号:抗战全面爆发之前的中
以新旧动能转换为背景,创新传统的思维方式,把高校"文化自信"培育纳入城市文化建设的一种理性向度。新旧动能转换对城市文化建设发展提出了新要求,高校"文化自信"教育应突破
文章介绍了基于NiosⅡ的SOPC的通用字符显示电路的设计,通过实时读取点阵字库信息并输出到VGA端口的方法实现。与传统方法相比,具有简单易行、便于二次开发的特点。以本方法
随着大数据时代的到来,高校学生管理无论是在管理方式、管理手段,还是在管理内容方面都发生了巨大的变化。为了更好地实现高校学生管理工作的信息化,需要明确高校学生管理在
林兴宅在20世纪80年代主倡的系统论文艺学内涵丰富,它包括将系统论的原理概念整合到文艺理论中生成的系统论文论、运用系统论方法进行的批评实践,以及对文艺的发展趋势——它
缝洞型储层是一种很重要的油气储层,但其非均质性很强,目前的随机介质理论已经无法描述缝洞型介质,需要进一步发展缝洞介质建模理论。首先给出了极值搜索法建立二维随机溶洞
大型石油化工项目投资大,建设周期长。作者多年从事大型石油化工项目工程造价管理,本文主要对石油化工建设项目的工程造价控制提出“全过程”的控制理念。同时对项目投资控制
中高职教育衔接是现代职业教育体系构建的一项重要内容,其最核心的环节在于课程的衔接。而在中高职课程衔接方面,普遍存在文化基础脱节、课程设置重复、技能水平倒挂现象。对此