基于间隔理论的过采样集成算法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:yangjianglong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统集成算法不适用于不平衡数据分类的问题,提出基于间隔理论的AdaBoost算法(MOSBoost)。首先通过预训练得到原始样本的间隔;然后依据间隔排序对少类样本进行启发式复制,从而形成新的平衡样本集;最后将平衡样本集输入AdaBoost算法进行训练以得到最终集成分类器。在UCI数据集上进行测试实验,利用F-measure和G-mean两个准则对MOSBoost、AdaBoost、随机过采样AdaBoost(ROSBoost)和随机降采样AdaBoost(RDSBoost)四种算法进行评价。实验结果表
其他文献
<正>δ13C作为全球碳循环的重要标志,对以初始生产力为代表的碳转换和储碳过程的变化有快速的响应,同时作为大气CO2及水体溶解CO2的同位素组成,通常通过沉积物中的δ13C表示
会议
目的:人类转录激活因子蛋白-4(AP4)在细胞凋亡、DNA修复等过程中起着至关重要的作用。国内外许多研究表明,AP4基因参与多种肿瘤的发生与发展,如肝癌、结直肠癌、胃癌、肺癌、
中职院校学生综合评价是当前教育信息化的重要内容之一。通在中职学校以及其他院校结合学校自身实际情况研发并应用学生综合评价系统,提供对学生全面、真实、科学、有效的测
随着教会的快速发展,一些教会的信徒人数增长很快,按照传统的牧养方式,有时就会有信徒感到教会不够温暖。要解决这一问题,需要我们在做好日常牧养工作的同时,更注重牧养的精
期刊
研究背景:乳腺癌是目前中国女性最常见的恶性肿瘤,也是全世界肿瘤致死的首要原因。三阴性乳腺癌是指免疫组织化学染色显示雌激素受体、孕激素受体和人类表皮生长因子受体2均
通过对煤燃烧过程中煤种、温度、停留时间等不同因素对硫析出影响的研究,建立煤燃烧过程中硫析出动力学模型,对燃煤硫析出进行了动力学分析.
侦查效益的提出是社会发展过程中对侦查工作的必然要求,也是现代侦查必须遵循的原则之一。在侦查资源有限、刑事违法犯罪态势日益严重的今天,要求侦查部门科学、合理地配置有限
目的观察雷公藤内酯醇、沙利度胺对多发性骨髓瘤细胞株及骨髓间充质干细胞的作用,及对骨髓间充质干细胞细胞因子的表达影响,并进行机制的探讨,为临床应用提供一定的基础。方
目的:评价及对比磁共振扩散加权成像(DWI)与扩散峰度成像(DKI)在鉴别宫颈癌病理类型及分化程度的价值。方法:纳入39例经病理证实的宫颈癌患者。根据病理类型,将患者分为鳞癌
研究背景及目的意义:多发性骨髓瘤(multiple myeloma,MM)是好发于老年人的恶性浆细胞疾病,以单克隆浆细胞恶性增殖并分泌大量单克隆免疫球蛋白为主要疾病特征。近年来,蛋白酶