【摘 要】
:
不平衡学习指在分类任务中不同类别的训练样本数目差别很大的情况。近十年来,这个领域越发的受到研究者的关注,近五年以来,更是呈现爆发式的增长。与传统分类任务不同,一方面
论文部分内容阅读
不平衡学习指在分类任务中不同类别的训练样本数目差别很大的情况。近十年来,这个领域越发的受到研究者的关注,近五年以来,更是呈现爆发式的增长。与传统分类任务不同,一方面数据的不平衡性会导致传统分类算法的性能大幅下降,另一方面,不平衡学习往往存在错分代价不均等的问题,故对不平衡学习的研究有重要的意义。之前的研究已经提出了大量的不平衡学习算法,但对于从后处理预测概率的角度提升少类的分类精度却鲜有研究。基于当前的研究,针对二分类和多分类问题,对不平衡学习中,少数类样本精度不高问题以及错分代价不均衡问题进行改进。本文主要通过两阶段的学习过程,对不平衡数据分类进行优化。第一阶段得到预测概率,第二阶段利用改进的花朵授粉算法对预测概率的进行优化,保证得到更好的分类结果。实验表明,在10个二分类真实数据集上,此方法能成功的提升少数类样本的精确度,具有很好的实际运用价值,在多分类中,通过人工数据集和真实数据集的验证,此方法都在少数类样本上取得了更高的精确度,并把此方法成功的应用在农场退出预测问题上,实验表明,该策略大幅度的提升了预测精度。
其他文献
介绍了杭州市蒋村商业综合楼基坑支护设计方法,根据本工程的工程特点,采用坑边卸土2.5m后用SMW工法内插型钢结合一道钢支撑支护的思路,并选取2个典型计算断面对基坑结构进行
随着我国市场经济持续、健康发展,社会主义市场经济制度不断完善,越来越多的公司为促进产业结构调整,采用并购重组的方式来提高自身竞争力、维持市场占有率。与之而来的企业
顺风车服务作为专车类共享经济平台新业态的典型代表,弥补了传统出租车服务数量不足、覆盖面低的缺陷,满足了人民群众日益增长的交通出行需求。但网络效应在促进顺风车服务迅
通过订正技术提高风速预报的准确性,能够显著提升风电场风力发电效率,增加电能并网的稳定性,减轻电网压力、降低经济运营成本。为电场优选出合理的风速订正方法,利用Weibull
文化价值观在现代国际商务管理和活动中的影响越来越大,人们把不同的文化划分为不同的种类,地域和生活习惯的差距使不同文化的群体之间相互疏远,要正确意识到这个问题,提高管
在实际应用中,数据标签的分布往往是不平衡的,并且少数类样本是我们关注的重点。因此,研究不平衡数据的分类方法很有必要。针对不平衡数据的分类问题,主要从数据采样和算法改
相声是产生在中国的笑的艺术,幽默是相声艺术的生命,没有幽默相声毫无乐趣而言。相声由一个又一个的“包袱”串联而成,所谓的“包袱”体现在相声语言的幽默艺术上,而语言是创
本文对我国风电建设的后评价进行了研究,提出了风电建设后评价从项目过程评价指标、项目效益评价指标、项目影响评价指标和项目持续性评价指标四个方面进行评价,并给出了四个
作为词籍中最重要的"副文本"形式,词籍序跋对于词研究有重要意义。相对于其他文体的序跋研究,词籍序跋研究是个短板。本文从历代词籍的资料整理与研究现状两个方面对其做一梳
目的:创伤后肌腱粘连发生率高,导致运动功能障碍,临床治疗尚缺乏有效靶点。巨噬细胞是组织粘连的调控者,可通过细胞间“通讯”的方式改变靶细胞的功能和表型,而由外泌体(Exos