一种新分类模型运用于不平衡分类

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ly303237971
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不平衡多分类问题是目前分类问题中的研究的一个热点,有着广泛的应用背景,如异常检测、疾病诊断等等。同时,不平衡多分类问题也是分类问题中的一个难点。首先,它的样本分布不均匀,不同类别之间样本数目差别大;其次,它又是一个多分类问题。本文创新地构建了一种新分类模型,对于解决不平衡多分类问题取得了不错的效果。本文采用了医学诊断方面一个的数据集Arrhythmia。该数据集由452个患者记录组成,每个记录总共有279个特征值,目标是将数据集分类为16类。其中,类别的分布不均匀,正常的类别占整个数据集的一半多,而有的类别的占比不及1%。面对这样的一个数据集,本文创建了一种新分类模型,该模型是结合径向基函数插值和逻辑回归的算法思想而成的。为了寻找到最优的新分类模型,本文对新分类模型取了四种不同的径向基函数:高斯函数,Markoff分布函数,一次多项式函数和最简单的函数,在不同的参数下进行实验。最终得出,新分类模型在取一次多项式函数的形式下,相应的一次项系数c取10,惩罚项调节系数取1时,模型性能达到最佳,分类准确率高达76.01%。为了便于比较,本文还做了补充实验,将径向基函数插值和逻辑回归应用于该数据集。并且,对比了之前别人对这个数据集用不同分类器分类的效果。最后发现,新分类模型的分类效果是最好的。
其他文献
目的探讨剖宫产术后硬膜外微量麻药镇痛效果和对产妇的影响.方法将60例剖宫产术后产妇分成两组,比较硬膜外自控镇痛组与肌肉注射哌替啶(度冷丁)组的镇痛效果,观察两组产妇的
本文选取安徽省历年各个学历毕业生人数作为人才需求指标.根据2006年至2010年的历史数据对2011年至2020年安徽省人才需求做了灰色预测分析,然后根据安徽发展现状、经济发展前景
碳基超级电容器作为一种新型的能量储存装置,具有高的功率密度、优异的倍率性能、长的循环寿命和安全可靠等优点,更重要的是碳基电极材料来源广泛、制备方法相对简单,可以通
随着相关研究和技术的发展,微流控芯片越来越多地应用在各个领域。微米级颗粒(包括细胞、细菌)是微流控芯片重要的分析对象之一,面向微米级颗粒的操控是微流控芯片的重要任务。电
[背景]冠状动脉疾病是我国主要的公共健康问题之一,严重威胁国民的健康和经济,由于成年心肌细胞缺乏再生能力,瘢痕组织将会替代梗死后的心肌组织,导致左心室功能降低和心脏结