基于代价敏感的贫困生分类方法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:daocaoren666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国高校教育扶贫工作是国家精准扶贫政策中一项重要的内容。目前,国家教育扶贫工作主要包括贫困生的资格认定和贫困生贫困等级的划分。信息化管理系统的应用为贫困生数据信息的采集提供了很大便利,但由于这些贫困生数据未经有效处理,导致了大量的数据堆积,同时也存在着诸如数据缺失、数据噪声及数据冗余等质量问题。对贫困生数据进行科学高效管理,进一步利用数据挖掘方法提高贫困生认定及贫困等级划分的准确率,从而更有针对性地依据贫困等级对贫困生进行资助,对实现国家教育精准扶贫工作具有重要的现实意义。现有的贫困生认定分类方法大多采用人工认定方式或传统的机器学习算法,人工认定方式往往存在不科学、不精准及效率不高的问题,传统的机器学习算法很少考虑到各贫困等级的不同重要程度,导致高贫困等级学生的分类准确率不高,从而产生资助不公平的现象。本文以广西贫困生数据为研究对象,针对广西贫困生数据的预处理和贫困等级分类等方面开展研究工作,并提供合适的解决方案,主要内容如下:(1)针对广西贫困生数据存在的含有大量缺失值、属性分布不均匀、有噪声等质量问题,提出了一种基于特征选择的数据预处理方法DPFS。该方法包括数据准备、特征范围划分、特征组合和缺失数筛选四个阶段,首先是数据准备阶段,然后对准备好的数据通过使用特征选择算法划分特征范围,接着结合数据的真实属性分布均匀程度对特征进行组合,最后在缺失数筛选阶段以最大缺失数和分类准确率选取最优数据集。实验证明,该方法能够有效地提高数据集质量,较好地改善分类器的性能,为后续的贫困生等级分类模型训练奠定了数据基础。(2)针对贫困生认定分类中存在的数据不平衡问题,传统的机器学习分类算法未考虑不同类别的错分代价,在进行分类时往往偏向多数类而忽略少数类,导致少数类的分类准确率较低,从而使得高贫困等级学生分类准确率较低。综合比较传统的机器学习分类算法,其中CART决策树算法表现性能较优。本文提出了一种基于代价敏感的贫困生等级分类方法CSPSC,该方法通过在传统CART算法上引入代价,同时设置新的评价函数,对少数类赋予恰当的代价与权重,使得分类器在分类时能够更加关注少数类,构建了高校贫困生等级分类的新模型。实验结果表明,与传统的CART算法相比,CSPSC方法的高贫困等级学生的分类准确率提升了6%左右,更好地实现了高贫困等级学生的准确分类,有效解决了教育扶贫工作中出现的不公平问题,为教育精准扶贫和精准资助提供了参考依据。
其他文献
直接数字频率合成器(DDS)作为雷达系统及通信领域的关键模块,且随着高速数字化时代的到来,其发展迅速、应用逐渐普及。高性能DDS芯片的集成,需要高速、高精度的数模转换器(DAC)。电流舵DAC相对于其他DAC类型具有速度快、精度高、面积小等优点,成为当前较为热门的高速DAC主流结构,广泛应用于DDS中实现数模信号的转换。首先对数模转换器结构进行分析,并对比其优缺点,电流舵数模转换器无需电压缓冲器即
近年来,随着流媒体技术的高速发展,大型开放式网络课程被越来越多的人们关注。相比于传统的线下授课模式,慕课(Massive Open Online Course,MOOC)具有更高的开放性,用户可以根据自身兴趣爱好选择课程进行学习。然而,由于高度的自主选择性和缺乏师生之间的实时互动交流等原因,导致MOOC具有极高的辍学率。较高的MOOC辍学率引起用户规模和平台收益的缩减,从而成为制约MOOC平台发展
毫米波雷达是高级驾驶辅助系统的关键组成部分,随着汽车工业的发展道路上的毫米波雷达也越来越多。在众多雷达系统中,线性调频连续波雷达系统由于成本低、尺寸小和测量精度高等优点被广泛应用于汽车领域。随着毫米波雷达数量的增加以及有限的频谱资源,雷达间相互干扰的问题将会变得更加突出。线性调频连续波雷达之间的干扰可以分为交叉干扰和平行干扰,交叉干扰会增加频域的噪声基底,降低雷达的检测性能;平行干扰会产生虚假目标
抛丸机是制造业对各类异形零件非加工表面进行清理、抛光及强化处理的最常用设备之一,抛丸过程因硬质弹丸的连续高速运动,会同时造成设备内腔构件的迅速磨损。目前各型系列抛丸机普遍存在抛丸效率与设备寿命的矛盾,优化其核心部件抛丸器结构,配合升级整机智能控制技术是提高效率降低损耗的重要途径。研究学习机械、流体、自动控制、计算机应用等相关理论,结合目标抛丸器结构及运行工艺参数,以增效减损为目标制定抛丸器优化方案
基于机器学习方法的数字信号调制解调,可以在不进行载波恢复、滤波处理的情况下,实现在同一个网络模型下对多种数字调制信号进行解调,有助于提高通信系统中信息传输的效率,缓解日益复杂通信环境下硬件电路设计的压力。另外基于机器学习方法的数字信号调制解调,可以在不进行信道估计的情况下,直接将符号序列从衰落信号中恢复处理,有利提高通信系统的频率利用效率。因此,基于机器学习方法的数字信号调制的解调成为近年来研究的
深度相机的低成本化,加上有限的室内场景范围,极大地推动了基于RGB-D图像的室内视觉SLAM的发展。闭环检测与场景地图构建是RGB-D SLAM能够实现定位导航并保持全局一致的重要模块。闭环检测用于识别曾经到过的地方;地图构建用于将观测信息生成点云地图。目前的RGB-D SLAM存在两个方面的问题:一方面,传统的地图构建充分利用场景的几何信息,但忽略了语义信息,限制了机器人的任务能力;另一方面,常
目标检测是计算机视觉领域热点话题之一,它广泛应用在智能驾驶、智慧城市等方面。将目标检测技术应用到安全生产方面,是近年来国家倡导的跨领域结合,检测安全护具的佩戴情况具有重要的意义。传统方法使用图像处理和机器学习进行安全帽佩戴检测,存在检测准确率低、检测速度慢等问题,无法满足使用需求。安全帽佩戴检测使用深度学习技术使检测准确率大幅提升,但现有网络模型在复杂工作场景下仍存在错检漏检现象。本文基于YOLO
近年来,随着深度学习的快速发展,基于深度学习的单目标跟踪在算法性能方面也得到大幅度提升,而这一部分的提升很大程度上源于使用深度神经网络提取到的深度特征具有良好的分辨能力。目标跟踪在实际应用中存在以下问题,首先,小样本数据量不足、样本多样性低,导致网络提取到的特征数量有限。其次,在遮挡、形变和快速移动等因素的干扰下,目标跟踪精度低。针对上述问题,提出一种小样本目标跟踪算法,主要研究方向和创新点概括为
随着移动互联网、地图测绘和室内导航技术发展,基于位置的服务受到了极大地关注。据统计人们平均80%的时间是在室内,数据连接应用平均80%也在室内,在室外广泛使用的卫星定位技术全球定位系统和北斗定位系统仅仅支持室外定位,在室内复杂环境中无法进行精确地位置服务。随着数字化时代的到来,无线技术的迅猛发展,移动技术得到了广泛的应用,人们开始了对室内定位技术的研究和探索。由于单一定位技术存在精度有限、稳定性不
人脸检测是一种通过计算机算法对输入图像进行人脸目标查找的技术,人脸检测技术在智能安防、人流统计和刑侦破案等场景具有广泛应用。近年来人脸检测借助卷积神经网络技术使得检测精度取得了巨大提升。在实际运用场景中,由于图像背景物体复杂,人脸特征与背景高度融合和人脸目标尺度过小,使得人脸检测精度降低,因此需要对复杂背景下的小尺度人脸检测进一步的研究。论文基于YOLOv3和YOLOv4目标检测模型,研究复杂背景