基于集成方法的不平衡数据分类研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:wyattwong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
按照不同不平衡数据集在面对四类分类情况时侧重点的不同,构造出一种适用于不同特征不平衡数据的分类评价指标,并围绕此指标调整弱分类器权重及样本权重,改进集成算法中的AdaBoost算法,使其自适应不同特征的不平衡数据集分类.选择决策树算法作为基分类器算法进行仿真实验,发现使用AdaBoost算法和GBDT算法后准确率降幅较大,而改进的PFBoost算法能够在保证准确率的情况下显著提升F1值和G-mean值,且在绝大多数数据集上的F1值和G-mean值提升幅度远超其它两种集成算法.
其他文献
针对山火烟雾这类柔性目标图像存在的形状不固定所导致的识别精度低、泛化性差等问题,提出了一个基于YOLO的改进深度卷积神经网络(DCNN)识别方法。该方法通过数据增强算法优化训练网络;利用GIoU_Loss损失函数替换L2 Loss函数,大幅降低损失值;运用空间金字塔池化,将多尺度特征进行融合,增加网络的感受野,提高检测精度。实验结果表明,改进方法相对于原YOLO算法查全率提升了1.3%,查准率提高
作为系统重要属性之一的弹性受到越来越多的关注,而系统在受损后的规定时间内应当尽量多的恢复关键任务,所以相应的恢复策略的制定以及能够恢复到什么程度对系统的弹性来说是十分重要的.针对这种情况,文章提出一种新的考虑时间以及任务重要度等因素的适应度函数,利用遗传算法求解规定时间内系统恢复任务重要度的最大值,获得模型的满意解.仿真算例中,通过对比表明应用此算法的系统拥有更高的弹性恢复能力,证明了该模型和算法的有效性.
针对船舶供电系统电缆的绝缘状态问题,设计了一款电缆绝缘在线监测装置.装置采用低频交流注入法,在IT系统的中心点注入低频的交流信号,通过取样电路和A/D量化检测注入信号在电路中的响应,采用FIR滤波器及DFT算法提取注入信号,计算出系统的绝缘电阻和分布电容.基于MCGS嵌入版组态软件开发出人机交互界面,使测量装置操作更加便捷,更方便地监控IT系统的绝缘状态.实验验证该方法切实可行,装置测量精度高,数据稳定性好,能更好地评估系统的绝缘状态.
人工蜂群算法是一种简单、高效的智能算法.同时,蜂群算法也存在很多问题,例如:收敛速度不是太快、容易发生局部最优的问题等.一种改进的蜂群算法得以提出,其思想是:引入一种对比机制,和算法因子来改进算法,加强算法全局搜索能力,采用四个基本测试函数对所提出方法进行测试.结果表明,优化后的算法较原算法提高了收敛精度,有效解决了会发生局部最优的问题.
目标跟踪在智能监控、无人驾驶、航空航天等领域有广泛的应用,其目的是在视频每一帧中找到运动目标并用目标框将其定位出来,但由于运动模糊、外观变化、遮挡、光照变化和背景混杂等原因,跟踪器在跟踪过程中极易丢失跟踪目标。由于SiamRPN模型搜索目标区域面积较小,模型有丢失目标的风险,为了提高跟踪准确率和成功率,论文提出了一种扩大搜索区域的改进SiamRPN模型ACSiamRPN,利用目标在图像前后帧间的运
在无人驾驶技术发展的过程中,地图的匹配定位与其所指导的路径规划是十分重要的研究内容.路径规划的质量、总代价和稳定性往往与地图匹配定位的准确率有关.因此,论文使用正态分布变换算法进行基于高精度地图的无人车匹配与定位,然后将匹配误差引入路径规划代价函数.并引入道路危险系数的概念,根据匹配误差修改障碍物附近道路的危险系数,从而提高路径规划的稳定性和安全性.此外,论文进行了仿真实验,验证了算法的有效性.
在运动目标检测众多算法中,ViBe算法是一种快速并且高效的运动目标检测算法,在视频监控领域得到广泛的应用。但是这种方法存在对鬼影的消除速度缓慢,容易形成拖影,而且容易发生漏检,易受到噪音的干扰。当物体运动状态变化缓慢时,原位移区域会留下残影等现象。论文针对以上问题提出了一种结合三帧差分算法的改进的ViBe算法,改进背景模型的初始化来对鬼影进行消除,并且加快鬼影的消除速度。采用自适应阈值来提高检测效
论文中结合无人机在电力巡检中的应用以及无人机巡线的方式,引入了理想巡检路径,提出了一种基于人工势场的无人机航迹规划避障的改进算法;根据电力巡检无人机的应用场景对势函数进行了调整,并且引入无人机在理想航迹投影点的引力场,当无人机陷入U型障碍物时调整无人机对障碍物感知的范围,使无人机摆脱U型障碍物.该改进算法不仅可以提高无人机巡线的效率,也可以解决部分局部极小问题.最后通过二维平面轨迹规划问题的数学仿真,验证了该方法的有效性.
论文基于UVM验证方法学,以及覆盖率驱动的芯片验证指导思想,搭建并分析了高度可重用的以太网控制器IP的验证平台.为了提高验证效率,论文对MAC的工作流程进行了研究,对其功能点进行了划分,针对性地编写了测试用例.在测试用例的驱动下,对MAC的数据收发功能进行了全流程的仿真验证.在大规模随机测试用例和定向测试用例的共同作用下,加快了验证所需要的时间,节省了仿真所需的计算机资源,达到了功能覆盖率100%的目标.
为了将词义信息和语义信息更好的与句子进行融合,论文提出一种基于词义增强和注意力机制的Twitter情感分析方法.通过对Twitter中的单词进行词义和语义信息的补充,增加词向量的维度来增强语义;把扩充后词向量表示的文本与情感强度进行配对输入到双向注意力机制的长短时记忆网络(BiLSTM)中.在Twitter数据集上进行普通情感分类、普通情感回归分析、基于Valence-Arousal的维度情感分析.实验结果表明,论文提出的基于词义增强和注意力机制的文本情感分析模型相比于其他模型具有更好的效果.