基于遗传理论的改进数据过采样方法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:tlhcm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对数据分类预测模型的生成中,高度不平衡的训练数据会大幅降低模型的性能,本文提出了一种改进的基于遗传思想的不平衡数据集过采样方法,该方法从生物染色体遗传理论中得到启发,利用近亲生成相似而又不完全相同的新实例来平衡多数类,在保证样本分布不变的前提下,减弱甚至消除不平衡数据对训练结果的偏差影响.最后,通过在公共数据集上的对比实验表明,该方法取得了更高的召回率及G-mean值,证明此改进方法行之有效,所生成模型的综合性能有所提高.
其他文献
旅行商问题(TSP)是经典的NP难问题,对该问题的研究从未停止,也得到了很多的近似求解算法,但每一种算法都各有特色,正因如此,对旅行商问题总有新的算法在提出.麻雀算法是新近提出的算法,本文对麻雀搜索算法(SSA)的原理、搜索策略以及算法的基本流程进行研究分析,针对SSA搜索接近全局最优时,种群的多样性减少,容易陷入局部最优等问题提出一种改进的麻雀搜索算法(ISSA).使用6个标准测试函数与基本SSA以及其他群体智能算法进行仿真实验,测试ISSA的性能.最后应用ISSA对旅行商问题进行求解.实验表明,改进的
针对目前基于批量归一化的ResNet肺炎辅助诊断方法对于批量大小具有较高依赖性、网络通道特征利用率较低,并针对采用深度神经网络的肺炎诊断方法都忽略了医疗数据隐私和孤岛的问题,提出一种融合联邦学习框架、压缩激励网络和改进ResNet的辅助诊断方法(FL-SE-ResNet-GN),运用联邦学习保护数据隐私的同时结合压缩激励网络和组归一化方式充分关注通道特征.通过Chest X-Ray Images数据集的实验结果表明,该方法的准确率、精度和召回率分别达到0.952、0.933和0.974.与其它现有方法相比
本文提出一种新的智能小车主动及被动控制手段,采用STC89C51RC与K66双芯片实现对智能小车的控制.运用蓝牙通信技术实现通过手机端APP控制小车进行基本动作,同时利用超声波测距技术实现小车自动避障.此外,还加入了红外探测传感器以实现小车的自动循迹,结合低功耗的MT9V032摄像头,利用图像识别技术实现了信标灯寻的.实验测试结果表明该移动小车在光照条件适当的情况下具备良好的循迹性能,在小车速度为20 cm/s时避障准确率达到99%,能够以3.1 m/s的稳定速度识别到直径为7.85 m辐射范围内的信标灯
针对现有的深度学习去雾算法参数多,训练时间长,无法应用到实时计算机视觉系统等问题,本文提出了一种基于明暗通道的循环GAN网络(bright and dark channel CycleGAN network,BDCCN).BDCCN以CycleGAN为基础,采用固定参数和训练参数相结合方式,基于明暗通道先验理论,改进循环感知损失,实现图像去雾.实验结果表明,本文算法计算量小,收敛快,在合成数据集和真实数据集上均表现优异.
针对低渗油田储层粒度预测问题,本文提出利用机器学习中的极致剃度提升树(extreme gradient boosting,XGBoost)来对低渗油田储层粒度进行预测的方案.首先,根据问题构建合适的XGBoost模型,然后根据已有的岩心储层粒度特征值与其余测井信息的关系,选取适用于粒度预测的测井曲线建立样本库,最后利用样本库数据对建立的XGBoost模型进行训练,训练后的模型即可预测研究区域未知的储层粒度特征.结果表明,本文所设计的XGBoost模型对低渗油田的储层粒度预测方案在计算效率、预测准确率等方面
为了避免人们边行走边使用手机发生危险,本文提出了实时性强的轻量级模型(Mobile-YOLOv3)来检测路面障碍.我们在广州各地拍摄路障图片并标注了一个路障数据集,使用了一个轻量级的MobileNetv1网络来替换YOLOv3的骨干网络实现轻量化,并且应用了4个方法用于提高检测精度和模型的鲁棒型.4个方法分别为:边框回归损失函数CIOU、分类损失函数Focal、预测框筛选算法Soft-NMS、负样本训练.实验结果证明,该模型获得了98.84% 的MAP.与YOLOv3对比,该模型的规模缩减了2.5倍,检测
针对BGP异常数据的检测问题,依托互联网公开的真实BGP更新报文数据,重点结合网络的拓扑特征及时序变化特点,提出一种新的基于图嵌入特征和LSTM自动编码器的BGP异常检测方法.首先利用BGP数据中AS_PATH属性信息,构建基于时间序列的网络拓扑图的动态嵌入特征数据集,然后使用LSTM自动编码器模型对数据进行检测,发现异常数据.在实际的异常事件数据中,该方法成功检测到了异常数据,并且相比传统的检测方法有较高的准确率.
车牌图像重建是实现智能交通的重要步骤.在经过不断的重复实验后,本文提出了一种新的基于生成对抗网络(GAN)的超分辨率车牌图像重建模型.所提出的办法主要包括4个部分:(1)预处理输入图像,包括调整图片大小和筛选对比度差的图片;(2)引入了残差密集网络,能够充分提取车牌图像特征;(3)引入渐进式采样进行图片重建,因其具有较大的感受野,能提供更多的信息细节;(4)引入基于PatchGAN的鉴别器模型,该模型能更加精准地判断,从而引导生成器进行更高质量、更多细节的图像重建.通过在CCPD数据集上与目前较优的算法进
目前基于传统的机器视觉分析方法筛选后的PCB焊接缺陷图像还需要进行人工的复检流程,工作量大导致视觉疲劳后容易出错.为了改善这种现状,本文设计应用YOLOv3-spp的目标检测算法来构建焊接缺陷检测模型.为提升检测速度,采用模型剪枝、模型蒸馏、模型量化等技术对检测模型进行压缩优化,采用深度学习加速组件OpenVINO来加载压缩优化后的检测模型,实现对PCB焊接缺陷图像的复检.基于该优化算法设计了一种基于深度学习技术的PCB焊接缺陷检测识别系统.它能快速、准确地识别焊接缺陷并定位缺陷位置,解决了人工目检带来的
随着计算机硬件性能的提高,目前在个人终端上也开始出现使用预训练机器学习模型进行推理的运用.Caffe是一款流行的深度学习框架,擅长图像分类等任务,但是在默认状态下只能单核运行,无法充分发挥异构并行计算设备的计算能力.深度学习对于计算性能的要求较高,如果能并行化以充分使用所有计算设备,就能提升计算速度和使用体验.由于CPU和GPU的计算性能之比在不同模型下存在差异,因此不能简单将任务均分到多个计算设备.而任务拆分过多或者需要等待多设备完成任务后同步的调度算法会引入更多开销.因此,还需要设计合适的调度算法减少