不平衡数据集相关论文
针对分类任务中的不平衡数据集造成的分类性能低下的问题,提出了类不平衡数据的EM聚类过采样算法,通过过采样提高少数类样本数量,从根......
针对传统过采样方法导致的边际模糊及数据量增大的问题,提出了一种基于不平衡数据集的改进极限梯度提升(XGBoost)算法,并结合JJATT恐怖......
在实际工程应用中,滚动轴承在大多数时间都工作在正常状态下,故障状态时间很短。由于成本,让其长时间工作在故障状态是不现实的。这将......
由于现场条件限制,用于列车轴承故障诊断的故障数据样本量较少且多为不平衡数据集,为及时准确地识别轴承故障,提出一种基于互补经验模......
窃电现象不仅会为电力企业和国家带来巨大损失,还会对电网的安全运行和人身财产安全具有重要的影响。实时准确的定位窃电检测对电......
文章针对传统SMOTE及BSMOTE过采样方法会导致多数类样本识别率下降的问题,提出基于局部密度的改进BSMOTE算法(LDBSMOTE)。首先,根据样......
随着我国经济的发展和公积金制度的不断完善,人们使用公积金贷款购房的需求日益增加,银行的相关信贷业务也发展迅速。公积金贷款事......
随着我国国民经济产值大幅度提升,人民生活水平大幅度提高,我国的生活垃圾产生量也持续上升。不断上涨的生活垃圾使生态环境污染情......
针对目前常用的入侵检测数据集存在的类别不平衡问题,从数据的采样层面出发,提出基于数据增强的入侵检测算法,并对数据进行了特征选择......
在二代测序技术的推动下,宏基因组学的研究在广度和深度上都发生了巨大的变革,带来了宏基因组数据井喷式的增长,因此也给机器学习......
随着人工智能的高速发展和移动设备的普及,各种基于深度学习的应用进入我们的生活,深度学习的成功离不开神经网络对数据的高表征能......
企业财务困境预测是企业信用评估领域的重要研究课题,也是现实社会生产中企业管理、投资、授信及监管决策所面临的棘手问题。我国......
为减少直流系统停运与检修时间,提高换流阀运行的稳定性,提出一种基于多状态数据均衡与极端梯度提升(extreme gradient boost,XGBo......
不平衡数据的分类问题一直是机器学习与数据挖掘的共同课题。在传统的学习过程中,分类器大多在不平衡比例接近1的数据集上进行分类......
目前机器学习技术在医疗领域的应用越来越广泛,利用这种技术可以帮助医生及早发现隐匿疾病,正确预测疾病进展,从而降低患者的发病......
2020年新冠疫情席卷全球,全国人民积极响应“宅家抗疫”的号召,使得网络金融蓬勃发展,但有不少犯罪团伙借此机会以网络游戏或网络......
针对不平衡数据集中少数类样本分类识别率较低的问题,提出一种基于代价敏感卷积神经网络(cost sensitive convolutional neural ne......
信息物理融合系统(Cyber-Physical System,CPS)是一种智能化系统,它实现了计算、通信和控制的高度融合。在“中国制造2025”的战略中......
传统DBSCAN算法对密度分布不均匀的不平衡数据集的聚类效果并不理想,同时传统算法的聚类结果对邻域半径(Eps)以及核心点阈值(MinPt......
移动互联网的普及伴随着大量网络安全问题的出现,许多新型的网络攻击方式层出不穷,危机事件频发。我国互联网安全态势仍然严峻。如......
随着大数据和互联网的快速发展,恶意代码的存在也对网络的安全性造成了严重的威胁。为此,大量的学者从不同的层面展开了对恶意代码......
工业控制系统异常检测大多面临类不平衡问题,从而导致检测模型准确率下降和泛化能力变差。根据生成式对抗网络,提出一种只使用正常样......
为分析临床脑卒中经颅多普勒超声(T CD)数据的实例相关代价敏感特性,提出一种基于实例代价的旋转森林算法.针对T CD数据构造多维组......
期刊
针对散料港口无人化取料机往复取料效率低,毫米波雷达感知数据集噪声多、波动频繁、数据不平衡导致现有机器学习分类模型效果欠佳......
研究表明支持向量机方法在样本集分布不均衡情况下,对少类样本分类准确率急剧下降。针对该问题,本文首先详细分析了支持向量机在不......
针对不平衡数据集分类问题中存在的难易样本不平衡问题,提出在提升树算法的基础上结合Focal Loss的不平衡数据集分类算法.分别在HT......
不平衡数据集的特点导致了在分类时产生了诸多难题.对不平衡数据集的分类方法进行了分析与总结.在数据采样方法中从欠采样、过采样......
针对小比例车模识别中图像种类繁多、部分类间相似度较高、网络数据类别不均衡以及质量参差不一的问题,文章提出了一种组合模型。......
许多现实生活中的应用都受到类不平衡问题的困扰,如医疗诊断和金融危机预测。在这些应用中,目标往往是代表性不足的类别。然而,经......
互联网已经成为人们日常生活中不可缺少的一部分,网络在带来便捷生活的的同时,由于网络安全问题日益突出,也给人们带来了严重困扰和焦......
随着互联网技术的快速发展,计算机及网络资源逐渐成为社会公共基础设施的重要组成部分。然而,随着相关技术进步,攻击者也不断创造出新......
变压器在电力系统中发挥着变换电压、分配电能等重要作用。其故障缺陷将严重危及电力系统的安全运行,从而造成巨大的经济损失和不......
不平衡数据集是指在数据集中,某一类样本的数量远大于其他类样本的数量,其会影响分类结果,使基本分类器偏向多数类。合成少数样本......
针对文本多分类算法中,由于不平衡数据集产生的小样本分类数据准确率低问题,提出基于轮廓系数动态K-means聚类的文本多分类混合式......
近几年来,随着词向量和各种神经网络模型在自然语言处理上的成功应用,基于神经网络的文本分类方法开始成为研究主流.但是当不同类......
针对目标检测网络单阶改进目标检测器(RefineDet)对类间不平衡数据集中小样本类别检测性能差的问题,提出一种部分加权损失函数SWLo......
如何能够在一个复杂的音频环境下检测音频事件并进行相关语义分析研究在多媒体检索、安全领域和移动机器人领域等都有广泛的应,成......
支持向量机(SVM)为一种由Vapnik等人研发出的机器学习方法,是面向小样本进行学习而提出的方法。它在统计学习理论的基础上发展而来,......
21世纪是一个高度信息化的时代,数据作为载体隐藏着大量可以挖掘的有用信息,如何处理数据和提取有价值的信息已成为迫在眉睫的问题......
近年来,大规模不平衡数据集的分类已经成为机器学习领域的一个难点与热点,越来越多的专家专注于这一方面的研究。大规模指待学习的样......
线性分类器虽然是模式识别中最简单的一类,但在许多问题中往往能取得比较好的结果,由于其简单容易实现,对资源要求低而被广泛应用。 ......
随着数据挖掘技术的不断发展和应用,决策树作为数据挖掘技术中的一个分类问题的解决策略,也越来越受到重视,并被不断的研究。目前研究......
衡量分类器及其学习算法优劣的标准不能简单地采用分类精度等单一指标。现实生活中有大量不平衡数据集,包括样本数量不平衡和分布区......
随着计算机技术的快速发展,计算机网络已经与人们的生活形影不离,然而网络攻击手段繁多,令人防不胜防,比如网络内部攻击、绕过防火墙的......
互联网的发展使得电子文本文档的数目飞速增长,自动文本分类越发的被人们所需要。文本分类作为数据挖掘、信息检索、机器学习等领域......