基于聚类和遗传交叉的少数类样本生成方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:JSLDYY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的分类算法在处理不均衡样本数据时,分类器预测倾向于多数类,样本数量少的类别分类误差大。针对该问题,提出一种基于聚类和遗传交叉的少数类样本上采样方法,通过K-means算法将少数类样本聚类分组,在每个聚类内使用遗传交叉获取新样本,并进行有效性验证。基于K-最近邻及支持向量机分类器的实验结果证明了该方法的有效性。
其他文献
光伏发电功率预测是减小大规模光伏发电并网对电网造成不良影响的有效手段,对电网调度及光伏电站的优化运行具有重要意义。针对光伏发电功率序列的周期性和非平稳性,本文提出了
分块有损压缩图像忽略了块间相关性,重构时会产生块效应,该文提出一种空域自适应去块效应算法。对块边缘采用方向自适应有理滤波,以弱化块效应。根据块的内部活动性将图像块分成平坦块和纹理块2类,利用基于方差的空域检测方法检测出平坦块,并对平坦块进行邻块边缘自适应平滑。实验结果表明,该算法有效去除了块效应,一定程度上提高了信噪比,算法简单且鲁棒性较好。
现有DNA数值计算模型大多在二进制基础上进行计算,通用性不强。针对该问题,设计基于N进制的DNA自装配并行加法与乘法模型。在Labean模型的基础上,加法模型通过改进库分子的编码
XML数据格式虽然具有易于创建和解析的特点,但数据格式过于冗长,难以实现具体的查询。该文引入XBW变换,将XML数据压缩成3个线性序列,使XML数据的查询处理从树形结构转移到这3个序
传感器网络的通信方式可分为多跳和单跳两种。如果采用多跳方式,靠近基站的簇头因传送数据较多而导致较早死亡,在单跳方式中,远离基站的簇头因传送数据能耗太高而很快死亡。