用于不均衡数据集分类的KNN算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:hubaonian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对KNN在处理不均衡数据集时,少数类分类精度不高的问题,提出了一种改进的算法G-KNN。该算法对少数类样本使用交叉算子和变异算子生成部分新的少数类样本,若新生成的少数类样本到父代样本的欧几里德距离小于父代少数类之间的最大距离,则认为是有效样本,并把这类样本加入到下轮产生少数类的过程中。在UCI数据集上进行测试,实验结果表明,该方法与KNN算法中应用随机抽样相比,在提高少数类的分类精度方面取得了较好的效果。
其他文献
针对自动气象观测站分布地区广、资料实时同步触发上传的特点,深入研究了基于TCP多连接通信的实时并发数据处理系统,详细介绍了该系统的工作原理和软件设计方案,尤其对决定系
本文从商业橱窗展示设计这一细分设计领域出发,阐述了展示与照明的关系、照明设计的对象与原则,进一步分析商业橱窗展示照明设计的视觉营造,着重探讨了照明设计在这一设计领
产业经济学作为从微观经济学分化发展出来的一门相对独立的经济学科,其发展过程主要经历了两个阶段:第一阶段是20世纪30-70年代;第二阶段是20世纪70年代至今。在这数十年的发
参照环境库兹涅茨理论,运用人均GDP与环境污染的相关统计数据,使用主成分分析法建立起反映环境污染整体状况的环境污染综合指数,通过回归一个简化型计量模型分析经济增长与环
论文提出了一种新的基于粒子群的多目标优化算法。用搜索过程中所发现非劣解的一部分构成精英集,将其作为粒子群的历史最佳,引导粒子群的搜索,并通过小生境技术和部分变异的
寻找大量的正交矩阵,一方面用来降低OFDM(正交频分复用)信号的峰均功率比,一方面作为密钥使用,是基于OFDM的信息安全算法的重点。经证明用生成多相正交矩阵的方法,可将单一的
为了研究河北省平泉县食用菌产业化发展取得的成功经验以及发展中存在的问题,运用典型调查法和案例分析法对河北省平泉县食用菌产业基地发展现状进行分析研究。结果表明:建设
针对地面站系统服务能力评估问题,研究了其评估指标及其计算方法.首先从卫星、地面站两个方面建立了地面站系统服务能力评估指标,并就各个指标以及指标的应用进行了分析.然后
利用"CAD法"对不同组混凝土试件的切片进行分析。通过研究发现,混凝土试件的孔结构是影响混凝土盐冻耐久性的重要因素。平均气孔孔径更适用寻找最佳含气量,气孔分布情况可以
<正>以广东省机械技工学校校园网建设为例,本着以用为本、经济实用的原则,从校园网设计的原则、需求的提出、校园网的总体规划与设计等方面,综合阐述中小型校园网规划与设计