基于聚类降维的改进KNN文本分类

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:flyby
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征向量的高维性以及训练样本分布不均影响文本分类器性能。提出了一种聚类模式下的KNN改进方法。首先使用一种改进的聚类方法对文本特征集进行初步筛选,随后使用一种基于类别的改进KNN分类器进行分类,减少了噪声样本对测试样本类别判定的干扰。试验结果表明本文提出的分类模型在分类效率上得到提高。
其他文献
近几年随着医学影像技术的迅猛发展,医学影像诊断水平的不断提高,胸壁结核性脓肿较常见,其影像学报道较少见,结合文献复习其临床病理和影像学表现,以提高对此病的进一步认识.
在详细工勘的基础上,为了得到庙冲尾矿坝坝体稳定性的可靠度,根据摩尔库仑准则,采用有限元分析软件计算出坝体的浸润线高度,在此条件下,考虑到岩体力学参数内摩擦角、密度和
目的观察雌激素皮肤贴剂(松奇皮贴每贴含17-β雌二醇1.5mg)在绝经期女性激素补充治疗方面的有效性、安全性及药物不良反应。方法绝经期女性35例,血清FSH>40U/L,E2<30pg/mL,连
从影响农户耕地行为各种相关因素出发,探讨河南省2004—2013年耕地集约利用时空变化特征及其驱动力,运用综合指数评价法、主成分分析法、聚类分析法、因子分析法,构建耕地集
代谢综合征(metabolicsyndrome,MS)是一组以中心性肥胖、高血糖、血脂异常以及高血压等聚集发病,严重影响机体健康的临床症候群,是一组在代谢上相互关联的危险因素的组合,主要临床
常用视频压缩算法DCT存在方块效应和"飞蚊噪声",在低速率传输下更为明显,难以满足视频传输中带宽窄、质量高的要求。基于数学形态学的视频图像帧间编码技术,是运用帧间运动补偿的编码算法,该算法通过复合形态变换,用结构元素对宏块中的不规则小块进行开、闭运算,选取并滤出不规则小块,再对不规则小块的大小和运动矢量进行运动估计编码,采用绝对差分和找出匹配块,实现帧间预测。通过仿真可达到比较精细的补偿,提高了编
本文对高层建筑的软土地基的处理作了研究,结合工程实例,着重阐述了换土垫层地基处理技术。
立体彩色汉画像石砖装裱工艺流程分四步,首先宣纸的选择和处理;其次汉画拓片的立体拓制;第三立体汉画拓片色彩的恢复;第四立体彩色汉画拓片的装裱。该项发明于 2004年12月获
目的:通过30例临床手术治疗结肠癌致肠梗阻的病倒探讨手术治疗此病的临床应用价值。方法:将30例患者分组治疗:进行结肠I期切除吻合手术的有18例;行Ⅱ期结肠癌切除吻合术9例;单纯结