用于文本分类的改进KNN算法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:milamiya2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近邻分类器是假定局部的类条件概率不变,而这个假定在高维特征空间中无效。因此在高维特征空间中使用k最近邻分类器,不对特征权重进行修正就会引起严重的偏差。本文采用灵敏度法,利用前馈神经网络获得初始特征权重并进行二次降维。在初始权重下,根据样本间相似度采用SS树方法将训练样本划分成若干小区域,以此寻找待分类样本的近似k0个最近邻,并根据近似k0个最近邻和Chi-square距离原理计算新权重,搜索出新的k个最近邻。此方法在付出较小时间代价的情况下,在文本分离中可获得较好的分类精度的提高。
其他文献
本文简要介绍了在高速公路系统竞岗聘任的重要性及与思想政治工作的紧密关系,介绍了竞岗聘任的方法和效果。  我们石黄处从2008年起推行了竞岗聘任制,所以中层干部和职工全部实行“双向选择,竞争上岗”,并融入思想政治工作。实行竞岗聘任对单位开展思想政治工作具有十分重要的作用。    竞岗聘任制,是调动、激发职工内在积极性的有效手段    思想政治工作最重要的目的,是要调动、激发职工的内在积极性。根据管理
19世纪的美国是新社会、新宗教的试验场。自从17世纪英国的清教徒抵达北美大陆以来,人们就在这个地方进行了各种各样的尝试,想要将它建成一个美丽的乌托邦。19世纪初的30年内,这里掀起过一场以“再现上帝的王国”为目标的宗教复兴运动。(与18世纪中叶的“第一次觉醒”相对,这一时期称为“第二次觉醒”。)   19世纪,宗教的觉醒和社会改良主义相结合。他们追寻的是废除奴隶制、女性解放、救济贫民、禁酒运动、解
在美国大学、公司、政府等许多组织中,经常可以看到类似“道德委员会”或“道德办公室”的机构。与人们想像中高谈阔论道德的机构不同,这里的“道德办”常常掌握着组织内官员的去留。在众多道德办中,美国联邦政府道德办公室(OGE)无疑是最受关注的一个。这个不足80人的机构,在庞大的美国联邦政府中可谓最小的部门之一。然而正是这个与联邦调查局同级别的小部门,塑造着400多万美国联邦政府官员及雇员的行为规范,被称为
基于主题的语言模型自适应方法应尽可能提高语言模型权重系数的更新速度并降低语言模型的调用量以满足语音识别实时性要求。本文采用基于聚类的方法实现连续相邻二元词对的量
数学表达式定位是印刷体数学表达式识别的前提。针对中文科技文档,分别对独立表达式和内嵌表达式的定位问题提出了新的方法。采用自适应神经模糊推理系统(ANFIS)对行特征进行分类,提取出独立表达式;采用模糊聚类和动态规划方法,从文档中依次提取出汉字、中文标点和英文字符,利用启发式规则合并剩余的数学符号而提取出内嵌表达式。实验表明,提出的表达式定位方法有很高的正确率。
“十一五”时期,文登经济综合实力显著增强,科学发展的新布局全面展开,现代产业体系初步形成,强化“三区”建设对接“两大板块”,突出结构调整,坚持以高端高质高效为方向着力打造以南海新区为主体的蓝色产业先行区、以经济开发区为主体的高端产业示范区、以城市文化商务区为主体的现代服务业聚集区带动城区、南海两个大板块的“跨越式”发展,其中作为《山东半岛蓝色经济区发展规划》中重点建设的三个海洋经济新区之一的南海新