一种基于中心文档的KNN中文文本分类算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:aws134
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在浩瀚的数据资源中,为了实现对特定主题的搜索或提取,文本自动分类技术已经成为目前研究的热点。KNN是一种重要的文本自动分类方法,KNN能够处理大规模数据,且具有较高的稳定性,但面临分类速度较慢的问题。以KNN方法为基础,引入特征项间的语义关系,并根据语义关系进行聚类生成中心文档,减少了KNN要搜索的文档数,提高了分类速度。仿真实验表明,该算法在不损失分类精度的情况下,显著提高了分类的速度。
其他文献
随着信息技术的飞速发展,在推进国家治理体系和治理能力现代化的今天,利用信息技术来推进政府简政放权、优化服务,提升政务效能显得尤为重要,智慧政务作为政府提升治理能力和
目的 探讨经皮穿刺桡动脉行冠脉造影术的术前、术中、术后护理方法,指导临床护理工作.方法 回顾42例经桡动脉行冠状动脉造影术患者的围手术期护理要点.结果 42例患者均经右侧
刘嘉湘教授是博士生导师,国家首届中医传承博士后合作导师,上海市名中医,全国老中医药专家学术经验继承班指导老师,我国著名中医肿瘤专家,现任上海中医药大学附属龙华医院终
目的:探讨四神丸治疗溃疡性结肠炎(ulcerative colitis,UC)的疗效机制。方法:采用TNBS/乙醇溶液灌肠法建立UC大鼠模型,光镜观察大鼠结肠组织病理形态变化并评分,采用ELISA法
文章通过柱淋溶实验探讨黄药在土壤中的迁移规律。实验结果表明:黄药的淋溶量及迁移距离随着黄药投加量和p H的增大而增大,主要以结合态形式存在。黄药投加量为50 mg/kg和100
近年来,吉林省中小企业的融资难问题日益加剧,严重影响了企业的进一步发展,在一定程度上制约了吉林省的经济发展。因此,在现阶段加强吉林省中小企业融资难问题的分析和研究具
<正> 从理论上说,道德,有其一系列无可否认的社会功能:批判—辩护功能、协调—聚合功能、激励—进取功能等等。道德调控,在依赖手段、调整范围、作用方式、心理机制等方面存
面向智能家庭环境中的厨卫应用,基于情境感知计算框架研发了智能烹饪助手服务(Smart Cooking Assistant Service,SCAS),在烹饪过程中向用户提供信息提示服务。SCAS建立并维护
当今社会财务舞弊行为日益严重,越来越多的企业在不违背会计法规规定下,以打擦边球的方式,通过粉饰财务报表、利用会计漏洞向外界披露掩盖真实的企业经营状况。因此,如何采取
提出了一种改进的语音增强算法,该算法以基于先验信噪比估计的维纳滤波法为基础。首先通过计算无声段的统计平均得到初始噪声功率谱;其次,计算语音段间带噪语音功率谱,并平滑