KNN分类相关论文
【目的/意义】针对基于用户的协同过滤算法中用户偏好获取不完善的问题,提出一种基于动态用户画像标签的KNN分类推荐算法,以解决在......
高光谱遥感影像在大数据时代带来丰富信息量的同时,也存在着波段维数过高、数据量庞大等突出问题。降维作为高光谱遥感影像处理环......
随着文本分类技术的日趋成熟,其在口语对话系统领域分类中的应用也越来越深入;随着统计模型发展,跟规则方法相比较,其在文档归类技术中......
文本分类和聚类技术是应信息检索和查询需要而出现的自然语言处理领域的重要研究课题。面对急速膨胀的各种文本信息,通过使用文本分......
经典粗糙集理论是定义在等价关系的基础上,只能处理名义型数据,对数值型数据必须离散化后才可以处理.由于实际应用中的数据往往是......
本文研究的是基于R软件和KNN算法的《红楼梦》作者分析,通过运用R软件将《红楼梦》前80回预定为第一类,后40回预定为第二类,进行KN......
离散文本已经成为一种占据重要地位的舆情信息表现形式,根据离散文本的特点,提出基于特征概念网的离散文本舆情信息的分聚类框架,......
为了改善单一聚类算法的聚类性能,提出一种基于量子遗传算法的XML文档聚类集成解决方法。该方法首先利用KNN分类算法将XML文档划分......
描述了一个完整的中文网页分类系统的设计和实现过程,重点介绍了网页分类中的网页净化、特征加权、KNN分类等关键技术.并结合网页的......
采用KNN算法实现了一种中文专利文献自动分类系统。针对专利文献数据规模过大,分类效率低下的问题,采用修剪样本技术删除冗余样本,提......
针对大型建筑的楼宇空调供能情况,考虑到其室内舒适性、节约能量等要求,提出了一个求得最佳参考日的模型及一个预测控制参数的模型......
在向量空间模型的中文文本分类系统中,多数传统的特征选择算法忽视低频单词对分类的正面贡献,互信息特征选择过分放大低频单词对分......
提出一种基于彩色-深度视频和复线性动态系统(Complex linear dynamic system,CLDS)的手语识别方法,可以保证时序建模数据与原始数......
KNN算法在分类准确率和召回率方面具有较好的性能,但由于样本相似度计算开销大,导致分类效率低.针对此问题,本文提出一种基于密度的训......
目的:对K最近邻(K-Nearest Neighbor,KNN)算法中k值的选取通常是人为设定,而且通常是固定的缺点,研究如何更好地选取k值.方法:引入k......
文本分类问题中,卡方特征选择是一种效果较好的特征选择方法。计算单词的卡方值时,先计算单词针对每个类别的卡方值,再通过类别概......
KNN算法是一种思想简单且容易实现的分类算法,但在训练集较大以及特征属性较多时候,其效率低、时间开销大.针对这一问题,论文提出了基......
如今,人们常常通过各种社交网站上发表的消息来了解当时的热点事件、社会舆论等。随着科技的快速发展,微博也逐渐普及,越来越多的......
在数据挖掘的整个过程中, EM 算法因其数值计算的稳定性、 实现上的简单性, 可靠的全局收敛性, 被广泛应用于处理数据不完整问题.......
针对信道状态信息数据量大、时变性强的问题,提出-种基于快速正交搜索算法的改进WLAN室内定位方法.定位系统利用无线网卡采集各天......
KNN短文本分类算法通过扩充短文本内容提高短文本分类准确率,却导致短文本分类效率降低。鉴于此,通过卡方统计方法提取训练空间中......
随着大数据时代的到来和不断发展,在城市研究中,多源数据的应用为城市规划和城市理解展开了新的篇章。其中,以手机信令数据为代表......
参数k值的合理选取是KNN算法设计中的一个难点问题。目前k值一般凭经验选取,而且传统的KNN算法中所有的测试样本都用一个k值,这对......
语音情感识别是实现智能人机交互的关键技术之一。然而,用于语音情感识别的语音情感特征十分有限。为此,提出一种新型的语谱图显著......
Internet技术的普及和流媒体应用的日益多样化使得音视频业务在网络数据流中的占比逐渐加大,这给网络带来很大的负担和安全隐患。......
近年来,随着人们对于基于位置服务(Location Based Services,LBS)的需求增加,出现了很多定位系统,室外环境利用全球导航卫星系统(G......
针对传统KNN算法在处理新闻分类时仅仅考虑文字层面上的相似性,而未涉及语义层面,本文提出了一种基于VSM和LDA模型相融合的新闻分......
为了提高k-nearest neighbor algorithm(KNN)算法处理大数据集的能力,本文利用Map Reduce并行编程模型,同时结合KNN算法自身的特点......
指出传统KNN(k-nearest neighbor)算法的两大不足:一是计算开销大,分类效率低;二是在进行相似性度量和类别判断时,等同对待各特征......
KNN算法是数据挖掘技术中比较常用的分类算法,由于其实现的简单性,在很多领域得到了广泛的应用。但是,当样本容量较大以及特征属性......
利用《农业大词典》中词条的特征研究农业概念簇的生成。阐述了从释义部分抽取特征,包括了人工特征抽取特征词和词语概念,以及KL变......