基于维度分组降维的高维数据近似k近邻查询

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:sansancaicai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有的高维空间近似k近邻查询算法在数据降维时不考虑维度间关联关系的问题,首次提出了基于维度间关联规则进行维度分组降维的方法.该方法通过将相关联维度分成一组进行降维来减少数据信息的损失,同时针对Hash降维后产生的数据偏移问题,设置了符号位并基于符号位的特性对结果进行精炼;为提高维度间关联规则挖掘的效率,提出了一种新的基于UFP-tree的频繁项集挖掘算法.通过将数据映射成二进制编码来进行查询,有效地提高了近似k近邻查询效率,同时基于信息熵筛选编码函数,提高了编码质量;在查询结果精炼的过程,基于信息熵对
其他文献
1建园橘园基地选择应注重水土保持,根据不同坡度和地形,选择适宜的时期、方法和施工技术。选择海拔500 m以下、坡度小于25°、冷空气不易沉积的平地和丘陵缓坡地建园,开
中国古代向来注重精神文明的培养,尤其是在为人处世、安身立命等人生哲学方面,人生哲学是每一哲学家必须回答 而不能回避的现实问题。孔子和老子不同的人生哲学思考形成了鲜
传统社会的大部分女性都是弱小、无助又可怜,没有什么重要性可言,更没有所谓的“人”的权利。有时她们会像男 性一样“高高在上”,她们作为女性却进入了男性的秩序中 , 成为
目的探讨后肾腺瘤的计算机断层扫描(CT)诊断及病理特征。方法收集郑州大学第五附属医院收治的4例后肾腺瘤患者的临床、CT、病理检查结果等相关资料,进行回顾性分析,总结归纳
小学是学生学习成长的基础性阶段,这个阶段的学生不但要学习文化知识,还要在德育、美育的共同促进下成为全面发展的学生。因此,小学班主任在进行班级管理的过程中,不但要优化
目的分析血清胃蛋白酶原Ⅰ(PGⅠ)、胃蛋白酶原Ⅱ(PGⅡ)胃泌素-17(G-17)水平检测在胃癌诊断中的应用价值。方法纳入2017年2月至2019年1月期间灵宝市第一人民医院收治的50例疑
中国现代主义文学是以 1917 年文学革命为标志正式形成,以 1949 年新中国建立为结束标志的文学流派。现代主义文 学流派的产生与发展延续了本土历史脉络,在本土与传统中进行
因为生命是一个复杂过程,其受多种因素的影响;疾病是多重因素作用下的结果;诊断是甄别和排除的过程,因此要深入了解健康状态或疾病本质必须全面采集四诊信息。
《平凡的世界》是路遥所著,受到了很多人的喜爱。这部作品震撼力非常强大,著作中所体现出来的核心价值观耐人寻味, 值得每个人去思考。在作品中,它不仅仅是叙述人生的成长过
幼儿教育中,游戏是最好的方法,是提高幼儿综合能力的关键。为了让幼儿形成创新素质,就要发挥区域游戏作用。依靠游戏的过程,使幼儿形成灵活的思维、开放的大脑。本文将以幼儿