【摘 要】
:
KNN连接作为数据挖掘的基元,可以用来大幅度提高相似搜索、数据分析和数据挖掘的速度.到目前为止,对KNN连接的研究主要在基于磁盘系统的背景下进行,假设数据库太大以至于不能
【机 构】
:
哈尔滨理工大学计算机科学与技术学院,哈尔滨工业大学计算机科学与技术学院,长春大学软件学院
【基金项目】
:
黑龙江省自然科学基金项目(F200601)
论文部分内容阅读
KNN连接作为数据挖掘的基元,可以用来大幅度提高相似搜索、数据分析和数据挖掘的速度.到目前为止,对KNN连接的研究主要在基于磁盘系统的背景下进行,假设数据库太大以至于不能装入主存.随着RAM越来越大,价格也越来越低廉,这种假设逐渐受到挑战.因此,有必要重新对基于主存的KNN连接进行研究.在高效主存索引的基础上,采用编码解码、自底向上、深度优先遍历和剪枝等技术提出了一种新的KNN连接算法Δ-tree-KNN-Join.该算法解决了KNN连接中确定搜索半径困难的问题,提高了连接效率.在真实数据和合成聚类数据上
其他文献
在无线传感器网络中,蚁群算法构建的路由容易出现能量洞,影响网络的寿命和整体性能.所以提出了BEACO算法.主要思想是将下一跳的选择抽象成为基于最短路径和最小费用流的组合
根据相关工程实践和研究,总结和分析了UEA防裂机理和实际功能,使用混凝土微膨胀剂的缺点较多,在使用过程中尽量少用或不用混凝土微膨胀剂,而通过加强施工管理和养护,并采用非早强
社会对FPGA人才的需求量巨大,国内的独立学院通信电子类专业相继开设了FPGA/CPLD技术的相关课程。文章就独立学院开设FPGA/CPLD技术课程的重要性及存在的包括实验平台建设、理论
针对医学图像配准鲁棒性强、准确性高和速度快的要求,提出了一种基于融合多种特征点信息的最小生成树医学图像配准算法.该算法首先提取3种特征点,Harris-Laplace,Laplacian of Gaussian和网格点;然后使用遗传算法去除特征点集的冗余,并通过对位映射构建无向完全图顶点集合;进而使用改进的Kruskal算法来构造最小生成树;最后使用得到的最小生成树估计Rényi熵.该算法较好地解
高维数据集合的整体性匹配是一种重要的查询方式.基于点对点的元素匹配方式具有极高的运算复杂度,难以在大规模数据集中应用.针对相关性较强的高维数据集合,提出一种基于空间