【摘 要】
:
在许多应用领域中,top-k查询是一种十分重要的操作,它根据给定的评分函数在潜在的巨大的数据空间中返回k个最重要的对象.不同于传统的TA算法,NRA算法只需要顺序读就可以处理t
【机 构】
:
哈尔滨工业大学计算机科学与技术学院,哈尔滨工业大学基础与交叉科学研究院高性能计算中心
【基金项目】
:
国家“九七三”重点基础研究发展规划项目基金(2006CB303005), 国家自然科学基金(60903016 60533110 60773063), 新世纪优秀人才支持计划(NCET-05-0333), 黑龙江省教育厅科学技术研究项目(11531276), NSFC-RGC of China(60831160525)资助
论文部分内容阅读
在许多应用领域中,top-k查询是一种十分重要的操作,它根据给定的评分函数在潜在的巨大的数据空间中返回k个最重要的对象.不同于传统的TA算法,NRA算法只需要顺序读就可以处理top-k查询,从而适合于随机读受限或不可能的场合.文中详细地分析了NRA算法的执行行为,确定了增长阶段和收缩阶段中每个文件需要扫描的元组个数.文中发现在海量数据环境中,NRA在增长阶段需要维护大量的候选元组,严重影响了算法的执行效率.所以,文中提出一种新的海量数据上的top-k查询算法TKEP,该算法在查询的增长阶段就执行早剪切,从
其他文献
目的建立测定人血浆中泮托拉唑含量的高效液相色谱(HPLC)方法。方法色谱柱为依利特Spherisorb C8,5um,4.6mm×150mm,柱温为30℃,紫外检测波长288nm,流速为1.2mL/min。流动
和磁盘相比,闪存作为一种新型的存储设备,具有读写速度快、抗震、省电、体积小等优点.因此,当前的研究普遍认为闪存将取代磁盘成为新一代的数据库二级存储设备.但是,由于闪存
目的 分析恩替卡韦对乙肝合并2型糖尿病患者肾功能的影响。方法 研究对象均为乙肝合并2型糖尿病患者137例,纳入时间在2014年4月~2015年5月,以治疗方案不同,分成2组,对照组给
基于Epidemic机制的路由算法为机会网络提供了一类可靠的数据传送方式,但在相遇节点感知和分组交换的操作中存在冗余,导致开销和时延增加;对此,作者提出一种基于分组索引增量交换
连接聚集操作是一种常用并且非常耗时的数据库操作.相对于准确查询,满足用户给定置信区间的近似结果由于其快得多的响应时间,更受用户的欢迎.作者分析发现现有的工作无法以既