有效解决数据缺失问题的聚集查询算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zhu0756
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,工业界和学术界面临着非常严重的数据缺失问题,缺失值极大降低了数据可用性。现有的缺失值填充技术需要较大的时间开销,很难满足大数据查询实时性的需求,为此,研究在有缺失值的情况下高效处理聚集查询,将基于采样的近似聚集查询处理与缺失值填充技术有效的结合,快速返回满足用户需求的聚集结果。采用基于块(block—level)的采样策略,在采集到的样本上进行缺失值填充,并根据缺失值填充的结果重构得到聚集结果的无偏估计。真实数据集和合成数据集上的实验结果表明,该文的方法比当前最好的方法在保证相同精度的前提下,大大
其他文献
近几年互联网金融快速发展,而当中一部分不容忽视的力量网贷融资悄然兴起,更多的企业和个体利用网贷融资来满足自己的需求。当前小微企业正长期面临着融资难的问题,网贷平台
随着时代的发展,人们的娱乐方式也发生了革命性的改变,越来越多的人们通过电视娱乐来使自己被娱乐,而电视节目的娱乐化倾向也越来越严重,目前,娱乐元素在电视节目中广泛渗透,
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
内河航电枢纽工程是以航运为主的水资源综合利用和开发工程,正确分析和计算内河航电枢纽工程航运经济效益是项目综合评价的重要内容。本文分析了航运经济效益概念,根据内河航
结合我国水路交通服务战略环境,分析我国水路交通服务现状及存在的问题;以服务旅客安全便捷出行、服务民生和生态文明建设、服务我国企业发展,以及服务我国经济发展为战略重