【摘 要】
:
数据过时问题普遍存在于实际应用中,因此将数据库中的过时数据修复为最新值是提高数据质量的关键步骤.当前主要有基于规则和基于统计2类数据修复方法.基于规则的修复方法能够
【机 构】
:
哈尔滨工业大学计算机科学与技术学院
【基金项目】
:
国家“九七三”重点基础研究发展计划基金项目(2012CB316200);国家自然科学基金重点项目(61133002)
论文部分内容阅读
数据过时问题普遍存在于实际应用中,因此将数据库中的过时数据修复为最新值是提高数据质量的关键步骤.当前主要有基于规则和基于统计2类数据修复方法.基于规则的修复方法能够将领域知识直观地表达为规则的形式,但是难以表达数据中某些复杂的关联关系;基于统计的方法能够表达数据中的复杂关联关系,并修复许多通过规则难以发现和修复的错误,但是该类方法均需要学习较复杂的条件概率分布,且难以直接应用数据语义相关的领域知识.研究数据时效性的修复问题,同时,为了克服当前2类数据修复方法的缺点,提出一类新的修复规则,将规则和统计的方法结合起来修复过时数据.该规则一方面能够以传统规则的方式表达领域知识,另一方面还能够使用其特有的分布表来描述数据随时间变化的统计信息.接着,还给出了修复规则学习算法和数据时效性修复算法.真实和虚拟数据上的实验均验证了算法的有效性.
其他文献
<正>2015年12月10日,老挝大米输华启动仪式在老挝南部沙湾拿吉省举行,标志着老挝从此开始对中国进行大米批量出口,也标志着中检集团柬埔寨公司圆满完成了老挝国首批输华大米
<正>税延优惠问题可能成为我国结构性减税下一时期的一个亮点如果按照国际标准来说,65岁以上人口超过7%就是老龄化状态。目前中国城市区域已较普遍地进入老龄状态,几年之后,
目的建立微波辅助-双水相萃取苦参多糖的方法,并优化其萃取实验条件。方法以乙醇/硫酸铵双水相为萃取溶剂,利用单因素试验和正交试验考察了双水相体系的组成、萃取温度、萃取
阿尔茨海默病(Alzheimer’s disease,AD)是一种常见的神经系统退行性疾病,临床表现为进行性认知功能减退,典型病理改变为老年斑(senile plaque,SP)、神经原纤维缠结(neuronal fibr
通过对Biolak型A2O工艺处理生活污水工程应用的研究,考察了好氧段溶解氧(DO)浓度对该工艺脱氮除磷的影响.试验结果表明,DO浓度变化对系统COD、NH+4-N处理效果的影响不大,而对
目的探讨加味银翘散对于病毒性感冒患者的临床治疗效果。方法选取我院在2012年11月—2013年3月间收治的200例病毒性感冒患者,随机分为对照组和治疗组,为对照组患者提供利巴韦
目的榆林市是碘缺乏病危害较重的病区,1975年普查甲状腺肿患者47180例,患病率13.04%,最高达到63.8%。经过全民普遍服用合格碘盐,重点人群补服碘油丸、海产品,取得明显的效果
精品资源共享课是国家精品开放课程体系中的重要组成部分。2007年北京林业大学"森林培育学"入选国家级精品课程,经过6年的建设,2013年成功升级为国家级精品资源共享课。"森林
<正>智能资金平台帮助财务公司建立健全了内部金融信息平台,提升了资金效益,推动红豆集团进入到产融结合的快速发展阶段从企业草创的1957年,到走出困境的1983年,再到目前大力
社会保险经办业务由若干环节组成,又通过诸多岗位来完成,其中,"咨询"就是一个不容忽视的重要岗位。如何加强咨询岗的建设,充分发挥其应有的作用,应引起我们社保经办部门的高