面向传感云的数据源质量研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wqh4975156
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着传感云的兴起,在很多场景下,人们更倾向于将传感器的数据传至云端处理。这样云端便累积了大量的历史数据。如果可以预知数据源的质量,那么可以在传感器推送数据至云端、云端将数据存入数据库时做质量标记。其次,如果应用或查询需要即时从传感器中拉取数据时,可以避免拉取劣质数据污染查询结果,同时节省网络带宽等资源。在传感云中,同一个区域的值通常会被不止一个数据源提供,但来自不同数据源的数据却存在着偏差。本文围绕传感云中的数据源质量进行研究,给出了数据源质量度量模型。将数据源质量描述形式化定义为质量矩阵,用于描述数据源的整体质量情况。由于数据量会不断增大,对质量矩阵进行化简,化简结果能够体现不同场景下的同一数据源的质量的共性或者差异。基于用户感兴趣的区域,研究面向同一实体的多个数据源的质量评估问题。针对不同化简目标,设计高效的评估方法,避免因为评估数据源的时间损耗而导致整体服务质量的下降。当用户对监测区域的局部信息感兴趣,但该区域实体和实体数目未知的情况下,形式化定义了传感器监测实体的概念,研究面向多个实体的多个数据源的质量评估问题。将其归约为实体识别问题,提出基于聚类的方法。结合面向同一实体的数据源的质量评估方法,能够高效评估数据源的质量。
其他文献
本文以河北省港口物流企业为研究主体,在对河北省港口物流现有服务模式分析的基础上,通过借鉴国内外其他港口物流服务模式的发展经验,对河北省港口物流服务模式进行了创新,提
电缆防火涂料的制备、配方和性能,讨论了诸多因素对该涂料性能的影响.
在这场欧洲债务危机中,希腊或许只是个配角,真正的主角尚未登场。一些分析师表示,西班牙债务问题解决与否,才最终决定欧元以及欧洲经济未来的发展。$$    在“PIIGS”五国(葡
报纸
DCT(Discrete Cosine Transform)变换是与最佳变换—K-L变换性能最为接近的变换,因此将其称之为准最佳变换。DCT由于其系数对称的特点,存在快速算法,便于实现。正因如此,DCT
二十一世纪,人力资源是企业的核心资源,企业要想发展必须要有足够的人才。而人才的培养不能只靠招聘,还需要依靠对的培训。因此企业对一线员工培训机制的成败,是推动企业发展
本文以巴基斯坦卡拉奇大学孔子学院(以下简称“卡大孔院”)的汉语学习者为调查对象,通过问卷调查和访谈等研究手段,着重讨论了汉语水平、性别、年龄等因素对学习动机的影响。本文除结论以外共分为四章:第一章介绍了选题的研究背景与意义,通过对相关文献的收集与整理提出本文选题的必要性与创新性。第二章以卡大孔院汉语教学现状的研究为基础,根据卡大孔院汉语学习者的基本情况,开展对卡大孔院学习者汉语学习动机的调查,并对
本实验测定了中国家鹅15个品种、欧洲鹅2个品种共44个个体的细胞色素b基因(Cytb)全序列,分别取鸿雁和灰雁家鹅的一致序列与GenBank库中的13条鸟类(鸡形目4条、鸭科鸟类9条)细
电力资源对于民众的生活、工作等方面有着显著的影响,并且随着我国经济发展速度的加快,对电力资源的需求也更为迫切,所以我国也因此加大了对电力工程的投入。与此同时,对于电
石油作为当今世界不可或缺的战略资源,对世界经济影响非常巨大。为实现国家石油保障战略任务.就必须加强成品油存货控制与管理,这是成品油销售企业经营管理的核心内容之一。保证
湖北是荆楚文化的发源地,京山县地处鄂中,京山人民在生产劳动的过程中,喜爱用歌声表达情绪。京山民歌作为京山人民生活中主要的交流方式,既是口头文学中的组成部分,也是日常