面向Deep Web本地化数据集成的数据源两层选择模型

来源 :计算机工程 | 被引量 : 0次 | 上传用户:w15002554773
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对基于数据源质量选择方法的数据源在数据爬取时存在代价大、重复率高的问题,提出一种结合两层选择模型的Deep Web数据源选择和集成方法。该方法根据数据源本身质量和数据源的效用构建数据源的两层选择模型。给出基于该模型的递归增量数据源选择和集成策略,采用基于数据源质量的选择器过滤大量低质量Deep Web数据源,仅选择若干个高质量的数据源作为第2层选择器的输入。从候选数据源集合中递归地选择,使集成系统在获得尽可能多的高质量数据的同时,避免出现较高覆盖率的k个数据源,作为集成系统最终需要爬取和集成的数据源。实
其他文献
一、微表处的技术优势与存在的问题微表处的技术优势可以完成路面构造修复、裂缝密封、车辙填充等多项修复功能;与热沥青薄层罩面相比。具有施工快捷高效、节省路面养护维修成
介绍思南县农作物病虫害专业化统防统治现状及取得的成效,分析存在的主要问题,并提出加强组织领导、建立健全制度、注重宣传培训、强化部门引导、加大扶持力度、创办示范样板等
为减少高毒、高残留农药的使用,提高水稻纵卷叶螟的防治效果,对不同配方的药剂进行了田间试验。结果表明:r13处理防治效果最好,分别比T1处理和他处理药后3d防效高16.65%,5.89%,药后7d防