多Web数据源环境下的重复实体识别方法研究

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:a479676614
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web中大量可访问的数据源为人们获取有用的信息带来了极大的便利。作为Web数据源集成的一个必要的步骤,需要将存在于不同数据源表达形式各异的重复Web实体准确地识别出来。在已有的重复实体识别的工作中,主要是在两个数据源之间进行。由于Web数据源数量众多,使得这些方法无法应用于多个Web数据源之间的重复实体识别。针对这个问题提出了一种基于迭代训练的Web重复实体识别方法,可以在较小规模的训练样本上实现在多个Web数据源上的重复实体-~Z5Jq。通过在图书和计算机产品两个不同领域中多个Web数据源上的广泛实验,
其他文献
目的探讨心脏型脂肪酸结合蛋白(H—FABP)在急性心肌梗死(AMI)早期诊断中的临床应用价值。方法将来本院的AMI疑似患者156例,按就诊时发病时间分为2组,分别在发病后0~3、3~6h内同时检测
针对霍州煤电集团静乐矿区特殊的煤层赋存特点,为解决综采工作面顺槽支护问题,提出了锚网梁、锚索支护方式,有效控制了顶板,确保了矿井安全生产,同时在大倾角三软煤层支护技
对土—结构动力相互作用的研究历史与现状进行了介绍,简要阐述了当前土与结构动力相互作用的研究方法,并对该领域今后的研究工作提出了建议,从而促进土与结构动力相互作用的
中国经济发展大的逻辑是,中国经济供给侧发生了重大的变化,实体经济出现结构失衡,包括供给的失衡。一方面是产能过剩,另一方面是居民持币待购。金融与实体经济失衡,房地产与
报纸
地中海贫血是由于编码珠蛋白的α或β类珠蛋白基因发生缺失或点突变,使α或β类珠蛋白链缺如或不足所致的贫血,东南亚是地中海贫血高发地区之一,我国广东、广西、云南、四川等省
目的探讨血清总胆汁酸(TBA)、腺苷脱氨酶(ADA)、a-L-岩藻糖苷酶(AFU)、单胺氧化酶(MAO)测定在肝脏疾病中应用价值。方法采用罗氏P800全自动生化分析仪对158例各种肝病患者和60例健康