基于数据区域发现的信息抽取规则生成方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:zhouly1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种自动检测网页中数据记录结构特点并生成Web信息抽取规则的方法,以网页DOM树为基础,自动发现和分离Web数据区域所对应的DOM子树,将其分解为数据记录子树集合,综合数据记录子树的结构特点生成抽取规则。实验结果显示,该方法具有较高的抽取准确率和查全率。
其他文献
金融服务外包是当前国际服务外包业务的重要领域,特别在当前全球金融危机的背景下,金融机构会更加倾向于将外围业务外包出去,已实现合理“瘦身”,轻装上阵。在我国金融服务业
在通识教育体系下,数学类课程是高职院校课程体系的重要组成部分。除《高等数学》《经济数学》等必修课程外,高职院校还应该开设一定的数学类选修课作为通识教育的完善和补充
为深入贯彻落实全省推进工业化城镇化发展流动现场会精神,加大力度推进全省城镇化发展,江西省住建厅结合全省住房城乡建设工作实际情况,研究确定了22条具体贯彻落实措施。
我国加入WTO后,关于金融安全的理论研究再次引起人们的思考,金融安全做为国家经济安全的重要组成部份,在97东南亚经济危机后引起广泛的重视。特别是有关金融安全问题的研究取得
经济的发展对金融有着决定性作用,同样金融也会为经济的发展提供支持。实体经济发展的速度与状态避免不了金融的支持,但当下金融支持实体经济方面却存在着很多实质的困难,为
<正>7月,中美之间贸易战有升级之势,且"战火"逐渐蔓延至更多国家和地区:特朗普狮子大开口,威胁向2000亿美元中国商品加征关税,同时忙于笼络欧日结成新型贸易联盟以围困中国。