基于分块重要性模型与Xpath的Web信息抽取的研究

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:huayuaneee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网页分块方法使得Web信息抽取的单位由页面缩小为块。文中研究了网页分块的主要方法与基于学习的分块重要性模型,对Xpath的Web抽取方法进行分析。结合两者的优势提出一种基于分块重要性模型与Xpath结合的Web信息抽取方法,探讨了其设计过程,并给出形式化描述与实验结果,结果表明该方法适合于抽取多记录型的网页。
其他文献
实验教学是掌握知识的必要环节,在计算机应用基础课程的教学中更是有着举足轻重的作用。本文以《大学计算机基础》课程为例,介绍采用客户机/服务器(C/S)结构模式结合B/S模式,开发网络实验教学系统的设计思想和功能模块。通过两种模式的互补作用,实现学生快速、方便的实验资源的使用,提高学生的实践能力。其设计界面友好,操作简单,功能齐全,实用性强,为实验教学提供了一种个性化学习平台。
我有一间神奇的小屋,它有三层:第一层是洗手间和厨房,第二层是卧室和书房,第三层是一个小阁楼。  洗手间里有一个密码控制器,按下红色的按钮,就会有一扇门打开。门里有一条密道,一直通往二楼的卧室。厨房里有机器厨师给我做饭,在紧急的时候,它还能保护我。  卧室的被子是鸡蛋煎饼做的,枕头是肉包子做的。只要我饿了,就可以吃一口香香的肉包,這就是传说中的“饭来张口”。  书房里有一道暗门,暗门里生活着一些神奇
为了对洋葱路由有一个清晰的认识和了解,在应用层上设计实现一种简单的洋葱路由器软件,并展示实现结果。实际结果证明在应用层上设计实现洋葱路由的可行性和通用性。
针对数字家庭网络应用环境,研究远程家庭设备控制问题,采用OSGi平台与UPnP技术相结合的方法,提出一种使用方便、费用低廉的基于OSGi家庭网关的UPnP设备远程控制系统架构,描述系统
为解决数据中心发生火灾带来的直接经济损失和数据丢失导致的间接损失,通过分析数据中心的电气火灾多、难以散热和火灾扑救困难等火灾特点,总结了针对数据中心选用气体灭火系