【摘 要】
:
当前 ,Web已经成为人们获取信息的主要渠道之一 .然而 ,用于表达 Web页面信息的 HTML语言存在着与生俱来的缺点 .HTML 的“标记”只是告诉浏览器软件如何显示所定义的信息 ,
论文部分内容阅读
当前 ,Web已经成为人们获取信息的主要渠道之一 .然而 ,用于表达 Web页面信息的 HTML语言存在着与生俱来的缺点 .HTML 的“标记”只是告诉浏览器软件如何显示所定义的信息 ,却不包含任何语义 .因此由HTML语言所表述的 Web页面经过浏览器分析后只适合人们浏览 ,不适合作为一种数据交换的方式由机器处理 .该文以文档对象模型 DOM为基础 ,把所要提取的信息在 DOM层次结构中的路径作为信息抽取的“坐标”,并以这个基本原理为基础设计了一种归纳学习算法来半自动地生成提取规则 ,然后根据提取规则生成 Java类 .生成的 Ja-va类可以作为 Web数据源包装器组成的重要构件 .
其他文献
随着计算机网络技术和多媒体技术的发展,网络已成为人们获取知识,学习技能的重要渠道。网络教学平台的研究与开发一直是校园网应用的重要方面。目前已有的校园网教学平台,大
分子识别是超分子化学研究的核心内容之一,它包括对中性分子、阳离子和阴离子的识别。由于无机离子在生物催化、生命科学、电子与信号的传递、环境保护等方面起着重要作用,因
2005年我国公司法正式确立了一人公司制度,同时引发了一人公司债权人保护研究热潮。从我国公司实践的情况来看,我国公司债权人承担了太多不应该由其承担的风险,这就使债权人
本文通过对南京市公园绿地实例的调查分析及国内外相关文献的阅读,探索当前公园绿地景观设计中缺乏人性化考虑和注重人性化考虑的案例,总结出营建人性化的公园绿地活动空间与
本论文是在“十一五”国家科技支撑计划项目—多功能林木采育作业关键技术装备研究与开发项目的基础上完成的,是此课题研究的一部分。随着社会经济的不断发展,对木材的需求量
红松(Pinus koraiensis)为我国东北东部地区地带性顶极群落建群种,但经过历史上长期破坏该树种数量明显减少。为恢复以该树种为主的地带性顶极群落,建国后在东北东部山地营造
<正> 祖国医学对水在人体内吸收、运化、布散、排泄等过程,均有比较细致的认识和独特的理论,对今天许多疾病的防治有很好的临床指导意义。本文从脏象学说角良出发,讨论体液在
研究3种非酿酒酵母与酿酒酵母在混菌发酵过程中生长的变化及对酒风味的影响。试验结果表明:非酿酒酵母的存在会降低酿酒酵母的发酵速率,与混合培养相比,连续培养能够提高非酿酒
拱结构和索结构被广泛应用在桥梁工程中以提高桥梁的跨越能力。拱结构主要被应用在拱式组合桥中,本文研究的拱式组合桥是由拱肋、吊杆或立柱、主梁组成的下承式拱桥、中承式