基于扩展锚文本的网页特征识别

来源 :苏州科技学院学报(自然科学版) | 被引量 : 0次 | 上传用户:qinyongj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于源网页的信息比目标网页的更具有区别性,提出通过提取源网页扩展的锚文本,进行目标网页特征识别。分析了不同位置的扩展锚文本,获取其XPath表达式,用于提取网页特征,并通过实验分析其性能。
其他文献
摘 要:管理信息系统是信息管理与信息系统专业的核心主干课程,是一门综合性很强的学科。同时,其他专业也开设这门课程,要求有所不同。本文基于西安科技大学信息管理与信息系统专业、电子商务专业、工商管理专业和物流管理专业四个专业的特点,分析了实验教学中存在的主要问题,对各专业实验教学的改革与实践进行了探讨。  关键词:管理信息系统;实验教学;教学改革  一、引言  西安科技大学管理学院管理信息系统课程应用
研究非保守力和非完整约束对Lagrange系统的Mei对称性和守恒量的影响。Lagrange系统受到非保守力或非完整约束作用时,系统的Mei对称性和守恒量都会发生变化。原有的一些Mei对
随着我国电力市场改革的启动和逐步发展完善,在竟价上网的过程中,所有的发电公司都想使自身的收益最大化,而电网公司却想使购电费用最小化,因此发电公司的报价策略显得越来越重要
利用通信系统中调制信号的循环平稳特性,对频谱空洞进行检测,提升频谱感知技术在低信噪比下的性能。实验结果表明:与传统能量检测方法相比,采用循环特征检测方法改善了认知无线电