【摘 要】
:
本文的研究目的在于设计和实现网络爬虫,该模块是Web应用程序漏洞评估工具的重要组成部分,设计和开发Web应用程序漏洞评估工具目的在于扫描网站、识别安全漏洞并且给出扫描评
论文部分内容阅读
本文的研究目的在于设计和实现网络爬虫,该模块是Web应用程序漏洞评估工具的重要组成部分,设计和开发Web应用程序漏洞评估工具目的在于扫描网站、识别安全漏洞并且给出扫描评估报告。网络爬虫同样被称为搜寻器或机器人,是一种自动从网站上下载WEB页面的程序。设计网络爬虫的主要目的在于恢复WEB页面。爬虫的主要目标在于下载一系列重要的页面,刷新已下载的页面,发现新的页面和保证页面拥有一个合适的展现。网络爬虫同样被用在信息提取上,例如提取商业情报,一个公司可以利用网络爬虫从WEB网站上提取关于他们竞争对手的信息。网络爬虫的其他应用在于监测WEB页面和搜索引擎。爬虫使得通过WEB页面中的超链接自动提取网页中的信息来实现上述功应用变得可能。一般来说,爬虫开始都是从一个初始的页面中提取超链接,然后从这些超链接中得到更多的页面信息,直到页面数量达到一定的规模或者已经实现某些较高的目标。在这个简单的叙述下面有更多复杂的研究点,例如可以利用的资源就包括带宽使用、硬盘空间、网络连接、爬虫陷阱、URLs分类、HTML和动态页面内容的分析。WEB的动态特性给网络爬虫的实现带来了挑战,如果WEB页面是静态的,爬虫只需要做少量的工作,因为爬虫可以维持一个它已经获得的页面列表信息,但是爬虫必须处理页面更新和删除问题。
其他文献
无线技术迅速发展,蜂窝网络就是由一些无线电蜂窝组成的无线电网络。所有的蜂窝都由一个叫做蜂窝站点或者基站的固定的交换中心为其提供服务。这些蜂窝将覆盖不同的地域来提
磁记录存储设备在我们同常生活和工作中有着不可或缺的作用。本文对磁记录信道中的一些关键技术进行了研究,以进一步提高磁记录设备的读取速率及可靠性。本文介绍了广泛应用的
手机等移动设备技术平台的发展和普及,为语音技术的应用提供的新的发展平台和契机,语音技术在移动手持设备平台的应用发展,也必将推动移动设备更加智能化,并为更多适用人群所接受
J2EE是当前成长最快的技术架构,它已经成为开发复杂企业级应用的首选。Struts+Hibernate体系架构能为企业级J2EE Web应用带来新契机,但它还处于试用和摸索阶段,许多问题有待
本文详细论述了在指纹识别系统中数据库模板形成时关于指纹对齐算法的研究和资源受限条件下指纹图像处理及识别方面的工作,包括理论基础、实现步骤、测试结果以及对算法的分
在嵌入式系统的开发过程中,仿真器是一个必不可少的开发工具。特别是对于初级嵌入式系统开发工程师,借助一个功能强大的仿真器进行开发工作,可以达到事半功倍的效果。一个嵌
WiMAX(Worldwide Interoperability for Microwave Access,全球微波接入互操作性)技术是以IEEE 802.16系列标准为基础的宽带无线接入技术,近年来发展迅速。在向宽带化、移动化
随着数字电视的普及,高清的数字电视节目进入了千家万户,然而,这个技术在给用户带来高清视频的同时,也给节目版权带来了新的问题:用户可以非常简单地非法录制和分发解扰后的数字电
运动目标跟踪在自治车辆导航,机器人控制,基于运动的识别,视频压缩,基于视觉的控制,人机接口,医学成像,增强现实和视频场景监控中都具有重要的应用前景。随着应用的推广,各种