网络爬虫实时控制器的设计与实现

来源 :现代计算机 | 被引量 : 0次 | 上传用户:schoolnowl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对个性化数据采集,提出一个轻量级网络爬虫框架,该框架包括控制器、下载器、解析器、线程池和代理池等组件。在此框架下,设计一个具有实时处理能力的爬虫控制器,能够自动保存和恢复任务场景。详细介绍爬虫控制器的工作原理和C#实现,并将其应用于站内文章采集。实验结果表明:所提出的爬虫框架是高效易用的,控制器的实时处理能力在实际爬虫开发中非常重要。
其他文献
2008年8月——美国国家仪器有限公司(National Instruments,简称NI)近日在广州、大连两地成功举办第四届全国虚拟仪器技术教师交流会。本次交流会围绕”从理论到实现”这一主题
摘 要:解读剖析一幅山水画作品的风格、流派以及审美意蕴,通常都会从画家个体的角度出发,因为画家不仅仅是创作的主体,也是阐述作品、建构画面的先行者。文章重新审视在传统的叙事方式中偏执于画家构建画意的绝对性,选择从观者的角度出发,理解和阐述山水画发展过程中的意涵,重新认识山水画意,为山水画的意涵提供新的视野和更多的可能性。  关键词:山水画;画意;观者;互动  对山水画作品意蕴的理解是多方面的,不仅需
介绍采用高性能的ARM处理器LPC2210和具有USB Host功能的控制芯片ISP1161实现对USB大容量存储类设备进行读写,以及在FAT文件系统的基础上实现对文件进行各种操作的开发,阐述
本文介绍了一种运用于无线实时视频监控系统的基于反馈机制的带宽自适应策略.通过接收端统计视频数据包的接收情况,并反馈至发送端,调整发送端的分包及数据传输策略,获得流畅、低
目的:探究复杂性肛瘘MRI扫描技术在临床中的有效性评价。方法:入选2016年1月—2018年1月滨州市第二人民医院医学影像科100例复杂性肛瘘患者,对所有患者均实施MRI扫描技术,分