一种高效的分布式爬虫系统负载均衡策略

来源 :计算机工程 | 被引量 : 0次 | 上传用户:ckforme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统分布式爬虫系统负载均衡方法仅考虑少量的负载影响因素,未对各爬虫节点负载情况进行全面有效的评估,使得任务量的分配不合理。针对该问题,提出一种面向分布式爬虫系统的高效负载均衡策略。分析影响爬虫节点运行时间的因素,采用BP神经网络构建基于多影响因素的非线性分布式爬虫节点运行时间模型。以该模型预测的各子节点运行时间的最小方差为负载均衡策略的目标函数,并利用带约束条件的改进粒子群优化算法求解目标函数,确定负载均衡的任务分配方案。实验结果表明,该负载均衡策略在满足爬虫节点高性能要求的前提下,能有效缩短分布式爬虫系
其他文献
目的分析护士工作压力管理在护士管理中的应用价值。方法选取2016年1月~12月护士60名作为研究对象,随机将其分为对照组与观察组,各30例,对照组护士行传统护士管理方法,观察组
企业文化作为一个企业精神的集中体现,是所有企业职工的共同价值认识。在企业文化中,最核心的组成部分就是企业职工文化。企业职工文化的本质是通过不断解放人性,从而使集体力量
期刊
九年义务教育《语文课程标准》当中要求:改变原有的单一的接受式学习模式,倡导“自主、合作、探究”的学习方式。在语文课堂教学中倡导合作学习能改变过去教师“满堂讲”“满堂