一个集群系统上的网络信息采集器

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:jhh760606
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着硬件和网络技术的发展,集群系统已成为构建网络服务的重要方式.基于集群系统提供网络信息检索服务(如搜索引擎等)具有很大的应用价值.网络信息检索的工作基础是从网络空间采集检索数据,通常由信息采集系统完成.本文介绍一个集群系统上的网络信息采集器.该采集器利用WWW网页之间的链接关系对采集空间进行宽度优先遍历.采用多线程并发方式来提高单结点上的带宽利用率;并在多结点间实现了简单有效的协同工作机制.
其他文献
传统的乐观并发控制策略利用了一些不必要的事务重启来保证数据的一致性,事务重启能够极大的增加系统载荷以及加强资源和数据的竞争,在分布式环境下,由于系统的复杂性和较高
提出一种基于服务窗口的P2P视频点播模型,有效解决了流媒体服务器负载能力在各个流之间的均衡分配的问题,同时融入带宽预留机制,以应对突发性连接请求.仿真结果表明,此模型具
噪声无处不在,而样本中含有噪声会对神经网络学习的效果产生重要的影响,因此,对神经网络容噪性的研究具有重要的实际意义.通过实验分析了样本数据中噪声、噪声频率及样本数据
对汉语 TTS系统的大规模语料库做了基本的韵律参数统计 ,分析了音节的韵律特征与其所在的韵律结构位置以及韵律结构边界的关系 .进一步 ,对有调音节样本集基于基频包络采用 k中心点算法进行聚类 ,通过听辨实验检验了聚类结果 ,并分析了音节聚类与其所在韵律结构之间的对应关系
本文算法先将原始模型上的每一点沿各自的法矢量方向偏移一定的距离 ,使整个原始模型收缩或扩张 ,生成内外两层包络 .在构造包络时采用了一维搜索中的二分法来逼近最佳偏移值 ,以保证原始模型尽可能简化 ,然后依次选择原始模型上的一些三角形 ,将其三个顶点合并 ,收缩成一个三维点 .如果这样收缩简化后的模型依然位于两层包络围成的空间中 ,则收缩操作产生的误差被认为是可接受的 ,这也就保证了简化模型与原始模
在煤矿开采作业中,通风是安全管理工作的重要内容,由于矿井开采的特殊性,只有保证足够的通风条件,才能够确保生产的安全进行。瓦斯是矿井开采中最具有威胁性的物质,其无色无
QC-tree是一种组织数据立方的有效数据结构,不仅可以降低数据立方的存储开销,而且能够保持数据立方的语义关系.QC-tree的原始构造算法分为两个阶段,由于涉及到临时类的生成和
从保护用户托管私钥安全与防止用户逃避密钥托管的角度出发,研究了一种基于PKI的电子商务密钥托管方案。提出了密钥托管的概念及其执行机构密钥托管代理(KEA),分析了密钥托管系统的结构