面向主题的网络蜘蛛技术研究及系统实现

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:jchangmafco
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
首先研究了面向主题的网络蜘蛛的关键技术:抓取目标描述、网页分析算法和网页搜索策略等,在此基础上,设计并实现了一个面向主题的网络蜘蛛系统(简称主题蜘蛛),采用向量空间模型来计算网页的主题相关度,使用改进的Shark-Search网页搜索策略来决定待抓取链接的访问次序,从种子网页开始,只爬行具有较高预测相关度的链接,仅采集与主题相关的网页,多线程对网页进行下载和分析,提高了主题网页采集的精度.
其他文献
提出了一种新的滤波方法,使用适当窗口在图像上滑动,计算该窗口中心像素的块均匀度,并与整幅图像的块均匀度比较,自适应地确定窗口中心像素是否为噪声点;然后统计该窗口中噪声点的个数,自适应地调整滤波窗口大小,最后自适应地计算权值,并采用改进的加权中值滤波方法对噪声点进行逐点滤波.模拟实验和分析结果表明该方法是有效的,既能有效地去除图像噪声点,又能较好地保持图像细节部分,为去除图像中的噪声提供了一种新的方
代孕作为一种新型人工辅助生殖技术,涉及法律、伦理等复杂关系。目前我国代孕市场暗流汹涌,社会舆论纷纷谴责,而相关法律却不健全。简单的禁止性规定并不能抑制代孕现象的出
对一种新型半绝缘SOIMOS器件的阈值电压进行建模,该器件采用源漏注氧OISD技术,具有优良的自加热效应抑制能力和耐压特性.由于沟道中存在复杂的二维势场分布,OISD MOSFET阈值
大数模乘和模加/减是椭圆曲线密码学(Elliptic Curve Cryptography,ECC)中的基本运算.通过分析改进的Montgomery模乘算法,把模乘运算划分成3个阶段映射到3级流水线电路中,并