基于PageRank的网页主题相关性算法研究

来源 :光盘技术 | 被引量 : 0次 | 上传用户:frontwave
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为主题网络蜘蛛搜索策略的核心部分,主题相关性判断算法是网络蜘蛛能够围绕设定主题进行聚焦检索的关键。本文针对现有基于链接结构的相关性算法PageRank算法的不足,提出了基于网页主题相关度的改进PageRank算法。理论分析和实验表明,相对于传统的信息采集策略,改进的策略在准确率和召回率方面具有明显的优势。
其他文献
以建筑废弃物粉煤灰砖块为原料,经破碎、筛分成不同粒径制备粉煤灰砖颗粒(简称FAB),研究了三种不同厂家的粉煤灰砖对水体中磷的去除效率。成分分析结果显示相对于粉煤灰原灰,FA
网络教学研究已成为当今教育领域的一大热点。我们必须把握机遇,迎接挑战,以树立现代教育思想为先导,将信息技术合理有效地应用于语文教育教学改革,推动面向二十一世纪基础教
随着改革开放的不断深入发展,市场经济在人民群众合法经营下稳步发展,但仍有不法分子在利益的驱使下从事非法经营,给经济市场以重大冲击。那么在新时期下,如何有效地打击非法
本文针对外延逻辑的局限性,运用格值偶逻辑(LVPL)的理论,提出了内涵逻辑建构及形式化的初步设想,并指出这些设想可能成为设计人工智能机的逻辑基础与数学基础.
本文针对运行将近20年的烷基化碱洗沉降罐内壁表面出现的许多裂纹和鼓包,进行解剖分析,并提供了大量理化检测资料,证明裂纹属于氢诱发开裂。其本质是氢损伤。 In this paper