web超链分析应用研究

被引量 : 6次 | 上传用户:yl2590
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断发展,网络已成为人们发布和获取信息的主要平台。由于互联网是一个高速增长、完全不受控制的异构信息集合,因而无论是web信息资源的利用,还是web拓扑建模,经典的信息挖掘技术和数据建模方法都很难得到有效应用,而超链分析的引入和应用为这些问题的解决提供了一条崭新的思路。本论文在对超链分析思想进行初步分析的基础上,着重就超链分析在web信息资源检索、web资源发现以及web拓扑结构建模等方面的应用进行了详细的研究。 由于超链接关系和引文关系在形式和功能上极其相似,因而引文分析的方法和思路被广泛应用于超链分析之中,但互联网动态、异构分布、无序增长等特点使得超链分析所需解决的问题更为复杂。因而,超链分析方法不仅仅只是简单的从算法上进行实现,还需要融合社会网络分析方法、复杂系统理论以及拓扑建模等技术,系统地对web超链接结构和web信息实体行为之间的关系进行研究。 对于一个特定的信息检索系统,影响检索效率的因素主要是系统对特定信息的覆盖率和对信息相关性判定的准确性。而在web环境下,信息检索的主要问题已不是覆盖率,而是如何能够滤出与查询无关的噪音,以获取准确、有用的信息。超链分析为此提供了一个量化“相关性”的自然方法。本论文的第二章对超链分析在网页爬行、关联网页发现、网页排序优化以及检索结果聚类等领域的应用情况进行了分析,并从超链分析和传统信息检索理论相结合、超链分析和用户网络行为分析相结合、以及超链分析之间的融合三个方面探讨了超链分析在web信息检索中的发展趋势,研究认为不断优化的超链分析方法丰富了现代信息检索理论,它能够有效地提高网络信息检索效率和改进搜索引擎的质量。 网页作者创建链接的过程并不是随意和无序的,而是以此作为扩展信息传播和交流空间的平台,并以相近社会背景或学科背景联结在一起,在极度分散和无序的web中,形成一个个的主题集合,并以这些主题为核心聚集了成千上万个的虚拟社区。可以说,以结构挖掘为基点的超链分析方法,为网络资源发现提供了一个量化资源“权威性”和虚拟社区发现的自然机制。本论文的第三章从一般网络主题发现方法、权威性网络主题发现方法、以及网络社区发现等三个方面对
其他文献
诚信是维系经济和社会正常运行的重要力量,是一个国家、一个民族、一个社会文明程度的重要表现。诚信是一切道德的基础和根本,是一个人必须具备的道德素质和品格。青年大学生
自从1890年,美国律师沃伦和布兰迪斯联名发表《隐私权》一文以来,隐私权就渐渐地在法律领域中占据一席重要之地,不仅在英美法系国家得以确立其为基本权利的地位,在大陆法系国
作为管理方法的一种,项目管理理论和方法从18世纪诞生以来,发展到现在,逐步完善,在诸如军事、IT、建筑等行业取得了巨大的成就。如今项目已经不再是IT、建筑等行业的专有名词
依法行政是依法治国基本方略的重要组成部分。从我国推进依法行政的进程看,现阶段保证依法行政最为关键的问题,就是加强对行政权力的规制,保证行政权力的正确运行,而这种规制
商誉问题,一直是会计理论界关注的焦点。在会计要素的确认及计量中,争论最大,讨论时间最持久,至今仍有分歧的,莫过于商誉问题。本文通过对各种商誉概念的细致分析,提出了商誉
以《普通高中地理课程标准(实验)》为核心的新一轮高中地理课程改革即将全面实施,而目前与高中地理新课程相配套的情景要素库建设仍几乎是一片空白。纵观目前国内外关于高中
人类社会进入了以知识经济和信息技术为特征的21世纪,世界范围内的综合国力竞争日趋激烈,全球一体化进程加速。在这样的时代背景下,对于人的素质的要求也越来越高了。培养具
人力资源会计运行,除了要有完善的人力资源会计的确认、计量、记录和报告等理论内核,还要有环境条件的支持。 本文首先从人力资源会计运行的理论意义和现实意义入手,分析
近些年来伴随着社会市场整体经济的飞速发展,由于合同关系着企业自身的生产运营以及未来长久发展方向,其逐渐成为了企业所需要的关键性依据。但是实际的生产生活中,国内的部
江西鄱阳“四洪”,是指生活于两宋之际的洪皓及其子适(Kuò)、遵、迈四人。从宋哲宗元祐三年(1088)洪皓出生,到宋宁宗嘉泰二年(1202)洪迈去世,共一百一十四年。洪氏父子的活