反馈式FTP搜索引擎的实现

来源 :天津大学 | 被引量 : 0次 | 上传用户:e7889620621
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类社会已经步入了一个信息量高速增长的信息化时代。搜索引擎技术使得人们能够更方便的寻找信息。但是,信息的持续增长让传统的搜索引擎也显得难于处理,为了解决海量Web信息的搜索问题,人们提出了新一代搜索引擎技术的概念。本文所研究的反馈式搜索引擎(FSE)正是新一代的搜索引擎技术的一种,文章展示说明了反馈式搜索引擎框架的概念,工作原理和核心算法。同时,本文介绍了一个开源搜索引擎Nutch,并且参考它的结构和解决方案实现了一个反馈式FTP搜索引擎。该FTP搜索引擎采用了内容相关性挖掘算法作为其实现反馈式功能的核心算法,这个算法对用户使用搜索引擎期间的点击行为作出合理的统计分析,从而提高返回结果的质量。对于搜索引擎技术来说,考虑用户的点击行为并做相关性挖掘工作是一个很有意义的尝试和创新。最后,文章根据反馈式搜索引擎框架的优缺点和有待改进的地方做出进一步总结和展望。
其他文献
随着Web技术的不断发展,Web服务逐渐广泛的应用于各个领域。服务发布者将自己定义的Web服务注册到UDDI注册中心,让服务使用者能够发现并访问服务。但是由于UDDI的开放性,注册到U
医学图像的三维表面重建可为医生提供逼真的三维表面效果图,这些三维图形对医生分析病人的病情起到了很大的帮助作用。然而,由医疗设备得到的断层图像相邻两层间的距离要大于同
随着计算机网络的普及,越来越多的资源以数字形式在网络上传播,软件产品已经渗透到工农业生产、商业活动和日常生活的各个方面。随之而来的是日益严重的盗版问题。现在,各种
近年来,计算机应用正以各种方式越来越快地渗透到各个领域之中。其中以数据库,尤其是关系数据库的应用最为广泛。关系数据库以集合代数为基础,利用关系模型来建立问题和领域
粒子群优化算法(Particle Swarm Optimization,简称PSO)是一种基于个体进化与群体协作和竞争的随机搜索算法。由于其过程简单明了、易于实现、计算效率高等特点,被公认为可以与遗
随着计算机系统和网络的广泛应用,可用性和高性能成为计算机系统所追求的目标,集群技术的出现和发展很好的解决了这两个问题。集群就是由一些互相连接在一起的计算机构成的一
基因表达数据是通过DNA微阵列技术获得的关于一组基因表达过程及其调控信息的定量描述。研究基因表达数据,获取有意义的基因簇,对于研究生物现象背后的本质、遗传性疾病的诊
在如今信息过载的互联网世界中,推荐系统扮演着越来越重要的角色。根据各种网络服务平台上数字产品的特征不同,对推荐系统功能、性能上的需求也会有较差异,数字音乐产业也不
企业信息系统在适应变幻莫测的市场需求时必须能够有效的集成已有软硬件及数据资源,由于原有信息集成技术的能力不足逐步显现,使得基于ESB的企业信息集成方法与技术已成为当
Ad hoc网络是一种无中心自组织的无线网络,其不依赖基础设施,因此在军用、民用等很多领域都有广泛的应用。因为Ad hoc网络主要由一些移动便携设备组成,这些设备通常只有有限