【摘 要】
:
因特网自从诞生发展到现在,网络信息资源在不断地快速增长,资源的形式也变得多种多样。要从浩如烟海的网络资源中寻找到需要的信息,搜索引擎是必不可少的工具,搜索引擎也越来
论文部分内容阅读
因特网自从诞生发展到现在,网络信息资源在不断地快速增长,资源的形式也变得多种多样。要从浩如烟海的网络资源中寻找到需要的信息,搜索引擎是必不可少的工具,搜索引擎也越来越受到人们的重视。目前,搜索引擎技术正成为计算机工业界和学术界争相研究、开发的对象。随着对搜索引擎的研究越来越深入,Web搜索引擎技术也不断的向前发展,现在搜索技术的发展趋势是无处不在,未来的竞争不仅限于互联网,本机、局域网、企业网内部以及无线网都将被包括在内。十几年来,Web搜索引擎的发展经过了集中式检索阶段、分布式检索阶段和智能化检索阶段,相关技术也从早期的主要依赖传统检索技术发展到综合人工智能、自然语言、并行计算,数据挖掘等跨学科,多门类技术。当前搜索引擎技术的研究集中在自动化、智能化检索和提高检索精度几个方面。未来的搜索引擎还需要不断扩展其附属功能,要能够实现多样化和个性化,以适应不同层次用户的多种信息检索需求。本文首先介绍了搜索引擎的基本知识和发展现状,并简单说明本文的主要工作,然后对搜索引擎的组成结构和工作原理进行了详细的分析,并对搜索引擎的性能指标进行了基本的介绍。接下来,本文对Web搜索引擎的几个重要技术:数据挖掘技术和中文分词技术进行了分析和讨论。数据挖掘技术是用于快速有效地提取各种类型的信息,中文分词技术则能够显著地提高中文搜索引擎的准确率。
其他文献
随着网格技术的迅速兴起与发展,对网格数据管理的研究也越来越广泛和深入。网格数据管理作为网格系统最基础和核心的功能部件之一,它主要是与远程数据传输、远程文件I/O 相关
近几年来,不确定性数据广泛出现在传感器网络,Web应用等领域中,对不确定性数据挖掘算法的研究已经成为了数据挖掘领域的新热点。不确定性数据挖掘主要包括聚类、分类、频繁项
在软件技术越来越发达的今天,基于构件的软件工程从根本上改变了软件开发方式,成为现代软件工程进步中的一个里程碑。软件复用技术的出现,提高了软件开发速度和质量,降低了开
视觉是人类接收信息的主要渠道。空间信息可视化,能让人更直观、更形象地认识和理解真实的地理空间。近年来,研究利用GIS、虚拟现实、计算机三维图形等技术构建虚拟环境,实
本文对H.264标准进行了深入研究,分析了其使用的关键技术,包括帧内预测,可变大小的图像分块,1/4和1/8像素精度的运动估计,残差图像的4×4整数变换编码,熵编码(CAVLC和CABAC)
本文主要研究了以下两方面的内容:在向量化蛋白质序列过程中所使用的生物学单词,以及用来解决单词多义性问题的潜在语义分析技术.为了克服其他方法中向量化蛋白质时计算代价
本文的主要研究内容是如何设计和实现一个功能强大,高效的网络信息发现平台。首先,本文介绍了网络信息发现的技术现状及面临的挑战,并介绍了几个优秀的网络信息发现工具
本文对入侵容忍技术与PKI技术相结合方面进行有益探索。提出了一种具有更高安全性的入侵容忍CA认证中心的设计方案和基于入侵容忍的CA认证中心的签名方案,最后对其安全性进
本文从可靠性分析、基于可靠性约束下最小维修成本的模型研究、考虑维修间隔期对组成设备的元件和可靠性结构可用性影响的分析着手,对设备可靠性指标、设备维修间隔期、设
模糊集是研究和处理模糊性现象的数学工具,在众多领域得到了广泛的应用、取得了丰硕的成果。直觉模糊集是对经典的Zadeh模糊集理论的拓展,在经典模糊集理论的基础上增加了非隶