基于内容的搜索引擎技术研究及其应用

来源 :郑州大学 | 被引量 : 0次 | 上传用户:seakider
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对在大量网络信息中进行快速搜索所关注信息问题,对基于内容的信息搜索引擎进行了分析和研究。主要内容包括:搜索引擎的发展与研究现状、搜索引擎中采用的spider原理、信息搜集策略、以及信息的提取与分析所涉及的数据挖掘、智能代理技术等。同时根据烟草行业应用实际,在分析实现信息搜索的机制与原理、主题相关度分析算法及分词技术的基础上,在中国烟草科教网平台上采用建立SQL SERVER索引数据库和C#开发语言,设计开发了一种基于内容的信息搜索引擎。实际应用效果表明,该搜索引擎对减少工作人员的重复性劳动强度,提高工作效率和质量,促进烟草行业办公自动化水平,有良好的社会效益与经济效益。本应用研究在主题相关度分析算法及分词技术等方面有一定的学术意义和推广应用价值。
其他文献
Web服务和对等网络是当前的热门技术。两者具有一定的互补性,因此可将这两项技术进行一定程度的整合。在P2P平台上实现Web服务不但可使Web服务分散,实现应用之间的松耦合;还
对于网络拥塞的控制,首先需要了解流量特性并建立准确的流量模型。传统的网络业务模型只能描述其短时相关性,研究发现网络流量具有长相关性,因而具有自相似性。FARIMA(p,d,q)
近年来,随着生物信息计算、网络入侵检测、文本检索等领域的发展,如何从序列数据中快速地提取用户感兴趣的、有意义的模式成为了一项关键的研究课题。对于已有的模式定义,最
在软件开发历程中,软件系统架构设计一直起着关键的作用。对于规模较大的企业级应用而言,系统架构不仅会影响到系统设计和开发的进度,也会直接影响到系统的后续发展潜力,甚至
汽车电子技术的迅猛发展,引发了汽车控制领域深刻的技术变革,目前汽车网络正朝着总线化的方向发展。CAN总线是目前被众多汽车产业广泛采用的汽车网络主流协议,FlexRay总线是
多模医学图像配准为医生利用多种模态的医学图像信息、提高医学诊断和治疗的准确性打下了基础。基于互信息的配准方法由于无需预处理、准确性高、稳健性好等特点,是当前医学
Web services定义了应用程序如何在Web上实现互操作性的一套标准,它可以在网络中进行跨平台跨语言的描述、发布、查找以及调用。因此Web services给应用程序的集成带来了方便,
因特网(Internet)在给人们生活提供便利的同时,也产生了许多意想不到的问题,计算机安全就是其中一个突出的问题。网络入侵检测系统作为当前网络安全体系框架中的重要组成部分
随着嵌入式实时系统的应用越来越广泛,安全问题显得越来越重要。嵌入式系统一旦出现安全问题,其后果不但严重干扰人们的日常生活,侵犯公民隐私,造成巨大的经济损失,甚至威胁