【摘 要】
:
随着Web的不断发展和数据量的增加,Web用户越来越依靠搜索引擎来检索信息。特别是对于企业用户,从Web上搜集信息、感知竞争变化、了解竞争对手动向、制定经营战略和竞争决策
论文部分内容阅读
随着Web的不断发展和数据量的增加,Web用户越来越依靠搜索引擎来检索信息。特别是对于企业用户,从Web上搜集信息、感知竞争变化、了解竞争对手动向、制定经营战略和竞争决策尤为重要。数据挖掘技术具有从大量复杂数据中发现规律的能力,因此,将数据挖掘的思想和方法应用到搜索引擎中:针对企业建立搜索引擎从而提高企业用户检索信息的效率,帮助用户从海量信息中得到真正有价值的情报,指导企业的经营战略和决策,有重要的实际意义。论文以某企业情报部门为企业内部建立的网站中搜索引擎系统为背景展开。分析了该企业竞争情报系统的需求;系统地研究了各种搜索引擎及Web挖掘技术特点;提出了一个适合于企业应用领域的竞争情报子系统构架;设计并实现了该企业内部网的搜索引擎子系统。论文讨论的内容包括:1.综述了数据挖掘的主要方法、常用技术以及挖掘过程;讨论了Web挖掘的定义、分类、流程、应用领域、研究方向以及当前面临的问题。2.深入探讨了面向特定主题信息的专业搜索引擎所采用的各项技术,为企业提供特有的检索服务确定了技术路线。3.结合实际的项目,将数据挖掘中的文本挖掘和结构挖掘等技术应用到实际项目中,搭建了系统结构,并给出了部分实现以及运行效果。
其他文献
在许多实际工程和科学研究中,混沌现象已经成为普遍存在,因而对混沌的研究显得越来越重要。本文采用理论推导和数值模拟相结合的方法对混沌系统的同步方法做了研究,取得了如下成
存储网格是网格技术发展的一个重要组成部分。它将分布在网络中的计算机集合起来,充分利用各个计算机的计算资源以整合出一个强大的计算系统一样,它将网络中的存储系统进行了整
随着数据库技术的飞速发展以及人们获取数据手段的多样化,人类所拥有的数据急剧增加,如何从规模越来越大的数据库中提取出人们感兴趣的信息以及知识,即数据挖掘技术早已成为
随着数据中心技术的不断发展,以及数据中心应用的不断产生,不同数据中心应用对网络提出了不同的性能要求。这导致了许多新的数据中心技术不断被提出。Web应用作为数据中心中
移动设备的飞速发展在给人们的生活带来便捷的同时也大大增加了个人隐私泄露的风险,移动设备的数据存储、信息通信的安全性问题受到人们越来越多的关注。P2P技术是无线网络环
随着Internet和Web技术的飞速发展,WWW已经成为人们进行信息交流不可缺少的巨大信息空间。面对如此大量的信息,人们在寻找自己所需要的信息时常常迷失方向。如何快速、准确的从
实时分布式系统的任务调度问题是一个富有挑战性的课题,也是当前的一个研究热点。由于任务调度是一个典型的NP问题,同时它又是直接影响分布式系统性能的关键因素,因此,研究实
近年来,生物医学领域的在线文献数量呈指数增长,大量的文献查询费时费力,无法高效地提供给用户所需的生物医学信息。信息检索技术和信息抽取技术在生物医学领域的应用,极大地
网格是将地理位置上分散的异构计算资源,存储资源和数据资源聚集起来提供资源全面共享的技术。网格门户是用户使用网格服务和网格资源的接口,需要完成网格作业的全局调度,是网格
本文以非线性理论中分形理论为基础,研究了几种快速分形图像压缩方法,具体研究内容如下:(1)基于分形的图像压缩编码是一种不对称的编码方法,编码时间长,而解码时间却很短。传