专业搜索引擎中文件服务系统设计与实现

来源 :北京化工大学 | 被引量 : 1次 | 上传用户:ArchrSaber
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了满足化工领域专业搜索的需求,我们研究室开发了化工专业搜索引擎。该搜索引擎需要对大量的文件做读写操作,这会消耗大量的系统时间,从而显著降低了搜索引擎的工作效率。因此,有必要开发专用的文件服务系统,为搜索引擎提供高速的文件读写服务。 本文设计并实现了化工专业搜索引擎专用的文件服务子系统,该子系统能够响应来自搜索引擎的文件读写请求,从而为搜索引擎提供高速的文件读写服务。该系统采用基于JAVA平台的分布式对象技术RMI实现,使用压缩打包的方式对文件进行存储和管理。有效地满足了搜索引擎对文件操作的需求。 该搜索引擎已经实现了对HTML文件的解析,但是还需要对网上许多其他不同类型的文件进行解析,以实现对这些文件的索引,从而使用户通过使用该搜索引擎能够检索到这些文件资源。本文继续这方面的开发又实现了对Excel文件的解析,为对这种类型的文件进行索引创造了条件。 以上代码均经过测试,可以稳定运行。文件服务子系统的实现对化工专业搜索引擎性能的提高有着较为明显的作用。而对Excel文件解析的实现则进一步完善了该搜索引擎的文件处理器的文件解析功能。
其他文献
移动Ad hoc网络具有组网速度快、抗毁、自愈能力强等优点,在军事和民用领域得到越来越广泛的应用。Ad hoc网络研究的创新性、前沿性、多学科交叉性以及实用性,使得这一研究领
图像序列中动态目标的检测与跟踪已成为计算机视觉的一个重要的研究方向。随着计算机硬件技术和计算机视觉技术的发展,基于计算机视觉的ITS、无人侦察技术等称为可能,其中视频
Internet具有的海量、异构、动态变化等特性使Web信息抽取不同于传统信息抽取,同时带来了新的挑战。首先,面对呈几何级速度增长的巨大的Web信息空间,如何自动高效地处理海量W
现在社会人们生活水平不断提高,对自身健康越来越关注,医疗图像诊断广泛应用。数字医疗兴起,医用显示器取代胶片成为影像诊断的主要工具。医用显示器具有高稳定性、整体一致等特
广义上,程序设计过程就是定理证明过程,因而程序综合与机器定理证明关系密切。通过一般情况下,构造性的证明过程才能抽取程序。归结原理是一种反证法,人们早已知道可以从归结
当前城市交通系统的发展重点是如何在Internet环境下建立交通应用系统,实现广域范围内的资源共享与协同操作。传统的软件技术体系无法有效地适应城市交通系统发展过程中所呈
本文首先介绍了数据挖掘的概念、任务及应用;其次给出关联规则的概念、属性、形式和种类;再次对关联规则挖掘技术的几种算法进行了研究分析,给出Apriori算法和FPgrowth算法的优
在数据挖掘领域,聚类分析是一种从大数据集中寻找信息的有效方式。聚类分析被广泛地应用于各种领域,作为信息发现提供信息支持。蚁群算法是模拟蚂蚁觅食过程,寻找到食物源的
非线性理论是描述具有无规结构的复杂系统结构形态的一门新兴边缘科学。它包含了分形、混沌和孤子这三个非常重要的概念。本文侧重研究了分形学中具有重要意义的牛顿(Newton)
随着宽带网络技术和流媒体技术的不断成熟和发展,网络电视(IPTV,InternetProtocolTeleVision)技术正在走进千家万户。IPTV不仅能使普通家庭用户可以随时使用他们最熟悉的电视机