论文部分内容阅读
为了满足化工领域专业搜索的需求,我们研究室开发了化工专业搜索引擎。该搜索引擎需要对大量的文件做读写操作,这会消耗大量的系统时间,从而显著降低了搜索引擎的工作效率。因此,有必要开发专用的文件服务系统,为搜索引擎提供高速的文件读写服务。 本文设计并实现了化工专业搜索引擎专用的文件服务子系统,该子系统能够响应来自搜索引擎的文件读写请求,从而为搜索引擎提供高速的文件读写服务。该系统采用基于JAVA平台的分布式对象技术RMI实现,使用压缩打包的方式对文件进行存储和管理。有效地满足了搜索引擎对文件操作的需求。 该搜索引擎已经实现了对HTML文件的解析,但是还需要对网上许多其他不同类型的文件进行解析,以实现对这些文件的索引,从而使用户通过使用该搜索引擎能够检索到这些文件资源。本文继续这方面的开发又实现了对Excel文件的解析,为对这种类型的文件进行索引创造了条件。 以上代码均经过测试,可以稳定运行。文件服务子系统的实现对化工专业搜索引擎性能的提高有着较为明显的作用。而对Excel文件解析的实现则进一步完善了该搜索引擎的文件处理器的文件解析功能。