论文部分内容阅读
图书内容索引在西方长期受到广泛的重视,西方读者习惯于使用图书内容索引来检索自己所需的内容。图书内容索引编制的好坏,通常作为评判图书质量的重要指标之一,图书内容索引也是国际学术著作通行的惯例,是图书结构规范化和标准化的要求。但在我国,现代编辑出版几乎不编制图书内容索引。究其原因,这主要和我国缺乏图书内容索引编制工具有关。我国的图书内容索引主要依靠手工编制,耗时耗力,这直接导致图书内容索引得不到普及,不能发挥其应有的作用。自机编关键词索引思想提出以来,国外机编索引技术发展迅速。从设想到实验,从试验到应用,涌现了一批著名的索引工具。1992年《标引软件指南》(第4版)上收录了10种较稳定和流行的专用软件。美国索引协会按照专用索引软件(DedicatedIndexing Software),网络索引软件(Web Indexing),嵌入式索引软件(Utilities andAdd-ons)对现有的索引软件进行分类。本研究的目的就是通过借鉴国外先进的索引技术和索引工具的开发经验,开发出适合于编制中文图书索引的软件。论文首先通过使用国外各种索引工具,分析其在编制图书内容索引过程中体现的强大功能特点。在此基础上,针对目前国内索引工具的不足,设计系统的各个功能模块。图书内容索引软件能够辅助标引人员进行排版,校对等事务性工作,从而将标引人员从繁重的重复劳动中解救出来。论文从图书内容索引的编制机制出发,描述了计算机编制图书内容索引的流程。然后在分析国内外各种索引工具的功能特点的基础上,结合国内外专家对中文索引工具提出的功能要求,对中文图书内容索引软件应具备的基本功能进行了阐述。论文随即探讨了利用计算机编制索引存在的一些技术难题,包括文本处理,自动标引等技术。其中自动标引技术是本系统的难点与创新点。最后汇总国内外索引学专家的意见,提出了索引编制系统的功能需求,并给出系统的模块设计和功能介绍,对系统的功能进行了测试和评价。总之,本文全面系统地总结了目前国内外索引软件的功能特点,为系统的索引编制功能提供了很好的借鉴。同时,本文中采用的基于N-gram标引方法和基于词典的标引方法,经测试结果证明,具有较高的准确率,有一定的实用价值。