论文部分内容阅读
近年来,档案处理技术已经朝着数字化、信息化、网络化的方向飞速发展。传统的纸质档案处理方法在一定程度上限制了档案信息的共享与查询,浩淼如烟的档案给“三化”提出了新的挑战。针对档案信息化中的两项关键技术:件符识别技术与检索映像技术,本文从理论基础、应用方式、仿真分析三个步骤展开了全面和深入的论述。件符识别技术是整个流程的基础和核心。在传统以条形码作为信息标识的应用中,海量的档案文件使得档案工作者的工作量急剧增加,贴条形码的过程也极易出错。同时,条形码信息破坏了档案的原貌,对档案原件造成损害。件符识别技术以模式分类和神经网络技术为核心;以档案扫描图像处理技术为基本工作原理;以件符作为标识档案文件之间的分隔符;以人工预处理技术预先将档案和指定文件对应好为保障,成功的实现了取代原始条形码信息;降低了档案数据库的高度冗余,提高了查询效率;给后期的检索映像带来了相当的便利。检索映像技术是整个流程的目的和归宿。传统的纸质档案检索方式无疑是低效率的,并且面对大量的无关数据时,档案信息检索已经和互联网WEB信息检索一样,面对越来越多的挑战。此次成功的将现代互联网检索技术应用于档案信息检索中,以文本数据挖掘技术为基础,提出了档案间的相关度的概念,使得不同档案之间的自动聚类成为可能。同时,借鉴搜索引擎的PageRank算法,以不同优先级的形式,呈现在用户面前不同级别的搜索结果,从而更加便利的实现了查全、查准、查快的检索目标,是网络搜索技术在档案信息检索中的一次成功的应用。通过对相关的实现技术进行建模与仿真,采用真实的档案数据作为测试训练样本,导出测试结果,建立本档案管理系统的综合评价指标,有利于更进一步优化此系统的处理过程。最后,将所提出的关键技术进行总结和归纳,提出需要改进的地方,为下一步建立分布式共享档案信息平台做好铺垫。