论文部分内容阅读
本文论述了如何基于OCR技术实现固定资产管理系统的设计和开发工作。由于公司要进行固定资产统筹管理,要将一些纸质信息均为计算机打印字体的表单录入到计算机中。针对这种情况我们采用OCR技术可以提高录入的速度。采用固定的模板记录固定资产信息,然后通过OCR对其进行识别,并将识别的信息存入到计算机中。这样减轻了人工的操作工作,并提高了信息录入的效率。由于纸质表单的OCR识别不仅仅是要将信息识别出来,同时还要将这些信息按照字段分别存入数据库中。所以我们要对识别的信息进行一个位置识别,经过多方分析研究,我们确定用XML文件定义纸质表单的样式,然后系统读取XML文件,根据模板样式来对纸质表单进行OCR识别,并将识别的信息按照区域保存到不同的字段中。在分析版面的结构时,我们采用连通区域搜索的方式来查找。最后经过对实现的OCR技术的进行测试,我们得到了具有较高识别准确率的识别效果。经OCR技术应用固定资产管理系统中,在实际的录入固定资产信息时,还会存在识别错误的现象,但是相对于完全手工录入的工作量,即便OCR录入固定资产信息加上人工核对录入信息的时间,其录入固定资产信息的时间都比纯手工录入固定资产信息的时间要短。完全大幅度提高了录入的效率。本文的主要设计思想如下:(1)在设计功能模块时,确定了以OCR识别业务为业务流程的核心和主体;(2)采用xml文件定义纸质模板样式本文的主要工作和贡献如下:(1)基于OCR技术,实现了OCR识别汉字,数字,字母和字符的功能。(2)设计一套纸质表格定义规则,采用xml文件存储,通过这套定义规则实现对纸质表单的有序读取。(3)在录入固定资产的工作中,通过使用这项技术大大的提高了信息录入的效率。(4)软件从构思,需求分析,系统设计,软件开发到测试完全按照软件工程理论,并将这套理论贯穿于整个系统设计中。