论文部分内容阅读
表格分析是表格自动处理过程中的第一步。本文充分利用表格的特点 ,给出一个基于直线提取和补全的通用表格分析方法。先使用一种矢量化的直线提取算法在游程连通图的基础上得到表格线 ,同时对表格进行倾斜校正。然后根据表格特性调整表格线 ,再从表格线得到表格特征点 ,最后建立规则通过对表格线的补全来求得表格结构的行单元描述。使用该方法对表格图象进行分析 ,能处理表格线断裂、文字表格线粘连等常见问题 ,正确得到表格结构。