一种基于直线提取和补全的通用表格分析方法

来源 :中文信息学报 | 被引量 : 14次 | 上传用户:loadway
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表格分析是表格自动处理过程中的第一步。本文充分利用表格的特点 ,给出一个基于直线提取和补全的通用表格分析方法。先使用一种矢量化的直线提取算法在游程连通图的基础上得到表格线 ,同时对表格进行倾斜校正。然后根据表格特性调整表格线 ,再从表格线得到表格特征点 ,最后建立规则通过对表格线的补全来求得表格结构的行单元描述。使用该方法对表格图象进行分析 ,能处理表格线断裂、文字表格线粘连等常见问题 ,正确得到表格结构。
其他文献
梅毒是一种危害严重的性传染病,对梅毒进行准确的检测,可临床确诊梅毒以及防止梅毒的传播。根据梅毒螺旋体的生物学特性及病情的分期,梅毒螺旋体的实验室检测主要包括:病原体、非
杜拉拉,不只要升职还要生活,她在追求美好事业、浪漫爱情的同时,也没有放弃对办公室健康的执着追求,像杜拉拉这般事业健康兼顾的高智商职场美女,才配得起“职场老妖精”的光荣称号
(二) 生产育种生产育种就是利用在大生产中自然发生的变异所进行的菌种选育工作。例如,山东酒精总厂在生产中,原来应用的糖化曲菌种是A.S3.758于佐美曲霉,此菌种孢子为黑色。