文本图像处理算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:hhuzw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本图像处理一直是图像处理的热门分支,在图像检索、图像分析、智能交通、票据和证件的自动处理中都有着广泛的应用。它包括图像滤波、图像的几何校正、文本定位、倾斜校正、字符切分、二值化及字符识别等,而其中又以文字定位和倾斜校正最为重要,已经产生很多算法。本文在已有算法的基础上,提出了四种新的文本定位算法和文本图像的倾斜检测算法。首先,本文提出了基于数学形态学的简单背景下的文本分割算法。它分为两个处理阶段:图像的粗分割阶段和后处理阶段。粗分割阶段通过数学形态学操作定位出文字备选区域,其中包含了部分图片区域。在后处理阶段再次通过形态学操作精确定位文字,去除残余图片区域。实验表明,该算法能够精确分割多种版面排列的文本图像。对于复杂背景下的文本图像,仅仅通过形态学无法准确定位文本。本文提出了基于小波变换和形态学的复杂背景下的文本定位算法。经过小波变换,只含有背景的区域的小波系数明显小于含有文字的区域的小波系数。根据这个明显的差异,经过二值化、形态学限制即可精确定位复杂背景下的文字。在分析了多种已有的倾斜检测算法的基础上,本文提出了基于小波变换和投影分析的倾斜检测算法。通过小波变换,减小图片等非文字区域等对算法的影响,使得该算法相对于传统的投影算法检测精度大为提高。同时,经过小波变换,处理的图像数据急剧减少,大大提高了算法的检测速度。提出了基于粒子群优化算法的文本图像的倾斜检测算法。利用粒子群优化算法的全局搜索能力,在较大空间里搜索使适应值最大的变量值,即作为待检测图像的倾斜角。实验表明,该算法能够以较高精度检测出多种版面排列格式的文本图像在[ 9之间的任一角度。?0 ,90 ]本文提出的算法对大量不同的文本图像进行了实验。通过实验结果的分析可以看出,本文提出的文本定位算法和倾斜检测算法鲁棒性强,处理速度快,有较好的实际应用价值。
其他文献
随着多媒体技术和网络技术的飞速发展和广泛应用,多媒体版权的保护问题已经成为当前讨论的热点问题之一。数字水印作为信息隐藏领域的重要分支,也是版权保护的重要手段,已经得到
由稀土永磁体钕铁硼(NdFeB)构成转子的永磁同步电机(PMSM),由于钕铁硼的高磁能积和高矫顽力,使得永磁同步电机具有了结构简单、体积小、重量轻、效率高和特性好等一系列的优点,
诱发电位信号(Evoked Potentials, EP)是人体在外界刺激下所表现出来的神经系统活动状态,它描述了人体神经系统对受到外界刺激在特定部位与特定时间所综合呈现出来的电学特征,是一种极其微弱的人体电生理信号;肌电,是指肌肉在静止或收缩的时候所表现出来的电活动,记录肌肉电位活动的曲线称作肌电图(Electromyography, EMG);其中,特别是诱发电位的采集提取,对研究中枢神经系统
1984年台中区农业改良场新育成台中糯70号及台中籼糯1号,经水稻育种技术小组审查委员会审查通过,正式命名推广。“台中糯70号”为粳型糯稻,剑叶直立,叶色浓绿,强杆耐肥,脱粒
一九七八年早造,我们和县委农村部与马路公社马路大队合作二队科技组共同种植一块汕优三号高产试验田,面积1.88亩,共收干谷2558斤,平均亩产1360.4斤。试验田的穗粒结构为:有
神经元是神经系统的基本组成单位,神经元之间信息的产生和传导体现了丰富的非线性特征。近年来研究表明,在外界刺激下,神经元会产生不同的放电模式,如周期放电、混沌放电以及
随着通讯网络的飞速发展,网络系统的可修复性越来越受到网络设计者、建设者和使用者的普遍重视。通讯网络的可修复性和系统可靠性已经成为研究通讯网络系统综合性能的主要技术
目前在我省现有推广的小麦品种中,由于亲本比较单一,血缘相近,在性状上往往表现大同小异,增产潜力不大,远远适应不了农业现代化的需要。据统计,我省抗旱类型品种中,亲本来源
海事记录仪,即船载航行数据记录仪(VOYAGE DATA RECORDER缩写VDR)俗称船用黑匣子,是一种可以保存大量有关事故前、后船舶位置、运动、物理状态、命令和控制信息的设备。功能上
系统仿真可以预演或再现系统的运动过程,对无法或很困难直接进行实验的系统进行研究,从而节省大量的资源和费用,目前系统仿真已经在军事、化工、电力等领域得到广泛和成熟的应用