图像中的文本定位算法研究

被引量 : 0次 | 上传用户:mabeishangdeniuzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像中包含很多有用的信息,如新闻字幕,车牌字符,广告标语等,准确地从自然场景中定位出文本是数字图像处理中一个重要的研究内容。本文针对图像中三类典型的文本进行了定位研究:基于小波变换的新闻视频中的字幕检测算法、基于颜色模型的车牌定位算法以及基于笔画宽度变换的自然场景中的文本定位算法。针对图像中大小、位置、颜色等具有极大相似性的视频字幕,本文使用基于小波变换纹理分析的方法对新闻视频中的字幕进行定位。算法首先对视频帧进行小波变换,提取变换结果的LH、HL和HH子带统计特征,然后分别使用SVM和K-Means对特征进行分类。论文分别对5段中文新闻视频和5段英文视频进行了检测:SVM中文分类器的检测率为0.867,SVM英文分类器的检测率为0.863;K-Means分类器中文视频文本检测率为0.817,英文视频文本检测率为0.803。最后对两种分类方法进行了优缺点分析。对于图像中的蓝底白字车牌字符,由于字符边缘两侧像素点对颜色均为蓝色-白色,本文根据颜色对的分布特点拟合颜色模型。算法基于该模型滤除掉不符合分布模型的边缘点,得到候选文本像素点。然后使用水平扫描连接并填充候选边缘对,并对它们进行形态学处理,最后根据图像中车牌的几何特征定位车牌。实验结果表明,算法对曝光正常车牌图像,车牌定位率为0.91。对于自然场景中的任意文本,场景中处于同一语义的文本其字符笔画宽度、颜色—样,字符也处于同一水平线上。本文根据这些特征,首先对图像进行笔画宽度变换,求出图像中有边缘物体两段边缘之间的像素点数,即笔画宽度,然后根据自然场景中处于同一语义的文本的特征,定位出场景文本。实验结果表明该算法对语种不敏感,并且其文本定位率为0.66。
其他文献
邮轮游艇产业是中国特色社会主义先行示范区建设不可缺少的组成部分,大鹏半岛发展邮轮游艇产业在先行示范区建设和粤港澳大湾区协同发展中具有重要意义。大鹏半岛发展邮轮游
贫困,一个既古老又现实的问题,贯穿着人类社会发展的始终。它具有自我强加的持续性,类似于一个陷阱,使得处于该陷阱中的人们长期处于一种低水平的均衡状态。打破低水平均衡、
介绍结构半主动控制技术的发展过程及分类,综述了半主动控制的控制策略和算法,最后讨论了建筑结构半主动控制的研究方向.
现在越来越多的人将户外运动作为一种时尚的休闲方式,对户外装的要求也越来越高,不仅要舒适,而且要美观。因此国外一些公司越来越重视户外装,尤其是冲锋衣样版结构的研究。然
背景:糖尿病脑病(Diabetes encephalopathy, DE)是糖尿病(Diabetes mellitus, DM)严重并发症之一,损害患者的认知和记忆。传统治疗采用噻唑烷二酮(Thiazolidinedione, TZD)类过氧化物
随着信息技术和网络通信技术的发展,利用互联网组织的违法行为和活动越来越多。如何从多种网络数据中准确抽取人物的属性和社会关系等信息,进而挖掘潜在的关键人物和社团组织等
语文是与社会生活不可分割地联系在一起的。“语文”源于生活,人又常常要通过·“语文”来认识社会生活,并借助它来反映社会生活,参与社会生活,同时在这一过程中使人的语文能
农业产业化龙头企业是农业产业化经营的骨干和支柱,是有效推进我国由传统农业向现代农业转变的中坚力量。而技术创新是提升我国农业产业化龙头企业核心竞争力的关键。近年来,
目前,从复杂背景图像中快速而准确的识别出文本区域仍旧是国内外学者关注的热点问题。由于在很大程度上,系统的识别效果往往取决于图像文本区域定位的准确性,故图像文本定位是图
新时代宣传思想文化工作有着全新的特点。文章运用习近平新时代中国特色社会主义思想充分考量当地的宣传思想文化工作,提出了工作中的成绩和不足,以及努力的方向和措施。