【摘 要】
:
图片和视频中的叠加文字是帮助理解图片和视频内容高层语义的重要线索,有效地提取这些文字对图像理解以及基于内容的多媒体信息检索系统来说是一项重要的技术。目前商业的OCR
论文部分内容阅读
图片和视频中的叠加文字是帮助理解图片和视频内容高层语义的重要线索,有效地提取这些文字对图像理解以及基于内容的多媒体信息检索系统来说是一项重要的技术。目前商业的OCR技术对于二值图像中文字的提取识别已经趋于成熟,但对于图片和视频中的叠加文字,由于图像背景复杂,有效的文字提取具有很大的挑战性,这限制了OCR技术的成功应用。针对图像背景复杂、分辨率低,文字形态变化多端等问题,本文提出一种基于拆分-合并的鲁棒文字分割算法,在文字检测的基础上,利用文字的颜色和尺度信息,对检测到的文字块进行准确和高效的分割,最大限度地去除图片中的背景,为OCR系统提供完整清晰的二值图像输入。为了有效地剔除叠加文字的背景,研究人员做过很多尝试,提出的算法大多比较复杂,以致检测和分割的处理速度较慢,准确性与实用要求也有一定的距离。本文提出了一种基于时间自适应变化模型的视频文字提取算法,使得在引入简单的人工交互行为后,文字提取系统的性能和速度得到显著提高,这在一些对完全自动化要求不高,但是对准确性和处理速度要求较高的系统中将是一项很为实用的技术。此外,作为图像和视频文字提取技术应用的一个尝试,本文还将文字检测技术和图像恢复技术相结合,开发一个较为实用的视频字幕自动擦除系统,通过文字背景的空域恢复和时域恢复实现了图片文字的自动擦除。
其他文献
新农村文化建设作为我国文化建设的主要组成部分和最为重要的文化建设主战场,对推动社会主义文化大发展大繁荣起着至关重要的作用。而加强新农村文化建设,需深入了解当前农村
根据梅州市7个测站1961—2012年逐月气温资料,采用线性回归、Mann-Kendall法和小波分析等方法,研究了梅州市近52年气温的时空变化特征。结果表明,近52年来梅州市年平均气温以
兵团对新疆的资源开发与经济发展、社会进步与稳定、国家安全与边防巩固等方面都做出了重大贡献,兵团该如何进行城镇化建设为新疆跨越式发展和长治久安做出新的贡献。文章认
新公共管理对传统公共行政学的理论体系与逻辑结构产生了较为明显的本质性改变 ,但两者在理论与实务上的更替和转借并存。这种转生互动关系 ,在一定程度上标示了范式转换的趋
在近代西学的东渐中逻辑学具有重要地位。清末两部重要的逻辑学译著———由严复翻译的《名学浅说》和由王国维翻译的《辨学》各有不同,各具特点,它们分别代表了近代西学在中
在结构物与土体相互作用的研究中,分析界面剪切特性并建立合理的本构关系具有重要意义。利用改进的直剪设备,对粉质黏土与光滑或粗糙界面钢之间的剪切性能进行试验,分析剪切
由若干颗小卫星编队飞行组成一个虚拟卫星,其功能相当或超过一颗大卫星.这将开拓小卫星一个完全崭新的应用领域.文章首先论述编队飞行概念和应用,其次研究轨道动力学.系统地
世界文化遗产丽江古城,是中国古城风貌保存的典范,是具有较高综合价值和整体价值的历史文化名城。随着旅游业快速发展,古城面临着前所未有的冲击和挑战。文章基于丽江古城旅
把"生于"国外的马克思主义"拿过来"并"化"为"中国的"东西,实在是一件非同寻常的事情。但是,长期以来,对于这样一件非同寻常的事情,我们并没有真正地将之放在哲学层面上加以概
抗日战争时期,战前以上海为中心的中国电影产业被分隔为后方影业与沦陷区影业两部分,其中后方影业的发展路径表现为制作的官营化、内容的教育化、放映的普及化,从而与战前中