【摘 要】
:
随着多媒体技术的发展和网络数据量的巨大增长,视频检索已经越来越引起人们的重视。在基于内容的视频检索技术中,视频文本是重要的索引内容。提取视频中的文本后用OCR软件识
论文部分内容阅读
随着多媒体技术的发展和网络数据量的巨大增长,视频检索已经越来越引起人们的重视。在基于内容的视频检索技术中,视频文本是重要的索引内容。提取视频中的文本后用OCR软件识别,则可以建立视频内容的索引或快速浏览。以前这些文本大都是通过人工提取的,如果能够实现快速的自动文本定位提取,将大大节省人力物力。在提取出文本区域后,由于视频中的文本图片普遍具有分辨率低质量差的特点,如不进行增强处理,很难被OCR软件准确识别。因此,如何对提取出的视频文本进行有效的增强以提高OCR识别正确率日渐受到关注。
本文主要研究视频文本图像的定位和增强技术,提出了定位和增强方面的几种新方法,并实现了几种传统算法以进行对比实验。除了对算法进行深入研究以外,还使用了C++ Builder与Matlab混合编程搭建了视频文本处理系统软件平台。
首先提出了一种基于小波变换和神经网络技术的文本定位方法。该方法将小波良好的时频局部特性和变尺度特性同神经网络的自学习、强鲁棒性和推广能力结合起来发挥作用。在特征提取过程中,首次将峭度信息引入文本提取领域。取得了良好的效果。算法效率大大提高,定位的准确率也被提高到90.4%左右。为了证明峭度特征的有效性,还对传统的常用于神经网络分类的统计特征进行了对比实验。
其次,提出了一种基于Shannon插值的文本分辨率增强算法。并针对视频文本的特点对公式进行了改进,提高了算法执行速度。为了证明Shannon插值方法的有效性,本文还实现了几种常用的插值方法用以进行对比实验。实验结果表明经Shannon插值方法处理的图像结果更加平滑,灰度过渡的更好,且大大提高的OCR的识别正确率。
最后,提出了一种基于Niblack二值化方法的文本图像增强算法。通过大量实验,确定了在视频文本增强领域中Niblack二值化公式中相关参数的最佳取值。同时,分析了Niblack方法存在的不足,提出了一个崭新的偏移量S的计算公式,从而形成改进的Niblack二值化算法。为了证明算法有效性,本文还实现了几种常用的二值化方法用以进行对比实验。实验结果表明,经改进的Niblack二值化方法处理后的图像,笔画清晰,并且消除了条纹状噪声。经过分辨率增强和有效的二值化后,OCR正确识别率被提高到89%左右。测试过程中,对于一些质量较好的图片,OCR正确识别率可达到95%以上。
其他文献
摘要:新课程体系中的一些课程类型要求教师必须改变原有的以课堂讲授为主导的教学方式,把教学过程作为课程编制的过程来展开,这样就需要师生之间平等互动与积极对话,从而改变传统的教与学的方式。个性化学习方式要求教师不断提高教学能力,最终转变学生的学习方式,教师必需具备促进学生发展的能力,参与、协调与合作交流的能力,探究教学的能力,反思、提升教学水平的能力。 关键词:语文 个性化学习 意义 Abstra
论文摘要: 在施工中围绕科学发展主题,紧跟对技术创新的热潮,实现过程中对施工材料的不断创新,从而达到在人工,材料等方面的节省,以实现最大的经济效益。本实用新型涉及一种固定插座、开关面板的新型线盒,施工不仅能够节约成本,还能增加墙面整体美观效果。 关键词:新型线盒环保 施工方便节约成本 中图分类号:X324 文献标识码: A 文章编号: 一、传统线盒施工特点 建筑墙体上常用的插座、开关是通
便携式媒体播放器(PMP)是今年被讨论最多的一个话题。便携式媒体播放器的优点很多,它能够直接播放高品质视频、音频,也可以浏览图片以及作为移动硬盘、数字银行使用,更有的产
电子邮件作为互联网技术发展的产物,在给全球网民带来通讯便利的同时,正不可避免地遭遇有悖初衷的运用。垃圾邮件问题日益严重,受到研究人员的广泛关注。目前经常采用的垃圾邮件
摘要:我国研究生培养实行的是导师负责制,导师是研究生事业、生活的指导者,导师是决定研究生培养质量的关键因素,研究生和导师之间具有一种特殊的师生关系,其思想修养、政治素质、处世做人、学风、治学等直接影响着研究生素质的形成和发展,研究生导师即为研究生培养质量的界定者,导师水平和素质的高低决定着研究生培养水平的高低,研究生导师又是研究生培养质量的监控者。为提高研究生教育质量,必须加强导师队伍建设。 关
数字制造的过程决定了数字制造资源具有分布性,共享性的特点,这些资源在企业之间甚至企业内部分布在地理位置互不相同的多个地方,而不是集中在一起。同时企业为了完成产品生
中图分类号:K915文献标识码: A 文章编号: “绿道”是一种线形的绿色开敞空间,通常沿着河滨、溪谷、山脊、风景道路等自然和人工廊道建立,内设可供行人和骑车人进入的景观游憩线路,连接主要的公园、自然保护区、风景名胜区、历史古迹和城乡居住区等,有利于更好的保护和利用自然、历史文化资源,并为居民提供充足的游憩和交往空间。从规划建设思想来看,绿道建设基本不需要占用建设用地指标,具有投资少、见效快的特
随着汽车工业、通信和移动互联网产业的迅速发展,三者结合的产物车联网逐渐成为国内外的研究热点。车联网是以车载自组织网络为基础,通过GPS、RFID、传感器和车载无线通信终端
本文在研究前人概率密码体制的基础上,讨论一种基于同余理论的概率密码体制。该密码体制中,以k次剩余作为加密算法和随机序列产生算法,以中国剩余定理作为多用户信息组合方式
射频识别(RFID,Radio Frequency Identification)是一种自动识别技术,通过非接触式通信对数据进行读写和修改,从而实现对通信实体的身份识别。随着射频识别技术的发展以及应用,一