基于DM8168的视频字幕文字识别

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:tanjuan1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代社会已经进入数据时代,随着视频数据的爆炸式增长,人们渴望快速的找到自己感兴趣的视频内容;另一方面对电视视频等视频内容的有效监管也成为监管部门一块很重要的工作。视频字幕与视频内容有着重要的语义相关性。如果能够自动识别视频中字幕文字,那么很大程度可以解决基于视频内容的内容监管和内容检索。本文开展的研究工作是基于嵌入式平台实现的,采用的是市场上性能最好的DSP处理器DM8168。嵌入式平台与PC端相比具有更加便捷、成本更低等优点,同时开发难度也更大。本文的研究工作主要分为两块:一块是硬件平台的熟悉和视频数据链路的搭建;另一大块是字幕识别算法的开发和移植优化。字幕识别算法主要分为字幕提取和字符识别两部分。本文在分析了视频中字幕文字特点后提出了基于图像对比度的字幕提取算法,并用卷积投影法定位字幕区域。在字符识别算法中本文提取字符的线素统计特征,并用基于二元词组的后处理方式优化识别结果,提高字符识别准确率。实验证明,本文所提出的字幕识别算法可以在嵌入式平台下长时间、实时稳定的运行,并能够处理多种样式的字幕文字,具有一定的鲁棒性和适应性。在数据指标上取得了高于百分之九十的字幕检测率和高于百分之八十的字符识别率,取得了较好的实验结果。
其他文献
三雏增强磁共振血管成像(3D—CEMRA)具有无创、无辐射的优点,其使用的对比剂较为安全。肝脏具有肝动脉、门静脉双重血供,解剖变异较大,3D—CEMRA在肝脏应用较多。就三维增强磁共振
磁共振成像技术是近20多年发展起来的一种新型医学成像技术,由于其具有多方位、多参数、多序列的成像特点,且有良好的软组织分辨力,故现已广泛应用于临床。然而,对于体内有金
运动是人类维持和改善生活状况的必要活动,但有时也可造成肌肉损伤.CT、超声等影像学诊断方法在肌肉损伤中的应用存在局限性.就肌肉损伤的临床、病理学以及MRI在肌肉损伤中的
小额信贷自1993年引入我国以来,距今已经有了21年的发展。目前对于小额信贷的研究主要集中在一些理论上的缓释小额信贷风险的机制,而对于贫困农户融资困境的表现形式、造成农户
随着MRI分辨力的提高,对杏仁核的定量研究已成为现实.影响杏仁核体积测量的因素多种多样,其中最重要的是其解剖学定界.由于采用的定界标准、成像方式及影像后处理方法等的不
目的 用Gd-DTPA延迟增强联合MR电影序列,定量分析心肌梗死(MI)病人的局部射血分数,并与美国心脏病协会标准化的17分段法进行对照。方法 经审查委员会批准和知情同意后,对15例MI
期刊
PET/CT是一种崭新的功能成像手段,在对腹部恶性肿瘤的诊断和分期、抗肿瘤治疗的检测、肿瘤组织特征的显示以及放射性核素疗法的监测方面均具有较高的潜在价值,随着研究的不断深
自20世纪70—80年代CT、超声、核医学、MRI、DSA的陆续出现,医学数字化趋势已形成。常规放射学的数字化始于CR(computed radiographv),发展于数字化X线摄影DR(digital radiography
戴在最高处的眼镜江雨长颈鹿不大爱玩捉迷藏,谁躲在哪儿,他一眼就能看见。朋友们也不愿和他玩。有一回,长颈鹿进城去了,东看西看地走着。噢,一大帮人在排队买什么东西呢。原来在购