视频中语义信息的提取

来源 :复旦大学 | 被引量 : 0次 | 上传用户:zcy124589
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前的视频语义信息的提取工作还处于研究阶段,主要可以分成两大类,一类是通过提取视频中一些非常特殊的表述语义的对象来获取语义或者反映语义的线索。比如将视频中的文字识别出来,然后对于这些文字进行索引以支持基于关键字的检索。这类方法,一般性能比较好,但是只适用于一些特定的视频类型。另一类,是采用机器学习的方法,对于视频的各种低层特征本身,进行基于事先定义的语义概念的分类,这样获取的语义信息仍然可以通过各种概念的组合进行基于关键字的索引和检索。这类方法的优点是分析的视频内容本身,可以适用于所有类型的视频,但是需要一定的人工干预。 本文对这两方面的方法都作了一定的调查和研究。一是通过对视频中的文字的识别来提取语义信息,提出了针对视频叠加静止文字的基于多帧图像的文字检测和分割算法,提高了视频文字的检索性能。 二是通过对低层视觉特征的分类来提取语义特征,提出了一种通用的基于机器学习的高层语义特征提取算法,还参加了TRECVD2005的视频高层语义特征提取子任务的公开评测。
其他文献
随着能耗问题的日趋严重,多核/众核异构体系结构逐渐盛行。自2013年Intel正式商业化MIC(Many Integrated Core)协处理器以来,CPU/MIC异构体系结构受到了广泛的重视。虽然如此,CPU/
在并行程序编写过程中,用锁来保护共享内存比无锁操作更直观。因此,并行程序通常采用锁来保护共享内存。在某些场景下,锁竞争问题导致工作线程阻塞,从而使并行程序无法充分利用多
近年来,虚拟现实技术的应用与研究正在迅速地发展。它是一门涉及众多学科的新兴技术,涉及到计算机图形学,人工智能,多媒体技术及人机接口技术等诸多领域,在众多领域中有着良好的发
目前,随着软件工程方法学理论的进步、软件开发人员的成熟,计算机软件的应用面越来越广。在发达国家已经存在大量既存的应用软件,随着硬件和软件的升级、软件环境和需求的变化,这
本文主要从应用的角度分析描述如何实现基于Web Services的软件架构,提出并且实现了该软件模型。在现代企业应用中,人们发现系统的互操作越来越成为企业软件资产管理者、系统
Web Service是一种面向服务的体系结构,其突出优点是实现了真正意义上的平台独立性和语言独立性,为互联网应用提供了一种共享数据和功能的有效手段,能够较好地解决异构应用之间
分布式的P2P结构是目前解决流媒体系统瓶颈问题的有效途径。由于流文件的即时播放需要一定的带宽和速度支持,动态变化的单源传输常常难以满足要求,因此,多点下载技术成为一种提
混沌、分形理论是非线性科学中的两个富有挑战性和巨大应用前景的学科.混沌理论揭示了自然界非线性过程复杂系统内在随机性所具有的特殊规律.分形理论与混沌密切相关,混沌是产生
汽车行驶记录仪是一种降低交通事故的发生率,规范和保障驾驶人员的行为和权益,方便交通管理部门执法检查和事故责任认定,提高运营单位对司乘人员和车辆的监督管理的重要手段。以
分形几何理论是混沌学的一个分支,分形几何的概念是由曼德勃罗特于20世纪70年代创造.简单地讲,分形意味着自相似性,是在不同尺度上的一种对称.根据曼氏对棉花历史价格数据的分析,每