跨媒体搜索关键技术

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:nicday
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体设备的不断更新以及移动应用技术的快速发展,多媒体尤其是视频媒体传播越来越广泛,人们对视频搜索系统的要求也日益增长。本文研究了跨媒体视频检索中视频语义的分析与提取、基于场景的视频聚类等关键问题。主要的工作如下:1、提出一种跨媒体视频搜索框架,能够利用视频中的图像、音频、文本等多种媒体信息完成视频搜索。实现了对视频元数据和查询query的文本分析预处理,完成拼写检查、去停用词、词干提取和词形还原等操作,抽取出文本中的关键信息。在视频语义信息提取方面,提取出音频信息、文本信息,以及人脸和常见物体等概念语义,并以文本形式输出。用lucene分别对视频元数据和视频语义信息建立索引,完成视频搜索和排序。该系统适用于海量网络视频搜索,并在TRECVID-KIS视频搜索任务数据集上进行测试,MAP值为0.265,验证了有效性。2、在视频的语义信息提取方面,提出一种基于笔划宽度的文本检测算法,能够有效地检测和识别出视频中所包含的文本。视频中的文本信息通常为视频的标题或描述等,起着辅助理解视频内容的作用,因此文本信息、相对于其它媒体信息能更直接地体现视频的主要内容。本文采用笔划宽度和颜色特征相融合的文本检测算法,能够有效地把文本和背景区分开来,并筛选出文本区域。最后用OCR软件对文本进行识别。该算法应用在跨媒体视频搜索框架,使搜索结果得到稳定提升。3、提出一种基于场景的视频聚类算法,通过分析视频的场景,对视频提取更高层次的语义信息,用BoW模型对视频特征进行量化,采用谱聚类算法对视频进行无监督聚类。通过把描述同一个事件的视频聚到一起,自动地为视频附加类别标签,应用在最后的视频搜索过程中。在自建的网络热点事件视频库上进行测试,测试结果表明该方法能提高检索的查全率。
其他文献
现代研究表明白藜芦醇(Resveratrol)具有抗癌、抗氧化、抗血小板凝聚、抗菌、调节脂类代谢、保护心血管系统和神经系统等多种功能,从己查文献中可知虎杖中的白藜芦醇含量是迄
无线传感器网络(Wireless SensorNetwork, WSN)是由大量低成本、低功耗、具有信息采集、数据处理和无线通信等功能的传感器节点通过自组织方式形成的网络,广泛应用于军事监视
我国是世界上高速铁路处于前沿水平的国家之一。计算机联锁系统的性能对于行车安全、效率至关重要。因此,对其安全评估研究迫在眉睫。本文基于我国缺乏独立、可靠的高速铁路
无线通信、特别是移动通信的蓬勃发展,需要在有限的频谱范围内划分出更多的频段给不同的运营商,以满足多种通信业务的需求。为避免信道间相互干扰,需要在所有的系统内配置高性能