面向场景理解的视、听觉媒体内容处理与分析方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:gaochao321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景分析与理解是与人类生活密切相关的研究领域,主要包含听觉场景和视觉场景两类最为重要的组成部分。在听觉场景理解中,基于内容的音频信息摘要工作为分析音频语义信息提供着可靠的线索,是音频研究领域的重要环节;在视觉场景理解问题中,文本则是重要的语义载体,文本信息提取和理解也因此逐渐成为视觉内容理解的关键之一。本文首先提出了一种多源音频场景下的基于检测声音事件和场景变化的音频摘要方法。该方法首先检测固有声音空间中发生变化的位置对音频流进行粗略的分割,并利用一个自适应的算法调整音频分割点的位置;然后,通过谱聚类的方法将相似音频分割片段聚类,得到不同的音频事件,并识别出其中的背景音频事件、前景音频事件和关键音频事件;最后,结合上下文模型来帮助发现并标识音频事件之间的语义关系,从而得到摘要。该方法的有效性在来自多种类型的电影电视音频数据中得到了印证,在音频摘要提取上取得了很好的性能。鉴于视频帧中文本信息模糊的问题会给文字检测和识别造成一定程度的困扰,我们提出了一种用于模糊视频文本信息增强的多光谱融合方法。该方法首先把输入视频帧分别转化为灰度图、R值图、G值图和B值图,并分别进行局部区域的增强。然后,我们将四个通道的增强图按照多种规则融合成五幅中间图。我们用取中值的方法将这五幅中间图进行融合,得到融合-1增强图。进一步地,我们将五幅中间图分别用k等于2的k-means方法转化成五幅二值图,并按照中值规则进行再次融合,得到最后的融合-2增强图。在多来源退化视频帧数据上的实验结果表明,该方法在一定程度上可以有效地增强退化图片中的文本信息,提高文字检测与识别的结果。
其他文献
多序列比对(MSA)是一个在生物信息分析领域的经典和广泛应用的技术。随着生物数据集规模的急速增长,为了严格控制执行时间,提高系统效率,对多序列比对的优化研究成为重要的课
快速正交频分复用(Fast Orthogonal Frequency Division Multiplexing,FOFDM)系统因为其高的频谱利用率和简单的数字设计等特点获得通信行业的广泛关注。FOFDM相比于OFDM而言
贫困是世界性的问题,尤其是对于陷于“中等收入陷阱”的拉美国家而言,伴随着激进式的金融自由化改革产生的城市贫困特别突出。本文在综述国内外学者对于金融发展与贫困缓解的
近年来,光载多带超宽带(MB-OFDM UWBoF)系统因其将多带超宽带信号的高频谱效率、高数据速率和灵活的频谱资源分配与光纤通信的长距离、大容量、低损耗的特点相结合而越来越受
位置服务(Location-based Services,LBS)改变了人们的出行方式并衍生了很多基于位置服务的应用如定位技术、导航技术等。定位技术不仅便利、丰富了人们的日常生活,而且具有较高的学术研究价值。随着技术的发展,人们对基于位置服务的要求也不断提高,定位技术成为人们研究的热点技术。GPS和北斗定位系统的应用使室外定位技术变得成熟可靠,由于室内环境中卫星通信信号容易被建筑物遮挡,导致室外定
随着我国的经济持续发展和人民生活质量的提高,人们对冷链物流配送的生鲜产品需求量越来越大,我国的冷链物流行业进入快速发展的阶段。在现实生活中,货物的配送过程往往会遭
超临界火电机组作为我国火力发电最主要的发展方向,比亚临界机组具有更高的效率以及更低的污染排放,但其动态特性也愈加复杂。超临界火电机组的协调控制是一个典型的大滞后、
社会退缩是指儿童在社交情境下,抑制自己参与同伴交往,表现出独处的行为。社交回避是社会退缩的亚类型之一,指儿童总是自己主动回避社交和与他人进行社会互动的情境,为低趋近动机和高回避动机的结合。以往对于社会退缩的研究较少涉及社交回避这一亚类型。儿童的社交回避行为可能引起多种情绪适应不良。因此探讨社交回避影响情绪适应的过程机制十分具有现实意义。研究一采用自我报告的方式对上海某地区某中学6-7年级共388名
随着我国城镇化的高速发展,城市暴雨内涝灾害频发,城市暴雨内涝防治工作逐渐受到各级政府和学术界的重视。闽三角厦门地区是我国南部沿海重要经济发展中心,肩负海峡两岸经济往来,促进两岸友好交流的重要使命,在我国滨海地区经济发展中占有重要战略地位。本文以厦门市为研究对象,试图从理论研究、规划防护多个层面,对城镇化和暴雨内涝关系展开研究,探讨城市建设与城市安全之间的动态平衡,并将其体现在空间防灾建设中。在此背
城市交叉口作为道路交通系统的咽喉,其交通运行的好坏,直接影响整个路网的交通状况。其中立交交通问题尤为突出,匝道作为立交结构的重要组成部分之一,起连接主线与其他等级相