【摘 要】
:
目前,学术讲座视频已经成为读者获取知识的一种重要途径。然而,学术讲座视频的数量每天都在增长,面对大量的学术讲座视频,读者找到自己感兴趣的视频进行快速浏览并定位关注的部分
论文部分内容阅读
目前,学术讲座视频已经成为读者获取知识的一种重要途径。然而,学术讲座视频的数量每天都在增长,面对大量的学术讲座视频,读者找到自己感兴趣的视频进行快速浏览并定位关注的部分就成了亟待解决的问题。学术讲座视频的快速浏览技术也就应运而生,成为目前视频处理领域的研究热点之一。
基于关键帧的视频摘要和视频的字幕提取是实现视频快速浏览的两种重要技术。本文在分析前人研究的基础上,提出了基于内容的学术讲座视频快速浏览方案和基于关键帧、基于关键词的学术讲座视频段落定位方法。主要成果概括如下:
1、提出了基于镜头的关键帧提取算法。该算法基于学术讲座视频的镜头变化多采用突变方式的特点,采用已有的算法并根据镜头内容的多少确定提取关键帧的数量。
2、分析了基于视觉变化的关键帧提取算法和基于等间隔的关键帧提取算法。
3、提出了基于帧差的字幕提取算法,该算法基于学术讲座视频的字幕文本一般只在视频帧底部1/4处,而且字幕与背景对比明显的特点,采用帧差法只比较该处相邻两帧的直方图差异率,大大减少了计算量。
3、提出了基于镜头结合字幕比较的关键帧提取算法。该算法基于学术讲座视频的字幕文本在视频底部的特点,先根据镜头内容多少提取关键帧,再采用帧差法只比较视频帧的底部,从而删除字幕重复的视频帧。
4、提出了基于关键帧和字幕定位的学术讲座视频快速浏览方案。该方案一方面可以根据关键帧快速定位感兴趣视频段落,另一方面也可以根据关键词快速定位包含关键词内容的视频帧。
其他文献
肌音信号(Mechanomyographic,MMG)是人体发生动作时由肌肉收缩产生的声音信号,相比于其他生物电信号,肌音信号有较强的抗干扰,抗疲劳能力强,受环境干扰小,性价比较高等诸多优
VPLS(Virtual Private LAN Servie)能够将跨域的虚拟专用网的用户,通过运营商网络进行连接,使各用户站点的连接效果像是在同个局域网内部一样。三层MPLS VPN技术需要通过对路
嵌入式系统具有低成本、携带方便、功能强大、低功耗等优点,已被广泛应用于工业控制、消费类电子产品、通信系统、网络系统和无线系统等各类领域。嵌入式系统的硬件核心是嵌
预编码是一种根据信道情况对发射信号进行预处理,从而提高MIMO系统性能的技术。目前,预编码技术已经广泛应用于以LTE和LTE-A为代表的下一代通信系统中。对LTE系统中预编码技
近百年来,通信的目标始终围绕着如何在有限的频谱资源内,实现高速、可靠的通信传输而展开,但是随着多媒体技术的快速发展,移动端用户对带宽的需求越来越大,当前的网络已经难
近年来,随着机器人越来越多的渗入到我们的生活中,具有自主感知决策和执行功能的机器人得到了快速的发展,其中室内自主移动机器人成为了机器人研究领域的热点之一。实现室内
语音是实现人们之间沟通交流的最直接与方便的手段。近年来实现人与计算机之间高效的语音交流,也成为人们梦寐以求的梦想,语音识别是其中的关键技术。语音识别是指计算机对人
随着无线通信技术的迅猛发展和多样化业务的激增,有限的无线网络资源,如目前通信所用的频段和功率,显得弥足珍贵。无线网络设计就是考虑在满足用户不同QoS需求的同时,如何最
模糊控制是模糊信息理论在控制领域的重要应用,也是智能控制领域中的主要方法。模糊控制使用的方法是依靠模仿专家的控制经验,用模糊条件语句来代替模糊规则。将此系统以语言
本文提出了一种基于ARM平台和嵌入式Linux操作系统的远程视频监控系统的解决方案。伴随着网络技术和多媒体技术的飞速发展,视频监控技术向着网络化、数字化、智能化的方向发