基于内容的多媒体视频数据库的研究与实现

来源 :第十一届全国多媒体技术学术会议 | 被引量 : 0次 | 上传用户:gu999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了采用关系数据库平台组建视频数据库的设计思想与实现方法,镜头分割综合了压缩域DC图像检测和全图像颜色直方图检测等多种方法,自动检索系统则采用图像检索与字段标注相结合的方法,提高了检索的效率.
其他文献
数字博物馆是艺术和技术的结合,是基于网络、多媒体、数据库和虚拟现实技术的一种典型的可视化信息服务系统.目前,航空航天数字博物馆已经挂靠在中国教育科研网上,它是教育部现代远程教育网上公共资源建设的重要组成部分.本文介绍航空航天数字博物馆的建造方法.
本文在阐述了虚拟柱面全景模型及相关技术的基础上,设计了一种增强图像匹配效果、并能较好地消除"黑洞"现象的建模方法.该方法利用基于特征线段的匹配算法对图像进行匹配,然后用渐入渐出的方法进行平滑无缝拼接,再以反投影算法生成全景图像,正投影算法生成各视线方向的视图,最终在浏览器中实现了柱面全景图像的漫游.
虚拟实景空间就是利用IBR技术构造的具有三维操纵能力的虚拟环境.本文主要介绍了采用Java Applet实现基于WEB的虚拟实景空间浏览器的关键技术,如全景图像分块异步加载,反投影,全景图像漫游等.该浏览器已在航空航天数字博物馆项目中得到了很好的应用.
本文介绍了如何运用新的三维图形技术X3D,并结合VRML及JAVA技术进行基于WEB的交互式三维场景的创建.文中首先给出了虚拟飞行和导弹发射系统实现的模型,分析了人机交互行为的特点,并结合虚拟飞行与导弹发射的工程实例,研究了JAVA对VRML对象控制及如何在三维图形创建中利用X3D技术.
为在建筑造型领域实现三维造型的快速便利的建模,突破现有的一般视觉求解算法的诸多限制条件,论文分析了建筑场景的几何特征,提出了基于近景图像的三维建筑造型的改进算法和优化的系统结构设计,研究了开发专业化三维造型系统的实用性要求.该项研究的试验系统以建筑场景的数字化图像为输入,在保持三维几何计算的速度与计算结果精度的 前提下,尽量减少所需求解参数约束条件,重建具有照片感的三维建筑造型,实现了基于数字图像
本文介绍了船舶模拟训练系统的结构、功能,给出了硬件解决方案.并且分析了要达到身临其境的训练的效果,系统对视景的要求,针对各项要求提出了技术实现方法并给出了相应的实验结果.
压缩视频数据的预处理技术是MPEG域中基于内容视频检索的关键技术之一.本文详细讨论了目前MPEG压缩视频数据预处理中主要的两类算法——镜头检测算法和视频分割算法,分析了它们的性能.
本文提出了一种在CBIR系统中建立低层视觉特征到高层语义特征映射的方法,映射建立后能自动由图像的低层视觉特征提取高层语义特征.
当用户查找包含特定物体的图像时,这些特定的物体或可以由相互间具有一定的逻辑关系几何图形来描述,或具有一定的特征(形状、颜色、纹理).在这些特性基础上进行检索,可以避免传统的QBE方法中不相关的图像区域所带来的对特征匹配的影响,也 可以检索出包含任意方向和大小的特定物体的图像.
本文介绍了一种自动音频分类和分段方法.算法分成两个步骤:首先,使用音频分析的方法将新闻节目的音频分类成静音、语音和音乐,切分不同的新闻段;其次,对语音部分进行说话人辨识和平滑处理.本文对音频分类和分段技术中所涉及的关键技术进行了研究和探讨,并且提出了音频分类和分段系统的结构,并给出了评估方法和实验结果.