利用频繁模式挖掘进行图像的自动标注

来源 :复旦大学 | 被引量 : 0次 | 上传用户:mutaozhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着多媒体技术和计算机网络的飞速发展,多媒体数据,特别是图像数据,正在以前所未有的速度呈倍增长。如何有效的管理与检索图像数据已成为目前信息检索领域中的重要课题。 最初的图像检索方法利用传统的基于文本的图像检索技术,人工地为图像作出文字化的注释,将图像检索转换成文本检索。该方法具有两个缺点:不同的人对于相同的内容的解释存在较大差异;人工标注的效率低下。而基于内容的图像检索技术不需要用户对检索的内容进行文字描述,直接把图像本身作为检索条件提交给系统,系统根据用户提交的查询样例提取特征,并与待查询的图像特征进行比较,然后返回给用户查询结果。这种方法避免了人工标注的弊端但却绕过了语义层面直接比对图像底层特征,导致查询结果在语义上失配。因而,图像语义的自动标注成为这一领域的研究热点。 另一方面,为了有效地从海量数据中发现有用的信息,数据挖掘技术正越来越受到人们的关注。分类技术作为数据挖掘的一项关键技术也得到了长足的发展。其中基于关联规则的分类技术近年来成为研究的热点。而图像语义的标注问题可以看作是对不同图像按语义进行分类。 图像语义标注的难点之一在于低层的视觉信息与高层的语义信息并不存在显式的对应关系,这一现象被称为“语义鸿沟”(semantic gap)。如何将低层的图像特征与高层的语义信息相联系,即如何有效地根据图像的低层特征提取其包含的语义概念成为这一研究领域的核心问题。 本文中,我们主要基于关联规则进行分类的技术来处理图像语义自动标注的问题。首先,我们将图像分割成几个区域,使得每一个区域的视觉特征尽可能一致,并用一组离散的视觉单词来描述。视觉单词本身是通过对一组人工标注过的图像训练集进行学习得到的。然后,我们在图像训练集上寻找图像语义的决定性表征模式,这些模式是图像视觉单词的组合,它们对于标识某一语义概念是唯一的或者是关键的。最后,我们根据标注效果最佳的原则生成进行图像自动标注的规则集,并对新的图像进行自动的语义标注。基于权威的真实数据集上的实验表明,我们的方法在对含有多个语义概念的图像进行概念标注时要比之前的一些算法效果更好。
其他文献
自硬盘问世至今已过50多年,在这期间硬盘存储数据取得了广泛的应用,在存储领域占据着主导地位。在硬盘生产过程中,一个很重要的环节就是伺服刻写。在此环节中,硬盘工作所必须
本文对虚拟牙齿矫正系统中牙齿移动路径规划进行了研究。文章在分析隐形牙套矫正技术及目前各种路径规划方法优缺点的基础上,选择遗传算法解决虚拟牙齿矫正系统下的牙齿移动路
随着信息技术的发展,人们越来越多地考虑把PERT(plan evaluation and review technique)网络计划法应用到企业的生产计划中。虽然编制网络计划和绘制网络图的过程已经从最初的
随着 EPA 网络的开放互连和大量 IT 技术的引入,加上 TCP/IP 协议本身的开放性,以及层出不穷的网络病毒和攻击手段,安全已经成为制约 EPA 应用发展的主要瓶颈之一。没有安全就没
随着微电子学科的进步,在单个芯片中集成多个运算和控制核心的多核处理器已经问世。在这种条件下,如何充分利用芯片上的多个核心设计出高效率的算法和程序,是当前产业界和学术界
目前,无线传感器网络已成为通信领域中的研究热点之一。然而,传感器节点的能量有限,一般不能进行补充,而且在无线通信时消耗的能量最多。因此,设计或改进一种更适用于无线传感器网
随着数字化信息技术的进步,对信息存储技术也有了更高的要求。现有的存储设备中,硬盘已成为主要的介质形式。在硬盘的生产过程中,伺服图形发生器非常的重要,因此,对伺服图形
本文讨论了如何在分布式环境下构建一个容易根据需求快速开发的CTM(计算电话管理)系统。CTM系统是一个基于语音板卡的管理系统,它通过调用语音板卡的功能接口来提供语音方面的
为了让网络提供日益扩大的网络需求,满足各种各样的网络服务要求,我们认真研究了TCP/IP的体系结构的特点,发现基于层次体系结构的TCP/IP网络有许多固有的缺陷,而非层次体系结构的
学位