大规模图像集自动摘要技术研究

来源 :合肥工业大学 | 被引量 : 1次 | 上传用户:wly8213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络通信的飞速发展和图片共享网站的普及,互联网上的图片数量呈现爆炸式增长。然而,这个庞大的数据集合是杂乱无章,并且含有大量冗余和噪声。如何快速准确并且自动地从这样一个大规模图片集合中浏览和获取用户所需信息,已经成为迫切需要解决并且富有挑战性的问题。图像数据集自动摘要技术能够从原始的大规模数据集合中自动选取少量具有代表性的图像数据构成视觉摘要,以引导用户快速浏览或查询。本文主要从图像集摘要的代表性、多样性和自动性的角度出发,围绕着摘要产生过程中的几个关键技术进行了深入研究,具体包括图像特征描述、特征匹配和自动聚类。本文主要的研究工作和创新之处如下:(1)针对SIFT特征描述矩阵维度过高计算复杂的问题,采用加权的同心圆邻域代替方形邻域描述特征点,简化特征描述矩阵。引入了几何校验RANSAC算法对匹配点对进一步提纯过滤。为了降低RANSAC过高的时间代价,通过最优匹配点构建小样本集拟合变换矩阵,在有效的滤除误匹配对的同时,大幅降低了RANSAC的拟合时间,提高了运算效率。(2)提出了一种基于空间约束的SURF匹配优化算法,通过最优匹配点对构成旋转坐标系构建空间矩阵,并结合简化的RANSAC实现对匹配点对的几何校验,实现了高匹配精度的快速SURF图像匹配。(3)针对ATTA蚁群聚类算法易陷于局部最优解的缺点,提出了一种基于桶的ATTA蚁群自动聚类算法,通过ATTA算法对数据进行初步自组织聚类处理,然后结合桶聚类的思想,将初步区域成簇的数据映射到桶中,通过判别目标函数实现桶的合并和分裂,最终实现全局寻优的目的。(4)提出了一种基于有效性指标的AP自动聚类算法,结合聚类分析定义和相似对象分类一致性原则,设计了一种基于AP聚类的聚类有效性指标。针对在大规模数据集时的最佳聚类数搜索方法计算量巨大以及内存消耗大的问题,提出了一种快速最佳聚类数搜索方法。在原始大数据集中抽取几何密集数据构成代表数据集,根据AP聚类自身独特的偏向参数决定聚类数的特点,在代表数据集上运行AP算法搜索最佳偏向参数,从而获得原始数据集的最佳聚类数。该方案鲁棒性强,可以结合各种有效性指标实现大规模数据集的最佳聚类数确定。结合基于空间约束的SURF算法和基于有效性指标的快速AP聚类算法,设计了一种大规模图像集自动摘要生成模型。
其他文献
黑龙江省各族人民在长期的劳动生活中创造了风格迥异的少数民族体育文化,民族传统体育产业具有较大的发展空间。以发展少数民族体育旅游业为切入点,科学合理地开发民族体育文
在我国不断推进工业化进程的过程中,装备制造业得到了巨大的发展。但我国的装备制造业“大而不强”,独立完成核心技术能力不足、核心设备需要进口,自主创新能力较弱,结构性问题突出。而知识密集型服务业是信息科技时代知识要素高度集成发展所形成的产业,能够通过给装备制造业企业提供有效的知识和技术,增强其产品附加值,进而促进装备制造业升级。对于知识密集型服务业如何促进装备制造业升级的问题。本文主要从以下三个方面来
近年来数字内容产业在全球范围内蓬勃发展,并在经济领域扮演日益重要的角色。数字内容产业中,数字电影、三维动漫、三维游戏占有相当大的比重,它们都涉及到一个核心关键技术
阐述了构建和谐的劳动关系是构建和谐社会的基石及当前所面前的问题。说明了法治是构建和谐劳动关系的重要保障。
人脸识别在计算机视觉和生物识别系统中具有非常重要的作用。尽管现有的人脸识别系统已经比较成熟,但还存在着一些会对系统的可靠性构成威胁的因素。例如,姿态、光照、面部表
第一部电影音乐的诞生一九四五年,日本法西斯宣布无条件投降后,我随“鲁艺”文工一团到达大连。那时,我还是一名歌唱演员,在《黄河大合唱》里独唱《黄河怨》。一九四六年,蒋
文本蕴涵是计算语言学领域最具挑战性的课题之一,也是众多自然语言处理应用的一个重要部分。文本蕴涵作为一种文本推理的通用框架,为整合各种文本的语义表示方法、知识获取方
<正>数量众多、形式多样的故事资源,既是悠久历史长河积淀下来的珍贵文化遗产,又是人们丰富的劳动实践所创造的智慧结晶,蕴藏着巨大的教育力量。围绕讲好中国故事、传达好中
海量地形场景绘制是高效表现空间信息的基础,是地理信息系统、虚拟战场环境等大多数虚拟现实系统必不可缺的重要部分。各种传感器获取的高分辨率数据为地形绘制提供更逼真效