CG图像和相机图像的检测与分类标注

来源 :山东大学 | 被引量 : 0次 | 上传用户:case_sheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字图像的检测分类和内容识别标注是在确定图像类别的基础上,对图像的内容进行识别注释。数字图像有多种类型,如相机图像、CG图像、手绘图像等。随着数码相机的普及、图像软件的更新、渲染引擎的优化,图像的种类来源越来越复杂,图像的内容也越来越丰富。因此对数字图像进行检测分类和内容识别非常有必要。传统的检测分类和内容识别方法大都是对图像进行分割后针对每个分割块进行检测和识别。这样引入了图像分割这个额外操作,同时图像分割有可能把同一物体分为两部分,影响检测和内容标注结果。本文采用了对图像进行多次循环处理进行检测分类和内容标注。首先针对CG图像和相机图像的分类,提出了提取边缘过渡梯度、高饱和度颜色分布、图像暗部噪声分布、颜色过滤数组插值特性四个特征作为分类特征;通过对训练图像集提取这四个特征值组成特征向量集,并使用支持向量机进行训练,得到分类器;在检测图像阶段,获取待预测图像的四个分类特征,并使用支持向量机进行分类预测。然后对人物图像进行识别,使用基于Haar特征的人眼检测来给出人物图像的判断,包括Haar特征检测、边缘检测、“U”型线生长和优化、拟合并给出位置。最后通过读取配置文件,循环读取之前的检测结果,实现对图像的标注,并通过web服务器发布数字图像的检测分类和内容识别的web应用。本文实现图像的检测分类和内容标注没有使用图像分割操作,因此算法效率相对较高;使用类似决策二叉树的程序流程,可以方便程序的控制和进一步的扩展;在CG图像和相机图像的分类过程中使用了基于图像成像过程、图像颜色特征等提取的分类特征,有效地对图像进行检测和分类;在人物图像检测过程中,使用基于Haar的人眼检测,可以快速准确地给出判断,并给定具体的人眼位置。上述优点,使本文的图像检测分类和内容标注更加快速、准确、高效、可扩展。
其他文献
随着普适计算和移动计算的发展,嵌入式系统得到越来越广泛的应用。各种嵌入式设备的不断涌现,对系统的可移植性和开发效率提出了更高的要求。与传统的开发语言C/C++相比,java
虚拟现实技术作为一门具有广阔应用前景的新兴科学技术,越来越受到大众的关注。沉浸性、交互性和构想性是虚拟现实系统的三大特征。然而,如果不能对虚拟场景进行实时自然的交
远程教育已日益成为传统教育的重要补充和发展,而虚拟实验室在远程教育中占有非常重要的地位,它不仅解决了由于人数太多,教育资金不足而导致实验场所、实验器材的缺乏,而且实
随着互联网技术的迅速发展,接入互联网的终端也在急速膨胀,人们日常生活中的各种家电、办公设备都将会融入到互联网中,成为浩瀚互联网络的一个节点,为人们提供各种服务。在网络世
基于自然语言的文本水印是近年来文本水印研究的热点。基于自然语言的文本水印鲁棒性强,安全性好,但在不同程度上改变了文本中的词句,扭曲了文本原义,限制了实际应用。在一些
信息化是现代农业的一个重要特征,信息技术对农业经济的发展越来越重要。高效利用农业资源需要充分了解农作物的生长情况,研究作物生长通常要获取叶片面积等参数。本文基于数
近年来,随着城市居民经济水平、生活水平的快速提高,城市居民的日常出行逐渐向便捷、舒适的交通方式转移,作为城市公共交通系统重要构成部分的出租车可以根据乘客的需要提供灵活
在互联网技术飞速发展和普及过程中存在着巨大的安全隐患,其中木马泛滥异常猖獗,技术上不断更新,因此研究木马检测技术有着重要的意义和价值。本论文在研究当今国内外木马检
无线纳米传感器网络(WNSNs)是传感器网络快速发展的产物。WNSNs的提出进一步拓广了无线传感器网络(WSNs)的应用领域。太赫兹频段作为WNSNs的通信频段,具有极性分子能量吸收等其他
射频识别(Radio Frequency Identification,RFID)技术是一种使用射频信号进行目标物非接触式的自动识别技术。由于RFID技术方便的自动识别过程和标签的低廉成本,其已被广泛地