从人脸到人脸:部位检测研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:vbkiller2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉中的很多研究对象都可以分解为结构学意义上的多个部件的组合,比如人体可以分解为头、躯干和四肢,而人脸可以分解为眼睛、鼻子、嘴巴和下巴等。检测对象所包含的部件是计算机视觉中一项重要而基础的任务,基于部件检测,我们可以:1)规整化对象姿态;2)提取兴趣区域;3)计算局部特征;4)推理语义信息等。除了结构学意义上的部件,我们还可以定义带有某些特殊属性的部件,并通过检测图片中是否包含这类部件来判定图片的类别。比如,我们可以通过检测图片中是否包含带色情信息的人体部件*来判定给定图片是否为色情图片。
  一般而言,一个对象的多个部件之间具有一定的空间关系,这种空间关系在同时检测多个部件的过程中会起到重要的约束作用。然而,对于不同的对象,部件间空间关系的强弱各不相同。比如,人体部件之间的关系相对灵活一手臂既可以在肩上方,也可以在肩下方,而人脸部件之间的关系则相对固定一鼻子只能在眼睛下方,而不能在上方。此外,如果我们的检测目标是某一类部件(比如人体色情部件)而非多个不同的部件,部件检测问题就退化为一般意义上的对象检测问题,检测过程中不需要考虑部件间的空间关系。
  目前的文献中通常把不同的部件检测任务作为独立的课题来研究,比如人体部件检测(又叫姿态估计)和人脸部件检测(又叫人脸对齐)通常被认为是计算机视觉中两大不同的课题。据我们所知,目前还没有一篇论文从横向角度来观察和分析不同的部件检测任务,并揭示它们之间的区别和联系。为了填补这一空白,本论文按部件间空间关系从无到弱到强的顺序一从人体到人脸十,以无空间关系一色情部件检测,弱空间关系一人体部件检测,强空间关系一人脸部件检测这三个具体的任务为例,针对每一个任务分别提出了自己的新算法,并讨论了空间关系强弱对于部件检测建模思路的影响,以及其它若干重要的问题。
  具体而言,本文的主要贡献可以总结为以下四点:
  1)研究了如何利用部件检测技术识别色情图片。我们首先给出了色情部件的定义,包括关键色情部件和目标色情部件;然后提出了一种度量任意图像块色情程度的方法,解决了目标色情部件定义中涉及的主观性和模糊性的问题;最后提出了一种深度加权多示例算法,在训练色情部件检测器的过程中显式地嵌入了不同示例的色情程度。为了评估本文方法的性能,我们收集了一个包含138,000色情图片和205,000张正常图片的大型数据库,并且在100,000张色情图片和100,000张正常图片的测试集上取得了优异的结果:FalsePositiveRate1%的情况下,TruePositiveRate达到97.52%。
  2)提出了一种基于姿态专家的人体部件检测算法。我们在学习空间关系模型之前,首先在姿态空间对样本进行聚类,然后利用聚类得到的每个小组内的姿态相近的样本分别学习树结构姿态估计器,并将这些估计器称为姿态专家。由于训练阶段隐式地施加了特定的全局姿态偏好,每个姿态专家都能更好地处理特定的人体姿态。测试时,我们将所有姿态专家估计结果中置信度最高的结果作为输出。我们提出了两种样本聚类的方法,并且在两个公开数据库上验证了姿态专家算法的有效性。此外,我们基于所有姿态专家估计的结果,提出一种鲁棒的人体动作识别算法并取得了很好的实验效果。
  3)提出了一种鲁棒的判别式Hough投票的人脸部件检测算法。我们首先在受限局部模型的框架下统一了主成分分析模型和形状模板模型,然后在形状模板模型的基础上提出了我们改进的基于Hough投票的人脸对齐算法。相比原来的形状模型方法,我们的方法使用了更少的锚点(通常只用一对眼睛),并对锚点定位的误差具有较强鲁棒性。我们还提出了一种判别式的模板选择算法可以更精确的选择与当前测试人脸相匹配的模板。我们的算法在四个困难人脸数据集上取得了优异的结果。
  4)基于以上三个具体的部件检测任务,我们总结了空间关系强度对于部件检测建模思路的影响,并针对部件检测算法最核心的构件一形状模型展开了三组讨论,包括近年来流行的隐式形状编码方法的动机和优缺点;经典的树结构模型和主成分分析模型各自对应的数据分布假设;形状模型的灵活度的可能改造方案。这些讨论让我们能够更好地理解目前最先进的部件检测算法的合理性和局限性,并期望可以启发出更多优秀的算法。
其他文献
川办发[2021]5号各市(州)、县(市、区)人民政府,省政府有关部门、有关直属机构,有关单位:《四川省十大文化旅游品牌建设方案(2021—2025年)》已经省政府同意,现印发给你们,请结合实际认真组织实施。
本文以产业转移升级创新收益机理分析为切入点,基于能力结构与区域经济合作利益分配模型,对京津冀各城市产业协同创新收益分配态势进行测度,研究认为城市群各城市通过产业转移升级能够获取创新收益,各城市产业协同创新能力耦合度大小对创新收益分配有重要影响;京津冀城市群内各城市创新能力差异较大、创新能力耦合网络有一定优化空间,政府的产业转移升级政策对促进各城市创新收益分配趋向均衡
在数字通信中,电子侦察往往会通过对截获信号的盲解调来获取信息。盲解调作为非协作信号处理的一个关键技术,其方法涵盖参数估计方法、调制识别方法、符号同步与载波同步方法以及盲均衡方法。本文研究了MPSK、MAPSK信号的通用盲解调方法,在深入研究盲解调算法原理基础上,完成算法的性能仿真。全文的主要工作包括:首先,载波频率和符号速率在解调中是需要已知的,对于非协作侦察来说,
多传感器图像融合已经成为近年来图像工程的研究热点之一,在军事、医学影像、遥感图像和计算机视觉等领域得到了广泛应用。所谓的多传感器图像融合是指,采用一定融合规则,使不同传感器图像中的特有信息在融合图像中都有所反映,融合图像具有比单一传感器图像更丰富的信息量。本文主要是在小波变换基础上,对多传感器图像融合算法进行研究,主要工作如下:1. 阐述了多传感器图像融合的背景、层次结构和一般方法,对多分辨率金字
学位
传统鲁作家具是中国明式家具的一个重要分支,是带有明显山东地域文化特征的优秀民间艺术,它的发展离不开齐鲁文化的滋养,应时而生,载道于器。本文从齐鲁文化入手,创新性地阐述了齐鲁文化儒、雅、仁、礼、中、庸、天、道、和、谐等思想对传统鲁作家具的意境、功用、构型、材饰、设计等方面的影响。力图发掘鲁作家具的魅力,为当代鲁作家具的发展提供借鉴。
近期,笔者对纳入全国碳排放权交易市场的6家武汉电力企业开展调研。调研发现,碳配额抵质押贷款是盘活企业碳配额资产的重要方式,但提供金融服务时需注意多方面问题。同时,对金融机构支持碳市场建设提出政策建议。
各种应用需求促使了大量的异构平台的涌现。典型的异构平台加速器包括数字信号处理器(DSP)、面向通用计算的图像处理器(GPU)、众核协处理器(MIC)以及硬件加速器(FPGA)等。  针对异构平台的编程优化面临诸多挑战。由于各种异构平台体系结构的差异,所采用的编程方法以及并行优化方法都将不同。针对GPU这种含有大量并行计算单元并以SIMT方式执行的异构平台,编程实现中,需要特别注意避免条件分支语句的
学位
随着物联网各项技术的不断发展,基础设施不断完善,创新的数据采集与信息交互方式提供了测量,预测、理解和改变环境的新手段,推动着物联网系统在个人健康、公共事务、智能家居等领域得到广泛应用,成为了人类连接未来生活的桥梁。随着人们对应用需求的不断增长变化,互联网上将接入海量不同类型的智能传感设备为用户提供各类服务。通过统一的平台实现海量设备的在线实时管理、按需整合各类设备服务形成创新的物联网应用成为未来物
学位
本论文研究加密散列函数在面对强力测试时的安全性问题。实践证明加密散列函数在保护信息真实性、完整性方面发挥着重要作用。加密散列函数的应用包括完整性验证、消息认证和数字签名。全文首先对加密散列函数的理论研究结果进行了概述,描述了传统散列值安全性分析算法,并研究了传统散列值安全性测试算法存在的不足。暴力搜索算法在面对较大的密钥空间时,效率较低,而字典和查询表算法又存在占用空间较高和无法直接应用于通用硬件
本文以复杂网络特性以及链路预测算法为主要研究内容,研究的主要目标是提升复杂网络中链路预测算法的准确度,并且期望将复杂网络的结构特性应用到链路预测中去从而提升算法的预测效果。  首先,通过实验去模拟复杂网络中WS小世界模型及BA无标度模型的建立过程,由实验结果去分析各模型中聚类系数与重连概率或网络规模之间的关系。并且发现WS小世界模型中聚类系数的计算公式依赖于网络规模这样一个前提。  其次,本文对现
学位