基于标签分布的头部姿态估计算法研究及其应用

来源 :华中师范大学 | 被引量 : 2次 | 上传用户:zhl165408
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的发展为教育的改革创新注入了新的活力,为教育现代化发展提供了新途径。学校的信息化教学环境已基本建立,以多媒体与网络为代表的信息技术广泛运用,丰富了教学内容表现形式及教学活动形式。然而,教学模式多局限于“传递——接受”的传统模式,学生的主体地位得不到体现,不利于个性化发展。因此,为了充分体现学生的主体地位,教学过程中掌握学生的学习状态或兴趣是非常必要的。注意力能客观地反映学生的学习状态或兴趣,是实现个性化教学的关键。头部姿态是个体的头部朝向,在很大程度上反映了注意力方向,因此为掌握学生的注意力,本文展开头部姿态估计算法的研究。头部姿态估计是指利用计算机视觉和模式识别技术来估计数字图像中头部的朝向。头部姿态估计具有广泛的应用前景,近些年受到研究者们越来越多的关注并且取得了不错的进展,然而在实际应用中仍然无法获得理想的性能。影响头部姿态估计算法性能的关键因素包括:(1)标签的准确性。标签的真实合理是算法有效性的前提;(2)特征的有效性。增强有效特征、降低干扰因素是提高性能的关键;(3)方法的泛化性。方法的泛化能力是算法能否实用的保障。具体来讲,存在的挑战有:(1)数据集标注困难。自然场景下无法获取精确的头部姿态标签;(2)面部身份信息干扰。同一个体的身份表观相似性高于不同个体同类头部姿态之间的相似性;(3)泛化能力弱。通常在一个数据集上训练好的模型应用到另外一个数据集时性能呈明显下降。针对以上挑战,本文首先提出基于弱学习策略标签分布构造方法,有效降低了构造的标签分布与真实分布之间的差距;然后提出正则化卷积神经网络学习鲁棒性的深度特征,同时发展人脸鉴别辅助的深度多任务学习方法,降低面部身份信息对学习头部姿态特征的影响,显著提升了准确率;最后提出基于标签分布的分类及回归融合的方法,有效缓解头部姿态估计跨数据集性能下降问题,该方法的实用性在实际教学大场景中得到初步验证。本文研究工作主要体现在以下几个方面:(1)为了解决高斯函数产生的标签分布不能合理地描述真实的标签分布问题,本文提出了一个弱学习策略,其采用数据驱动的方式为训练集中的每个头部图像学习一个近似合理的分布,学习的分布随后用作监督信息。当无法获取更多的标记信息时,例如仅知道水平角度,传统的基于标签分布的方法性能明显下降。为此,本文进一步将正则化项以及正相关和负约束引入到损失函数来提高学习模型的泛化性能。(2)为了提升单一背景下头部姿态估计的准确率,本文提出了一个新颖的头部姿态估计框架。其采用一个轻量级并且鲁棒的卷积神经网络架构,由一个主干网络和三个子网组成。该架构以整个图像作为输入、标签分布作为监督信息,通过两种类型的目标函数(KL散度损失和Jeffreys散度损失)来优化。实验结果证明,提出的方法能够很好的学习带有互补特性的深度特征表示,并且能够挖掘更有区分性的类判别区域。(3)为了缓解面部身份信息对头部姿态估计的影响,本文提出了一个联合头部姿态估计和人脸鉴别的深度多任务学习框架,其中头部姿态估计为主要任务,人脸鉴别为辅助任务。考虑到人脸鉴别的区分性特征主要在于人脸区域,而头部姿态应该尽可能地包含整个头部区域,因此分别地将这两种不同的图像区域输入到两种不同的任务。这两种任务在网络前端共享特征表示,然后通过数据分离模块分离两种不同的区域并送入到各自的任务分支,最后采用两种类型损失函数的加权来进行优化。(4)为了实现教室大场景下的头部姿态估计,本文提出了基于标签分布的分类和回归融合的头部姿态估计方法,并且使用大规模的合成数据集来训练提出的模型,在教室场景数据集上进行的跨数据集头部姿态估计实验中表现出优秀的性能。此外,我们提出了一个更合理的注意力几何模型来建模注意力点、个体在世界坐标系中的位置以及估计的头部姿态角度三者之间的关系,并成功地应用到教室场景下的学生注意力识别中。
其他文献
随着经济的发展,产业和金融的结合越来越紧密。没有金融的有力支持,将很难实现产业的快速发展;缺乏产业的依托,金融也将失去其载体。产业投资基金就是在产业成长过程中,产业和金融
低氧是心血管疾病中普遍的现象,不仅急性心梗时伴有缺氧,在许多临床情况下也存在心肌绝对或相对供氧不足。研究表明,低氧应激能够通过调节生长因子、酶、应激蛋白质等的基因表达
由于消费者对山羊奶干酪特殊风味和营养性、益生性的喜好,导致山羊奶干酪今年研究呈现逐渐增多的趋势。羊奶干酪己经成为其饮食结构中不可缺少的一种食品。但由于山羊奶受产
随着2013年余额宝的问世,我国互联网金融市场发展迅速,同时也带动P2P网络借贷行业的发展。我国正常运营的P2P平台数自2012年底的400余家“暴增”至2015年年底的3400余家,虽20
倒立摆是一个典型的非线性、强耦合、在自然状态下绝对不稳定的系统。它可作为检验各种新型控制方法是否具有正确性的理想装置。在其控制过程中,能反映出许多控制领域中的关键问题,如鲁棒性、随动性及快速跟踪等。因此,将倒立摆作为研究控制方法的对象具有重要的理论研究意义和工程指导意义,获得成功的科研成果已被普遍应用于航空航天、机器人等领域。本文以直线二级倒立摆为控制对象,对其进行稳定性控制方法的研究,研究内容有
女,75岁,因腹痛、腹胀伴呕吐7 d入院,体质量下降。既往有胆囊结石、胆囊炎约8年。腹部立位平片示肠腔内有少许肠气,左上腹部及中下腹部见数个液平影,较长液平位于左上腹部。X
目的:对于牵张成骨用于治疗皮罗氏序列征患儿OSAHS的效果进行Meta分析。方法:通过系统检索1990年1月至2020年6月中国期刊网全文数据库、万方数据库、Pubmed、Web of Science
归一化植被指数(NDVI)时间序列数据已经成功应用于全球与区域环境变化、植被动态监测、土地覆盖变化和植被生物物理参数反演等多方面的研究。NDVI时间序列数据受到云、气溶胶
项目活动是现代素质教育过程中的重要组成部分,在教学进程中发挥着极其重要的作用。如何在项目活动中推动深度学习的展开,则关系着活动的效果和学习能力的培养。而相比小学、
齿轮传动作为最常用的传动方式之一,因其轻质高效的特点广泛用于工业生产、交通、航空航天、仪器仪表等各行各业。近年来,随着电动汽车的发展,研究适用于电动汽车变速器工况的齿轮传动系统这一任务迫在眉睫。本文基于国际科技合作项目《电动汽车轻量化及动力传动系统关键技术合作研究》(2014DFA80440),以及国家自然科学基金项目《精度主导的大重合度齿轮动态设计理论与实验研究》(51775156),针对影响单