低分辨率人体姿态估计方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:yhbin2yhbing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态估计旨在高效、准确地定位人体关节点,是计算机视觉理论的实际应用,是行为识别、人机交互等研究方向的技术支撑,在计算机视觉领域中起着承上启下的重要作用,是国内外学者的研究热点。尤其近十几年来,随着深度学习理论的深入研究以及高性能计算平台的技术革新,人体姿态估计方法得以飞速发展。国内外学者从神经网络结构设计、关节点的编解码方式、模型效率等角度对人体姿态估计方法展开一些系列的研究,并取得了诸多的成果与应用。例如,卡内基梅隆大学、上海交通大学、脸书公司均已开源自主研发的实时人体姿态估计系统,为行为预测、行人重识别等领域提供强大的技术支持。现有基于视觉的人体姿态估计方法大多以高分辨率图像作为模型输入获得人体关节点位置信息。然而在实际应用中由于图像设备性能、传输带宽、场景时效要求等限制,难以提供高分辨率的视觉图像,从而导致现有人体姿态估计方法性能的降低。为了提高低分辨率场景下的人体姿态估计方法性能,本文分别从关节编解码的量化误差、关节位置的不确定性、多尺度特征偏移三个方面深入研究讨论,主要工作包括:(1)针对低分辨率人体姿态估计任务中的量化误差问题,本文采用适用于低分辨率任务的复合关节场编解码关节点位置信息。首先,本文分析了估计误差对编码关节粗略位置的热力图扰动,设计高斯加权的热力图。其次,本文深入探讨关节偏移向量场训练与关节点预测的内在不对齐问题,设计一种置信感知的偏移向量场学习方法,使用热力图的预测信息引导偏移向量场的学习过程,从而耦合关节点复合场的训练和预测,保证两者的一致性,提高低分辨率关节点预测精度。最后,在COCO数据集上验证所提置信感知偏移向量场学习方法在低分辨率图像场景的优越性,同时展示所提方法对高分辨率人体姿态估计同样有效。(2)针对低分辨率关节点的定位不确定性问题,本文通过在关节复合场中引入不确定性估计实现低分辨率关节点预测。首先,采用关节点概率分布表征关节定位不确定性。具体而言,将关节点复合场分别建模为概率分布,利用高斯函数建立关节热力图和偏移向量分布,将确定性关节点回归转换成关节概率分布回归。其次,观察到用于分布距离描述的相对熵损失函数会造成梯度爆炸现象,从而导致模型难以收敛。通过定量分析模型梯度设计一种适用于关节点不确定建模的损失函数保证模型平稳训练。再者,根据模型梯度分布设计一种基于偏移向量场分布的置信投票机制,将关节点不确定建模融入关节点预测,保证模型训练与预测的一致性。最后,通过实验对比不同损失函数、关节点预测后处理机制证明所提方法在低分辨率人体姿态估计任务的有效性。(3)多尺度特征融合时存在特征偏移问题,对低分辨率任务尤为严重。针对这一问题,本文设计一种通用的多尺度特征无偏对齐策略解决特征偏移问题以提升模型性能。首先,系统地建模多尺度融合中特征位置映射关系,探究多尺度融合中特征偏移现象及其根本原因,同时量化特征不对齐导致的具体偏移误差。其次,根据不同的尺度融合方式、应用场景中特征映射的数理关系提出用于多尺度特征无偏对齐的通用方案。再者,将特征无偏对齐方案应用于低分辨率人体姿态估计任务,设计无偏数据处理、基于无偏特征对齐的姿态估计模型、无偏关节点编解码方式,提出一种无偏的人体姿态估计方法。最后,实验验证所提无偏人体姿态估计方法在低分辨率人体姿态估计任务的优越性,同时表明无偏特征对齐方案适用于高分辨率图像和其他姿态估计模型。
其他文献
城市草坪是一类重要的城市生态景观,而草坪的水量平衡则是城市生态水文过程的重要组成部分。在干旱半干旱地区,水资源的严重匮乏和草坪不合理的灌溉现象导致城市水资源巨大的供需矛盾,目前,我国城市草坪的灌溉管理水平普遍较低,同时城市水资源的合理利用率较低,从而提高城市草坪的灌溉管理水平和有效利用水资源这一问题亟待解决。因此,优化城市草坪的灌溉制度对缓解水资源供需矛盾和提高水资源利用效率具有重要的现实意义。本
研究目的:所谓"惩戒",即是指"通过处罚来警戒",随着教学改革步伐的加快,体育教学的理念也发生了一定的变化,鼓励成为了课堂教学的"维生素",体育惩戒是一种教育性惩戒手段,在当今社会由于受到传统体育教育观念的影响以及法律法规对教师的惩戒权缺乏明确的规定,致使在现实教育中时常出现一些不合教育性、道德性、合法性的惩戒现象。在现实教学中如何看待惩戒教育及如何合理使用体育教育惩戒权利成为亟待解决的理论与现实
固体氧化物燃料电池(SOFC)因为具有高转化率和环境友好等优点被广泛关注。A2BO4型类钙钛矿因具有突出的热稳定性以及较小的热膨胀系数(TEC)等优点,有望成为SOFC的阴极材料。本论文系统研究了新型Ln2Cu O4+δ(Ln=Pr,Nd,Sm)类钙钛矿材料的制备、组成以及电化学性能,通过对其A位进行掺杂来提高材料性能。首先,在A位进行Y3+的掺杂。采用溶胶凝胶法在1000℃下煅烧24 h后合成了
进入二十一世纪,信息系统的快速发展和效率的提高,市场体制的完善,经济的发展以及全球化的不断推进,对某些集团企业的发展起到了一定的推动作用。许多大型集团企业开始通过各种方式来提高市场竞争力,然而企业的扩张必然会导致许多业务的重组,例如对财务工作来说,会带来工作量增大、工作成本提升、信息重复等问题,使财务工作的效率降低。而建立财务共享服务中心能在一定程度上缓解这些问题,从而提高财务工作效率。财务共享服
我国非遗保护工作已走过了近20年的历史,在非遗文化资源的濒危性抢救、构建合理完善的非遗传播途径以及发展性保护方面积累了独特的经验、取得了非凡的成就。近年来,我国非遗主题图书不断涌现,受众群体不断扩大,带来了显著的社会效益和经济效益,正在成为图书出版的新趋势。本文以“当当”综合网上购物商城、京东商城销售的青海非遗主题图书为调研对象,总结分析当前青海非遗主题图书的出版现状、出版方式、存在问题及发展趋势
<正>绞胎和绞釉陶瓷是中国古代陶瓷中两个颇为特殊的品种,在外观上有相似之处,容易造成概念上的混淆,但两者出现和流行的年代有差异,在工艺上也完全不同。绞胎器流行于唐宋(金)时期,元代以后逐步衰落,做法是"把配出的深色和白色泥切成薄片,按造型要求堆叠成雏形,然后放到刻好形体的陶范中挤压成型"[1]。唐代绞胎器的器形以枕为主,分全绞胎和半绞胎两种,全绞胎
期刊
市场操纵扭曲股票价格,降低市场资源配置效率,对国民经济造成严重危害。分析师作为股票市场信息中介,能够促进投资者之间的信息共享,提高市场效率,研究分析师关注对市场操纵的影响,能够从中介机构的角度为防范我国股市的操纵行为提供建议。本文通过构建收盘价操纵识别模型探究我国股票市场中分析师关注对市场操纵的影响,并结合离散变量的中介效应检验模型探究分析师关注抑制市场操纵的作用机制。研究发现,第一,我国股市中分
一直以来,不平等问题备受社会各界关注,联合国《2030可持续发展议程》明确提出“减小国家内部和国家之间不平等”的具体目标,在此之中,如何降低收入不平等可谓首当其冲的问题与挑战。不少研究基于国别或区域层面展开,鲜有研究能将各国间不平等与各国内部收入不平等置于统一的分析框架下,实现两者的统筹兼顾。此外,随着全球化的加深,密切了各国联系,一国之内的收入不平等亦将超越国界影响其他各国,然就现状而言,世界大
China’s intangible cultural heritage shadow puppet shows its more than two thousand years’ history.In today’s era full of luminous screens,few lights are still projected on the shadow puppets.The shad
《闲情偶寄》是明末清初文人李渔撰写的一部“寓庄论于闲情”的随笔,共分词曲、演习、声容、居室、器玩、饮馔、种植、颐养等八部,论及戏曲理论,妆饰打扮、园林建筑、器玩古董、饮食烹调、竹木花卉、养生医疗等诸多问题,内容相当丰富,是作者一生艺术感受和生活感受的结晶,充满了独特的文化情趣和鲜明的人文意识。此书堪称“古代生活艺术的袖珍指南”,在中国思想文化史上具有重要而独特的地位,沉淀着多重文化意蕴的真实素材,