基于深度学习的人体姿态生成方法研究

来源 :沈阳理工大学 | 被引量 : 0次 | 上传用户:sjh_qj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态生成作为深度学习和计算机视觉领域的研究热点,已经被广泛的应用在人机交互、医疗辅助、智能监控识别等诸多领域。近年来,随着人工智能的兴起,利用生成式对抗网络的理念进行人体姿态生成的研究已经受到了越来越多的学者关注,并基于生成式对抗网络提出了很多改进的生成方法和理论,但是在人体姿态图像生成的过程中仍有训练过程不稳定,生成图像特征的不可控,以及生成图像质量不够的问题。本文针对在人体姿态图像生成过程中出现的训练过程不稳定、图像特征不可控、以及生成质量不高等问题,利用特征提取、姿态与语义特征融合、搭建新的网络模型进行人体姿态图像的生成,并采取不同的优化方法实现对人体姿态的高质量可控生成。在解决问题的过程中,具体工作如下:针对人体姿态图像生成过程中生成姿态特征存在不可控性的问题,本文利用特征提取和深度学习的方法,以卷积神经网络为基础,对人体姿态进行特征的提取并与语义融合为潜在特征向量,在生成网络中加以控制。针对生成过程中图像生成质量不高的问题,通过对人体姿态图像特征的研究,设计生成网络和判别网络模块,搭建TCI-GAN(Text control image-GAN)网络模型,并根据研究的目的和网络结构构建损失函数。针对生成人体姿态图像训练过程不稳定的问题,对网络损失函数和优化方法加以改进,特征提取网络及生成网络分别采取不同损失函数和优化方法优化网络权重、调整网络参数,并在判别网络梯度下降中加入Lipschitz条件限制,提高网络的稳定性。通过实验验证本方法在人体姿态的可控生成以及生成图像质量上达到了良好的效果,对比其他网络,本网络IS(Inception Score)分数更高,并且对生成的姿态图像实现可控性生成。实验验证了该网络在人体姿态生成方面表现出更好的质量和可控性。
其他文献
随着人口老龄化的日益加剧,在我国出现了越来越多的独居老人,这些独居老人由于独自在家无人照顾的缘故,一旦出现室内跌倒的情况就会十分危险。为了及时发现这些室内跌倒行为,一个可以在室内环境下实时检测跌倒行为的系统就显得格外重要了。而随着计算机视觉和深度学习近几年的飞速发展,二者的结合解决了很多实际问题,从最初的图像识别、物体识别已经发展到现在的行为识别和姿态估计。本文利用了深度学习中的代表算法——卷积神
本文针对基于深度学习的三维物体建模方法开展研究,从多模态特征融合和基于多网络协同学习的角度探索提高三维模型生成精度的方法。研究了基于多视角和单视角的三维模型生成方法并提出改进措施。本课题的主要成果包括以下几个方面:针对三维模型特征提取的问题,本文提出一种基于自编码网络的改进网络,从原始的三维物体模型中重构出该目标物体的三维模型,并得到输入原始三维模型的鲁棒性特征表示。实验表明,该自编码网络取得了比
在21世纪,随着我国科技发展的不断进步,汽车已经成为人们出行的主要交通工具,也成为了每家每户必不可少的日常用具之一,随着汽车行业发展的不断推进和汽车数量的逐渐扩增,城市的交通拥堵也日益增大,同时道路交通的管制也变得越发困难。道路拥堵、事故多发等因素,不仅对交通管制形成了严峻挑战,也同时对驾驶员增加了巨大的压力。道路交通标志物可以起到对驾驶员传递指路、警示、限制等重要信息,可以引导驾驶员安全驾驶,保
水下传感器网络(Underwater sensor networks,UWSNs)被广泛应用在监测海洋环境、探测海底目标及收集海洋数据等方面,引起了军民两领域的密切关注。UWSNs的特点是采用声波通信,由于水声信道具有低带宽、长传播时延和高误码率等特点,因此,构建高效的通信网络非常重要。要实现数据的高效传输,关键之一是根据水声信道特点设计MAC协议。本文针对大规模水声异构传感器网络的特点和水声信道
近年来,随着深度学习技术在计算机视觉领域的广泛应用,图像语义分割问题吸引了大量计算机视觉研究者。其作为计算机视觉任务中一个重要的组成部分,被广泛应用与各行各业。例如自动驾驶、医学影像分割、行人检测、室内机器人等领域。其主要任务是在复杂的实际应用场景中对图像中的每个像素点进行类别区分。为了实现在室内环境下对人物进行精准的语义分割,综合考虑室内环境下的语义分割难点,基于深度学习模型,开展室内环境下的语
人脸属性生成和风格迁移作为计算机视觉的研究重点,已经广泛的被应用于人脸数据扩充、人机交互、虚拟机器人、人脸修复等诸多领域。2014年,Goodfellow首次提出生成对抗网络GAN,其模型任务旨在实现图片以假乱真,这使得人脸属性生成和风格迁移得到了迅速的发展,越来越多的人对该网络进行研究,通过对GAN的改进也得到了许多变种网络,在不同方面的改进使得网络的效果得到了巨大的提升。但是在人脸属性生成过程
自整定方法在工业控制过程中被广泛应用,主要是由于其具有自动化和智能化的特点。在工业应用中,控制器性能质量直接关系到控制系统的好坏,影响产品质量的好坏。因此,确保控制器性能良好尤其重要。PID控制器作为一个常用的控制器,它的整定方法具有很多种,主要是通过控制要求及环境等条件不同,采用不同的控制方法,在选择控制方法中需要充分的考虑到算法的可行性、收敛性,并且对算法要综合考虑负载干扰、环境干扰等因素造成
磁控形状记忆合金(Magnetically Controlled Shape Memory Alloy,简称MSMA)是一种近年来新兴的智能材料。与已知的压电陶瓷和形状记忆合金相比,它具有输出形变量大、响应速度快、能量转换率高等优点。MSMA材料在磁场的作用下可以获得较大的形变量,并在磁场消失后还可以维持较大的形变量,称为材料的正特性;同时,MSMA材料也可以在力的作用下,随着MSMA材料的形变引
复杂面部表情图像生成是深度学习中的一个研究热点。在虚拟化战场推演中,多智能体识别敌方的复杂表情,根据面部反映的不同表情做出战略调整。高质量的面部表情图像生成可提高多智能体表情识别的准确率,促使推演系统高效地做出最优作战策略。警员学习不同情境下推演出的制胜策略,及时准确地制止现场犯罪活动,给处理复杂的真实场景提供经验,对保障国家和人民安全具有重要的实用价值。复杂面部表情生成实质体现在表情强度可控,而
近年来互联网、机器学习、人工智能、边缘计算等高端技术的发展越来越迅速,在技术的不断融合与创新中,也促进了我国的高端制造业的发展。主要体现在生产更智能化,生产效率更高效化、生产的工业产品流程更复杂化等方面。复杂的工艺流程意味着工厂进行每一步操作都可能有异常工况的发生,工业现场的复杂化给工艺产品高质量生产带来了巨大挑战。工业控制系统是整个工业生产的“大脑”,工业控制系统的安全是国家与企业的关注所在。本