基于三维图像的人体姿态识别研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:MagicStone2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着RGB-D三维视频采集设备的日益普及,针对RGB-D视频的计算机视觉任务的研究越来越受到重视。相比于传统的RGB视频,增加的深度信息可以有效恢复场景的纵深信息,从而提升后续识别任务的精度。在此背景下,本文主要对RGB-D视频的人体姿态识别进行研究,利用深度神经网络进行三维关节点识别,并利用识别出的关节点数据进行后续动作分类,并在车内场景中验证所提算法的可行性,将算法与实际需求相结合。以下是本文的主要研究内容和贡献:第一,构建了一套车内的RGB-D姿态数据集,利用RGB-D摄像头和可穿戴惯性传感器采集数据。该数据集包含RGB视频、深度图像以及驾驶员三维关节点信息;并提出了一种时空同步方法,利用特定信号对齐和摄像机投影回归将多个数据流进行时间、空间对齐;通过特定人工标注帧的标注结果拟合实现大规模数据自动标注,减少人工工作量,为后续的姿态估计和动作识别提供可靠的车内场景数据。第二,设计了一种基于RGB-D数据的人体姿态估计算法模型。整个算法分为相对姿态估计和绝对姿态估计。相较于只使用2D姿态回归3D姿态的一些相对姿态估计算法,本文额外使用深度图像以弥补RGB图像的深度缺失。首先将典型2D姿态估计算法的结果和深度图像特征作为输入,结合空间注意力机制对深度图像特征提取,用深度特征和2D姿态回归出人体相对3D姿态;绝对姿态估计使用深度图像进行特征提取,检测出人体的根节点位置,结合相对姿态的估计结果即可得到人体的绝对姿态。在Human3.6M数据集上对算法性能进行测试,并与只用2D姿态的基线算法进行了对比。实验结果表明,提出的人体姿态估计算法能够有效减少平均关节点误差和根节点定位误差。第三,提出了一种基于三维骨骼序列信息的多尺度共现特征动作识别算法。目前学术界许多用于动作识别的图卷积模型将重点放在空间特征的学习上。提出的算法模型引入多尺度时域特征,采用多尺度时域卷积核提升模型对于时域特征信息的学习能力,从而使模型能够对不同持续时间的动作进行更好的识别;该算法使用图卷积模块学习人体拓扑关系特征,利用卷积的特性以及注意力机制学习非直连关节点的相关性,使空间特征的学习不受限于人体结构。实验结果表明该模型在NTU-RGB-D和Kinetics数据集的实验性能均超过了基线模型,并能够在车内数据集中对异常驾驶行为有效识别。
其他文献
随着近年来互联网新兴业务的快速发展,网络中的通信流量呈现爆炸式增长的态势,建立一个超高速、长距离和大容量的光通信网络成为研究的热点。而传统的光网络是基于电层交换的网络系统,需要在光网络节点处进行“光-电-光”的转换,随着网络中流量的急剧增长,“电子瓶颈”终将制约光通信系统的高速传输,全光信号处理技术因其能够充分利用光域处理的大带宽以及减小电光转换过程的处理时延等优势,成为当前的研究热点之一。QPS
教育学虽然是国家一级学科,但当其作为一门专业出现时,常常因培养目标不明确、就业范围狭窄等问题引发质疑.该专业的同学更是处于“摸不着头脑”的状态,对自己师范生的身份感到怀疑,极大地影响该专业学生的专业认同感以及未来就业方向的选择.以L大学教育学专业本科生为例,本文以访谈和问卷调查的方式了解该专业本科生对其专业的认同程度,并分析形成该局面的影响因素,从而就提升教育学专业认同感提出建议.
随着高速率大容量的通信需求不断增长,高吞吐量卫星通信系统正在成为未来研究的重点。在这种发展趋势下,存在两种可以提升系统吞吐量的卫星通信系统:第一种是可以提供高卫星资源利用率和高等效全向辐射功率的多波束卫星通信系统;第二种是由多个卫星组建可以提升系统吞吐量的卫星分集-虚拟MIMO通信系统。除此之外,融合上述两种通信系统的多个多波束卫星通信系统可以进一步提升系统性能。然而,多个多波束卫星通信系统的应用
在中国现阶段,常见的网络社交渠道有:社交网站、微博、微信、QQ、bilibili、和各种直播平台等,其中腾讯旗下的社交软件用户数量最多。随着手机的普及,5G技术的成熟落地,各种发达的信息咨询使得社交平台已成为人们日常生活的一部分,已经离不开社交平台。但社交平台就如同一个双刃剑,发达的信息技术并没有很好的保障大众的信息安全,反而暴露出了各种各样的问题。如在网络服务中用户的个人信息遭到黑客攻击窃取;系