论文部分内容阅读
近年来,我国人口老龄化趋势加剧,空巢老人的陪护问题越来越突出。传统雇用家庭陪护人员的方式服务水平参差不齐,人力成本也持续提高。随着机器人、机器学习、计算机视觉等人工智能技术的飞速进步,家庭陪护机器人相关方法和技术进入全新发展阶段。鉴于家庭陪护机器人正常工作的前提是能够获取陪护对象的位置,这样才能据此进一步实施后续状态评估、运动规划、导航避障等工作,因此有必要研究适用于非结构化家庭复杂场景的多人动态实时定位方法。本文研究了基于单目视觉的动态多人定位方法,通过构建的多元回归人体定位模型,建立了人体从2D图像空间到3D位置空间的非线性映射关系,并结合多目标跟踪方法,最终实现视觉多人定位功能。本文的主要研究如下:(1)针对多人定位的实际应用场景,同时为了提升人体定位模型的效果,提出了人体定位数据样本集的构建方法和人体定位特征的构造方法。根据时间戳对获取的人体3D位置真值标签和人体2D图像骨架特征进行同步与匹配,得到均匀分布的人体定位数据样本集。另外,通过对人体2D图像骨架特征进行特征构造,得到与建模目标密切相关的人体定位特征,从而增强人体定位模型的可解释性。(2)针对相机存在标定误差以及单目视觉相机无法直接获取人体深度信息问题,提出了基于多元回归的视觉人体定位模型。通过将人体2D空间到3D空间的非线性映射融合到所构建的人体定位多元回归预测模型中,以实现人体定位。该方法基于单目视觉相机实现,计算量小,同时无需对视觉相机进行内外参数的标定,实用性强。(3)针对面向家庭陪护的非结构化复杂场景,尤其是多人场景中频繁发生的目标遮挡、目标交互、目标消失等问题,提出了基于人体3D定位数据的运动模型和基于颜色特征与HOG特征的外观模型。通过将人体定位数据融合到运动模型的状态变量中,同时采用颜色特征和HOG特征共同描述人体的外观状态,可以更好地反映陪护对象的真实运动状态,并减少目标遮挡等情况造成的错误匹配现象,进而增强目标匹配的鲁棒性。本文的研究成果在自主开发的视觉多人定位平台系统进行了实验与应用验证,表明了上述研究的可行性与有效性。