【摘 要】
:
为了更深入地理解视觉世界,计算机不仅需要检测出复杂场景中的单个目标,还要对目标间的关系进行推理。在各种视觉关系中,我们最关注的是场景中的人与其他物体间的关系。人物交互(Human-Object Interaction,HOI)检测是用于判断人与物体间的交互行为的计算机视觉任务,具有巨大的实际应用价值和潜力。HOI检测通常被理解为检测三元组<人、动词、物>,在检测出人和物体的基础上,对候
论文部分内容阅读
为了更深入地理解视觉世界,计算机不仅需要检测出复杂场景中的单个目标,还要对目标间的关系进行推理。在各种视觉关系中,我们最关注的是场景中的人与其他物体间的关系。人物交互(Human-Object Interaction,HOI)检测是用于判断人与物体间的交互行为的计算机视觉任务,具有巨大的实际应用价值和潜力。HOI检测通常被理解为检测三元组<人、动词、物>,在检测出人和物体的基础上,对候选人-物对进行交互分类。由于物体的种类较多,并且每类物体都与多种交互行为有关,因此HOI检测任务具有较大的难度。经典的HOI检测方法采用多路结构,包含人路、物路和空间路。三路分支分别处理人和物体的外观特征以及人和物体的空间关系。其他拓展算法还进一步加入了上下文信息、知识和人体姿态信息。虽然这些方法的检测效果有一定提升,但它们都将人作为一个整体进行处理,没有考虑人体的不同区域对交互的影响。实际上,人体是由许多身体部位组成的。人与物体进行交互时,这些身体部位的状态会同时发生改变并对交互产生不同的影响。与人体的coarse-level视觉特征相比,不同身体部位的视觉特征及与物体的潜在关联能够为HOI检测提供更精细的线索。针对以上问题,本文将Two-stage策略与Multi-level人体特征结合,提出了一种基于Two-stage策略的Multi-level人物交互检测框架。此框架由共享特征提取模块、交互判断模块和Multi-level交互检测模块构成。交互判断模块采用三路结构,利用人物的视觉特征和空间关系判断交互是否存在,并对无交互的人-物对进行抑制。Multilevel交互检测模块用于判定具体的交互类别。该模块在三路的基础上增加了Finelevel身体部位路。该路将不同身体部位的fine-level特征和身体部位与物体间的距离关系结合,从而与利用coarse-level人体特征的人路互相补充,共同辅助交互检测。考虑到不同身体部位对交互行为的重要性是有区别的,我们进一步引入了部位注意力机制的概念。部位注意力模块根据人和物体的空间关系和身体部位间的位置关系获得注意力打分,用来反映各个身体部位的相对重要性。将部位注意力机制应用于Fine-level身体部位路能够增强重要的身体部位的影响,从而更容易区分不同的交互行为。此外,我们还对Multi-level注意力交互检测模块的交互预测得分的融合方式进行改进,加入融合系数并根据交互行为的特点进行混合融合。实验结果表明,相比于已有方法,本方法能够有效降低交互行为的漏检和误检概率,并获得了更高的平均检测精度。
其他文献
随着我国的经济发展进入新阶段,供给侧结构性改革逐渐取得成效,近两年钢铁、焦炭等行业主流企业逐渐开始企稳。伴随着推动制造业强国建设,绿色化、智能化、服务化的发展潮流,会给冶金装备制造业的市场需求带来哪些新变化,对行业内企业来讲具有一定的研究意义。D公司焦炉机械产品市场经过前几年大幅下滑后,近来也出现了企稳现象,后续市场趋势将如何变化,需要从长期、全面的视角进行客观系统的研究分析,有助于企业更加科学的
无线传感器网络包含大量多功能、低功耗、廉价的传感器节点。节点间采用自组织的无线通信方式相互传递信息,协作完成特定功能。无线传感器网络具有部署灵活、扩展方便、成本低、能快速从周围环境中获取信息等优点,在工业、农业、军事用途、环境监测、交通管理、医疗卫生等众多领域都有着广阔的应用前景。由于传感器节点资源受限的特性以及外部环境条件的限制,延长WSN网络的运行周期是一个十分重要的问题。在为无线传感器网络设
随着电子技术的不断发展,各种类型的硬件和软件开始应用到了各个行业中,但是在应用过程中出现的木马严重威胁到了信息管理的安全性,而存在于芯片中的硬件木马在危害程度上显著高于软件木马,这引发了学术界的关注。首先,本文使用EP4CE30F23C8型号FPGA实现了SM3加密算法,以此来模拟一个专用加密芯片。在FPGA中设置了12个环形振荡器(Ring Oscillator,RO),理论上有硬件木马的环形振
鱼油的营养价值极高,常被添加到水产养殖饲料中,但因其包含丰富的多不饱和脂肪酸,在生产运输及储存过程中由于一些不可抗拒的因素作用,性质不稳定的脂肪酸极易发生氧化变质,氧化后的鱼油产生的初级及次级代谢产物如醛、酮、醇、酯、酸等化合物直接影响水产动物对饲料营养成分的吸收和利用,威胁养殖对象的健康,进而给养殖户造成巨大的经济损失。目前对氧化鱼油的研究方向大多集中在其对水生动物带来氧化应激的消极影响,而关于
蔬菜是居民日常生活中的刚需性消耗品,由于自身易腐的特性以及人民生活水平的提高和物流业的发展,蔬菜对冷链的要求不断提高。通海县作为云南省重要的蔬菜生产基地,蔬菜产业
Because of the unique advantages,continuous-variable quantum key distribution has been greatly developed in recent years.Because the devices used in the prepara
随着通信电子产业的迅猛发展,无线终端相关的电子产品日渐增多,无线能量传输逐渐成为相关领域的研究热点。实现无线能量传输的具体方式主要有感应式、耦合谐振式以及电波辐射式三种,其中电波辐射式无线能量传输技术以传输距离相对较远等优势成为最有研究价值的方向。现今,无线能量传输效率一直很低,在众多原因当中,很大一部分原因是由于接收端的整流电路效率低下引起的,而在整流电路当中最核心的整流器件就是整流二极管。通常
我国经济已经从高速增长阶段转向高质量发展阶段,经济增长不仅要看速度,更要看质量。但我国上市公司普遍存在的非效率投资现象,严重制约了企业间资源配置效率、企业资本结构调整与企业价值增长。投资效率是提升企业价值的重要因素之一,然而由于受委托代理问题、信息不对称、管理者过度自信等因素的影响,企业管理者往往很难做出正确的投资决策,导致非效率投资。因此研究影响企业非效率投资行为的因素及其相关性,对于企业完善资
针对目前内镶迷宫滴头滴灌带生产过程中存在的打孔质量不稳定且普遍采用人工检测的现状,将机器视觉技术应用到滴灌带生产中。通过工业相机采集现场图像并进行一系列的图像分析与处理,识别、测量得出滴孔的位置偏差。然后将位置偏差反馈给控制器并控制打孔机进行调整,从而使系统形成闭环,实现滴孔加工位置的在线检测与反馈调节。在对检测系统进行总体结构和工作流程设计后,对机器视觉模块进行硬件的选型与安装。然后重点对基于机
随着城市化进程的快速发展,农村人口急剧减少,产业发展水平滞后,传统文化流失。根据国家政策和地区发展要求,对于具有文化特色和农业基础的贫困乡村,发展乡村旅游成为提升当地社会经济水平的重要手段。通过乡村旅游景观规划设计,优化重组农业产业结构,深度挖掘当地传统文化,保护生态可持续发展,打造特色乡村旅游主题,带动当地旅游经济和农民收益。本文通过文献综述法、实地考察法、归纳总结法、综合分析法,在大量查阅了国