基于可见光与远红外图像深度特征融合的行人检测方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:jieys75001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着国家对于自动驾驶技术的高度重视,行人检测系统作为自动驾驶的核心环节也随之得到广泛关注,它可以被运用到交通检测、视频监控和智能机器人等领域。当前基于可见光图像的行人检测算法虽然取得了较大进展,但是在低光照或夜间等恶劣条件下的检测器性能会出现急剧下降。利用可见光和远红外图像融合的方式可以有效缓解全天候行人检测问题,然而当前基于可见光和远红外图像特征融合的行人检测(简称多光谱行人检测)方法存在计算复杂度高、检测框定位不准确、行人模式特征表达能力弱和检测器运行效率较低等问题。针对以上问题,本文主要研究全天候场景下的高性能实时多光谱行人检测,以基于深度学习的可见光和红外图像特征融合算法作为切入点,对小尺度目标漏检率高、模型计算复杂度高、特征冗余和多模态特征盲目性融合等问题进行了深入研究。本文的研究工作如下:(1)针对小尺度目标的检测准确度低和计算复杂度高的问题,提出了一种基于改进Retina Net的多光谱行人检测算法。该方法首先利用双流Retina Net作为多光谱行人检测算法的主干网络,然后在此基础上增加了特征金字塔模块以提升特征的空间和语义分辨率。针对出现过多低质量检测框问题,提出了一种改进的损失函数来抑制大量低质量检测框从而提高整体检测框的质量。在KAIST公开数据集上的实验结果表明:该方法的平均漏判率比Faster R-CNN方法降低了8%。(2)针对卷积神经网络输出特征图包含大量噪声信息的问题,提出了一种基于改进的空间和通道注意力的多光谱行人检测算法。该方法利用改进的空间和通道注意力模块,分别从空间和通道两个维度去解决特征信息冗余和噪声混叠的问题。在KAIST和CVC-14两种公开数据集上的实验结果表明:该方法的平均漏判率分别为19.44%和25.6%,相比未添加该注意力机制的方法在漏判率上降低了2个百分点。(3)针对多光谱行人检测模型检测耗时过长的问题,提出了一种基于无锚框机制的多光谱行人检测算法。该方法首次引入Center Net模型的无锚框生成机制,极大地降低了模型计算复杂度,检测速度是Faster R-CNN检测器的2倍。针对多模态特征盲目性融合的问题,该方法在特征融合网络中又引入了差异特征感知融合模块,利用跨模态的互补差分信息来增强原有特征的表达能力,进一步提升模型的检测性能。在KAIST、CVC-14和FLIR三种公开数据集上的实验结果表明:该方法的平均漏判率分别为14.51%、25.54%和28.43%,运行速度达到了20 FPS,相比基于锚框的Faster R-CNN算法漏判率降低了11个百分点,检测速度提升了1倍。
其他文献
柴胡皂苷是中药柴胡的主要生物活性成分,其母核结构为齐墩果烷型五环三萜类,具有解热、镇痛、镇静、抗肿瘤等药理作用;文献报道其中以柴胡皂苷A(saikosaponin A,SSA)、柴胡皂苷B1(saikosaponin B1,SSB1)、柴胡皂苷B2(saikosaponin B2,SSB2)、柴胡皂苷D(saikosaponin D,SSD)含量较高。但是,这些原生苷由于分子量和极性较大,在小肠内
行业产品技术迭代与竞争对手服务模式更替的速度加快,致使制造企业依赖实物产品获利的空间不断受到挤压,以产品服务集成为表现形式的混合产品提供逐渐成为诸多制造企业赢得竞争优势的有效策略。如何使混合产品内的产品与服务有效匹配,从而实现与客户问题解决的外部匹配,以及混合产品整体价值的实现成为值得关注的一类问题。本论文在模块化、混合产品匹配及混合产品定价的相关文献梳理基础上,首先,阐述了与混合产品匹配及其定价
随着国内外对电磁波应用技术的深入研究,微波技术在谷物质量检测领域中的应用备受瞩目。谷物的微波特征谱中所携带的物理与化学信息极为丰富,这为微波技术在谷物质量检测中的应用提供了科学依据。本文设计了一种新型的谷物质量安全检测平台,以谷物粉为实验样品,对其微波频段的电磁波特征谱进行分析并采用BP神经网络进行鉴别分类。获得了相关谷物的指纹特征谱,为探索新型谷物质量检测方法与装置提供可借鉴的关键技术。主要研究
随着近年来工业蓬勃发展,工业上对以永磁同步电机为核心的伺服系统在精度、实时性等多方面提出更加严苛的要求。因此,针对以永磁同步电机为核心的伺服系统研究是当下一大研究热点。然而,永磁同步电机系统是一个多变量、强耦合的非线性复杂系统,倘若采用传统线性控制方法来处理永磁同步电机系统,往往无法达到预期控制效果。本文采用滑模变结构、自适应控制和非线性观测器技术,对永磁同步电机系统性能进行改善,具体内容包括:(
翼手目动物(Chiroptera),俗称蝙蝠,是唯一能够真正飞行的哺乳类动物,物种多样性仅次于啮齿目(Rodentia),是第二大的哺乳动物类群。蝙蝠扩散能力强,分布广泛,广泛适应多种生境,在自然生态系统及生物多样性的维持与稳定中起着非常重要的作用,但人们对蝙蝠的地理分布格局研究较为有限。国内一些研究对蝙蝠物种资源进行了大量的基础性调查,并对其生物保护展开了分析和讨论。国外已有一些关于蝙蝠的海拔分
智能水凝胶是一种重要的高分子材料,在学术研究和工业应用方面都有广阔的前景,尤其在药物输送系统中,能够响应特定的生理触发因素从而在适当的时间和作用部位释放包埋的药物。近年来,刺激响应型水凝胶的合成、自组装、溶胶-凝胶行为及其载药-释药特性是国内外高分子及材料科学领域的一大研究热点。本文基于目前智能水凝胶在生物医药领域的研究现状,采用可逆加成-断裂链转移聚合(RAFT)法,以2-(2-氰基丙基)二硫代
随着全球环境和能源问题的日益加剧,电动汽车凭借节能、环保等优点受到了各国政府的广泛关注和大力推广。电池管理系统(Battery Management System,BMS)作为连接电动汽车和动力电池的重要纽带,对其研究成为了近几年的热点。精确的电池荷电状态(State Of Charge,SOC)是BMS制定能量分配、充放电控制等控制策略的重要依据。然而,SOC在车辆行驶过程中无法由传感器直接测得
近些年来,互联网和计算机技术获得快速发展,智能交互逐渐开始改变人们的生活方式,影响人们生活的各个方面。语音作为一种最重要、最常见和最方便的信息交互方式,在人们的日常生活中发挥了非常重要的作用,是智能交互领域的研究热点之一。近些年来,自动语音识别、语音合成等语音交互技术得到研究人员的广泛关注,在一些领域得到了很好的应用。但仍存在一些问题亟待解决,如多目标同时说话会严重影响自动语音识别系统的识别性能等
“一带一路”战略为中国企业走向国际提供了良好的机遇,但动荡的国际环境和激烈的市场竞争又给中国承包商承包国际项目带来极大的风险,熟练掌握国际工程项目管理模式必不可少。EPC模式是设计、采购、施工一体化的项目管理模式,作为国际市场最为主流的模式之一,应用频率日渐增加。对于国际工程EPC项目而言,众多的参与方,多样的合同关系,复杂程度高、耦合性强的风险因素,都增加了总承包商项目风险管理的难度。而要想做好
随着移动互联网的迅速发展,一些基于位置的社会网络(Location-based Social Network,LBSN)平台日益普及,这些LBSN平台的用户在地理位置点上签到、分享位置以及活动信息等行为,在平台产生了大量的签到数据。这些数据催生出一项新的推荐服务——基于位置的推荐服务。在地理信息系统中,餐厅、影院、体育馆等具有唯一标识、且反映用户偏好的位置被称为兴趣点(Point-of-Inter