基于深度学习的多特征融合的目标检测

来源 :浙江大学 | 被引量 : 0次 | 上传用户:xiaoxiaofan0303
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是在给定的图像或视频帧中识别目标并定位的过程。它是很多计算机视觉任务的必备前提,也被广泛应用到实际任务中。然而,传统的目标检测方法在特征设计上花费了大量时间,并且手工设计的特征并不通用,导致检测精度低。现在通常通过深度学习方法,使用卷积神经网络代替手工设计特征。但是现有的目标检测方法常常会使用预训练模型来提高精度,而在某些场景中,无法使用预训练模型。如果能有一个网络结构,可以用随机初始化的方式来训练网络,并能获得令人满意的检测精度,在应用上有重要意义。本文提出一个训练方式简单、且可以提高检测精度的多特征融合的目标检测方法。为解决某些场景无法使用预训练模型的问题,本文设计了可以不使用预训练模型的神经网络结构。在训练过程首先以随机初始化方式初始化神经网络模型参数,然后加载大量图片和其对应的标签构造的数据集,对数据集中的图片进行预处理、数据扩增,再利用标注信息和代价函数迭代更新神经网络模型参数,直至收敛;在预测过程中,基于训练后的神经网络模型,将待预测的图像或视频帧作为输入,识别目标并给出其定位。为了验证本文提出的算法的准确性,在PASCAL VOC数据集进行目标检测实验,并以每幅图像为单位,统计本文算法的平均准确率均值,达到了 78.8%的平均检测率均值。在同样不使用预训练模型的情况下,平均检测率均值高于目前最优模型,且检测速度是其三倍左右。本文设计的网络结构在使用PASCAL VOC数据集训练的情况下可以对20个类别的目标同时进行检测。实验结果表明,本文的基于特征融合的卷积神经网络模型速度比大多数目标检测模型要快,目标检测的精度更高,最后,得益于网络结构上的优势,本文通过随机初始化权值的方式训练达到不输通过迁移学习训练的目标检测模型。
其他文献
基于交替迭代的交直流潮流计算是柔性互联电网研究的基础,其能灵活适应电压源换流器(Voltage Source Converter,VSC)的各种控制方式,且对成熟的交流潮流计算方法具有良好的继
为封堵工作井异常涌水涌砂缝隙,以某隧道新工作井液氮二次冻结封堵水工程为背景,基于液氮气化时剧烈吸热的原理,提出采用液氮土层冻结技术快速冻结封堵涌水的解决思路。研究
从古罗马光辉的拱券,柱式的演进厦定型再到哥特式尖,顶意大利的文艺复兴,古代欧洲的建筑一直顺着自己的社会地域宗教,文化这条脉结不断茁壮的成长。演变,进化,每一栋留下来的都是百
目的:探讨吸烟对慢性阻塞性肺疾病(COPD)患者血清S100A8/A9、8-异前列腺素F 2α(8-iso-PG F 2α)、组织蛋白酶S(cath-S)及其它炎症因子表达水平的影响。方法:按照是否吸烟将
并购作为企业外延式增长的一种方式,备受诸多企业的青睐和重视。然而,纵观近些年国内企业的并购活动,获得并购绩效提升的企业却为数甚少。随着国内并购活动的不断增加,破解并
批评性语篇分析可以与认知转喻结合形成批评转喻分析。批评转喻分析是解读转喻现象背后隐藏的作者的观点、信念和态度的一种方式,能够构建一种理解语言、思维与社会之间关系
随着近年来国民经济的迅速发展,旅游成为人们休闲娱乐的一项重要消费,旅游行业也已经成为国民经济支柱型产业之一。消费水平和国民综合素质的提高,使得消费者的消费观念从传
目的:分析肝豆状核变性病人的临床特点。方法:回顾性分析59例肝豆病人的临床表现特点、血象、肝功能、凝血功能、颅脑磁共振等检查结果。结果:59例病人中肝型15例(25.4%),脑
液氮冻结具有系统简单、冻结速度快、温度低和冻土强度高等特点,在城市地下工程建设中得到广泛应用。为了对某一地铁端头井进行加固,保证盾构机进洞安全,利用液氮冻结技术进
本文探讨从认知转喻视角对批评话语分析研究的可行性、必要性和具体途径。通过分析与概念转喻相关的侧重和背景操作、转喻操作和隐转喻模式操作的认知识解模式在批评话语分析