基于卷积神经网络的行人检测方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:alexkent
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通环境中的行人检测问题对于算法的检测精度和速度都有较高要求。传统方法能够满足速度要求,但在精度上差距较远,基于卷积神经网络的方法精度较高,但是计算量巨大。本文主要在基于卷积神经网络的基础上构建精度更高速度更快的行人检测方法。
  首先,本文分别从网络结构设计,损失函数设计,正则化方法和优化策略四个方面总结了卷积网络应用相关的基础知识;然后以 MNIST数据集上的手写数字识别为例,重点比较了梯度下降优化算法不同变体之间的差别,为优化算法的选择提供了实践依据。
  其次,在目标检测领域内领先的Faster RCNN方法基础上,基于总结的设计准则和行人的尺度特性,调整了网络的锚点窗口设置和区域生成网络方式,添加了环境区域池化层。然后基于开源深度学习框架对该网络在加州理工行人数据集上进行了实现,实验结果表明该方法可以实现高效的行人检测。
  然后,针对单尺度区域生成网络由于输入特征图固定造成的无法兼顾大小行人检测精度的问题,设计了基于特征图分层的多尺度区域生成网络,并为之设计了相应的随机缩放裁剪数据扩增方法应对训练不均衡问题。实验结果表明,该网络能够在输入分辨率较低的情况下实现比单尺度方法在高分辨率输入情况下更高的检测精度。
  最后,针对测试过程中检测速度慢的问题,设计了基于奇异值分解和Tucker-2分解的全连接层和卷积层的压缩方法,分别将高维的全连接层和卷积层近似为级联的低维全连接层和卷积层。结果表明,通过“训练-分解-调优”的三段压缩方式,该方法能够在不明显损失检测精度的情况下实现单层4倍、总体1.6倍的加速和总体4倍的模型大小压缩。压缩后的网络在GTX1080显卡加速下能够达到30帧每秒。
其他文献
目前,中国现有19个城市群的土地总面积仅占全国国土总面积的22.1%,但人口占全国总人口的50%以上,GDP占全国的75%以上,其中5个大型城市群(长江三角洲、珠江三角洲、京津冀、长江中游以及成渝城市群)的人口规模大都过亿,GDP占全国比例达到48.6%,城市群已成为国家经济发展格局中最具潜力和活力的核心单元。2014年3月中共中央、国务院批准实施的《国家新型城镇化规划(2014-2020年)》以
期刊
期刊
汽车行驶记录仪是能够对车辆行驶速度、时间、里程以及有关车辆行驶的其他状态信息进行记录、存储并通过接口实现数据输出的数字式电子记录装置.由于记录仪能够实时地记录车辆运行和驾驶员驾驶活动的有关信息,它可在遏制疲劳驾驶、车辆超速等严重交通违章、约束驾驶人员的不良驾驶行为、预防道路交通事故、保障车辆行驶安全、提高营运管理水平等诸多方面发挥重要的作用,并将为事故分析鉴定提供原始数据.为了达到相关的技术标准,
近十年来,随着全球范围内数据流量的激增以及未来网络中IP技术地位的日渐明晰,IP很有可能成为下一代网络的主体架构.各种基于IP核心的技术即将成为未来信息通信的主导技术.IP报文可承载各种业务,最终实现话音、数据、图像等多种业务融合和网络融合.如何采用统一的技术解决方案来构建下一代信息网络,以提供话音、数据和图像等综合服务,实现电路交换向分组交换过渡并转化,将是21世纪下一代通信网络发展的主要研究方
学位
我国是水产品进出口大国,海关统计数据显示,2020年我国水产品进口额为120亿美元,居世界第二;出口额为175亿美元,连续19年居世界第一。国际物流作为国际贸易中的载体,其发展进步能使货物进出口贸易进程更加顺畅。水产品由于易腐易变质、季节性生产运输的特点,对物流条件的要求较高,不仅表现在对运输设备的高要求,且对海关通关效率、物流服务、货物追踪能力也提出了较高的要求。本文首先从降低物流成本、整合企业
学位
学位