基于改良区域回归的行人识别框架

来源 :东南大学 | 被引量 : 0次 | 上传用户:simon20088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能技术的迅速发展,推动着许多领域不断革新。无论是无人汽车的自动驾驶,还是监控视频的自动预警,行人识别都成为亟需解决的核心问题之一。基于特征的传统机器学习方法一度成为行人识别的主要解决方法,但随着场景愈发复杂,不同的视角、环境和光照等都会对识别效果产生不利影响。随着大数据时代的到来,传统机器学习也无法适应海量数据的处理需求。因此,基于深度学习的行人识别方法近年来逐渐成为该领域的研究主流。本文通过对目前行人识别研究领域的分析和讨论,设计了一个基于深度学习的行人识别框架,它是由区域生成网络和深度卷积神经网络两部分组成。区域生成网络生成若干候选区域和相应的评分,深度卷积神经网络对候选区域进行分类,最终融合两个网络的得分作为最终预测输出。针对拥挤场景中行人互相遮挡的情况,本文提出了一种改进的区域回归策略,在候选区域进行位置回归的过程中考虑多重因素的影响,包括趋近预测目标行人区域及远离邻近的非目标行人区域等要素,减少回归过程中的偏移和定位错误。本文通过提取图像中的语义信息帮助模型更好的进行分类,分别在区域生成网络和深度卷积神经网络中增加语义分割层,提取图像中的语义信息与高维卷积特征进行融合,提高整体识别的准确率。除此以外,本文还通过使用Soft-NMS策略降低NMS阈值对模型的影响。最后,本文对模型进行训练和测试。经过对比实验表明,改良区域回归策略和融合的语义分割层能够有效提高模型的识别效果,降低模型漏检率。和其他方法进行对比表明,本文提出的方法具有较低的平均漏检率,验证了算法框架的可行性。
其他文献
本研究对184个的农村学生发放问卷、对典型案例进行访谈,通过对有效问卷的定性与定量分析,分析影响农村学生职业发展的相关因素,实证教育对农村学生职业发展的作用和影响,分
图像盲复原是指在点扩散函数未知或者已知部分信息的情况下,从观察到的退化图像中恢复出清晰原始图像,是一个病态逆问题的求解。在计算机视觉领域,去除图像模糊是一个具有挑
对于大数据处理平台而言,存储系统的设计对提高其性能至关重要。尽管研究人员已经提出了众多优化办法,但现有优化方法均根据系统设置,静态的为计算分配资源、对存储进行管理,
本文为一篇中译英翻译实践报告。本报告是根据作者所实习的公司提供的《机器人滚边技术概述》翻译项目进行分析与讨论。机器人滚边技术作为一项新型装配技术,极大促进了国内
给定一个文本串T和模式串P,字符串匹配就是从一个T中找到所有和P相同的子串。字符串匹配的应用涉及到生物信息学、文本编辑、模式识别、自然语言处理和搜索引擎等领域。随着
旋转式惯性导航系统是旋转调制补偿技术应用于捷联惯导系统而发展形成的,它可以在系统成本增加有限的情况下大幅度地提高惯导系统的精度。在结构层面,旋转式惯导系统相较捷联
多核时代的到来,处理器的运算能力得到了很大的提升.但由于处理器和主存之间的发展速度的不均衡,“存储墙”的问题越来越严重,成为影响系统性能的瓶颈。在多核体系结构下,多
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种典型的高分辨率二维雷达成像系统,具有全天时、全天候、高处理增益、穿透力强等特点,无论在军事领域还是民用领域都发挥着
随着语义网的迅速发展,RDF(Resource Description Framework)格式的数据广泛应用于百科全书、地理信息、生命科学等领域。在海量数据的压力下,传统的RDF关键词近似搜索方法已
随着现代社会科学技术水平的不断发展,为了满足人类更高的生产生活需求,越来越多的重工业技术在增加使用,与此同时,也带来了能源问题、污染问题等一系列问题。为了实现人类社会的可持续发展,为子孙后代留下绿水青山,越来越多国家开始关注能源和污染的问题。本课题旨在研究一种基于金属毛细管网新型末端形式的高效节能热泵空调系统。本文基于Simcenter Amesim软件,建立了一种基于金属毛细管网新型末端形式,选