面向行人检测的动态视觉词提取与集成分类方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:jipin226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测系统(Pedestrian Detection Systems:PDS)旨在通过安装在汽车上的传感器设备,识别汽车行进视角一定范围内的行人,跟踪其位置并判断可能的碰撞,起到辅助驾驶、保障交通安全的目的。作为智能交通(Intelligent Transportation Systems:ITS)的核心技术之一,行人检测受到产业界的高度关注,具有重要的应用价值。此外,由于行人个体的多样性和检测背景的复杂性、动态性,行人检测也是机器视觉(Computer Vision)应用中的一个重要研究课题,其研究涉及机器学习、计算智能、自动化与控制、信息融合等领域,是多学科交叉的研究热点,具有重要的理论价值。与一般的目标检测相比,行人检测的主要特点在于检测的动态性和实时性。在检测过程中汽车和行人都是运动的,不仅行人个体具有很大差异性,地形、天气、光照等路况因素的动态变化也给检测带来极大的困难。另一方面,由于实时性的要求又必须保证检测速度,不能使用复杂度太高的检测算法。因此,如何开发能够适应路况变化的高效行人检测方法是一个挑战性技术问题。目前的行人检测方法主要包含图像处理和分类两个类,其中图像处理方法由于过程较为复杂,往往难以满足系统的实时性需求,而基于分类的行人检测由于简单易用成为主流。基于分类的行人检测通常包含特征提取和分类两大步骤,特征提取阶段从图像中的一些兴趣域提取物理特征描述子,在分类阶段对于提取的物理特征使用分类器进行分析,以判断每个兴趣域是否包含行人。目前的研究中,在特征提取和分类两大环节已经有多种方法提出,这些方法在单一场景检测中可以取得很好的效果,但是对于路况变化的应对能力不足。特征提取方面,物理特征描述子对路况的变化较为敏感,路况变化时其分布也将发生变化,导致原有的特征描述失效。分类器设计方面,由于新旧场景特征分布的变化,原场景训练的分类器在新路况下直接检测性能较差,而如果重新训练又无法满足系统实时性需求。采用集成分类技术将不同路况下的分类器集成是一个可行的解决方案,但是目前的集成分类研究主要针对单一场景,针对多场景数据如何通过集成达到最优的性能组合仍然有待研究。针对现有行人检测方法在路况变化对应能力方面的不足,本文分别从集成分类技术、行人关键特征提取和动态特征分类器设计三个方面提出针对性的解决方案,为基于分类的行人检测提供技术支撑。本文的主要工作和创新如下:1)针对行人检测中完全集成策略性能不均衡的问题,提出一种演化生成的选择性集成策略传统的集成方法对于多场景训练的分类器均采用完全集成策略,而在实践中完全集成难以解决多场景数据冗余的问题,且未必能在检测率、误报率和检测速度的综合性能上取得最优,只采用部分分类器的优化组合有可能取得比完全集成更好的效果。本文提出一种演化生成的选择性集成策略,通过智能算法优化成员分类器的组合,为避免未成熟收敛及加速寻优过程采用额外的种群协同进化,并通过适应度函数的设计将集成分类器的检测速度考虑在内,最终选择综合性能最优的组合分类结构。2)针对物理特征对路况变化敏感的问题,提出一种更高抽象层次的行人关键特征原始的物理特征对场景变化较为敏感,导致路况变化后基于物理特征的分类器不再有效。为了提高场景适应性,本文在原始物理特征基础上提取一种具有更高抽象层次的描述子,作为视觉词(Visual Words)。为了有效的用视觉词描述样本,在众多视觉词中需要选择一个有代表性的码表(codebook),即行人关键特征集。本文提出一种基于流形学习和中心度量的关键词选择算法,流形学习不仅起到降维的作用,还在低维空间建立了一个视觉词的模型,在低维流形上通过本文的中心度量算法,可以选择有代表性的视觉词,形成行人关键特征集,即使在场景变化时,也可以得到一个相对稳定的特征表示3)提出一种使用动态特征集的分类器,路况变化时通过特征集的动态调整使得分类器无须重新训练亦可适应场景变化现有方法中,原场景分类器在路况变化时性能难以满足需求,而使用新场景样本重新训练则无法实现在线检测。本文提出一种基于行人关键特征集的动态特征集检测机制,在变化场景检测中,分类器本身并不进行调整,而是通过动态特征集的调整来适应路况的变化。对每个检测到的行人样本,按一定规则进行分析,部分视觉词可能能被吸收成为新的行人关键词,而不再适应当前路况的行人关键词则会被淘汰。通过动态特征集的在线调整,分类器无须重新训练即可较好的适应路况的变化,从而实现对新场景样本做出有效的判断。
其他文献
随着社会经济的快速发展,建筑行业也得到了迅猛发展.如今,在城市里出现了很多高层建筑,高层建筑是属于比较精密的结构型建筑.也正是由于高层建筑复杂的建筑结构,给火灾的发生
现有的大规模图像检索系统依赖于鲁棒的局部图像特征及Bag-of-Words(视觉单词集合)图像表示模型以获得适用于大规模数据库的可扩展性。然而,Bag-of-Words表示模型的不足在于:
基于庄浪河武胜驿断面实测溶解氧及耗氧有机物浓度,分别使用单因子指数法和模糊综合指数法对河段水环境质量进行评价。根据两种评价方法得出的不同结论,探讨两种评价方法的优
流行语是一种普遍存在的社会语言现象,反映一定社会时期政治、经济、科技、文化和生活的特征。本文以近些年的大学校园流行语为范本,首先界定了大学校园流行语的内涵;然后分
将湖南润滑油行业的整体的宏观发展当做本次研究的背景,并且以湖南润滑油终端销售服务网点为研究对象,运用现代市场营销理论,对玉柴马石油润滑油公司在湖南市场的营销活动进行了
为研究Miles术后应用生长激素(rhGH)的有效性及安全性,将Miles术后患者分为研究组和对照组。研究组术后第1天起给予rhGH,4.5~10U/d,持续8天;对照组不用rhGH。结果,研究组患者前白蛋
本文利用蒙特卡罗方法,模拟计算了无人直升机航空放射性测量系统在不同高度对点源和不同大小面源的探测效率,并转化为计数率,得出了该系统在不同高度、不同面源情况下计数率
未来的生产活动中,归根到底在于这三个角色:企业家、专家和金融家。经济学上有一个概念叫消费者剩余,即"一种物品的总效用与其总市场价值之间的差额称为消费者剩余。之所以会产
<正>名列增幅Top10榜单的App,没有一款是绝对意义上的"综合应用"。移动互联网的市场正越来越细分。一位一线城市的中产人士,可能从未打开过拼多多;一个热爱游戏的男生,可能不
人脑弥散张量DTI图像作为一种非侵入性成像技术,能够提供传统CT、MRI等结构成像方式难以捕捉的白质纤维走行信息,拓展了人脑连接组(human brain connectome)研究、人脑疾病诊断