基于特征学习的校园场景识别与定位

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:strengthandhonor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉是一门跨学科的科学领域,涉及计算机如何从数字图像中获得高级理解。从工程学的角度来看,它试图理解人类视觉系统可以完成的任务并通过编程的方式实现。计算机视觉任务包括用于获取、处理、分析、理解数字图像和提取可产生数字或符号形式的决策信息的高维数据的方法。场景识别是机器人和计算机视觉应用的基本问题,而学习特征是计算机视觉的一个重要技术,它是允许系统从原始数据中自动发现特征检测或分类所需的表示形式的技术。本研究的校园场景识别和定位的基本特征学习是属于图像定位领域的,对图像中的物体进行定位、摄像机拍摄的场景图像的定位与识别又是计算机视觉领域的一项任务,也是解决识别问题的第一步。现有的研究说明了场景识别和分类定位的重要性。本文采取了五种不同的行为方式,如鼓掌,拳击,挥手,投掷和步行。使用HOG&SIFT等特征检测技术,并在支持向量机上训练,最终给出了准确的结果。基于图像定位的目的是从单一的查询图像中检索出感兴趣区域内摄像机的姿态(方位和位置),并显示出可识别的目标位置,本研究的目标是通过使用摄像机拍摄各个建筑物不同角度的照片,来对这些位置进行定位。本文使用了一种对图像预处理的方法,目的是去除不必要的信息,帮助模型有效地学习图像的特征,从而提高了精度。本文还介绍了图像预处理的几种方法,包括调整图像大小、创建图像像素阵列和数据采集、去除图像中的背景噪声。特征提取对正确检测目标具有重要作用,本文提出了一种基于兴趣的局部特征提取方法用于检测图像中的关键点,该方法通过计算该点周围区域的方向梯度(HOG)直方图,并用尺度不变特征变换(SIFT)提取特征,该变换包括四个主要阶段:尺度空间的极值检测、特征点定位、特征方向赋值和特征点描述。为了评价本研究提出方法的性能,使用一组新的测试图像预测其类别,并给出位置预测的准确性。将支持向量机(SVM)算法用于特征提取后的图像分类。支持向量机是一组用于分类的监督式学习方法,适用于广义线性分类。支持向量机的特点是,它能同时最小化经验分类误差和最大化几何边缘区,因此支持向量机(SVM)被称为最大边缘区分类器。支持向量机将输入向量映射到一个高维特征空间,在该空间中构造一个最大分离超平面,在分离超平面的每一侧构造两个平行超平面,分离超平面是使两个平行超平面之间的距离最大化的超平面。这些平行超平面之间的差距或距离越大,则说明分类器的泛化误差就越小,论文的最后在对常见评估指标进行了比较的基础上,我们将混淆矩阵用于评估本研究提出方法的性能。混淆矩阵是一个表格,通常用于描述一个分类模型在一组已知真实值的测试数据上的性能。它允许可视化算法的性能,并显示分类模型在进行预测时被混淆的部分。本研究首先介绍了所使用的数据集,并对数据集进行了预处理,然后对数据进行提取特征,最后将每幅图像对应的特征组合成不同类别的分类图像用于场景识别。由于定义场景识别是计算机视觉的一项里程碑式的任务,因此可以定义用于对象识别的上下文。该方法同时利用图像的全局特征描述符、局部特征描述符以及对应于每个图像的描述符,从每幅图像中提取与检测到的关键点相对应的尺度不变特征变换(SIFT)特征。本研究主要利用sklimage库(scikit图像)进行特征提取。对应于图像中的每个关键点,都存在一个尺度不变的特征变换描述符,其尺寸由参数步长(描述符采样点之间的距离)和半径(描述扫描区域的尺寸)控制。本研究还提取了一个与不同粒度的整个图像相对应的标准方向梯度(HOG)描述子直方图(利用像素/单元、单元/块和方向的参数),该直方图允许我们选择不同尺度的特征。实验采用标准支持向量机(SVM)分类器进行场景识别。我们利用sckit-learn(sklearn)库来实现支持向量机,通过将数据集随机分成训练集和测试集来进行交叉验证,并从划分的训练集中构造训练特征向量。最后我们通过得到的总体准确性、混淆矩阵以及标准信息检索数据,如精确率、召回率和F值来评价本研究提出的方法的性能。我们收集了北京交通大学收集的数据,将各个建筑的地标作为该地点的标志位置,在每组中构建了53组用于场景识别的建筑地标图像,其中包含了该建筑地标在不同角度的更多图像。然后将用于场景识别的数据集分为两类(训练和测试),通过随机选择训练集和测试集,得到了特、场景识别和定位技术上的实验结果。最后我们可以在数据集中检索图像进行场景匹配,并分析了实例级地标匹配对场景识别等影响定位精度的因素。在本研究的实验中使用python编写来实现特征提取和分类器模型。实验实现了从所有训练图像中提取的尺度不变特征变换(SIFT)描述子。在单用尺度不变特征变换(SIFT)描述子时,分类准确率为76%,平均准确率为76%,平均召回率为75%,平均F1分数为71%。在只使用方向梯度直方图(HOG)时的分类准确率为56%,平均准确率为61%,平均召回率为52%,平均F1分数为58%。最后,利用支持向量机算法对训练后的数据集进行分类,发现尺度不变特征变换(SIFT)和方向梯度直方图(HOG)两种特征提取方法结合使用时的分类精度达到77%。平均准确率为78%,平均召回率为76%,平均F1分数为72%。在使用集成学习特征,得到的预测识别位置的准确率为77%。实验结果表明,HOG描述可以与SIFT等能够处理尺度、方向和平移的特征描述子较好地相结合,产生更好的实验效果。
其他文献
随着城市现代化建设以及人们生活水平的提高,现代农业科技园得到大力发展。在现代农业科技园发展的过程中,园区植物景观规划出现诸多问题。本研究以南京翠谷现代农业科技园为
目的:利用频域光学相干断层扫描仪深层成像模式(enhanced depth imaging spectral domain optical coherence tomography,EDI-OCT)测量并分析不同分期萎缩性黄斑病变脉络膜厚度
苯甲腈(BT)是一种应用广泛的有机化工原料和有机合成中间体。本文提出了以苯甲醛(BD)和离子液体型羟胺盐为原料一步合成BT这一绿色工艺路线,并进行了较为系统的研究。对锌盐为催
随着国家的发展,人民生活的日益改善和生活方式也发生了很大的改变。但生活水平的提高确带来许多疾病。研究表明,脑卒中的发病人群变得越来越年轻化,而脑卒中致死致残率较高,
光合作用是指藻类、光合细菌和陆生植物等吸收光能、将水和二氧化碳转化为氧气与有机物的过程。光合作用捕获光能,释放氧气,用以供给地球上的生命。在高等植物中,光合作用发生在叶绿体的类囊体膜上。类囊体膜上分布着许多参与光合作用的大分子蛋白复合物,这些蛋白复合物分别为光系统II(PSII)、Cyt b6f、光系统I(PSI)和ATP合酶等,它们协同合作,高度有序,分别行使着各自的功能,以完成光合作用这一高度
随着人工智能不断的深入研究,本体越来越多地被应用在领域知识的表示以及共享。如何将本体应用于医学领域是当前的研究热点之一,目前研究较多的是将构建的本体应用在知识共享以及查询上,针对医学本体知识辅助推理的应用研究较少。妊娠糖尿病是我国孕妇较为多发的高危症状,国内针对糖尿病领域本体的研究应用还处在初步阶段。产科医生在诊断过程一般都是根据相关指南再结合临床经验来进行判断,这种诊断方式较依赖于医生的临床经验
中国人民的生活水平随着全球经济的发展有所提高,但是近些年一些疾病仍然困扰着人们的生活,糖尿病就是其中的一种。由于糖尿病是一个长期的患病过程,这就使得糖尿病的治疗成为了一个漫长的家庭经济负担。糖尿病之所以成为危害家庭和国家发展的重要疾病,是因为这种疾病知晓率低,治疗的概率低,并且控制的概率也非常低下。因此基于这种状况,中华医学会糖尿病学会主席贾伟平呼吁我国的全体国民都应该引起对糖尿病的重视,在日常生
背景:Th17、Treg在临床中的作用已受到人们的广泛关注,比如在风湿、免疫,肿瘤,心血管等,在慢性肝病中研究也很多,但主要在病毒性肝炎等方面以及动物实验中,而在非酒精性脂肪肝病(NAFLD)方面研究报道很少。与其他代谢性疾病一样,饮食限制和定期体育锻炼方面的生活方式改变是治疗NAFLD的基础,但仍然需要药物治疗。在目前可用的药物中,有不少指南推荐,维生素E和吡格列酮可以作为非酒精脂肪肝炎(NAS
牦牛主要分布于青藏高原地区,能在高寒、低氧、强紫外线等极端环境条件下生存,在当地畜牧业发展中占有十分重要的地位。低氧适应性受多基因、多通路级联调控,是一个复杂的调
煤矿行业是公认的高风险行业,工作场所大多在地下几百米以上且活动空间受限。煤矿工作环节复杂、地质条件多变,生产条件恶劣,加之技术设备差等因素,经常受到透水、火灾、瓦斯以及自然灾害的威胁。受煤矿工作面环境限制,当矿难发生时,救护人员在施救的过程中有可能造成二次伤害,针对其矿区分布面广、救护应急响应速度慢、应急方案缺失、救援现场实时监控困难等现状,实现应急救援现场视频监控、井下救援人员实时精准定位、微型