【摘 要】
:
随着信息技术的不断发展,计算机视觉、机器学习、模式识别等领域的研究不断进步,物体识别与分类作为其中基本且常见的问题,更被广泛研究,并在各个应用领域普及,逐渐渗入进人们的日常生活中。常见的物体识别与分类研究都是基于视觉一种模态上的研究,而在现实世界中,人们不止用眼睛去感知识别外界事物,还会通过触觉,嗅觉等去感知识别。相应的,在模式识别领域,用物体图像信息作为人们眼睛接收到的信息,用触觉信息作为人们触
论文部分内容阅读
随着信息技术的不断发展,计算机视觉、机器学习、模式识别等领域的研究不断进步,物体识别与分类作为其中基本且常见的问题,更被广泛研究,并在各个应用领域普及,逐渐渗入进人们的日常生活中。常见的物体识别与分类研究都是基于视觉一种模态上的研究,而在现实世界中,人们不止用眼睛去感知识别外界事物,还会通过触觉,嗅觉等去感知识别。相应的,在模式识别领域,用物体图像信息作为人们眼睛接收到的信息,用触觉信息作为人们触摸事物接收到的信息,用计算机模拟人们的大脑,对接收到的不同信息进行处理和分析,进而正确的对物体完成识别和分类任务。近年来,多模态与机器视觉的课题被广泛研究,很多的研究成果验证了多模态融合在不同的领域较单模态性能都有明显的提升。但是多模态融合课题在模式识别领域的研究上还有很大的空间,使计算机通过学习不同的模态信息并将之融合用于物体识别与分类具有重要的研究意义。深度学习作为研究人工智能的一个重要方法被广泛研究。近几年卷积神经网络(CNN)以其局部感知及自学习等优势在机器学习、模式识别领域成果显著。但是该算法效果好的同时也需要较大的运行内存,且时间消耗大。2015年提出的基于局部感受野的极限学习机算法(ELM-LRF),不仅训练速度快而且通过局部感受野提取特征使得算法在图像领域有很好的表现。但是ELM-LRF算法是在ELM基础上的扩展研究,仍是一种批量算法,训练过程需要所有的数据一起训练,无法单纯的更新训练新数据。在实际应用中,数据通常都是在动态实时更新变化的,随着数据量的递增,批量算法的的研究将不再适用,训练时间会大大增加,而且ELM-LRF算法中局部感受野大小是单一固定的,对复杂图像的特征提取也有待改进。在线序列极限学习机(OSELM)具有ELM速度快、泛化能力强的优点,还可以随着新数据的到来不断更新训练模型,而不需要使用所有的数据进行再训练。在实际应用中具有更好的适用性。本文以OSELM为基础,引入多尺度的ELM-LRF(ELM-MSLRF)在图像领域做进一步的研究。首先进行多模态融合研究,并将研究算法在表面材质分类数据集上进行验证。后考虑到OSELM中输入权重随机生成,算法结果可能不是最优且随机权重会造成算法结果不稳定,所以本文在寻找最优权重方面进行研究,并将研究算法在图象识别分类数据集上进行验证。本文的主要创新点如下:(1)针对物体材质仅依靠视觉图像无法很好区分,本文提出一种多模态融合框架用于物体材质分类。基于ELM-LRF方法在训练过程中不能只更新训练新的数据且局部感受野大小单一的问题,本文提出的多模态融合框架基于多尺度局部感受野在线序列极限学习机进行研究,即多模态融合的多尺度局部感受野在线序列极限学习机算法(MM-MSLRF-OSELM)。为了充分利用图像的颜色信息,MM-MSLRF-OSELM算法还对输入样本进行了R、G、B颜色分离,在特征提取过程对传统的框架进行改进。通过在TUM数据集上验证,实验结果表明模态融合后的分类精度优于单模态的分类精度。将MM-MSLRF-OSELM算法的分类性能与MM-MSLRF-ELM算法进行对比,证明本文算法分类性能更佳。而且MM-MSLRF-OSELM还可在训练数据集时顺序更新训练,在实际中更加实用。(2)针对MSLRF-OSELM的输入权重是随机产生的,所以生成的权重不一定是最优的,导致算法结果可能存在次优,且随机生成权重对结果的稳定性有一定影响的问题。本文在MSLRF-OSELM基础上进行改进,提出一种改进的多尺度局部感受野在线序列极限学习机算法(PSO-MSLRFOSELM)。引入粒子群算法(PSO)对MSLRF-OSELM的输入权重进行寻优。PSO-MSLRF-OSELM算法在MNIST数据集和NORB数据集上进行了验证,实验结果表明改进后的算法不仅性能有了提高,稳定性也更好。综上,本文在MSLRF-OSELM的基础上进行扩展研究,分别提出两种新的算法,使其在物体材质分类,目标识别和图像分类领域有更好的表现,相应的可以应用于机器人物体材质分类、医学图像检测、车牌识别等。
其他文献
近几年来,伴随着国家宏观经济下行,以及“三公消费”禁令、“八项规定”等一系列政策对政务消费的严控,白酒消费需求受到强烈的冲击,导致白酒行业在2012年出现断崖式崩溃,从黄金发展期迈入深度调整期。但是,随着消费升级带动白酒个人消费需求,我国经济逐渐转型发展,自2015年开始,白酒行业经营业绩重新开始以稳定的速度上涨,渐渐展现出了复苏回暖的态势。因此,对各大白酒企业来说,若能把握住此次行业复苏的巨大机
自21世纪以来,核心素养逐渐成为各个国际组织和国家教育领域的热点话题和重点研究对象。我国基于自身教育背景和国家对人才发展的培养目标,于2016年正式发布《中国学生发展核心素养》,之后所有学科接踵提出具有各自独特性的学科核心素养理念。在这种情势下以“图像识读、美术表现、审美判断、创意实践、文化理解”为培养目标的美术学科核心素养正式形成。依据美术学科核心素养理念研制的《普通高中美术课程标准》在2018
在科技时代背景下,信息技术时刻在高速率地发展着,各行各业中产生了大量的数据,据不完全统计,在互联网中每天有数万亿PB数据不断更新和增长。这不得不使得人们在收集大规模数据,以及储存处理数据的这些方面的技能迫切提升。在许多工业、教育以及医疗行业中都存在着大量多维的数据,针对于此类数据进行一定程度的数据分析,有利于人们从数据中挖掘出来隐藏在数据背后的有价值的信息,同时,也有利于预测出下一阶段数据的变化情
未来伴随着新能源汽车的发展,动力电池需求的缺口会愈发扩大,锂电池负极材料产业未来发展前景广阔。未来两年,我国负极材料出货量预计将突破30万吨以上,产值预计将达到上百亿元规模。LG公司主要生产锂电池负极材料,客户主要为新能源锂电池企业。据数据显示,2018年全球五大负极材料厂商中国占据四席,分别是贝特瑞、杉杉股份、江西紫宸和凯金能源,其市场占有率合计约为66%。作为锂电池负极材料企业在电池材料产业链
长期以来国内跆拳道大型赛事上我国女子的整体实力较强,体现在世界上的大型国际赛事如奥运会、世界锦标赛等等,与我国女子跆拳道的发展相比,男子跆拳道的发展远远不及女子运动员在跆拳道上的发展。2016年里约奥运会上赵帅获得男子跆拳道58KG的冠军,成为我国男子跆拳道在奥运会上第一个获得冠军的运动员,一方面打破了我国男子跆拳道运动员在奥运会上没有获得过金牌的尴尬局面,另一方面也在一定程度上给我国跆拳道男子与
华北落叶松(Larix principis-rupprechtii)是我国华北地区重要的经济林和生态林树种,种子园是其提供良种的重要途经。为了提高华北落叶松种子园的生产效率,缩短育种年限,筛选出结实性能优良的无性系,为种子园的更新换代和建立高世代种子园提供优良的建园材料。本文在子代生长性状、种子园母树结实性能方面进行了相关研究,利用EST-SSR分子标记技术,筛选出子代生长和种子园母树结实性能兼优
民宿业作为旅游业的一种新型业态,逐渐受到消费者青睐,而民宿业也是服务业的一种,在日趋激烈的市场竞争中,企业服务质量对于民宿业的发展至关重要。高水平的服务质量能够吸引更多的顾客,低水平的服务质量会导致顾客的流失。作为服务业的一种,服务失误的发生不可避免,而服务补救质量的高低也会影响顾客的满意度和重购意愿,高的服务补救质量能有效的缓解和消除顾客的不良情绪,防止顾客的流失,重塑企业形象。作为住宿业的一种
幼儿园体育是幼儿园教育的重要组成部分之一,在幼儿园教育中担任着不可或缺的角色,幼儿园体育教学内容作为幼儿园体育的基本构成要素直接影响着幼儿园体育的发展。论文运用文献资料法、访谈法、问卷调查法、数理统计法与逻辑分析法等研究方法,主要研究梅州市幼儿园各类体育教学内容的情况,通过对梅州市幼儿园的家长和教师的问卷调查,结合实地走访,了解梅州市幼儿园体育教学内容的存在问题,分析制约梅州市幼儿园体育教学内容发
全球卫星导航系统(Global Navigation Satellite System,GNSS)提供的定位导航服务已广泛应用于各个领域。在城市中,由于存在大量高层建筑以及反射物,导致多径信号的反射点距目标较近,多径信号时延短且密集,严重干扰了定位精度。由于短时延多径效应对定位精度的干扰比中长时延多径效应严重,并且其误差和参数难以通过建模准确估计,因此短时延多径成为城市多径效应中主要的误差源。为了
体能是支持人们进行正常的生活、工作、学习等多种活动所需要的能力,在人的长期发展中占据重要的位置。青少年的健康情况关系国家发展,近年因学业繁重、新科技电子产品的吸引以及家庭教育观念等原因,导致我国青少年学生体质监测结果不佳。为贯彻落实增强学生体质健康政策,大力提升学生体能水平,广州市教育局提出在中小学时期学校每周必须安排一节体能训练课。本研究通过文献法学习国内外体能、体能训练、体质等相关文献书籍,在