工程机械动作识别研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:fuyao698
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机视觉技术和计算机硬件的迅速发展,动作识别作为计算机视觉中的热门研究领域,已经在视频监控、人机交互、虚拟现实等领域得到了广泛的应用。目前,动作识别的研究主要集中在人类动作识别领域,除此之外,工程机械的动作识别也开始获得研究人员的关注。建筑行业管理人员可以通过工程机械的动作识别迅速掌握设备的施工信息,及时做出判断并采取应对措施,以达到提高生产效率、节约成本和节能减排的目的。但是在工程机械动作识别领域中存在着数据集不充分、算法相对不丰富等问题。本研究为了解决这些问题,做出了三点贡献。首先,本研究开发了一个可用于工程机械动作识别的开源数据集,该数据由2064个视频序列组成,包括两种工程机械,五种作业动作,并按照6-2-2的比例将其划分为训练集、验证集和测试集。其次,本研究基于深度学习的思想,分别采用卷积神经网络和长短期记忆网络提取视频序列的图像特征和时间特征,搭建了一个工程机械动作识别模型,该模型在本研究开发的数据集上取得了76.25%的F-1分数,与类似的工程机械动作识别模型CNN-DLSTM具有相当的识别性能(F-1分数为75.25%)。最后,本研究选取三维卷积网络和双流卷积网络作为人类动作识别方法的代表,在本研究的数据集上对他们进行了测试,结果显示它们在工程机械动作识别任务中也具有良好的表现(F-1分数分别为73.55%和76.26%)。因此,本研究对目前仍不完善的工程机械动作识别数据集进行了补充,提供了一个简单的工程机械动作识别模型来进行测试,初步证明了人类动作识别方法具有用于工程机械动作识别的潜力。
其他文献
近年来,自动驾驶技术的蓬勃发展极大地促进了汽车科技的智能化变革,但高昂的传感器硬件成本严重阻碍了自动驾驶汽车的落地应用。因此如何使用低成本传感器在特定的场景下实现自动驾驶成为了学术界与产业界非常关注的问题。自动驾驶汽车落地应用的基础是精确的感知与定位,因此基于视觉的感知与定位研究对加速自动驾驶汽车低成本落地应用具有重要意义。本文聚焦结构化道路环境,提出一种基于视觉的低成本方案来实现自动驾驶汽车的横
与传统的信息检索系统相比,问答系统提供了一种更为自然的人机交互方式,使得用户能够通过自然语言的方式与机器交流来获取信息。但在很多的实际应用中,机器需要主动地向用户提问,通过理解用户给出的答案来确定用户的真实意图,这个过程被称作反向问答。然而,当前几乎所有的解决方案都通过强制用户点击选项来避免自动的答案理解,这极大地破坏了用户的体验。针对答案理解任务,文章设计了相应的深度学习模型,旨在为用户提供一种
二维人脸识别面对光照、妆容、姿态和遮挡等因素的变化表现较差,在实际应用中对采集的图像要求较高,需要采集到正面清晰图像。而三维人脸数据因为包含二维人脸图像无法提供的深度信息,从而可以有效地应对光线变化与妆容变化等带来的干扰。传统三维人脸识别方法过程复杂,而基于深度学习的三维人脸识别方法,由于缺少足够规模的数据集,目前还无法达到二维人脸识别的研究水平。基于我们的调研,目前相关研究成果中,多是基于已有三
曲率是曲线和曲面重要的几何量,是图像、视觉分析以及计算机图形学的基本几何元素。而欧拉弹性是较早被应用到图像处理领域和计算机视觉中的基于曲率的方法。考虑到曲率在连接缺失的边缘和结构方面出色的能力,我们通过欧拉弹性提出了新的稀疏重建模型。特别地,我们首先将欧拉弹性正则化模型拓展为非局部形式,充分利用图像的模式冗余和结构相似性。由于欧拉弹性项非凸、非平滑、非线性,我们将局部和非局部弹性正则项视为加权总变
信息时代的用户需求趋于个性化、多样化、动态化,如何准确地掌握用户需求并快速地实现其向工程语言的转化成为企业关注的重点问题。如今越来越多的垂直网站、电商网站、产品论坛、社交媒体、问答社区可以为消费者提供广阔的意见表达平台,由此产生的评论内容能够较为真实地反映用户需求与产品缺陷。根据互联网评论数据挖掘用户需求并将其转化为指导产品设计的技术要素,能够帮助企业较好地了解用户体验以及较快地推动产品开发。本文
相比于传统CT,能谱CT利用不同能量光子关于物体衰减的差异性进行成像,能够提高物质分辨能力和准确的材料分离和定量化信息,逐渐成为近年来医学成像领域的研究热点。本文以研究能谱CT成像探测和自动分割技术为目标,对基于边缘入射探测器的成像仿真系统进行级联分析,并提出了改进的CT影像自动分割算法。在CT成像探测方面,本文建立基于边缘入射探测器的CT成像模拟系统,对内部设置相对完善的物理环境的同时利用复合能
光电跟踪系统是一个集光、机、电于一体的远距离光学跟踪成像系统,近年来在海上搜索、靶场测量、国防安全等领域,作为雷达探测的补充装备,在获取目标的精准定位和清晰成像方面上有着不可替代的作用。系统采用闭环控制,将指向器采集到的目标信息经图像处理板处理后传输到显控台,再由显控台根据图像信息生成指令控制指向器,实现对目标的监测跟踪。但由于运动目标会导致系统成像出现不同程度的离焦模糊,影响光电跟踪系统对目标的
知识图谱表示学习的目的是将知识图谱中的实体和关系嵌入到连续低维向量空间中,以便在保留知识图谱结构的同时提升下游机器学习任务的性能。但已有的知识表示学习方法大多仅将工作重心放在表示三元组中的结构化信息,而忽略了语义信息对于知识表示学习的重要性。本文将从关系层次结构和实体类型这两类语义信息入手并分别提出对应的知识表示学习方法。关系层次结构,是由关系间的泛化关系subRelation Of构建而成的结构
为了保护图像的信息安全,图像加密技术已经成为信息安全领域研究的重点问题。其中最具有代表性的技术是基于双随机相位编码(Double Random Phase Encoding,DRPE)的图像加密技术,该技术近年来得到了广泛发展。本文总结分析了基于DRPE的光学图像加密的一般框架,并在一般框架下提出新的加密技术。具体内容如下:(1)本文总结了基于DRPE光学图像加密技术的一般框架,一般框架由预处理操
分子成像技术的出现为生物体内肿瘤的无创可视化打开了大门,各类分子成像探针也在快速的被开发研究。一些成像探针在肿瘤成像方面表现出良好的成像效果,但其潜在的生物安全性难以预测,限制了其近一步的临床应用。基于蛋白质的成像探针由于具有良好的生物相容性、可灵活设计性和较好的成像效果而被广泛关注。本论文围绕基于蛋白质的成像探针的设计合成、性能及生物应用进行了一系列研究,主要研究工作归纳如下:第一章,主要介绍了