基于神经网络的手语运动区域分割与手语识别研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:ddssdcsyqc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语是听障人士交流的主要方式,主要通过手臂以及手部动作、身体运动轨迹以及面部一些细微的动作来表示。但对于不熟悉手语的人群来说,要理解手语的含义十分有难度。根据世界卫生组织数据显示,在全球范围内,患有残疾性听力损失的人数已达4.66亿之多。研究手语识别对于听障人士之间相互交流以及听障人士与非听障人士交流有着重要意义,能够促进听力及语言障碍者获取更加便捷的学习、工作与生活方式。手语识别的目的是将手语视频或图像翻译为文本或者语音输出。根据识别对象的不同,手语识别可分为孤立词识别与连续语句识别。同时,手语运动区域分割后的运动区域图像以及运动区域的识别可以用于智能人机交互领域。近些年深度学习的迅速发展,使得计算机视觉领域的研究有了另一个维度的思考方式,通过不同研究者的实验,证实了基于深度学习的算法具有泛化能力强、建模能力出众以及提取特征丰富有效的优势。基于此,本文在使用深度学习方法的基础上,进行了手语运动区域分割与手语识别研究,主要的研究内容包括:1、为了提升手语运动区域分割的准确性与直观性,提出了基于Deeplab V3+与Mobile Net V2的手语运动区域分割方法。采用该算法进行手语运动区域分割,不仅能够将运动区域有效分割,还能够保留运动区域在原图像中的位置信息,进一步得到直观的运动区域轨迹。2、将手语运动区域分割模块与手语特征分析模块联结以实现手语RGB图像序列的运动区域分割、跟踪、表征以及识别。在手语运动区域分割的基础上,提出了基于分割图像的手语识别方法。由于动态手语数据源多为视频格式,所以不仅空间上手语运动区域非常重要,时间域上运动轨迹同样对于手语词的识别结果有重要意义,故采用基于时域位移模块的残差网络作为手语分析的主干网络,不仅能够有效进行手语时空域建模,还仅保留二维卷积的计算参数量。最终在含有500词的大型手语数据集SLR500上,获得了89.1%的识别准确率。3、为了实现对手语完整图像以及运动区域图像的全面分析,在运动区域分割的手语识别框架基础上,增加基于手语全局图像分析分支,形成改进的手语分析双流网络,最后将两分支的分类结果进行数据融合,最终在SLR500数据集上得到了94.7%的识别准确率。
其他文献
学位
随着城市快速发展,新式高楼建筑平地而起,大量陈旧建筑拆除的同时产生的建筑垃圾中有近一半的废弃黏土砖。将废弃黏土砖应用到道路工程中,是一个具有重要实践意义的课题。公路工程实践中,红黏土作为一种特殊性土,具有较高的液限和塑限,不宜直接作为路基填料。因此,利用废弃黏土砖改良红黏土后的“废弃黏土砖-红黏土”混合料作为路基填料,研究其工程特性,为工程实践提供理论计算依据。本文以废弃黏土砖和红黏土进行不同比例
随着我国社会经济迅速发展,汽车保有量持续增加,公众跨区域出行需求日益增强,对高速公路的需求远远超过其建设速度,使得高速公路承担的通行压力越来越大,从而导致道路拥堵、交通事故频频发生,高速公路整体服务水平大大降低。为了缓解经济发展带来的交通运输压力,使资源最优化,我国加大对智能交通系统(ITS)的研究与建设力度。高速公路行程时间预测是智能交通系统建设的重要内容之一。本文以广西高速公路收费数据为基础,
钢-混凝土组合梁在建筑工程领域中得到了广泛的应用,并在实际使用过程中逐渐衍生出了预制装配式钢-混凝土组合梁、可拆卸钢-混凝土组合梁、可拆卸预制装配式钢-混凝土组合梁等多种新型钢-混凝土组合梁。近年来,钢-混凝土组合梁的正弯矩区段受力特点及理论分析已经得到了比较充分的研究,但是对负弯矩区段的力学性能研究尚不充分,针对此现象,本文通过试验和模拟研究了负弯矩作用下装配式组合梁的力学性能。本文设计了1根采
现阶段中国发展的动力引擎开始“换挡”,经济发展模式由“要素驱动模式”进入了“创新驱动模式”的新阶段。以科技创新为动力,大力促进科技型企业的蓬勃发展,完成产业结构的优化升级,完成经济可持续增长的任务目标,已成为当下我国经济发展的重大战略任务。科技型企业是国家科技创新能力的重要载体,是一国国际竞争能力的核心所在。但当下我国科技型企业的发展面临严重的资金约束,由于科技型企业本身具有高风险,轻资产、收益延
伴随着科学技术的飞速发展和人力成本的增加,使用机器人代替人工劳动的应用变得愈加广泛。当前大多数机械臂只是机械的完成点到点的操作,只能在环境固定单一和任务固定重复的情况下有效工作。一旦工作环境、目标状态和抓取任务发生了变化,就需要重新配置,缺少灵活性。因此,对于机械臂来说,正确识别和有效抓取位姿未知的目标物体是一项非常具有挑战性的问题。得益于计算机算力的大幅度提高,深度学习技术取得了高速发展。为提高
教育评价是教育发展的风向标,其关注焦点由教师和学校转向学生意味着教育日益聚焦本质,走向教育的中心;由学生发展结果的评价转向增值性评价更是教育理念的巨大变革,是关注每一位学生促进教育公平的巨大进步。为此,厘清以每位学生多方面进步幅度为评价基础的发展关注点,以激发每位学生潜能促进本我多元发展为目标和以评价模型建构为实践媒介的增值性学生评价核心问题,是深入理解增值性学生评价在评价内容、评价过程、评价结果
本文以黑龙江省通河林区黄鼬{Mustela sibirica manchurica)冬季为研究对象,观察不同部位毛被分层结构,并使用红外热像测温技术和动物体被热物性测试技术,分别定性和定量地测量待测样本热物性参数。同时,应用FLIR Quick Report1.2软件分析毛被表面红外热像图;Excel软件计算毛被的传热系数;SPSS17.0软件分析黄鼬毛被的部位和性别的差异显著性。实验结果为:(1
诺如病毒是非细菌性急性肠胃炎的最主要的病原体,据世界卫生组织在2015年的报告内容,诺如病毒每年致病人数约1.25亿人,是食源性疾病的首要病因。本研究从CNKI数据库获取数据源,以Cite Space软件为可视化分析工具,绘制出我国诺如病毒研究领域的科学知识图谱。本研究对所获得的科学知识图谱进行分析,得到了我国诺如病毒研究领域中各研究机构之间的合作关系及各研究作者之间的合作关系情况,分析了我国诺如
增值评价是一种发展性评价,旨在引导学生多元化发展。本文以“宁夏水稻种植”为例,立足于区域资源环境,结合农业区位、农业地域类型等地理知识,以增值评价理念为指导,评价遵循普适性、过程性、发展性、差异性、自主性、创新性等基本原则,从教学内容、过程、方法和形式四个方面挖掘教学过程的“增值点”进行评价,促进地理核心素养的落实,以期达成激发学生地理学习热情、促进学生可持续发展的目标。