【摘 要】
:
读取视频人物唇部动作是模式识别领域里一项具有挑战性的数据分析课题,主要任务是将深度学习中改进的卷积神经网络、时间序列预测和概率建模等方法应用于序列化的人物唇部数据,在抽取唇动信息的基础上对视频人物所说句子内容进行识别。目前的各类识别算法在视频处理和挖掘方面正逐步拓展延伸,对于视频中动态的人物分析,尤其是关于唇动信息与句子文本的对齐研究还需要进一步的探索。本学位论文以有效识别视频中单个人物的唇部动作
论文部分内容阅读
读取视频人物唇部动作是模式识别领域里一项具有挑战性的数据分析课题,主要任务是将深度学习中改进的卷积神经网络、时间序列预测和概率建模等方法应用于序列化的人物唇部数据,在抽取唇动信息的基础上对视频人物所说句子内容进行识别。目前的各类识别算法在视频处理和挖掘方面正逐步拓展延伸,对于视频中动态的人物分析,尤其是关于唇动信息与句子文本的对齐研究还需要进一步的探索。本学位论文以有效识别视频中单个人物的唇部动作为研究目标,首先自建唇读识别数据集训练多场景下的人物视频与相应的句子文本标签序列,接着设计一种基于卷积神经网络的视频人物唇部语义抽取方法实现唇部区域划分与唇部特征的多层级提取,最后设计一种基于时序预测的视频人物在线句子级唇读识别方法完成人物唇动与句子序列的关联对齐及在线方式的识别展示过程。本文的工作创新主要体现在以下三个方面:(1)采集大量具有说话人物的节目视频并进行预处理,结合三阶段深度可分离卷积的神经网络与非极大值抑制改进算法检测人脸并利用卡尔曼滤波进行持续跟踪,将具有人脸的视频帧序列和音频对应的文本标签加入训练以完成本地唇读识别数据集的建立。(2)利用K-means聚类划分粗选取的唇部区域,通过全卷积网络获取唇部候选框,使用融合了时空与多通道信息的残差网络提取多层级卷积下的视频人物的唇部特征语义。(3)通过双向门控循环单元记忆视频序列中人物说话句子内容的前后向关键信息,引入混合注意力机制的联结主义时间分类损失算法对齐文本标签与句子中的字符,以同步唇部运动轮廓,并结合Web框架和云存储平台在线展示唇读识别的句子序列。
其他文献
摘 要:做好初高等数学承接教学工作,使大学生尽快掌握高等数学的学习方法。针对初高等数学教学现状,给出承接初高等数学教学的方法,即注重教师的引导工作,培养学生学习数学的兴趣,指导学生适应新的学习模式,提高自学能力,为学好高等数学夯实基础。 关键词:初高等数学;教学方法;学习观念 随着科学社会化的发展,各行业间的联系日益紧密,教育改革逐渐趋于培养应用型全面发展的人才。高等数学无论作为专业必修
随着计算机技术的快速发展以及互联网应用的普及,数据规模不断扩大,我们已经进入了大数据时代。尽管传统的关系数据库管理系统(RDBMS)可以提供非常成熟的数据存储和处理方案,但是面对不断增长的数据量,RDBMS分析和处理大数据的能力在可扩展性方面遇到了严重的瓶颈,No SQL数据库应运而生。它使用灵活的数据模型存储大数据,可以很容易地实现扩展性,因此诸如HBase之类的分布式存储系统在数据服务中发挥着
工程热力学是过程控制与装备专业的一门技术基础课,该课程一直存在学生难学、教师难教的问题。本文就该课程的特点和教学现状进行分析,并提出提高教学质量的几点方法。
文章首先对中学英语阅读教学现状进行分析,通过引入思维导图这一概念,从读前、读中、读后、课后四个环节将阅读教学分为四个阶段,提炼出主题词、图像、关键词和网络结构,为学
[目的]新辅助治疗联合全直肠系膜切除术已成为局部进展期直肠癌的标准治疗模式。然而,新辅助放化疗的反应存在个体差异,导致患者疗效和预后各不相同。ypTNM分期是新辅助治疗
用土柱管栽试验方法研究了不同灌溉施肥深度对夏玉米生长发育、地上地下部分同化物分配、产量和水分利用效率的影响.试验结果表明:土表下灌施抑制了玉米生育早期的地上部分生
异响和烧机油是发动机常见的故障,通过对它的原因进行分析可知,按使用说明书正确使用、按时检测、维护和保养都会避免或减少发动机早期磨损、烧机油、机油消耗量高等故障现象
【正】构建和谐领导班子,是提高高校党委的执政能力,营造和谐校园环境,促进高校事业又好又快发展的根本保证。从目前有的高校领导班子建设的情况看,构建和谐领导班子,需要着
悬浮载体流化床是一种新型反应器。介绍了该反应器的特点及试验方法,并通过试验考察了硝化液回流比对悬浮载体流化床TN去除效果的影响。结果表明,硝化液回流比对反应器去除CO