基于深度学习的动作视频生成研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wangxiaoxiao880523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频生成是计算机视觉的重要研究方向,而动作视频生成是其中备受关注的方向之一。在基于深度学习的动作视频生成算法中,一些算法使用对抗生成网络来生成动作视频,但是这些算法无法生成长时间的动作视频。为了提高动作视频的生成质量,一些算法使用骨架信息来约束动作视频的生成,但是这些算法也有一些限制。第一,为了生成一段新的动作视频,这些算法需要对应每一帧的人体骨架作为输入,但是在大部分情况下,我们很难获得这样的骨架序列。第二,这些算法都是监督算法,需要与生成视频对应的Ground Truth来监督训练过程,这使得算法无法进行更大规模的训练。为了解决这些问题,本文提出两种动作视频生成算法。针对骨架信息难以获得的问题,我们使用高斯过程来生成骨架序列,不再需要事先提供与生成视频对应的每一帧的人体骨架。针对监督算法应用受限的问题,我们进一步地提出非监督的动作视频生成算法,使用双空间约束(动作约束和外观约束)来帮助动作视频的生成,不再需要与生成视频对应的Ground Truth来监督训练过程。具体地,本文研究的目标是,给定一张单人图片(称之为目标外观)和一类动作数据(例如跑步、跳舞等等,称之为目标动作),如何生成一段新的动作视频,其中目标外观对应的人做着目标动作。我们提出基于骨架自动生成的动作视频生成算法,首先使用高斯过程在目标动作空间中生成一段合适的骨架序列,然后使用对抗生成网络根据目标外观图片和这段骨架序列生成一段新的动作视频,使得其外观信息和目标外观一致,动作信息与目标动作一致。我们进一步地提出基于双空间约束的动作视频生成算法,重新检测生成的动作视频中的人体骨架,使得这段骨架序列尽可能地接近高斯过程所生成的骨架序列。动作约束被用来衡量这两段骨架序列的相似性,而外观约束保证生成的动作视频中外观信息和目标外观一致,动作约束和外观约束跨越动作空间和视频空间,共同约束动作视频的生成。本文将提出的方法与目前效果较好的动作视频生成算法进行比较,实验证明提出的方法可以生成长时间的高质量的动作视频。
其他文献
随着经济的不断发展,农产品深加工行业在顺应传统产业转型升级飞速发展的潮流的同时,也面临着巨大的竞争压力,如何在激烈的竞争环境中占据一席之地,寻找到适合自身持续稳定发展下去的竞争战略至关重要。本文以青岛华红食品有限公司为研究对象,通过分析该企业与周边竞争对手企业自身的优势、劣势,以及外部环境的机会和威胁,为目标企业寻找到最优的竞争战略,并针对企发展现状提出相应的对策和建议,以推动企业未来更好的发展。
滇东北小河铅锌矿床位于昭通市巧家县小河镇,是滇东北矿集区内赋存于震旦系灯影组白云岩中铅锌矿床之一。本文以小河铅锌矿床为研究对象,基于前人的研究成果,结合区域地质特征、地质背景与详细的野外地质调查,针对矿区主要矿体,开展了金属硫化物电子探针分析、微量稀土元素地球化学分析、C-O-S同位素地球化学研究,探讨成矿流体和成矿物质来源,分析矿床成因机制。主要取得以下认识:(1)确定了小河铅锌矿含矿岩系岩石类
基于生物信息的身份认证技术是近年来计算机视觉领域较为热门的研究方向。步态识别是一种基于行人行走时的姿态特征的生物信息身份认证手段,可以用于远距离的被动身份识别。
由于新兴技术对电源的特殊要求,传统的供电方式已经无法满足,所以我们必须找到新的电源,消除现阶段电池的局限性。能量俘获技术可以利用振动俘能装置将周围的机械能转换为电能并存储利用。振动型俘能装置成为一种为低能耗的电子元件以及无线传感器提供电能的可能,并且可以克服传统供电方式的诸多问题。且随着轨道交通的快速发展,轨道路线不断地增加,轨道车辆的运行日益增多,所以对轨道车辆在运行过程中由于轨道车辆的速度、质
随金融市场的迅速发展,个人业务在各大商业银行中竞争十分激烈,从各大商业银行未来的发展方向和战略目标来看,个人业务的发展占据重要的地位。中国银行贵阳市观山湖支行于2011年在观山湖地区选址成立,随着该区域商业银行的不断新设增加,观山湖支行将与其所在区域内各家商业银行乃至贵阳市内的商业银行在个人业务方面围绕产品、渠道、客户等多方面展开激烈的竞争。本文主要是分析观山湖支行在现阶段市场环境下,在所面临的内
网络技术和应用的飞速发展先后催生了认知网络和软件定义网络(SDN)等新网络技术概念的诞生,也带来愈加巨大的管理挑战和安全风险。最新研究已将机器学习和深度学习的新方法引
我国西部A油田某区块,储层埋深超过8000m,地层压力接近140MPa,储层最高温度接近190℃,表现出超深、超高压和超高温的“三超”特征。压裂施工中,最高施工压力达136MPa,对安全改造作业带来了极大的挑战。本文针对此类“三超”储层,通过搭建实验平台、优选低摩阻加重压裂液、明确压裂液体系性能影响因素、确定各添加剂使用浓度,形成了交联时间可控、耐温耐剪切性能良好的加重压裂液体系。首先,建立包含流
现场钻芯取样是一种简单、直观、有效的路面性能检测方法,是道路进行养护决策时最为实用的手段之一。但现场钻取的芯样受路面病害、结构形式、钻芯操作等影响,所钻取的芯样高度往往达不到标准试件的高度,采用已有的评价方法,不能准确得到其力学指标。因此研究尺寸效应对芯样力学性能的作用机理十分重要。本文基于室内试验、数值模拟的组合分析,借助实体工程试验进行论证,对沥青混合料的基本力学性能尺寸效应进行了较系统的研究
相对于传统的低动态范围视频,高动态范围(High Dynamic Range,HDR)视频能够在高亮和低暗的区域呈现出更加丰富的细节以及对比度信息,给人们带来更加接近真实世界的视觉体验。因此,HDR技术在监控安全、影视娱乐等领域有广泛的应用前景。现有的高性能视频编码(High Efficiency Video Coding,HEVC)标准虽然兼容对HDR视频的编码,但考虑到HDR视频高动态范围和高
疲劳问题在道路工程领域一直是研究的重点与难点,可靠度作为材料和结构健康程度和服务能力的判定,在设计安全和质量控制方面越来越受到更多人的关注,同时在路面设计、材料研究、养护实施方面日益成为研究的重点。文章通过三点弯曲疲劳试验得到疲劳寿命和弯曲劲度模量,首先根据残余强度理论建立弯曲劲度模量衰变模型,研究弯曲劲度模量随加载周期的演化规律。然后基于弯曲劲度模量构建可靠度分析功能函数,借助Matlab编程实