基于点云的人体三维构建与虚拟换装应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wzhqch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维重建是三维视觉领域重要的研究分支之一。随着高性能深度传感设备与相关传感技术的飞速发展,三维重建领域吸引了学界越来越广泛的关注与研究,其在自动驾驶、虚拟换装等新兴领域中均具有广阔的应用前景。其中,虚拟换装是随着近年蓬勃发展的电子商务而逐渐兴起的技术。消费者可以通过在虚拟模型上直接进行服装更换来了解试穿效果,以获得更可靠的购物体验。本论文借助深度摄像设备对用户进行采集,并基于得到的点云数据展开三维人体重建与虚拟换装方面的应用与研究,进而搭建了相应的换装系统。该系统提供的换装流程以尽可能减少与用户间的交互为目的,具有与传统流程相比更高的自动化程度,使得系统在工作效率不受影响的同时,更易于用户的使用。本论文的具体工作如下:首先,进行了三维人体重建工作。根据深度摄像设备所采集的点云数据,借助配准算法对其进行配准与融合,并通过引入数据点的RGB信息提高配准精度。拼接完整的场景点云将用于对人体部分的点云的提取,进而借助曲面重建算法完成三维人体模型的构建,并将其输出到后续模块中。构建完成的人体模型能够再现用户的形体特征,使得系统的表达效果更加自然真实。其次,进行了服装信息提取工作。借助目标检测深度学习网络对用户输入的服装图像进行处理,从而标记出目标类别以及其对应的边界框与像素覆盖区域等内容。这些标记将作为纹理信息输出,以服务于后续三维服装模型的构建过程。在满足位姿规定的条件下,输入到该模块的服装图像将可以由用户任意指定,从而保证系统拥有更高的自由度与泛用性。最后,进行了虚拟换装与展示工作。根据前面流程中输入的人体模型与纹理信息,基于系统中预设的衣片样板对衣片进行实例化,并以此为基础将各衣片缝合在人体模型四周。结合碰撞检测技术,缝合完成的服装模型将自然依附在人体模型上,生成最终的换装结果。该结果将借助相应的可视化手段输出到显示器上,最终展示给用户。这一过程将完全脱离用户的干预,降低了该换装系统对于用户的使用门槛。
其他文献
随着互联网上信息量的快速增长,人们对信息检索效率的要求越来越高。如何从互联网上高效的获取信息成为一个重要的问题。搜索引擎是检索信息和收集互联网数据最为有效的工具,但是搜索引擎返回的结果仍然包含着诸多的干扰信息和冗余信息,需要进行进一步的分析和归纳才能掌握搜索引擎返回的重点。而面向问题的文本摘要可以解决这个问题,面向问题的文本摘要旨在基于给定的问题从文档中返回一段含有文档中重要信息的简短的文字,配合
光场显微技术作为一种无需扫描、可伸缩的方法,可以以高分辨率观察跨越多个时空尺度的各种解剖和功能信息,从而实现从单细胞标本到哺乳动物大脑的高速、体积成像,但重建伪影的出现和复杂的计算成本大大限制了光场显微技术的广泛应用。因此研究人员通过两个方面对光场显微系统不断进行优化和改进。一方面通过调整微透镜阵列的相对位置,得到了较高分辨率的光场显微镜,并有效避免了重建伪影;另一方面,通过将微型显微镜平台和光场
近年来,我国在电力系统建设上的投入不断增加,电网覆盖范围也越来越广,随之而来的是输电线路舞动事故发生频率逐年攀升。舞动已经成为造成电路安全隐患的主要原因之一,并成为各国研究焦点问题。使用输电线路舞动监测技术可以得到输电线舞动的关键参数,这一点对于研究舞动产生机理以及分析影响舞动因素就尤为重要。输电线路舞动监测技术有诸多解决方案,其中,基于视频采集的监测技术凭借其非接触测量特性,可以较大程度地省却安
为了提升高功率激光装置中大口径光学元件的初始损伤检测与跟踪能力,针对光学元件损伤暗场图像的纹理信息少、关键信号微弱的问题,提出基于模型集成的暗场图像超分辨率重建方法,对早期发现光学元件损伤具有重要意义。本文主要研究内容如下:(1)对图像超分辨率重建方法进行系统综述,分析了从传统的基于插值法到目前的基于深度学习法的图像超分辨率重建技术原理和特点;(2)提出一种基于模型集成的暗场图像超分辨率重建方法,
由于“大跃进”和农村人民公社化运动的失误,加上1959—1961年连续三年自然灾害和苏联政府背信弃义地撕毁合同,使我国国民经济陷入困境,国家和人民遭遇重大损失,农村生产力遭到破坏,农业产值特别是粮食产量连年减产,人民口粮出现供应紧张的状况,部分地区出现严重饥荒。粮食成为影响全国人民群众最突出的问题。1960年代初的农业困难引起了整个国民经济困难,党中央为了战胜困难,走出困境,1960年8月10日中
基于知识库的问答系统能够针对用户提出的自然语言问题直接作答,相比于借助形式化查询语句获取知识库内容的方式,问答系统更加智能且高效。依托于大规模知识库的问答系统通常采用流水线工作模式,在这种模式下,系统利用自然语言处理的相关技术确定问题查询的主题实体,并在知识库中抽取主题实体相关的三元组,从中找到与问题相关度最高的组合用以抽取问题的答案。知识库中相互关联的三元组表现为小规模的图结构,这种结构被称为查
随着近几年来自然语言处理技术的迅猛发展,人工智能已经渗透到我们生活的方方面面,各种各样的人工智能产品出现在市场上,人们也逐渐对计算机寄予了越来越高的期望,希望计算机能够帮助人们完成更多更复杂的工作。得益于深度学习和大数据的发展,一些任务导向的对话语音助手也渐渐在人们的日常生活中出现。这些对话语音助手,不仅可以陪用户闲聊,还可以智能化地解决人们很多日常需求,比如听音乐、打电话、订车票等。其背后的主要
随着监控/摄像头覆盖率的不断提升,人们可以越来越方便快捷的获得大量的视频信息,比如课堂视频,小区门岗监控等。传统的依靠人工进行的监察、判断手段缺点越来越明显:观看视频效率低、速度慢;人的注意力容易不集中;人工手段成本过高等。而通过人工智能技术的动作识别算法在复杂的环境下又会出现识别率过低,识别结果不可信的问题。本文使用深度学习技术进行视频的自动识别分析。通过对视频中人物的关节点识别+动作识别来获得
随着互联网与多媒体技术的不断发展,数据传输日益便捷,由此引发了许多侵权、恶意攻击以及盗版等问题,数字水印技术在版权保护方面就显得尤为重要。虽然电子文件逐渐取代了纸质文档,但仍有许多重要文件例如证件、证书、书本等需要制成印刷品,水印的抗打印扫描攻击能力在版权保护中也十分重要。目前,许多学者选择在更不具有可见性的频率变换域中进行水印嵌入,然而在图像频域嵌入水印存在着难以平衡水印隐藏性、鲁棒性以及嵌入容
语义分割是像素级的图像分类任务。相比于其他的计算机视觉任务如图像分类和目标检测而言,语义分割能够提供更加丰富的语义信息。随着深度学习在近些年来的迅猛发展,基于深度学习的语义分割算法已经在自动驾驶、缺陷检测、智慧农业和医疗图像分析等领域拥有了广泛应用。但是目前基于深度学习的语义分割算法的计算量往往都很大,这限制了算法在资源有限的嵌入式设备等平台上的应用。本文首先分析了现有的基于光流法的视频语义分割模