特征点定位及图像变形在人脸动画中的应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:kl7aa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能人机接口技术尤其是虚拟人脸合成成为近年来国外的一个热点研究领域.该项技术也被称为多模态(Multimodal),视觉语音(Visual Speech),说话头(Talking Head).这种技术将语音和图像两种模态结合到一起,能够对单一使用某一种模态的不足进行合理、有益的补充,使人们对信息的了解更全面;通过虚拟人脸,人们可以方便的和计算机进行交互.而将语音和图像相结合的人脸动画技术正成为计算机图形学中最富有挑战性的课题之一,它可以提高在环境噪声较大情况下语音识别的识别率和稳健性.可以广泛应用于电影制作,计算机动画行业、游戏行业、远程会议、代理和化身等许多领域,是近几年来国际上的研究热点.使用改进的基于图像库方法HMM进行人脸语音动画合成过程,为了保证结果视频流的平滑真实,因此在相应音素的图像帧之间进行插值产生中间帧就成为语音动画中十分重要的部分.该文着重介绍了从相应语音的图像帧中提取特征区域进而对其中的特征点进行定位,根据特征点的位置将特征区域根据需要进行划分并在前后对应音素的图像帧中进行变形进而得到流畅自然的语音动画效果的工作模块.该文的主要工作包括:第一,研究了传统的基于图像库的方法.第二,研究了图像特征定位及图像变形的方法并做了一定的比较.第三,使用改进图像变形技术应用在我们的方法中,使用Delaunay三角剖分,仿射变换并对中间图片进行重染色,以得到流畅自然的语音动画效果.
其他文献
抽象与建模是人类认识世界和解决复杂问题所采用的基本方法之一.企业建模是认识企业的基础,也是改造企业的客观需求.无论对于企业管理者还是企业管理信息系统开发人员,构建正
高性能计算与资源共享一直是计算机应用的重要问题,这两个问题的基本解决途径是构造大型分布式系统.随着人们求解问题领域的不断扩展,所遇到的问题越来越复杂,而且规模越来越
计算机技术迅速发展。从硬件技术看,CPU速度越来越高,处理能力越来越强;从软件技术看,应用程序的规模不断扩大,特别是Internet及WWW的出现,使计算机的应用范围更为广阔,许多应用程序
随着软件再工程时代的到来,基于框架的软件定制生产的兴起,如何通过再工程活动使得软件定制生产能够充分重用成熟的既存系统已经成为一个非常有价值的课题.有重用价值的成熟
智能主体(Agent)是分布式人工智能领域中的一个重要应用,其主要目的是减轻人们的负担,以增强软件的友好性,最大限度地提高工作效率。智能主体是指能在某一环境中运行,并能响应环境
数字化后的视频和音频信息的数据量非常大,它给信息的存储和传输造成较大的困难,成为阻碍人类有效地获取和使用信息的瓶颈。有效的数据压缩编码方法,以压缩的形式存储和传输这些
企业中各个系统使用各自不同的编程语言和系统平台工作,数据存在于一个个信息孤岛中,无法实现数据的共享和交换。怎样将这些独立的应用集成起来,在平台和操作系统之间实现无缝互
因特网规模的不断扩大使得移动计算成为一个重要的研究领域.在该领域内,代码安全性问题(code safety)受到学者的广泛关注.移动代码的特点是异地编写,该地执行.这种代码的来源
计算机日益广泛的应用,促使整个计算机科学技术领域发展的日新月异,并且对当今整个社会的发展都起着重大的推动作用。作为计算机科学技术中的核心和重要内容之一的软件技术的发
随着计算机技术特别是网络技术的迅猛发展,新的计算机病毒的产生和传播速度越来越快,危害也越来越大.现有的反病毒技术主要是基于特征码匹配的方法,对于已知病毒可以准确快速