汉语文本驱动的人脸动画演示系统设计

来源 :武汉理工大学 | 被引量 : 2次 | 上传用户:sisi22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来逼真的三维人脸动画系统的研究已成为计算机领域的热门话题,并在人工智能、影视制作、多媒体教学、远程会议和计算机游戏等方面得到广泛的应用。但是,目前国内对于三维动画系统的研究还处于初级阶段,如何针对特定的人脸建立逼真的三维模型,并运用汉语文本驱动人脸动画模型,三维动画关键帧之间的自然过渡,且与实际生活中人在说话时的嘴型相符都是目前的研究重点与难点。本文在分析研究了三维人脸建模、三维动画和汉语文本分析的关键技术和难点问题的基础上,采用基于形变模型的人脸重建方法,完成了特定三维人脸模型,并对汉语文本进行了系统的分析,归纳了汉语发音口型中的协同发音现象,实现了在连续语流中关键帧模型之间的口型过渡,最后设计实现了本文中汉语文本驱动的人脸动画演示系统。其主要内容如下:(1)在阐述了MPEG-4标准动画原理的基础上,选取特定人脸作为系统的三维人脸模型;设计了汉语文本驱动人脸动画演示系统的总体框架,分析了实现文本驱动三维动画系统的难点以及本文研究实现的重点。(2)讨论了标准人脸和特定人脸的三维人脸建模的优缺点,选用了基于形变模型的三维人脸重建方法,并选择单张正面人脸图片标定特征点,与形变模型的原始二维图像进行匹配,通过求解最小欧氏距离,得到重建模型的二维人脸图像,再将纹理映射到三维网格模型上,得到个性化的三维人脸模型。(3)通过分析汉语输入文本,对应查找汉语拼音对照表,得到输入汉字的拼音表示。并总结了汉语语音的发音规则,将汉语拼音的基本口型依据视位的不同分成了12类,并生成相应的三维口型关键帧。(4)分析讨论了人在说话过程中普遍存在的协同发音问题,通过分析基本元音、辅音发音口型之间的相互影响程度,对前后发音口型关键帧设置权值,在关键帧动画之间插入过渡帧,使得各关键帧口型之间的过渡更加自然。(5)完成了本文汉语驱动的人脸动画演示系统的功能设计,采用基于OpenGL库的VC++6.0编程实现了以汉语文本作为驱动,将输入文本转换成汉语拼音音子的三维人脸动画演示系统。
其他文献
多输入多输出(MIMO)技术是无线通信领域中的智能天线技术的重大发展之一,它能在不增加带宽的情况下,成倍地提高无线通信系统的容量以及频谱资源利用率。随着对该技术的不断研究
随着网络技术、数码设备的迅猛发展,数码照片已经取代传统的胶片照片而成为了主流。同时,各种图像修改软件也随之普及,这些软件都有一个特点就是易操作、且修改效果较好。因此任
近年来,越来越多的数字产品的涌现使得其版权保护问题日益受到关注,数字水印技术作为一种较为有效的方法成为研究热点。最新的H.264编码标准具有优异的压缩性能和良好的网络
本文对OFDM--UWB系统的∑--ΔDAC和ADC的设计与实现进行了研究。多频带OFDM-UWB技术是一种特殊的OFDM技术,也是下一代通信的核心技术之一。多频带OFDM-UWB使用频率精确隔开的
Cu(In,Ga)Se2(CIGS)薄膜太阳电池,具有吸收性好、转换效率高以及抗衰退性能稳定等突出优点,被认为是最有前途的光伏器件之一。采用电沉积技术制备CIGS薄膜能够降低成本,提高原料
无证书公钥密码系统有效解决了复杂的身份认证问题和密钥托管问题,具有突出的优势。但由于没有身份认证,无证书签名容易受到公钥替换攻击,又因为KGC(密钥生成中心)知道用户的部分
随着无线通信、嵌入式计算、低功耗数据处理等技术的高速发展,无线传感器网络(Wireless Sensor Network,WSN)发展迅速,正在越来越多的领域发挥前所未有的作用。无线传感器网络有
随着无线通信的飞速发展,频谱资源紧张的状况日渐突出。为了提高频谱利用率,认知无线电技术随之产生。认知无线电源于软件无线电技术的扩展,具有学习和随环境实时改变参数的能力
随着科学技术的迅猛发展,人们对位置服务的需求变得越来越多,对位置定位精度的要求越来越高。位置服务产业在智慧城市、救灾减灾、物联网等诸多领域都存在广阔的市场。现如今
信号感知技术通过对接收的信号进行检测、分类和识别来获取信号所携带的信息,是认知无线电和调制信号识别等领域的重要技术。谱相关理论关注信号的循环平稳特性,即统计参数随时