基于汉语协同发音模型的文本驱动三维口型动画合成研究

来源 :山东财经大学 | 被引量 : 0次 | 上传用户:cin_long
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机动画技术的不断发展,人们对三维虚拟模型情感表达的真实感提出了更高的需求,三维口型动画就是其中的一个重要部分。论文根据汉语协同发音规律对口型合成的影响,提出了一种基于汉语协同发音模型的三维口型动画驱动方法,使得三维口型动画的合成更流畅、更平滑、更接近人们真实发音时的口型。本文的研究内容如下:(1)完成声母和韵母的聚类,构建汉语可视化协同发音模型,解决协同发音对汉语连续发音时口型的影响。(2)利用MPEG-4中“中性人脸”和“FDP”的定义规范化三维模型,并建立基本口型库。(3)利用连续文本驱动合成口型动画,实现口型间的平滑过渡。本文的创新点如下:(1)改进基于汉语的协同发音模型。首先,为每一类不同的声母和韵母增加不同的“影响等级”和“受影响等级”属性,并综合考虑口型发音姿态,改进声母和韵母聚类方法。其次,增加考虑音节间元音的相互影响,构建协同发音模型,提高模型的表达能力。(2)提出了一种基于连续文本驱动口型动画合成方法。利用改进的协同发音模型,实现输入的所有发音音素的优化,输出新的口型序列。通过改进对插值生成过渡帧的控制,生成更具真实感的口型动画。实验表明,论文提出的方法能充分模拟汉语协同发音对发音口型的影响,可以合成自然流畅的口型动画。基于文本驱动的真实感三维人脸动画在影视、游戏、社会生活、教育等多个领域都具有极其广阔的应用前景。
其他文献
作为被当前推荐系统最普遍采用并取得较大成功的推荐技术,协同过滤推荐技术根据目标用户(或项目)的访问数据或评价信息找到与其相似度较高的用户(或项目)作为最近邻居,然后根
无线胶囊内窥镜(Wireless Capsule Endoscopy, WCE)作为一种新型的胃肠道疾病检测技术,克服了传统的机械式内窥镜检查存在的缺陷,避免给患者带来身体上的痛苦,已经广泛应用在
无线传感器网络(WSN)是由大量传感器节点以自组织方式组成的一个监控系统,可以对目标区域的信息进行实时地监控和处理,应用十分广泛。对于大多数WSN来说,未知节点所感知的信
随着计算机仿真技术和硬件设备性能的不断提高,红外图像仿真技术能够很好的生成各种不同气象条件、不同时刻和季节下目标和背景的红外图像,近年来得到迅速发展,并获得了广泛
步入信息化时代,中文信息处理成了重要研究领域。中文信息存在错综复杂的关系,相关是对多种关系的总称,范指任意两个对象之间存在的关联关系,相关度是对相关的定量表示。词语
随着城市现代化建设的快速发展,城市轨道交通正逐步全面进入网络化运营时代。在大幅提升交通运力和出行便利的同时,也给运营调度带来了新的问题和挑战。在网络化运营及“无缝
室内定位技术的研究已有二十多年历史,人们使用超声波、红外、射频识别等技术研发出各种不同的室内定位系统,针对不同应用环境得到不同的定位精度。但是,它们通常需要较为昂
量子计算具有许多优良的特性,如并行性、存储容量达指数级以及指数加速等,当今许多国家都对其进行研究,并把其列为本国重点研究的前沿学科。量子理论中定义的量子态的叠加、纠缠
对人脸图像的研究问题一直是数字图像处理、模式识别、计算机视觉等领域的热点之一。然而,受制于成像设备、传输带宽、环境干扰等硬件条件的限制与影响,获取的人脸图像的分辨率
医学图像分割是对正常组织和病变组织进行三维重建、定量分析等后续操作的基础和关键,并可为临床诊断和辅助治疗提供有力的支持。由于在核磁共振成像的过程中存在电子噪声、