文本驱动虚拟人多模式行为合成

来源 :中国科学院计算技术研究所第七届计算机科学与技术研究生学术讨论会 | 被引量 : 0次 | 上传用户:chyenu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首次提出并实现一种文本驱动虚拟人多模式行为合成系统,系统在播放合成语音同时,还伴随有唇动,面部行为以及身体手势动作等.在多模式合成系统中,各模式之间协同是至关重要的,本文由此提出基于语音韵律与手语时长融合的协同韵律模型,用于多模式数据之间的协同控制中.通过文本分析,利用文语转换的韵律信息调整手语合成中的时间信息从而得到协同合成的韵律,利用协同韵律实现身体动作与语音输出的协同,极大提高了多模式语音合成系统的真实感和自然度.
其他文献
软交换是新一代VoIP通信网络的发展方向,其对网络管理的要求不断提高,远程监控(RMON)技术在充分发挥SNMP优点的同时,为软交换系统网络管理提供了低成本高效率的解决方案.本文介绍了SIP软交换网络管理中利用RMON达到负载均衡的思想,并做出具体的设计与实现.
本文介绍了几种实时Linux操作系统,重点对RTLinux和RTAI两种实时操作系统进行了分析和比较,最后简要介绍了代表实时Linux发展方向的TimeSys Linux/RT实时操作系统.
现场总线技术的发展,引起传统控制系统结构的改变.许多基于现场总线技术的先进控制系统应运而生.本文介绍了Profibus现场总线技术在数控领域的一个应用.
结合Windows2000的WDM驱动程序模型和Windows环境下网络驱动程序所遵循的标准NDIS,介绍了Windows2000下网络协议驱动程序的设计,包括WDM的工作原理、驱动程序的结构与工作方式,并解释了驱动程序的设计思路.
本文介绍了两种典型的实时多任务操作系统实时Linux和μC/0S-Ⅱ的基本原理,并结合电力监测系统开发的实例,说明了如何有效的将这两个系统应用到目标系统中,最后总结了应用实时操作系统进行开发的几个优点.
简要介绍了EBMT的机器翻译方法和EBMT中的双语平行语料对齐问题.提出了一种基于短语内聚性的可应用于技术文档平行语料的短语对齐的方法,这种方法只需要对平行语料的一方进行句法分析.
情感计算是建立和谐的人机环境基础之一.情感计算是关于、产生于和影响于情感方面的计算,其目的是赋予计算机识别、理解、表达和适应人情感的能力.本文旨在紧跟国际高技术前沿,介绍有关情感计算的基本理论,包括定义、发展史、目的和意义、应用方向、研究内容、关键技术等.
基于网络的软件租用是网络及软件使用方式发展的趋势之一,本文提出了一个新的软件租用模型并对该模型的特点进行了讨论,最后给出了一个具体的原型实现.
MPEG标准采用帧间预测编码,使得基于MPEG码流的精确到帧的访问变得非常困难.本文提出了一种有效在MPEG码流快速定位特定视频帧的算法,该算法基于两分查找的思想,无需事先对码流进行任何预处理,能够直接在码流上实现精确到帧的访问.此算法适用于MPEG1、2各种类型的码流,同时也适用于MPEG4码流,具有极大的通用性.
码率控制是视频编码过程中一项重要的技术,它不仅在编码端影响压缩图像的质量,同时还会影响信道的传输以及解码端的解码过程.许多编码标准都有一套码率控制方案,如MPEG-2的TM5,H.263的TMN8等.H.26L是正在研究中的编码标准,它正以其比MPEG-4更高压缩比的优点越来越受到大家的重视,但还没有针对H.26L的码率控制方案.本文结合TM5,TMN8两种码率控制技术,提出了一种简单的适于H.2