基于激励源及其韵律特征的源—目标说话人声音转换研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zk1311988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在不改变说话内容的前提下,实现源说话人声音向特定说话人声音的转换,其研究是在说话人识别和语音合成的研究基础上进行的,同时也是这两个领域的丰富和延拓,具有非常广阔的应用前景和理论研究价值。目前,声音转换的研究大多集中在声道谱参数的转换上,对于影响语音音色和听感的激励源及其韵律特征,由于提取和建立数学模型的困难,其研究较少。为了使转换后的语音音色具有更多的目标说话人倾向性,本文主要针对激励源和韵律特征的转换进行了相应研究,主要工作如下: 1 对于与文本无关的源—目标声音转换,本文给出了一种基于混合高斯模型(GMM)的分类线性加权组合映射方法。该方法对短时特征参数采用GMM描述参数空间的连续概率分布,并将其作为分类器,可在一定的分类数下利用概率加权组合获得远大于分类数的映射规则,提高了转换效果。实验表明,该方法明显优于基于矢量量化(VQ)的分类线性变换方法的转换效果。 2 声门激励的形状对合成语音的音色影响很大,通常采用声门闭合期间估计得到的声门波导数作为激励信号,对于声门激励的转换,本文提出了一种基于勒让德正交多项式分解的声门波导数波形参数化的方法。该方法将声门波导数波形的n维勒让德正交空间坐标组成的声门波导数特征矢量,去除了矢量中各维参数的冗余,因而对该特征矢量作相应源—目标的转换,相对于普通多项式系数构成的特征矢量而言,转换效果更好。
其他文献
随着互联网不断发展以及"互联网+"的提出,社会经济网络化也越来越广泛。21世纪是互联网经济的时代,也是经济全球化和经济网络化迅速发展的时代。互联网经济影响着社会的方方面面
<正> 德国现代著名戏剧家布莱希特有句话:真理是时间的孩子。它形象地告诉人们,任何理论思维都带有时代性。苛求前人的理论或拘泥于前人的理论都是不对的。我力图用这样的原则来思考车尔尼雪夫斯基“美是生活”的定义。
提出了一种新的铝液杂物快速检测方法。导出了法的检测原理方程,分析并试验研究了影响检测重复性和分辨率的因素。试验选择了较好的检测参数,并获得了较好的检测结果。
目的探讨不同强度下低频超声波介导透皮给药对人体皮肤组织的影响.方法以24例健康青年志愿者的双上臂作为试验区域,每个试验者两上臂同时涂抹1 g eutectic mixture of local
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
不断提升大学生社会主义核心价值观教育工作的针对性和时效性,其中的关键就在于能够能够建立大学生社会主义核心价值观教育载体。本文首先是对大学生社会主义核心价值观教育
细化共晶团是提高球铁综合力学性能的有效途径。加快铁水凝固的冷却速度就可以实现共晶团的细化。金属型铸造可以加快冷却速度,但是由于冷速过快,容易使球铁铸件出现白口;同时也
上证报记者日前获悉,作为推广PPP(政府与社会资本合作)模式的重要制度设计,特许经营法目前正由发改委加紧起草,其征求意见稿已八度修改、反复推敲。有迹象显示,在PPP模式成为地方政府化解资金压力重要抓手的背景下,该法案的立法进程将进一步提速,最终方案的出炉已越来越近。  据了解,这份全名为“基础设施和公用事业特许经营法”的法案由国家发改委牵头研究、调研并起草。据接近有关部门的人士对上证报记者透露,目