基于高斯混合模型的语音转换方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:jiujiejushi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是指改变一个人(源说话人)的语音个性特征使之具备另一个人(目标说话人)的语音个性特征,从而使源说话人的语音听起来像目标说话人的语音的一种语音处理技术。随着现代生活水平的提高,人们不再单单追求语音的可懂度,而更加强调语音的个性化特征,因此,该技术的研究不仅具有重要的理论意义,同时也具有巨大的应用价值,正逐渐成为语音处理领域的研究热点之一。   本文主要研究语音转换技术的基本理论和方法,介绍了语音韵律转换和谱包络转换的基本概念和方法,重点研究了基于高斯混合模型的谱包络转换算法的原理和实现,论文的主要工作如下:   首先,本文研究了传统的基于高斯混合模型的谱包络转换算法,该算法在转换函数训练时采用期望最大算法(EM算法),由于其具有局部收敛特性,导致模型的参数估计对初值较敏感,且容易收敛到一个局部最优值,本文将该算法与具有全局优化特性的遗传算法相结合,利用遗传算法的并行搜索和全局寻优特性对其加以改进,将其应用到语音转换的过程中,通过仿真实验分析了算法的性能。   其次,本文研究了基于模糊高斯混合模型的谱包络的转换算法,该模型与传统的高斯混合模型算法的主要不同在于对特征矢量的划分采用了模糊聚类技术。本文描述了基于模糊高斯混合模型的谱包络转换算法的具体实现,并结合STRAIGHT语音分析合成模型实现了基于模糊高斯混合模型算法的语音转换系统,通过仿真实验对比分析研究了传统高斯混合模型和模糊聚类高斯混合模型在谱包络转换效果方面的异同,分析了转换后的语音质量,并对存在的问题和不足做了简要阐述。
其他文献
多天线系统,也称为多输入多输出(MIMO)系统,可显著提高通信系统的传输容量与链路传输的可靠性,因而,已成为实现未来高速宽带无线接入网的关键技术之一,并且广泛应用于下一代
目标的录取参数精度随着雷达技术的不断发展有了越来越高的要求,同时随着作用范围的增大,录取目标的数据量随之增加,处理时间也随之增加。点迹凝聚是一种利用雷达回波信息提
随着Internet的飞速发展,网络由以前单一的数据网变成了多业务的综合数字网,它的设计有两大目标:一是保证各类业务的QoS要求,二是使网络的资源利用率达到最佳。因此,研究网络分组
现代信息技术的迅猛发展和人们生活质量的提高,使得视频处理方面的研究与应用,尤其是实时图像处理受到了广泛关注。近年来,DSP技术的不断发展,将数字信号处理领域的理论研究
语音是人们日常交流的主要手段,也是信息的主要载体之一。语音信号存在着很大的冗余度,因此语音压缩在存储和数字化传输方面起到的至关重要的作用。随着通信、计算机网络技术
随着高速飞行器的发明,传统机械扫描雷达由于天线惯性越来越难对高速飞行器进行探测,而相控阵雷达在波束转换速度以及波束形成灵活性上的巨大优势,使其已经受到各国的广泛关
在早前,诸如雷达、通信以及电子战等应用通常在收发操作层面上是相互独立的,且分别拥有各自独立的收发器及信号处理设备。由此也带来了资源冗余、电磁兼容性差、规模庞大、缺
Windows CE是微软公司推出的一项功能强大的实时嵌入式操作系统,它具有很多优秀的性能。Windows CE操作系统的模块化设计,使得开发人员可以根据需求定制设备,这种定制有助于