基于分类线性加权的源-目标话者声音转换算法的研究

来源 :电路与系统学报 | 被引量 : 0次 | 上传用户:wm3033
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
源-目标话者的声音转换是一种变换说话人声音特性的技术,它将源说话人的声音转换成另一个指定的目标说话人的声音。对源话者声道谱特性的修改是声音转换的关键之一。为了克服一般分类线性转换算法中分类不准确所带来的误差,本文引入了分类线性加权转换的策略,根据不同子类的转换函数对谱特性的贡献,赋予不同的加权系数,给出了一种基于GMM后验概率加权的线性转换算法。在微软汉语普通话语音数据库上做的四组对比实验表明,该算法在谱转换性能上均有不同程度的提高。
其他文献
提出了一种基于输入队列交换的公平可扩展网络调度系统FSSA。通过将若干个容量较小的调度器合理连接并使其协同工作,构成多端口大容量网络交换调度系统,解决了单个调度器容量和
将形态记忆聚氨酯与交联剂、柔软剂等整理剂复配后,对经液氨处理的薄型纯苎麻平布进行抗皱免烫整理,通过试验得到足够的工艺参数和织物性能的数据,运用正交试验确定最佳的形
最大似然检测在误比特率最小的意义下是最优接收,但是其复杂度不可实现。本文介绍了半定松弛、分枝定界和堆栈三种低复杂度最大似然检测算法,并对其性能和复杂度进行了仿真分析
在去除图像噪声的同时,如何避免图像细节信息的损失和边缘的模糊,是图像处理技术中的一个难点。针对灰度图像中存在的椒盐噪声问题,提出了基于双向预测算法的去噪方法。首先根据椒盐噪声的特点,判断图像像素是信号像素还是噪声像素。对于信号像素,保持灰度值不变;对于噪声像素,利用双向预测的方法来确定处理后该像素点的灰度值。针对上述方法中存在的不足之处,又提出了一种改进方案。改进方案在对噪声像素处理时,根据像素之
割集在组合电路等价性验证中得到了广泛的应用,已有的方法常构造能将整个电路一分为二的割集,虽然这种割集在验证后续节点时可以重用已构建的BDD,但它的排序对大多数后续节点都
目的了解深圳市幼儿园园医的口腔知识水平,评价对园医开展口腔健康教育讲座的效果。方法采用讲座前后分别填写问卷的方式,调查并对比461名园医在口腔健康教育前后口腔保健知
油气资源是社会、经济发展与运行的动力,油气产业是国民经济的支撑产业。陕西省作为全国油气大省,油气产业稳健发展的同时也遇到了很多制约因素影响其可持续发展。本文采用DPSI
高职教学团队是影响高职人才培养质量的关键因素,建设具有高职特色的教学团队是高职教学工作的重头戏,关系到学生、教师、学校的发展。因此,我们必须采取可行的方法和途径,建设具
本文基于R.Gan等人提出的图像配准方法,利用变量间的Minkowski不等式关系理论,引入全新的联合灰度分布间Minkowski距离(Minkowski Distance,MD),以此距离作为相似度进行多模态图像配准。经分析,因Minkowski距离的引入,使得本文的优化目标函数可保持良好的全局凸性和光滑性,优化求解可以有效地克服局部极值问题,配准成功率较R.Gan等人的配准方法有显著提高。大量
本文对OFDM系统中广泛应用的一种导频辅助的信道估计器-2×1-D维纳滤波器进行了改进,以ML信道估计代替了其中的频域滤波,并将改进的估计器与2×1-D维纳滤波器在IEEE