语音变调算法研究及其在语音合成中的作用

来源 :山东大学 | 被引量 : 0次 | 上传用户:wyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和多媒体技术的发展,普通的音视频素材已经不能满足人们生产活动和娱乐生活的需求。应运而生的语音变调技术,是在保持音频文件播放速度不变的前提下,按照某种算法对说话人的音调进行调整,从而实现音调的升高或降低,而语音音调的不同主要是由基音频率和共振峰频率来决定,因此音调的改变可以通过改变原始语音信号的基音频率和共振峰频率来实现。目前存在的语音变调方法都还不是很完善,还存在着各种各样的缺点。   语音合成技术是随着人们对人机交互提出要求而发展起来的一种语音信号处理技术,是将计算机输出的或人为输入的一些非语音信息如文字、数字、标点符号等转换为清晰自然可懂的语音输出,这种技术又称为文语转换技术(简称TTS)。较早的文语转换系统在合成模块一般采用参数合成法,其中共振峰合成法和LPC合成法应用较多。对参数合成法的研究起步比较早,所以参数合成法已具有相对成熟的理论基础,而且实现起来较简单,但实际合成的连续语音不自然,有明显的机器腔。二十世纪九十年代初,基音同步叠加技术的研究开始兴起,并成功运用到了TTS系统中。基音同步叠加(PSOLA)技术不同于简单的波形拼接技术,它在对语音基元拼接的时候,首先对音频文件分析得到基音标注,然后以基音周期为单位对拼接单元的基频、音长和音强等韵律特征做出适合的调整,在不改变原始语音基元音质的基础上,灵活地改变语音的韵律特征。本文通过分析研究现有语音合成方法存在的优缺点,在PSOLA算法的基础上,提出了一种时长和基频分步处理的语音合成方法,并通过实验证实了其有效性。   本文主要工作如下:   1、对现有变调方法作了分类分析,主要分析了3种典型方法的变调原理和特点,即时域同步叠加固定合成法(SOLA-FS)、频域插值法和相位声码器法,并通过分析研究指出了它们的优缺点。然后在SOLA-FS算法的基础上,提出了一种改进的基于SOLA-FS的变调方法,仿真实验发现该变调方法不仅能在保持音频播放时间不变的前提下改变音调,而且降低了算法复杂度,并在一定程度上减少了噪音,并给出了改进前后运行时间的比较,以及改进前后对应的语谱图。实验发现改进的SOLA-FS方法在自然度上的优势明显优于其他变调方法,然后给出了三种不同变调算法下变调结果的主观测听对比。结果表明:不论对语音音调的升高还是降低,在相同变调系数下,改进的SOLA-FS方法均具有最好的变调效果。   2、将改进的SOLA-FS变调方法与波形拼接技术相结合,提出了一种音高、时长分步处理的语音韵律拼接合成方法,既保持了语音拼接单元的清晰度和自然度,也在一定程度上提高了合成语音的韵律修改能力。文中给出了在不同的音高调整参数下,传统的TD-PSOLA方法与时频分步合成法在基频修改时所对应的合成语音的时域图和基频轨迹图,并在最后给出了算法复杂度的比较。实验证明,传统的TD-PSLOA方法在音高修改时,其合成语音对应的基频轨迹的包络与语音样本的基频包络有较大出入,尤其是当基频修改幅度较大时,会造成叠加单元的混叠或遗漏,从而影响合成语音的效果。而时频分步法在音高修改时,其合成语音对应的基频包络相对语音样本基本不变,而且当音高变化幅度较大时仍能达到较好的语音合成效果。但是,本文提出的合成方法在时间复杂度上会增加,但随着计算机技术和数据存储技术的发展,算法的复杂度将不会是一个大问题。论文最后对所做的全部工作进行了总结,并给出了论文中存在的不足和下一步要研究的方向。
其他文献
无线射频识别(Radio Frequency Identification,RFID)技术是物联网(Internet of Things,IoT)中的一项关键技术,它以射频通信方式来实现无线非接触式信息识别。随着RFID技术不
量子点半导体光放大器(QD-SOA)与其它光学放大器相比具有阈值电流低、增益响应快、噪声指数低、差分增益高和频率带宽大等优越的性能,非常适用于实现全光波长转换器和全光逻
无线传感器网络发展至今,应用越来越广泛,使用范围开始涉及到生活的方方面面。对无线传输的数据速率与服务质量的要求正在不断地提高,无线传感器网络的研究也越来越深入。与
自主式水下机器人AUV(Autonomous Underwater Vehicle)代表了未来水下机器人技术的研究方向,是目前研究工作的热点。而导航问题仍是AUV所面临的主要技术挑战之一,在导航问题
正交频分复用(OFDM)是一种多载波调制技术,能够有效对抗多径衰落和符号间干扰,并且具有频谱利用率高的特点,被认为是下一代移动通信的关键技术。但OFDM对时间和频率同步误差
无线传感器网络(Wireless Sensor Networks,WSN)源于对外界信息的需求,得益于嵌入式技术的发展。由于WSN中节点的电源一般不可更换,所以能耗成为制约WSN网络寿命的关键因素,