汉语耳语音——正常音转换的机理研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户：wuqianlan987654

【摘要】

：

耳语音转换为正常语音在通信系统、安全保密系统、金融系统、医学等领域有着广泛的应用前景。汉语耳语音的转换目前仍处于研究的初级阶段，由于汉语耳语音与正常语音的巨大差异

【作者】

：

陈雪勤

【机构】

：

苏州大学

【出处】

：

苏州大学

【发表日期】

：

2009年期

【关键词】

：

汉语耳语音转换法基频轨迹重构听神经发放率声道参数转换

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

耳语音转换为正常语音在通信系统、安全保密系统、金融系统、医学等领域有着广泛的应用前景。汉语耳语音的转换目前仍处于研究的初级阶段，由于汉语耳语音与正常语音的巨大差异，在实现汉语耳语音向正常语音的正确转换和获得较高的语音质量方面还有许多亟待解决的问题。本文对耳语音向正常语音的转换机理进行了比较深入地研究，并确立了按照语音分析-综合的思路研究汉语耳语音转换的原理与方法。为便于耳语音转换系统今后实际应用于通信等领域，采用修正的混合激励线性预测声码器为汉语耳语音转换系统的合成模块。以合成语音所需参数为目标，重点研究了耳语音与正常音的激励特征与声道谱特性的差异，指出实现汉语耳语音转换在特征与模型方面目前面临和需要解决的几个关键问题。针对这些问题，本文做了以下几方面的工作： 1、对汉语耳语音的声学特征进行研究分析，提出基于多尺度特征的汉语耳语音端点检测及声韵分割方法。韵母是汉语音语义的主要载体，并且耳语音与正常音的差异主要在韵母部分，它是汉语耳语音转换的主要研究对象，因此在汉语耳语音预处理部分，声韵母的准确分割非常重要。本文根据汉语耳语音非线性及混沌特性，分别采用分形维特征和子波能量比特征实现耳语音的端点检测和声韵分割。改善了汉语耳语音的声韵分割的准确率，该方法具有在低信噪比下具有较高的鲁棒性和与说话人及文本无关的优点，可用于汉语耳语音的转换与识别的预处理。 2、对汉语耳语音的听觉感知特征进行研究分析，提出了基于听觉计算模型的汉语耳语音基频轨迹重构方法。根据听神经发放信息是听觉中枢的唯一信息来源，它是对于语音信号的声强、频谱、共振峰等多种声学特征的综合反应这一理论依据，以听神经平均发放率为线索感知汉语耳语音声调及音高，提出了汉语耳语音音调的定量描述方法。在感知耳语音音高及声调的基础上重构基频轨迹，为汉语耳语音的转换提供重要的激励信息。以声调识别率结果验证了该方法与主观听觉感知吻合。 3、对耳语音与正常语音的声道特征异同进行了深入研究，提出一种基于概率加权高斯混合模型的汉语耳语音声道特征转换方法，并提出汉语耳语音的声道特征转换误差的客观评价方法。该方法建立了耳语音声道模型与对应的正常语音声道模型之间的映射关系。与相关文献中对声道参数采用全局线性偏移的方式相比，这种“柔性”的转换方式更加细致地实现声道模型之间的转换，更加符合语音及说话人个性特征的多变性，为汉语耳语音的转换提供重要的支撑。 4、在对汉语耳语音声学特征提取及转换的基础上，以修正混合激励线性预测声码器为合成模型实现了汉语耳语音转换。本文以混合激励线性预测声码器为原型，根据汉语耳语音的特点对合成模型的参数进行调整与设置，建立一个适合耳语音转换的合成模型，对激励与声道处理部分所提供参数的准确性进行了检验。对转换结果在语义、语音自然度等方面的评价结果表明基于该汉语耳语音转换系统的转换语音达到了通信质量。

其他文献

模糊推理中CRI算法与全蕴涵三Ⅰ算法的等价性研究

Zadeh于1973年首次提出了基于模糊集合理论的模糊推理算法，即CRI(CompositionalRule of Inference)算法。从此，以模糊推理为基础的模糊控制技术被广泛地应用于工业控制领域，并取

学位

模糊推理CRI算法全蕴涵三Ⅰ算法等价性模糊蕴涵算子

忠实于植物学的虚拟植物生长研究

虚拟植物生长是指在计算机上形象直观地再现植物的生长过程.它的研究内容十分广泛,该文主要集中研究如下五个方面:1.建立忠实于植物学的植物形态发生模型;2.植物构造模型的生

学位

虚拟植物生长建模双尺度自动机可视化

城市公路隧道智能监控信息系统中若干技术的研究——排水系统

城市公路隧道的发展迅猛,但很多相关问题的研究仍处于起步阶段,公路隧道的智能监控系统是保证隧道正常高效运营必要条件,而本文所研究的隧道排水控制系统是公路隧道监控系统

学位

城市公路隧道Elman网络模糊规则排水控制系统

基于CORAS框架的信息安全风险评估方法

随着计算机和互联网技术的突飞猛进,信息安全问题日益严重。解决信息安全问题的基础是信息安全风险评估。信息安全风险评估的实质是风险管理,它是运用科学的手段,依据相关的

学位

CORAS信息安全评估UML建模

基于神经网络的中国水墨画艺术风格学习

美术作品的艺术风格学习是一项有趣的研究活动。它的目的是让我们的计算机程序像人一样“感知”提交给她的艺术图片,从中抽取出它的“艺术风格特征”,并将这种特征赋予另外一

学位

水墨画艺术风格学习BP神经网络纹理分析图像分割

基于Petri网的水产品追溯信息模型及其应用

学位

基于MobiLink技术的统计移动办公系统研究与设计

随着我国经济的迅速发展,人们的生活、工作节奏越来越快,迫切需要在任何时间、任何地点访问所需要的数据,“移动办公”的概念正是在这个背景下被提出并越来越受到关注,成为软

学位

移动数据库MobiLink统计

模糊层次分析方法在高速船通航风险评估系统中的应用研究

随着我国沿海经济持续增长,水上交通运输需求急剧增加。近年来,杭州湾航区高速船客运市场发展迅猛,业内外人士对于水上高速客运市场充满了期望。但是,由于自然资源的有限性,

学位

高速船模糊数学综合评价层次分析计算机辅助

基于B/S和C/S综合模式就业信息管理平台的设计与实现

近期金融海啸席卷全球,对于我国大学生就业环境的影响越来越严重,并且在办公自动化程度、统计分析、适应性等方面对高校毕学生就业工作特别是高校毕业生就业信息化工作提出了

学位

SCSFWCF智能客户端就业信息管理数据模型扩展

基于全方位视觉的运动目标检测跟踪研究

随着计算机技术、图象处理技术的不断发展,视频监控已经成为计算机视觉领域的一个重要研究课题,而运动目标检测与跟踪是视频监控的重要组成部分。本文基于全方位视觉设备获取

学位

全方位视觉减背景法自适应阈值选取背景干扰过滤颜色模型

汉语耳语音——正常音转换的机理研究

与本文相关的学术论文