【摘 要】
:
语音增强在通信设备、助听器等产品中应用广泛,同时可作为语音识别、语音编码与合成等语音技术的预处理技术,具有较高的研究价值。基于神经网络的语音增强算法是其中一项重要研究内容,同时,注意力机制能够较好的提取特征中的全局相关性,从而使语音增强网络的能力得到进一步提升。通道注意力、自注意力等方法可使语音增强网络有效区分语音与噪声信息,从而更好的抑制噪声。然而目前基于注意力机制的语音降噪方法还存在一定局限性
论文部分内容阅读
语音增强在通信设备、助听器等产品中应用广泛,同时可作为语音识别、语音编码与合成等语音技术的预处理技术,具有较高的研究价值。基于神经网络的语音增强算法是其中一项重要研究内容,同时,注意力机制能够较好的提取特征中的全局相关性,从而使语音增强网络的能力得到进一步提升。通道注意力、自注意力等方法可使语音增强网络有效区分语音与噪声信息,从而更好的抑制噪声。然而目前基于注意力机制的语音降噪方法还存在一定局限性,为进一步提高单声道语音增强网络的能力,本文做了以下方面的研究:(1)针对传统的卷积循环神经网络在低信噪比条件下提取语音信息的能力较弱,基于时域的两阶段Transformer网络结构较复杂的问题,本文利用离散余弦变换(Discrete Cosine Transform,DCT),将时域波形转换为实数频域信号,避免了幅度与相位的困扰。同时利用两阶段Transformer学习频域信息中局部和全局范围的特征,提出了基于DCT域的Transformer模型。含噪语音依次通过编码器、Transformer模块以及解码器得到增强后的语音频谱,最后通过逆短时离散余弦变换得到增强后的语音。相关实验表明,本方法在多种信噪比条件下,在短时客观可懂度和语音质量感知评估方面表现出比对比方法更好的降噪能力。(2)针对目前基于注意力机制的语音增强算法没有充分利用频域特征中空间与时间维度信息的问题,本文将可分离自注意力与复数神经网络相结合,在编解码器网络的基础上加入复数可分离自注意力机制。可分离自注意力分为空间自注意力与时间自注意力,语音特征首先通过空间自注意力模块,同时学习通道和空间维度的信息;然后通过时间自注意力模块,重点学习时间维度的信息。通过对频谱中各维度的特征进行针对性学习,可有效提取重要特征,抑制相关性较小的特征,减少参数冗余。在Timit和Noise X-92数据集进行的仿真实验表明,本方法具有良好的语音增强能力。
其他文献
<正>2022年1月12日,国务院发布了《“十四五”数字经济发展规划》,其中阐述了我国数字经济发展和建设的11个“工程”,具体内容如下。1信息网络基础设施优化升级工程该工程旨在推进光纤网络扩容提速,加快5G网络规模化部署,推进IPv6规模部署应用以及加速空间信息基础设施升级。
发展学科核心素养是新时期重要的教育理念之一。为了提高学生的综合素养,帮助学生健康全面成长,教师必须要创新教学方法,而不是将学生的思维固定在应试上。核心素养导向下的“大单元教学”设计,就是发展学生学科核心素养的有效方法之一。本文以高中语文“大单元教学”设计为例,从发展学生核心素养的教育观念出发,探讨“大单元教学”设计的优势和实施策略。
在落实立德树人根本任务,全面推进课程思政建设的时代背景下,本文以结构化学课程绪论部分教学为例,在课程教学过程中适时融入思政元素,实现在培养学生专业知识能力的同时,切实把思政引领融于教学全过程。从而提升学生认识分析问题以及解决问题的素养和能力,实现对学生世界观、人生观、价值观的引导和塑造。
目的 分析重症监护室(ICU)脓毒症相关性肝损伤的临床特点及危险因素。方法 选取2017年3月至2021年3月中山火炬开发区医院ICU收治的82例脓毒症相关性肝损伤患者作为观察组,并选择同期于我院治疗的脓毒症患者80例作为对照组。比较两组患者全身炎性反应综合征、免疫功能障碍、凝血功能异常的发生情况,同时记录两组患者ICU时间、机械通气时间、急性生理与慢性健康(APACHE Ⅱ)评分、序贯器官衰竭估
针对F51双相不锈钢阀门低温冲击性能不达标问题,经化学成分分析、力学性能检测、原始锻件锻造试验、金相组织检测、扫描电镜观察和能谱分析等方法,找出了产生问题的原因,最终生产出了合格产品。
<正>【教学目标】知识与技能1.词语积累。理解文章内容。感知安塞腰鼓的特点。2.体会排比、反复句子的含义及作用。过程与方法 1.反复诵读,体会文章恢弘的气势,理解其中包含的情感和深意。2.品析关键语句,体会文中多种表达方式综合运用、多种修辞手法综合运用的效果。情感、态度与价值观理解作者对高原生命的热烈赞颂,对民族精魂的礼赞,感受生命的律动和力量,从而热爱生命,热爱生活。
为制备性能优异的铜铝复合材料,基于MSC.Marc有限元仿真软件,选取1060纯铝和TP2纯铜进行冷轧复合界面的速度场模拟计算,将研究不同轧制参数条件下铜铝界面速度变化。确定了铜铝复合带在不同厚度配比和不同道次压下率时,其结合界面上的速度场变化与界面复合情况。模拟计算表明,随着铜铝复合带厚度配比的增加,界面复合所需的搓动速度差范围变大;剥离实验分析表明,在铜带与铝带厚度比分别为1∶4、1∶5、1∶
为明确胶东半湿润区不同播种密度和株行距对冬小麦产量形成的调控机理,以当地主栽品种‘济麦22号’为材料,探讨了不同株行距配置和播种密度对冬小麦群体动态、地上生物量、产量及其构成要素等指标的调控作用。两年试验结果表明:播种密度与基本苗、公顷穗数及籽粒产量呈显著正相关,相关系数分别为0.97、0.95和0.50,与穗粒数呈显著负相关,相关系数为-0.69;在相同播种密度下,窄行宽株距处理明显优于宽行窄株