基于RBF-GMM的蒙古语语音转换系统研究与实现

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户：yanhe100

【摘要】

：

【作者】

：

胡明櫆

【机构】

：

内蒙古大学

【出处】

：

内蒙古大学

【发表日期】

：

2021年01期

【关键词】

：

蒙古语语音转换 GMM RBF神经网络深度学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

蒙古语语音转换是蒙古文信息处理的一个重要分支,语音转换技术是指在不改变语音内容的前提下,将一个说话人（源说话人）的语音转换成另一个说话人（目标说话人）语音的一种技术,近些年来随着深度学习算法的提出,人工智能技术得到了快速的发展,而语音转换技术也因采用了深度学习模型而使得转换后语音质量获得较大的提升。目前,关于英语和汉语等主流语言的语音转换研究已经获得了非常多的成果,但是关于蒙古语的语音转换技术仍处于起步阶段。本文对语音转换相关技术展开研究,并实现了一个基于神经网络的蒙古语语音转换系统。研究内容如下:首先,本文建立了蒙古文语音转换语料库,并在此基础上建立了基于GMM模型的蒙古语语音转换基线系统。实验结果表明,由于GMM模型在转换特征时会出现过平滑的特征转换,因此转换后的蒙古语语音会出现模糊发闷的现象。其次,本文提出了基于GMM和RBF神经网络混合的蒙古语语音转换模型。针对转换语音不清晰、自然度不高等问题,本文利用多层的RBF神经网络改进了特征矢量,进而优化了语音特征的转换过程中的过于平滑现象。实验结果表明,在经过改进后转换语音自然度和清晰度得到了明显的提升,并得到了相似度较高的转换结果。最后,本文搭建了基于RBF-GMM神经网络混合模型的蒙古语语音转换系统,并搭建了云服务。系统可以实现说话人之间的语音转换,并具有音量调节、暂停播放、下载目标语音等功能。

其他文献

基于深度学习的蒙古文新闻文本分类与倾向性分析研究

在信息爆炸的当下,挖掘有效信息成为巨大挑战,新闻媒体正是大众获取信息的重要渠道之一。而新闻文本分类、倾向性分析可适用于新闻线索收集、舆情监控、决策辅助、有害信息过滤、运营分析、专题分析及新闻推送等领域,能够有效帮助用户快速、准确地获取所需信息,帮助新闻媒体在茫茫数据中分析出规律和关联项,达到便捷快速处理新闻的目的。文本分类及情感倾向性分析目前在国内外研究较多,发展相对成熟,但是蒙古文相关研究的起步

学位

长短时记忆网络新闻分类倾向性分析注意力机制可视化

基于深度学习的蒙古文微博情感分析研究

随着社会媒体的发展,越来越多的用户通过微博来表达情感。因此,对微博中的情感进行挖掘有很大的应用价值。近年来,深度学习的技术在自然语言处理领域中取得了广泛的应用。所以本文将基于深度学习对蒙古文微博情感分析进行研究,具体工作内容总结如下:（1）由于蒙古文语料匮乏,本文构建了蒙古文微博情感分析语料库,选用NLPCC2014部分中文语料作为原始语料。由于原始语料包含大量噪音,需要对原始语料预处理。将清洗后

学位

深度学习情感分析多头自注意力机制TransformerB/S结构

基于无人机的传感器网络数据收集方法研究

近年来,随着科技的发展,无人机技术的应用领域越来越广泛。无人机具有低成本、较强的移动性以及可以快速灵活地部署等众多特点。这些特点使得使用无人机辅助传感器网络完成环境监测数据收集任务成为了可能。使用无人机作为数据收集节点,可以拓宽节点的空间移动范围,更加适合复杂环境中的传感器网络数据收集任务。本文将传感器网络数据收集任务划分为单跳传输场景和多跳传输场景。在单跳传输场景中,初始状态下使用K-Means

学位

无线传感器网络无人机辅助数据收集能量路径规划

基于深度学习的场景文本检测与识别研究

场景文本的检测与识别是目前计算机视觉领域比较热门的研究内容,用于定位场景文本中的文本区域并识别其字符序列。场景文本中往往包含很多丰富的文本信息,这些信息可以帮助我们认知场景。场景文本的检测与识别可以被应用到很多领域,如无人驾驶、智能交通、即时翻译和视觉搜索等。虽然传统的印刷文本检测与识别技术已经较为成熟,但场景文本的检测与识别还存在很多难点,例如背景复杂、文本形式多变、文本图像透视曲率失真等。本文

学位

场景文本检测场景文本识别序列到序列模型注意力机制特征金字塔网络

基于图像分析的手机传感器行为识别研究

随着近些年移动互联网技术的快速发展和智能手机用户群体数量的不断增长,出现了多种多样基于智能手机传感器的应用,这些应用已经融入到人们日常生活和工作的各个领域,给人们的生活带来了极大的便利。这些应用的实现离不开行为识别技术的研究,目前基于手机传感器的用户行为识别研究主要存在以下两个问题:一、大多数研究工作是基于单传感器即加速度传感器进行行为识别,没有充分利用智能手机内置的其他传感器进行融合识别;二、一

学位

图像分析智能手机传感器行为识别神经网络

基于深度学习的蒙汉混合语语音识别系统研究与实现

随着人文交流日益密切,双语或多种语言混合表示成为了一种常见的语言现象。在国际上,汉英、英德、英法等混合语言运用越来越普遍。在国内,维汉、藏汉、蒙汉等混合语言现象也越来越多。所以多种语言混合语音识别成为了语音识别研究领域中的一个热门课题。虽然汉语、蒙古语、英语等单语言语音识别系统已经达到了使用要求,并且汉英混合语音识别研究也较为成熟,但基于蒙汉混合语语音识别研究仍处于起步阶段。因此,本文结合蒙古语和

学位

蒙汉混合语语音识别声学模型语言模型神经网络端到端

基于改进深度森林的助学金发放预测研究

为了解决国内家庭经济困难学生的就学问题,政府非常重视对助学金的发放工作,通过国家政策、学校组织和学生监管贯彻落实对贫困生的精准补助。然而,由于体系不完整和监管力度不足的原因,使助学金的有效发放受到很多阻碍。科学技术发展使得学校可以通过大数据手段有效评估学生信息,从而有效辅助助学金的精准发放工作。在此背景下,本文对学生在校多源数据进行分析处理,基于深度森林算法构建了学生助学金发放预测模型。本文的主要

学位

助学金发放预测典型相关分析类不平衡gcForest

基于图像特征的智能机器人身份识别系统的设计与实现

随着人工智能和深度学习的崛起,生物特征识别技术毫无疑问已经成为解决计算机身份验证和身份识别问题最有效的方法。目前先进的身份识别系统使用单生物特征的居多,但是使用单生物特征会存在信息限制,表达限制,不变性限制等问题,导致身份识别系统的准确性难以取得较好的结果。而多生物特征识别方法虽然能够在一定程度上提高身份识别的准确率,但需要每一种特征都要采集足够完整以进行识别。因此,在使用生物特征识别技术时,选择

学位

智能机器人身份识别生物特征识别技术特征融合

能量收集受限状态下EH-WSN的休眠调度算法研究

无线传感器网络（Wireless Sensor Network,WSN）面临的最大问题是能量受限。为了打破这一问题的制约,利用周围环境补充能量的能量收集型无线传感器网络得到了广泛的研究。应用最为广泛的是太阳能收集型无线传感器网络。而太阳能收集型无线传感器网络在冬天或阴天等光照时间有限或光照强度较弱的情况下,节点能收集到的能量也比较有限,从而导致网络的运行时间相应地减少。因此,本文从提高能量利用率、

学位

WSNEH-WSN休眠调度网络生存周期

基于深度学习的疲劳驾驶检测系统的设计与实现

道路交通安全问题与社会中的每个人都有着密不可分的联系,有统计数据表明,疲劳驾驶是导致道路交通安全事故的几大主要原因之一。为了更好的解决司机疲劳驾驶的问题,众多汽车厂商与科研机构都对此展开了研究。针对疲劳驾驶检测,目前最常用的方法有三种,分别为基于生理特征的检测方法、基于车辆行驶信息的检测方法以及基于驾驶人行为特征的检测方法。前两种方法由于分别具有对驾驶员含有侵入性与检测精度较低等问题而导致在实际生

学位

疲劳驾驶深度学习计算机视觉PP-YOLO模型训练

基于RBF-GMM的蒙古语语音转换系统研究与实现

与本文相关的学术论文