说话人聚类相关论文
随着智能采集设备、移动互联网及云存储平台的广泛应用,语音数据爆炸式增长。由于人工标注成本昂贵,经过人工准确标注的语音数据却......
说话人的语音分割与聚类是研究把一段包含多人语音的音频切分,标出各语音段对应的说话人,以获知“何人在何时说话”的技术,是语音......
近年来,自动语音识别系统的性能已经得到了极大的提高,它生成的高质量识别文本可以满足很多任务的要求。随着多媒体音频信息的快速增......
由于说话人差异所带的训练集和测试集的不匹配、及训练集本身过大的特征分布离散度和基元间混迭度,非特定人语音识别系统的识别率......
新闻广播语料自动标注技术的研究对于建立大规模语音语料库、语音识别技术、音频检索技术的发展都有重要意义.新闻广播语料的自动......
本文主要从说话人的切分和说话人的聚类两个方面讨论了视频中的说话人信息处理。在说话人切分方面,本文详细讨论了说话人切分的三个......
说话人聚类用于解决“谁,何时,说话”问题,是语音信号处理领域中的重要技术。说话人聚类算法主要应用在会议语音记录分类、语音识......
针对单一声学特征和k-means算法在说话人聚类技术中的局限性,为了更好地表达说话人的个性信息并提高说话人聚类的准确率,将特征融......
随着说话人识别研究的深入,多人对话的多个说话人识别受到人们的重视,已成为目前研究的热点.本文提出了对对话语音首先在计算计盒......
说话人自适应技术是非特定人语音识别研究的重要课题.本文提出一种结合了说话人聚类和模型自适应的说话人自适应框架,有效地提高了......
基于单麦克风的多说话人语音的自动标记技术是语音信号处理研究中具有挑战性的任务之一。“说话人标记”指在说话人个数未知的情况......
说话人分割与聚类(Speaker diarization)主要任务是在没有任何的先验知识的情况下,从一段录音资料中区分不同话者的说话区段,并且......
近年来,语音识别的研究对象从实验室内朗读式语音转向现实生活中的真实语音信号.广播新闻类语料作为真实语音的主要来源之一,成为......
学位
说话人聚类研究如何将一段语音中同一说话人的语音聚合.提出一种基于结合广义似然比与归一化交叉似然比两种距离测度的聚类算法.算......
交通广播中存在着多个说话人,本文讨论利用说话人聚类技术解决MLLR对自适应数据在量和文字标注上的要求,提高关键词识别率,实验证......
说话人聚类是说话人分离中的一个重要过程,然而误差向上传递的情况会由于传统的以贝叶斯信息准则作为距离测度的层次聚类方式而出......
说话人确认系统需要用目标说话人和背景模型说话人的语音数据对模型进行训练。背景模型说话人可随机选取或选取与目标说话人相近的......
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体......
目前说话人聚类时将说话人分割后的语音段作为初始类,直接对这些数量庞大语音段进行聚类的计算量非常大。为了降低说话人聚类时的计......
现如今,影视剧的海量增长给其有效管理带来了巨大挑战,而其中的角色识别在影视剧内容管理中具有重大意义。传统的角色识别主要采用......
基于端点检测出的音节切分段,提出了一种1.5秒内可变长的测试语音分段法.该方法保证了音节的完整性,提高了说话人识别率.另外利用......
说话人分段聚类的任务是将一段语音中由同一说话人发出的语音聚合起来。文中提出了一种基于交叉似数似然度(Cross Log—likelihood ......
说话人聚类是说话人分离中的一个重要过程,然而传统的以贝叶斯信息准则作为距离测度的层次聚类方式,会出现聚类误差向上传递的情况......
本文提出了一种新的基于假设检验的说话人聚类算法。该算法在传统的层次聚类方法基础上引入误差平方和最小准则,通过优化类别划分......
提出了基于远近距离的说话人聚类算法:首先,使用端点检测算法把语音分割成读音段,然后,采用他公式对近距离的说话人语音段进行聚类得到......
说话人差异是影响语言辨识系统性能的一个重要方面。采用说话人聚类技术对训练数据进行了预分类,以此为基础训练各种语言模型,得到聚......
基于高斯混合模型(Gaussian Mixture Model,GMM)间差别的方法是进行说话人聚类的常用的一类方法。该文提出两种新颖的GMM差别度量,“......
新闻发布会中,首要说话人(例如政府要员)通常要即兴回答记者事先准备好的问题。因而首要说话人语速一般很慢,而其他说话人(例如记者、......
随着流媒体应用的蓬勃兴起,基于媒体内容的检索和管理逐渐成为当前的学术研究热点。新闻节目作为电视节目的一种常见形式,对其主题......
该文提出一种基于特征均值距离的短语音段说话人聚类算法。首先,定义特征均值距离用来在特征层而不是模型层刻画两个类之间的相似......
说话人识别技术如今在日常生活中得到广泛地应用。由于移动互联网的快速发展,语音数据量正在不断地增长,大规模应用下的快速识别任......
语言辨识(又称语种识别)技术是语音识别技术的一个重要方向,具有广泛的应用前景。语言辨识系统主要可分为三个部分,即特征提取、模......
今天,各种高效、快捷的算法使得建立实时的连续语音识别系统成为可能,但是在实际应用中由于说话人的改变会使得系统性能下降。说话人......
随着媒体数字化技术和网络技术的发展,人们的日常生活中所接触到的数字视频越来越多。相应的,对数字视频进行分析和查找的需求也越......
说话人分割与聚类系统的任务是在没有任何先验知识的情况下,对于一段含有多个说话人的语音中不同说话人的语段进行一一标注。说话......
近年来,语音识别中的关键词检出技术的研究取得了很大的进展,并且应用在电话信道的条件下。然而在实际应用中,实验室“成功”的检......
现代IT技术的发展越来越快,获取各类音频文档的方法也都相继出现,而数据量则呈现快速增长的趋势,管理音频文档将会越来越困难,因而对音......
现有基于混合高斯模型的说话人聚类方法主要依据最大后验准则,从通用背景模型中自适应得到类别的混合高斯模型,然而自适应数据较少......
针对采用传统的在线聚类方法时后续判决错误率较高的缺点,提出了一种改进的基于决策树的在线说话人聚类算法。通过构建一个决策树,......