广播新闻语料自动识别系统

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:judge119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,语音识别的研究对象从实验室内朗读式语音转向现实生活中的真实语音信号.广播新闻类语料作为真实语音的主要来源之一,成为语音识别的研究重点.本报告针对广播新闻语料声学环境复杂多变的特点,构建了完整的广播新闻语料识别系统-ThinkIT-BNR系统.有别于传统的大词表连续语音识别系统,该ThinkIT-BNR系统包括:音频匹配、音频自动分段、音频分类、说话人聚类、识别后处理,以及多阶段识别策略等多个模块.本报告提出和实现了多种算法,它们是:提出了基于距离的可变长非同源音频匹配算法,该算法能够根据提示音乐快速定位新闻节目的边界;从韵律节奏出发,提出了多种基于能量的自动分段算法,其中基于方差的分段算法简单易行且性能与手工分段相当;实现了基于混合高斯模型的音频自动分类算法.
其他文献
本文介绍了零动能光谱学的基本原理和发展概况,并利用该方法研究了多种有机分子的离子态光谱,主要研究内容如下:  1、利用共振增强多光子电离技术研究了间二甲苯分子的激发态
随着稀土元素在农业、畜牧业、工业以及现代生物医学上的广泛应用,稀土不可避免的通过各种途径进入环境、食物链,进而进入人体,因此稀土摄入的安全性问题已成为人们日益关注的热
一、营造适合学生的对话氛围,激起学生对话的欲望《语文新课程标准》指出:“语文教学应在师生平等对话的过程中进行。”就是说语文课堂上的对话应在民主、平等的氛围中进行。
微晶硅(μc-Si:H)薄膜在廉价、长寿命的a-Si:H/μc-Si:H叠层电池具有明确的应用前景。HWCVD技术具有沉积速率高、气体分解充分和设备简单等优点,因此采用HWCVD技术高速沉积、
学位
如何得到一个自洽兼容的引力的量子理论,是自量子力学和广义相对论建立以来理论物理方面的核心问题之一,而且随着时间的推移,这个问题格外显得引人注目。弦理论是至今为止理论物
学位
用重铬酸盐明胶(DCG)记录的反射体全息光栅是一种具有广阔应用前景的基础光学器件。尽管人们对DCG反射体全息图已做了大量的研究,但由于DCG记录介质处理工艺的复杂性,目前的理
碳纳米管以其独特的物理化学特性在刚刚被发现就引起了人们对它的极大的兴趣,十几年来的理论和实验的研究都表明碳纳米管具有巨大的潜在应用价值。单壁碳纳米管作为一种特殊结
本文首先详细介绍了目前常见的几种DNA单分子操纵仪器,如光镊、磁镊、玻璃微针和原子力显微镜等技术,分析其优缺点.在此基础之上分析目前开展的几种DNA操纵实验及其结果.然后
自1999年全国第三次教育工作会议提出了“素质教育”的理念和“健康第一”的指导思想以来,2000年中国启动了基础教育课程改革;2001年教育部推出初中各学科《课程标准》。此次课程改革,从指导思想和内容框架方面均发生了根本性的变化。面对新的体育与健康课程标准,(以下简称新课标)本文想谈几点认识与思考。  一、对新体育与健康课程标准的认识  (一)新课标促使体育与健康课程的教学理念更为完善。新课标通过
弯曲振动型薄板扬声器出现于20世纪90年代,作为一种新型的电声换能器件,已经越来越引起人们的兴趣和科研工作的重视。目前,弯曲振动型薄板扬声器的主要研发机构为英国新型换能器