有序聚类方法及其在神经网络语音识别中的应用

来源 :电路与系统学报 | 被引量 : 0次 | 上传用户:bbcr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种新的网络结构,我们称之为有序聚类网络。这种网络能够对语音信号进行特征提取,很好地解决神经网络语音识别中的时间规整问题。有序聚类网络从输入语音信号的特征矢量序列中提取出一组固定数目的特征矢量,然后将这组特征矢量馈入神经网络分类器进行识别。和其他的神经网络语音识别方法相比较,用这种网络进行前端处理,可以缩短后端神经网络分类器的训练和识别时间,简化分类器的网络结构并保持较高的识别率。根据该方法我们建立了一个语音识别系统,并对两组英语单词进行了识别测试。实验结果表明,该方法优于传统的隐马尔可夫模型方法以及其它一些神经网络方法。 This paper presents a new network structure, which we call an ordered clustering network. This kind of network can extract the feature of speech signal and solve the problem of time warping in neural network speech recognition well. An orderly clustering network extracts a fixed number of eigenvectors from the eigenvector sequence of the input speech signal, and then feeds the set of eigenvectors into a neural network classifier for identification. Compared with other neural network speech recognition methods, the front-end processing using this network can shorten the training and recognition time of the back-end neural network classifier, simplify the network structure of the classifier and maintain a high recognition rate. According to this method, we establish a speech recognition system, and test two groups of English words. Experimental results show that this method is superior to the traditional Hidden Markov Model and other neural network methods.
其他文献
本文提出一种基于快速小波配置法(FWCM)的非线性动态电路时域稳态模拟方法。该方法可以对电路瞬态响应过程用大步长(低阶小波)模拟,而对稳态响应过程用小步长(高阶小波)模拟,从而避免
本文给出了一种新的电阻抗成像的图像重建算法,该算法是对Newton-Raphson类算法的改进.算法根据对EIT问题中目标函数的分析,将以前常用的,对正规方程组的求解,转化为求解一个
本文提出一种连续隐马尔可夫模型(CHMM)和人工神经网络(ANN)相结合的鲁棒性识别方法,用于噪声环境下特定人数码语音识别。该方法以CHMM的输出作为系统的识别矢量,利用人工神经
期刊
本文讨论了在源输入的确定赋值数最小时组合电路的测试生成方法后,介绍了基于可满足性的测试向量压缩的整数线性规划(ILP)模型.利用ISCAS85基准电路仿真的结果说明了用此模型
基于准东—四川±1100 kV特高压直流输电工程,详细分析了特高压直流换流站阀厅和直流场的操作过电压机理,并仿真计算了高压端Y/Y换流变阀侧绕组接地、低压端Y/Y换流变阀侧绕
本文从模板匹配的角度研究了多层前向感知机(MLP)在汉语孤立数目字语音识别中的应用,针对训练样本数受限的情况提出了新的训练方法,研究了语音固化、特征提取、学习算法和策略诸
期刊
本文简要介绍了湿法氧化镁烟气脱硫技术的特点.并对湿法氧化镁烟气脱硫技术在威海新力热电有限公司2×130t/h锅炉上的应用进行了探讨,结果表明湿法氧化镁技术具有好的应用效
本文在比较了运动估计的各种匹配准则计算复杂度的基础上,提出在DSP上实现极低码率动态图象编解码标准H.263时,选择均方误差(MSE)做为匹配准则的半象素精度运动估计的方法。由于