【摘 要】
:
唇读作为自动语音识别的辅助手段,将听觉通道与视觉通道相结合能够比单独听觉通道取得更高的识别率,本文针对基于视频的计算机唇读系统的唇部检测、唇读特征提取和唇读识别等
论文部分内容阅读
唇读作为自动语音识别的辅助手段,将听觉通道与视觉通道相结合能够比单独听觉通道取得更高的识别率,本文针对基于视频的计算机唇读系统的唇部检测、唇读特征提取和唇读识别等关键技术进行了研究。本文将主动外貌模型和隐马尔可夫模型相结合,提出了一种基于主动外貌模型和隐马尔可夫模型的唇读识别方法和一种能准确找到嘴唇的嘴唇特征点。主动外貌模型用于特征提取,隐马尔可夫模型用于特征序列的识别。在训练阶段,首先利用本文提出的唇标记点集来训练主动外貌模型得到嘴唇的空间分布统计特性;其次通过K-Mean聚类算法将视频高维序列降到一维标量序列作为观察值,来训练隐马尔可夫模型集得到每类发音过程的时间分布统计特性。在识别阶段,用马尔可夫模型集来分析测试视频的时间动态特性,计算出每一模型产生该序列的概率,概率最大的模型就是识别序列所属的类别。对汉语数字进行了识别实验,实验结果表明:该方法识别率较高,是一种具有较好应用前景的识别方法。
其他文献
<正>随着经济的快速发展,城市化进程的进一步推进,城市管理的作用也越来越突出。中国城管队伍即是战斗在城市管理第一线的卫士,他们肩负着城市管理的使命,改善着市容市貌,维
高校心理咨询师肩负大学生心理健康教育工作的任务,在学生心理危机预警和干预中有着重要作用。但是,在实际工作中,心理咨询师却面临着各种突出的问题。本文拟从专业胜任能力
目的探讨终末期肾病患者动静脉内瘘(AVF)建立的手术方式及手术经验,提高对动静脉内瘘手术的认识。方法对2009年5月至2013年5月在我院行动静脉内瘘成形手术的308例患者的手术
目的:研究柚皮苷在大鼠在体单向肠灌流模型上的吸收特征。方法:建立检测大鼠肠道灌流样品中柚皮苷、柚皮素含量的超高效液相色谱法,采用大鼠在体单向肠灌流模型,考察柚皮苷(10μ
本文以杭州市城乡居民购买养老地产意愿及参与行为的调查资料为基础,对居民购买养老地产意愿及其影响因素进行了分析。笔者通过建立Logistic回归模型分析得出,在影响居民是否
慢性前列腺炎是青壮年男性的常见病、多发病。目前慢性前列腺炎,特别是慢性盆腔疼痛综合征的病因与发病机制尚未完全明了,在治疗上有许多问题没有统一的认识。本文系统地探讨
近年来,我国国民经济一直持续稳定增长,居民消费需求发生了深刻变化,这种经济环境形成了连锁超市发展的温床,使得我国的连锁超市迅速而且蓬勃的发展起来。连锁超市是否能够成
本文利用1994-2012年间A股上市公司的财务数据和地方政府财政支出数据,实证检验了地方政府的财政支出对当地不同所有权性质、不同规模的上市公司资本结构的影响。研究结果表
20世纪90年代,我国地方政府在行政改革的实践中提出了构建"服务型政府"的目标,它体现了政府的执政理念、职能、体制、运行机制及行为方式等方面的全面转型。服务型政府建设对
金融资产在储蓄—投资转化中功能再认识●叶望春吴少新对于金融资产,在人们眼里仅仅是与实物形态存在的资产相对应的概念,即它是一种以价值形态存在的资产。显然,它指出了金融资