唇读相关论文
产生效应指朗读的记忆成绩好于默读,然而目前还不清楚发音动作和声音在其中的作用。本研究采用fNIRS技术,考察大学生朗读、唇读、默......
唇读是一种仅靠唇部运动传递的视觉信息识别说话人言语信息的技术,其也被称为视觉语音识别。唇读技术不受声音信号信噪比高低的影......
随着数十年数据、硬件、理论、技术为科技闭环的飞速发展,人机智能交互朝着更加智能、便捷、自然的方式不断发展。特征提取算法作......
语音识别技术在实验室条件下逐渐发展和成熟,但在噪声环境下的语音识别问题仍然是语音识别技术完全从实验室走入人们的日常生活的......
唇读是利用计算机来识别唇动序列的一门技术,它涉及到模式识别、人工智能、图像处理等多个领域。本文主要研究了单视觉通道下,唇读......
机器唇读,是一种非常新颖,只使用视觉信息即可理解讲话内容的技术。唇读识别是人工智能和计算机视觉领域重要的研究课题,借助唇部......
作为人与计算机或者其他设备沟通的桥梁,人机交互技术在“智能化”科技和需求的双轮驱动下,经历了单纯从鼠标、键盘的接触式交互到......
唇读技术,不仅可以作为语音识别的辅助手段应用于多模态语音识别系统中,以增强系统的鲁棒性与准确性,突破应用场景的限制;还能够应......
一位身穿蓝色旗袍校服的女生,在美国有线电视新闻网络(CNN)及各大媒体的镜头前,示范透过嘴唇阅读点字。她就是2017年全港中学文凭考试(......
将电视机调到“静音”后,你能“看懂”主持人说的话吗?你或许以会这只是一种有趣的游戏,意义不大。其实这是唇读学正在攻克的难关。......
聋哑学校语文课的基本教学任务是向学生进行听话(看话)、说话教学,进行祖国语言文字的教学,使他们具有一定的看(听)话、说活、阅......
2008年8月,美国女孩塔米卡·凯金斯和她的队友夺下了北京奥运会女子篮球赛的冠军。之前,凯金斯已经参加过许多盛大的比赛。“如果没......
人类的语言认知过程是一个多通道的感知过程。除声音信息通道外,唇动视觉信息可以作为一种重要的语音理解源。视觉语言具有许多潜......
唇读是通过观察说话者口型的变化,“读出”所说的内容。语音识别技术发展日趋成熟,但在噪声环境下识别率大大降低,近年来,计算机唇读技......
电视机调到“静音”后,你能看懂”主持人说的话吗?你或许以会这只是一种有趣的猜测,意义不大。其实这是一门别具一格的新兴学科—......
唇读是聋生形成语音编码的一条途径,无论是间接还是直接的方式,唇读形成了语音编码中的构音编码与语言编码,它们肯定在唇读汉字语......
本研究探讨了视素可见性在听障学生唇读汉语元音识别中的作用。结果发现,唇形在听障学生唇读汉语元音识别中的作用明显,不圆唇音/a......
将现有唇读识别常用的双唇线口型模板简化优化,创建了单唇线即内唇口型模板,并结合内唇的灰度特征,利用相关函数的相似性匹配实现......
目的通过单视觉(唇读)、单听觉、视觉与听觉结合对正常青年人言语识别率的对比测试来说明唇读对语句识别的影响。方法选择正常听力青......
在语音与唇读识别应用中,传统的LDA(linear discriminant analysis)算法一般以音节、半音节、HMM状态等基元为类别进行数据分段,经......
英国东英吉利大学计算科学学院海伦·L.拜尔博士和理查德·哈维教授开发出一种新的唇语阅读技术,可用在任何凭声音难以确定人们在说......
由于唇动序列和语言序列是一对多的映射,计算机自动唇读识别仅使用HMM是远远不够的。以HMM为基础,结合语言先验知识,建立了新的唇动识......
针对单视觉通道唇读系统中唇部特征的提取问题提出了基于DCT+ONPP的特征提取方法。相对于保持全局结构特性的PCA方法,ONPP是一种既......
为了准确地识别嘴部张合程度,提出了一种基于嘴部状态分类的内唇开度估计算法。将嘴部局部图像从RGB空间转化到YIQ空间,利用牙齿、......
本文针对汉语中所有声韵母发音序列中的连续口型提出了一种口型分类的思路。在建立了覆盖所有声韵母的汉语双模态语料库的基础之上......
针对单视觉唇读系统中唇部特征的提取问题,提出了基于双树复小波和PCA的唇部特征提取方法。利用双树复小波变换的近似平移不变性,......
针对目前唇读系统多采用HMM的识别方法,提出了基于AdaBoost的唇读识别方法,有效地解 决了样本空间的交叠问题,通过强化训练那些难......
在建立视觉单通道的大词汇量唇读系统中,提出了归一化的U-LDCT-KL两级唇读特征提取方法,即针对唇区分块的DCT(Discrete Cosine Tra......
唇部检测是唇读识别的基本步骤,在研究人类视觉和唇色聚类的基础上,分析了唇色和肤色的聚类性,提出了基于惩罚感知器学习算法对彩......
将电视机调成“静音”模式后,你能“看懂”主持人说的话吗?在这个情景之内,你或许感觉这是一个游戏,但“唇读”已伴随人工智能越来越精......
在视频图像中快速提取完整的嘴唇外形是计算机唇读系统的首要任务之一 ,文中提出了一种综合采用RedExclusion和Fisher变换的唇部检......
提出了一种基于多色彩空间的自适应嘴唇区域定位算法。该算法结合RGB色彩空间彩色梯度信息与HSV空间色调、饱和度分量的阈值分割,......
计算机唇读是利用计算机对说话者的唇动等视觉语音信息进行分析以识别出其所说内容的过程,并可与听觉语音信息相融合以进一步提高......
针对面向唇读的水平集模型在嘴唇分割中存在边界过收敛和过早收敛的问题,文中提出了一种改进的基于先验知识的水平集模型(简称为PS......
唇读,也称视觉语言识别,旨在通过说话者嘴唇运动的视觉信息,解码出其所说文本内容.唇读是计算机视觉和模式识别领域的一个重要问题......
着眼于语音可视化。为呈现真实说话人各发音器官的运动,提出一种改进的CM协同发音模型,并采用该方法合成汉字的发音轨迹,进而以此......
期刊
为使唇读系统准确定位唇部图像,对彩色人脸图像的肤色和唇色进行了色度分布研究.利用直方图分析R、G、B色度分量在肤色和唇色中的......
根据嘴唇的几何分布特性,提出一种基于多方向的水平集方法(Multi-Level set)来进行嘴唇轮廓的定位。Multi-Level set方法通过对嘴......
实现一种结合 CbCr 颜色空间、Fisher 变换及变形模板的自动唇部定位及唇轮廓提取、跟踪方法.首先在CbCr 空间建立肤色模型进行人......
论文对适合唇读研究的连续音节双模态语料库及其语料切分算法的设计和研究工作进行了讨论。介绍了基于句子级的双模态语料库HIT Bi......
为解决视觉语言特征提取这个唇读技术中最关键的难题,提出一种新的基于DCT和LDA的特征提取方法。为提取对不同口型最具分类能力的......
人类对语言的感知是多通道的,听力正常者在交谈的过程中也无意识的使用唇动、表情等视觉信息以辅助听觉能力。对于听力障碍者或噪......