基于语音识别的轻度认知障碍检测方法研究

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:FalyE
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
轻度认知障碍(Mild Cognitive Impairment,MCI)指的是当老年人的认知功能水平介于正常人和阿尔兹海默症(Alzheimer Disease,AD)患者之间时的一种病理状态,它具有可逆性的特点。但是,阿尔兹海默症是具有不可逆性的,因此,准确地筛查出老年人是否患有轻度认知障碍,是有效预防阿尔兹海默症的一个关键因素。语言作为人类的一种高级认知功能,能够很好地反映人的认知能力,因此,对于轻度认知障碍患者而言,当他们出现认知能力下降的现象时,他们的语言功能也会受损,从而导致其产出的语音在声学特性上发声变化,不同于正常人。根据这一特性,我们就可以通过处理语音信号以及分析语音声学特性变异的方法,来实现对轻度认知障碍患者的筛查。目前,一些现有的基于语音分析来筛查轻度认知障碍的系统多以英语或欧洲语种为主,它们对于中文的语音和语法特点来说,存在着匹配程度较低的问题。并且对于中文而言,这一类语音数据库也有着数据规模小、语音任务简单、需要批量人工转录等缺陷,这会导致对轻度认知障碍筛查的效率和可靠性都大打折扣。于是,本课题针对以上问题,探索了一种基于中文普通话语音的轻度认知障碍筛查方法,并设计了一个实用性强、可靠性高的轻度认知障碍筛查系统。具体的工作及研究内容如下:(1)建立一个中文轻度认知障碍语音数据库。根据课题目标和实验目的设计语音数据采集任务,并指定相应的数据采集方案。根据采集任务和采集方案,分别在深圳市罗湖福利中心、粤海街道办、深圳市人民医院,以及北京天坛医院等地,共采集了74名已被确诊为患有MCI患者的语音数据,同时,也采集了122名正常老年人的语音数据作为对照。对于每一名被试者,在采集其语音数据的同时,还对其进行了MOCA(蒙特利尔认知量表)评估,量表评估的得分将作为控制样本质量的指标和评价检测系统性能的参考。根据以上信息,建立普通话轻度认知障碍数据库,数据库中共包含了196个样本,这些样本产出音频总时长约48小时。(2)针对轻度认知障碍患者语音的特点,对ASR系统进行改进。由于轻度认知障碍患者的自发性语音中会出现大量无意义的词语,导致ASR系统识别他们的语音时性能下降。为了解决这一问题,提出了一种Filled Pause(填充暂停)检测技术,并将其引入ASR系统中,通过级联型机器学习模型,对认知障碍患者自发性语音中的几类无语言意义的填充暂停进行分类和筛查,从而提升ASR系统识别MCI自发性语音的性能。其中,针对MCI患者自发性语音的填充暂停检测系统在测试中得到了91.7%的精度,而将它引入到ASR系统中之后,使得ASR系统在识别MCI患者语音时性能得到了约9%的提升。(3)在融合多类语音任务的基础上,完成对轻度认知障碍患者的筛查。根据每一类语音任务的特点和作用,分别建立特征集。分别基于人工手动转录的文本和ASR系统自动转录的文本,提取三类语音任务相对应于各自特征集中的特征值,并构成特征向量,训练分类模型,通过测试得到样本在分别三类任务上独立的判别概率,然后,在任务级别上进行决策融合。最终两类方法分别得到了最佳0.94和0.85的检测正确率,并在单个样本级别上,将系统的检测结果与MOCA量表得分进行相关性分析,结果证明了检测系统的可靠性。通过以上论述和实验可以得出,本文提出的方法能有效地通过中文语音实现对轻度认知障碍进行检测和筛查。
其他文献
学位
近几年,卷积神经网络发展迅速,在图像识别、语音识别和机器翻译等方面取得了不错的成绩。但传统的卷积神经网络擅长处理规则数据,如图像、文本。现实生活中存在交通网络、社交网络和生物网络等图结构数据。由于这种普遍性开始关注在图形数据上使用深度学习模型。但图结构数据具有不规则性,多样性,规模很大等特点,使得构建图卷积神经网络存在一定的局限性。图卷积神经网络作为一种基于图结构数据的广义神经网络结构,因其独特的
近年来随着我国铁路运输行业的发展,列车的行驶安全也越来越受到人们的关注。而引起铁路安全事故的重要原因之一是由于铁路周界范围内的异物入侵,传统铁路周界防护系统通过在铁路周界设置屏障或采用人力巡逻的方式,但是随着我国铁路建设里程数不断增长,这两种方法难以满足人们的需求。随着视频监控技术的发展,基于视频监控技术的铁路周界异物检测方法已经成为研究的热点,但是由于铁路环境复杂多变,在铁路周界范围内发生异物入
随着对安全性和隐私权担忧的增加,用户正在寻找保护帐户安全的方法。于是包括Whats App,Facebook Messenger,Signal等在内的端到端加密消息系统已经越来越流行,现在数十亿人依靠它来保证安全。最近端到端的加密消息系统出现新的安全措施。恶意发送者可能会发送骚扰消息。当恶意发送者发送骚扰信息、恶意软件或任何不适当的内容时,应允许接收者向提供商报告该内容,以阻止发送者。端到端加密会
无线传感器网络(Wireless Sensor Network,WSN)是一个庞大的研究体系,它是多种信息技术与电子技术的综合体,包括无线传输技术、拓扑技术、嵌入式技术等等,其中如何延长无线传感器网络工作寿命,一直是研究的热点问题。目前也有诸多方式来提升网络的工作时长,例如优化网络的拓扑结构、采用能量补给、优化网络的路由协议等。而随着微电子技术的发展,基于环境能量补给的自供能无线传感器网络(Ene
学位
随着轨道交通技术的飞速发展,磁悬浮技术的研发和生产被不断地推进,尤其是高温超导型磁悬浮这种新型的磁悬浮技术已经成为世界各个国家聚焦的热点。磁悬浮技术被广泛应用的同时,也引起了公众对列车电磁环境安全方面的关注。磁悬浮列车在工程应用上有长足的进步和积累,但磁悬浮列车电磁环境对人体影响的相关研究相对较少。本文通过运用COMSOL Multiphysics有限元仿真平台,参考巴西里约热内卢联邦大学的高温超
随着物联网和智能设备的快速发展,相关网络的带宽和资源利用效率需要提高。与此同时,相应的能量消耗也越来越严重。面对如此局面,可以在两个邻近的终端设备之间创建D2D通信链路,无需基站协助就可以共享蜂窝链路资源进行直接通信,从而充分利用通信资源,缓解资源频谱短缺和能量消耗等问题。然而在D2D用户共享链路资源时,蜂窝用户和D2D用户会产生干扰使通信网络性能降低。同时,由于用户的大量增加以及终端设备电池容量
盲源分离的任务是从混叠信号中提取和分离出源信号,随着社会科技的不断发展,盲源分离技术也得到了长足进步,并且能够在多个技术研究领域中为分离混叠信号提供技术支撑,极大地促进了多领域的共同发展,然而,更符合实际应用的欠定盲源分离技术,虽然研究起步较晚,但是因其拥有较高研究价值同时具有较高挑战,已经成为了当下盲源分离领域的一个研究重点。目前解决欠定盲源分离问题的主要方法是基于稀疏分量分析的“两步法”,即在
(1)以玉米淀粉(CS)为原料,结合壳聚糖(CH)在增塑剂甘油的作用下通过溶液浇铸法制备了壳聚糖/玉米淀粉复合可食薄膜,运用傅里叶红外光谱(FTIR)和扫描电镜(SEM)对玉米淀粉薄膜的结构及表面和断面微观形貌进行了表征,研究了壳聚糖的含量对薄膜机械性能、水蒸汽透过性、阻油性及抗菌性能的影响。结果表明,适量的壳聚糖可以较明显地改善薄膜的机械性能,提高其隔水和阻油性能,壳聚糖可以与玉米淀粉之间形成氢