论文部分内容阅读
抑郁症是一种常见的精神疾病,主要临床表现为显著而持久的情绪低落,影响患者的身心健康。当前临床诊断方法受患者的主观意愿影响较大,存在较高的误诊率,因此许多研究人员正在寻找一个客观有效的手段用来辅助诊断抑郁症,其中语音信号以其具有可量化、非侵入式、低成本等优点受到青睐。语音信号受多种因素影响,语音诱导方式便是其中之一。然而,在使用语音评估抑郁症的研究当中,不同语音诱导方式下的语音特征存在分析结论不一致的问题,因此我们推断语音诱导方式同样是使用语音评估抑郁的一个重要影响因素,目前还没有团队明确的提出该问题。所以在本文中,我们设计了包含言语方式和情绪刺激两类诱导方式的实验,用于分析语音诱导方式对语音特征的影响。通过统计分析及机器学习两种手段对语音特征进行分析,对不同语音诱导方式做了量化评估。本文的主要贡献如下:1.对诱导方式做了量化评估,发现自发式语音与中性情绪刺激下的语音特征在抑郁组和对照组上差异更大,分类准确率更高。通过对特征的分析得到以下结果:1)相对机械式语音,自发式语音下的声学特征在抑郁组和对照组间表现出更大的差异和较高分类准确率;2)对比正性和负性情绪刺激,中性情绪刺激更能反映出两类人群的差异,并且能够较好的识别两类人群。2.基于诱导方式,对语音特征作标准化后构建出新特征,得到更高的抑郁识别准确率。对比分析标准化前后的特征,得到以下结果:1)新特征的t-检验结果大多在抑郁组和对照组之间存在显著性差异,表现好于标准化前的;2)女性的分类准确率平均提高了5.4%,男性的平均提高了5.0%;3)以自发式语音或以中性情绪刺激为基准构建的新特征,抑郁识别的准确率高于其它诱导方式。3.用特征选择算法对新特征做有效特征筛选,提高了学习器的工作效率的同时提升了分类准确率。结果如下:1)分类准确率平均提高9.4%(女性)和2.7%(男性);2)分类准确率最大值达到86.1%(女性)和90.8%(男性)。结果表明,使用语音评估抑郁症受到语音诱导方式的影响,其中自发式语音与中性刺激下的语音在特征分析及抑郁识别上表现较好。本研究成果为使用语音评估抑郁研究中的优化实验方案给出了参考。