论文部分内容阅读
年轻时期的抑郁症状可能会持续到成年,并发展成抑郁症。因此,早期发现和治疗抑郁症对于促进该疾病的缓解至关重要。然而,传统的诊断方法是通过问卷和访谈,评估主要依赖于患者的报告和临床医生的观察,存在主观偏差。此外,抑郁倾向的早期迹象很难检测和量化。不少研究表明利用行为特征进行自动抑郁识别具有可重复和可推广的潜质。抑郁的自动识别可以提高诊断的准确性和可用性,从而带来更快的干预(Haque,Guo,Miner,&Fei-Fei,2018)。基于此,本研究旨在应用人工智能领域的特征提取与分类算法,通过提取不同实验情景下的多种行为特征来预测大学生的抑郁倾向。
在本研究中,我们从自行建立的中国大学生行为数据库中提取不同类型的行为特征,以此建立大学生的抑郁倾向和他们的行为之间的映射关系。研究首先建立了一个新的中国大学生多模态数据集,该数据集包含4个实验任务下的被试行为数据和被试两个抑郁量表(BDI-Ⅱ和CES-D)的得分。接下来,通过包含5个子实验的实验研究,从该数据集中提取行为特征,用于建立大学生抑郁倾向的预测模型,并分析对比不同预测模型的预测效果。由此可以探索抑郁倾向识别的基准测试程序,为系统化的抑郁倾向识别模型的建立提供参考。
实验一考察基于自然行走情境中步态信息的抑郁倾向预测效果。结果:本数据库中的自然步态信息不能很好地进行抑郁倾向预测,不同分类器的预测效果均不佳。但数据增强后的ST-GCN对抑郁倾向的分类准确率相较于未数据增强的ST-GCN有所提升,准确率从59.0%提升到了61.5%,且敏感性达到了80%。
实验二考察基于文本朗读情境中动态表情特征的抑郁倾向预测效果。结果:文本朗读情境中的动态面部表情特征可以有效预测抑郁倾向。融合不同效价朗读文本的预测模型的区分准确率最高,达到了76.1%。
实验三考察文本朗读情境中不同的声音呈现和特征提取方式在基于语音信息的抑郁倾向预测模型上的效果。结果:基于中低音频特征的语音识别模型比基于可视化语音特征的预测模型能更好地预测抑郁倾向。
实验四旨在提出基于文本朗读情境的系统化的抑郁倾向预测模型的基线回归参数,并比较基于深度特征和手工特征的预测模型对抑郁倾向预测的效果。结果:基于面部深度特征特征建立的抑郁倾向预测模型的预测效果(RMSE=11.59,MAE=8.28)优于基于面部手工特征的抑郁倾向预测模型的预测效果(RMSE=12.38,MAE=10.43)。
实验五探究情绪视频观看情境中的面部情绪识别能否有效预测抑郁倾向。结果:实验采用的面部情绪识别技术无法有效地预测抑郁倾向。
以上研究表明:
(1)基于面部信息的抑郁倾向预测模型具有较好的预测效果,这种预测效果具有跨情境和跨效价的稳定性。这提示两类人群的面部活动表征模式可能存在差异。
(2)自然情境(自然行走与视频观看)下抑郁倾向预测模型的效果不如实验情境(文本朗读)F的抑郁倾向预测模型效果。
在本研究中,我们从自行建立的中国大学生行为数据库中提取不同类型的行为特征,以此建立大学生的抑郁倾向和他们的行为之间的映射关系。研究首先建立了一个新的中国大学生多模态数据集,该数据集包含4个实验任务下的被试行为数据和被试两个抑郁量表(BDI-Ⅱ和CES-D)的得分。接下来,通过包含5个子实验的实验研究,从该数据集中提取行为特征,用于建立大学生抑郁倾向的预测模型,并分析对比不同预测模型的预测效果。由此可以探索抑郁倾向识别的基准测试程序,为系统化的抑郁倾向识别模型的建立提供参考。
实验一考察基于自然行走情境中步态信息的抑郁倾向预测效果。结果:本数据库中的自然步态信息不能很好地进行抑郁倾向预测,不同分类器的预测效果均不佳。但数据增强后的ST-GCN对抑郁倾向的分类准确率相较于未数据增强的ST-GCN有所提升,准确率从59.0%提升到了61.5%,且敏感性达到了80%。
实验二考察基于文本朗读情境中动态表情特征的抑郁倾向预测效果。结果:文本朗读情境中的动态面部表情特征可以有效预测抑郁倾向。融合不同效价朗读文本的预测模型的区分准确率最高,达到了76.1%。
实验三考察文本朗读情境中不同的声音呈现和特征提取方式在基于语音信息的抑郁倾向预测模型上的效果。结果:基于中低音频特征的语音识别模型比基于可视化语音特征的预测模型能更好地预测抑郁倾向。
实验四旨在提出基于文本朗读情境的系统化的抑郁倾向预测模型的基线回归参数,并比较基于深度特征和手工特征的预测模型对抑郁倾向预测的效果。结果:基于面部深度特征特征建立的抑郁倾向预测模型的预测效果(RMSE=11.59,MAE=8.28)优于基于面部手工特征的抑郁倾向预测模型的预测效果(RMSE=12.38,MAE=10.43)。
实验五探究情绪视频观看情境中的面部情绪识别能否有效预测抑郁倾向。结果:实验采用的面部情绪识别技术无法有效地预测抑郁倾向。
以上研究表明:
(1)基于面部信息的抑郁倾向预测模型具有较好的预测效果,这种预测效果具有跨情境和跨效价的稳定性。这提示两类人群的面部活动表征模式可能存在差异。
(2)自然情境(自然行走与视频观看)下抑郁倾向预测模型的效果不如实验情境(文本朗读)F的抑郁倾向预测模型效果。