论文部分内容阅读
随着信息化的快速发展,来自可穿戴设备、电子病历、便携式监护仪等医疗数据迅猛增长且存储结构多元化。传统的存储结构与计算模型不能够很好的解决这些数据的存储和计算分析的问题。幸运的是大数据量的增长能够很好的解决传统机器学习的方法中数据样本不足的问题,但是单机数据处理的计算能力达不到要求且需要专业的人员进行相关数据特征的人工提取。特征的提取过程麻烦且受到专家的主观因素影响将会导致分析的结果不准。为了解决上面的问题,本论文主要研究内容如下:(1)构建了一个生理大数据的集群分析平台,来解决数据大存储与计算能力不足的问题。该平台采用了Hadoop中的HDFS来解决非结构化数据的大规模存储问题。除此之外还采用了消息队列、流计算框架来提升平台的整体性能。(2)采用MapReduce计算框架解决了大数据集的计算分析问题。实现了基于MapReduce的BP神经网络的并行化,实验的结果表明神经网络并行化实现的可行性并且能够有效地提高分析的准确率、减少训练时间,加快研究速度及分析效率。(3)针对传统机器学习方法中需要人工的提取特征的不足,尝试采用了深度学习技术并将其应用到生理信号分析的方法中。目前国内基于深度学习的生理信号研究还很少,本文使用了深度学习中的DBN、CNN、SAE网络来获取抽象特征避免了人工干扰,同时结合了传统的分类器SVM及神经网络对相关生理特征进行分类。实验的结果表明本文提出的方法可以适用于生理信号的分类,并取得了不错的效果。