论文部分内容阅读
大数据时代给心脏病诊断带来了新的挑战,传统的计算方法已无法满足心脏病诊断中海量健康数据的诊断分析工作。本文提出了一种基于Hadoop的分布式C4.5决策树算法,使用Map Reduce并行编程模式、HDFS分布式文件存储系统加快了C4.5算法的效率,将其应用在心脏病诊断中可以得出病人的分类模型。论文首先介绍了算法的设计思路,然后介绍了健康数据在算法中的分析实现过程,最后展示了基于该算法的系统界面。