Hadoop平台下Mahout随机森林算法的分析与实现

来源 :舰船电子工程 | 被引量 : 0次 | 上传用户:aiyang1115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了验证Mahout随机森林算法的评估效果,文章基于Hadoop平台以UCI数据库中的Banknote Authentication数据集为应用背景,对该算法进行了验证分析。首先阐述了Hadoop云计算平台的重要组成部分——HDFS分布式文件系统和MapReduce计算框架,同时搭建了完全分布式的Hadoop物理集群实验环境。然后,对随机森林算法在Mahout算法库中的实现过程及其原理进行分析。最后,用UCI数据集在Hadoop平台上进行验证。实验结果表明,随机森林模型对Banknote Authenti
其他文献
第十一届国际传染病会议于2004年3月5~7日在墨西哥坎康举行.大会进行了7个主题发言;36个专业论坛和28个张贴式专题报告,共有与传染病有关的研究报告近900篇.为使检验检疫人员
[目的]调查秦皇岛口岸仓储库的鼠患情况.[方法]随机选取秦皇岛口岸8个仓储库,观察鼠类活动情况,用夹夜法捕鼠并将捕到的老鼠计数、分类.[结果]每个仓储库都有老鼠活动的痕迹,
[目的] 寻找1种在对冷冻水产品进行检测时能提高霍乱弧菌检出率的增菌方法。[方法] 用3种不同的增菌方法进行比较。[结果] 染菌虾样本,在90d的贮存期内,3种增菌方法间检出率差
随着我国拆船业的发展,国外的废钢船大量涌入我国,造成越来越严重的卫生学和环境问题,加强对入境废钢船的检验检疫和后续管理工作已刻不容缓.针对废钢船存在使用放射性超标材