国家农作物种质资源数据库数据挖掘平台研究

被引量 : 0次 | 上传用户:xianglikai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国家农作物种质资源数据库拥有200种作物、41万份种质信息、2400万个数据项值,数据量达230GB,是世界上最大的植物种质资源数据库之一。随着农业科学和计算机技术的发展,利用数据挖掘的原理、方法和技术发掘这些海量数据中蕴藏的信息,逐渐成为作物种质信息领域研究的重要内容。开展农作物种质数据挖掘平台研究对于充分发挥国家农作物种质资源数据库的作用,更好地保护和利用我国丰富的农作物种质资源具有十分重要的意义。论文根据国家农作物种质资源数据库的基础条件和发展需要,结合“大数据”时代下海量数据挖掘新的发展方向,把云计算相关技术引入农作物种质资源数据挖掘中,以满足农作物种质数据不断增长所需的计算能力。论文研究了数据挖掘的基本理论、一般过程和常用方法,作为构建农作物种质资源数据挖掘平台的理论和技术基础,分析了国内外主流云计算平台,研究了开源云平台Hadoop的体系结构。在此基础上完成了基于云计算的农作物种质资源数据挖掘平台的总体设计和原型开发,并对所设计平台的架构、工作流程和各功能模块进行了详细描述。研究了经典Apriori关联规则算法基于MapReduce框架的并行化策略,利用JAVA编程实现了并行化的Apriori算法,并将其部署在挖掘平台上。利用挖掘平台对国家农作物种质资源数据库进行试挖掘,初步获得了有关水稻种质特征特性的关联知识。在不同数据规模下,通过开展单机处理性能比较实验和平台加速比性能实验,测试了挖掘平台相关性能,最终论证了农作物种质资源数据挖掘平台的科学性、有效性和可行性。
其他文献
深度学习要求学生参与教与学的过程,并能用高阶思维学习新知识、新方法,来完善自己的知识体系。针对初中学生的认知水平,将课堂表现性评价的三个核心要素——目标、表现性任
酪蛋白营养丰富,是一种全价蛋白质。但酪蛋白的一些功能性质不能很好满足食品加工的需要,本文对酪蛋白进行美拉德改性,来研究酪蛋白的凝胶特性,初探改善机理,目的是为开发与
2007年美国次贷危机等历史以来的多次危机表明房地产价格波动是引发金融风险的重要原因。目前,我国经济发展高度依赖房地产市场,金融资源向房地产市场过度集中,我国近三年房
本课题以2014年秋的黑龙江绿豆为材料,研究了不同含水量(11.2%、13.1%、14.9%)的绿豆在不同储藏温度(15℃、22℃、30℃)和储藏方式(常规储藏、充氮储藏、真空储藏)下生理及储
手术衣作为医护人员与手术室环境体系之间的重要媒介,尤其在高强度的手术过程中,手术衣的热湿传递能力愈发显得重要。同时,手术衣是创建无菌手术区域的关键环节,是隔离医护人
介绍了我国自行设计、制造、安装和调试的第1套炉卷轧机—泰钢1800mm带钢炉卷轧机的工艺,主要介绍了其装备水平和特点。经1年多的生产实践,各项指标和功能基本实现。
传统水浴柔软整理(浸渍法)目前普遍存在柔软剂利用率低(约70%)和废水污染的问题。然而,随着地球上现存水资源的萎缩及环境污染的日益加重,改革整理工艺,特别是选择新型整理介
卷心菜富含叶酸、维生素、膳食纤维、矿物质等,是主要蔬菜种类之一。鲜切卷心菜是以新鲜卷心菜为原料,经除杂、清洗、切分等工序加工制成,但是在加工、运输和贮藏过程中,由微
柑橘属于低温敏感型果品,在不适宜的低温条件下贮藏会发生冷害现象,导致果实品质劣变,不耐贮藏。本试验以2% NaCl溶液为电解质制备电生功能水,研究电生功能水性质较为稳定的
商业银行作为经营货币的特殊企业,面临着与生俱来的诸多风险。伴随全球经济一体化步伐的加快,经济规模迅速扩大,经济业务日益多样化,商业银行所处的内外部环境愈加复杂,因此