论文部分内容阅读
中国养猪业经过了三十多年的发展,伴随着国内、外规模化养猪技术的推广和应用,我国的猪场生产水平也有了一定程度的提高。但是,目前我国的养猪技术仍然低于国外先进水平,规模化养猪产业面临着缺乏养猪人才、生产效率底下、成本高、效益差等亟待解决的问题。因此,近年来,多数大型规模化养殖场开始采用智能化设备来提高猪场的生产效益以及行业中的竞争力。在智能化养猪过程中,需要对采集的数据进行全面的分析和研究,及时发现猪群的生理特点、生产性能和健康状况,帮助养殖人员制定出符合要求的饲养方案。而面对大量的多属性数据记录,能否高效地识别出各数据属性之间的关联性,挖掘出其中所蕴含的宝贵知识,将会对养猪业带来十分重要的经济效益,是一项极有价值的研究工作。数据挖掘能够发现隐含在大量数据中的潜在知识,是现今较活跃的研究领域。其中关联规则挖掘则是数据挖掘中最重要的分支之一,用来寻找数据属性间的依赖关系。其核心的问题就在于提高挖掘的效率,并合理应用于某个特定领域中。本文重点是对智能化养猪领域中关联规则挖掘模型的研究,针对应用领域的特征和要求,提出了基于类别的挖掘算法和基于增量更新的挖掘算法并应用在该领域中。论文研究的主要内容和相关成果如下:在算法研究方面,论文首先分析了现有的典型关联规则挖掘算法,Apriori算法和FP-Growth算法以及这两种算法在智能化养猪领域中应用的不足之处。然后以重庆市科委关于规模化猪场生产性能自动测定系统应用以及研究的攻关项目为背景,根据重庆市荣昌养猪场的情况,从以下两个方面进行关联规则挖掘模型的研究:(1)针对养殖用户的需求,提出了类别属性和规则有序树的概念,设计了基于类别的关联规则挖掘算法(CACC);(2)针对养猪场数据不断更新的特点,提出了归类和基础解的概念,设计了基于增量更新的关联规则挖掘算法(IUAC)。最后,通过实验将两种算法在标准数据集上与现有算法进行比较,并运用规则实用性测度指标的评估证明了算法的可行性、有效性和实用性。在算法应用方面,利用项目开发的自动饲喂系统采集大量精确的原始数据,经过数据预处理,采用CACC算法和IUAC算法构建出关联规则挖掘模型,对养殖数据进行挖掘,通过模型得出关联规则结果并实现当前最佳饲养方案推荐,供养殖用户参考。从而验证了算法的实践可行性,且在该领域的挖掘中相对更有优势。通过对规则结果的分析,表明挖掘的关联规则也符合养猪技术相关的理论和经验,具有较好的养殖参考价值。