论文部分内容阅读
科学技术的日益发展使得社会生产水平不断提高,农业的生产经营与管理更是离不开信息技术。实践证明,运用数据挖掘的经典算法来进行农业数据的分析有助于提高农业生产效率,但在猪的繁殖生产预测领域却并没有相关技术应用的先例,因此本文将猪的繁殖生产与数据挖掘技术相结合,探索提高猪繁殖生产效率的方法,为猪的繁殖生产预测工作开辟新道路。母猪繁殖效率与企业盈利水平有着紧密联系。根据定义,PSY(Piglets weaned/Sow/Year)为母猪的年所能提供的断奶仔猪头数,PSY直接影响到猪场的经济效益,为准确预测PSY,寻求提高生产效率的方法,本文完成了以下工作:第一,基于实际生产经验和历史数据进行特征选取。综合考量历史数据和实际生产,确定特征为:猪场ID、胎龄结构、分娩次数、分娩活仔数、配种分娩率、哺乳死亡率,结合种猪繁殖生产领域的经典公式,计算猪只个体的年PSY、配种分娩率、哺乳死亡率。对数据集进行预处理,包括数据结构处理和数据文本处理。第二,将问题抽象为多元回归分析问题。将经典回归分析算法与猪繁殖生产预测相结合,对数据集样本进行训练,提出了基于猪繁殖生产预测的最小二乘法、BP神经网络、支持向量机、M5P、遗传算法等算法,比较各繁殖生产预测数据挖掘算法在不同参数条件下的最优回归效果,建立回归分析模型预测PSY,并基于以上数据挖掘算法提出了多预测器融合策略。第三,通过实验探究胎龄结构、哺乳死亡率、配种分娩率等指标对PSY的影响,比较不同胎龄结构、哺乳死亡率和配种分娩率下的PSY预测值,结果显示通过优化母猪的胎龄结构或降低哺乳仔猪死亡率或提高配种分娩率可显著提高PSY,并提出降低哺乳仔猪死亡率和提高配种分娩率的具体措施。针对样本参数胎龄结构空缺值的问题,将回归模型与神经网络算法结合填充空缺值,计算结果表明空缺值的预测最大误差为3.6%,在要求范围之内。第四,将本文研究成果应用于实际生产。系统解决了生产过程中无法预知猪场母猪未来所能提供的断奶仔猪数的关键问题,受到了用户的一致好评,通过实践应用验证了模型算法与软件系统的有效性。