论文部分内容阅读
若干年来,反贫困一直是全球性的任务和难题,除政府层面非常重视以外,如何解决贫困问题也是世界各国学术界致力研究的重要课题。新形势下,为了提高扶贫工作的效率,我国提出了以精准识别贫困户为基础和核心的精准扶贫工作机制,精准扶贫成为“十三五”时期我国的头等大事和第一民生工程。然而,当前在贫困户识别方面,我国仍以单一的收入维度作为评价依据,即多依靠以年人均综合收入指标来识别贫困户,而事实上贫困的产生是由多维因素共同作用的结果,单维度的识别方法较难综合反映农户的贫困状况,更无法全面识别致贫的原因所在。因此,为了更精准地识别贫困户,精准诊断致贫原因,精准制定扶贫方案,提高扶贫工作成效,真正做到“真扶贫、扶真贫”,本文基于云南省某市“三农”基础信息系统建设项目中采集的2016年数据为研究原始样本数据,以多维度精准识别贫困户助力精准扶贫工作为目的,选取收入、教育、住建、农业、就业和家庭人数情况六个维度中的年人均收入、家庭在校人数、宅基地面积、是否危房、承包土地面积、承包林地面积、家庭劳动力人数、家庭户籍人数和家庭实际人数九个指标,首先充分利用数据挖掘与分析技术,采用人工神经网络的BP神经网络模型、支持向量机模型和随机森林模型,并用R语言进行实现,对这三个模型的模拟及精度进行对比分析,以此分析各个致贫指标的重要性程度;其次,建立农户贫困度多维评价指标体系,运用熵权法与先验知识结合的二层权重分配法确定各指标的最终权重,并构建农户贫困度多维精准识别模型,以综合评价法建模的原理方法对模型进行了算法实现,利用两步聚类和K-均值聚类分析法确定综合评价值的分类情况,并以此作为评判依据;最后,在RStudio开发环境中,利用R语言中的开发Web界面的Shiny软件包实现了多维精准识别贫困户服务平台,开展多维度识别贫困户的实证研究,主要研究结论如下:(1)通过三个模型模拟精度的对比分析,结果显示随机森林模型的误差率最低,之后利用该模型推导出指标的重要性程度。而对预处理过的样本数据进行多维度识别贫困户的实证分析得出导致农户多维贫困的各维度指标的贡献率,一方面建立科学的评判标准,准确评判农户是否贫困,另一方面选取精准的识别方法,做到对贫困户的精准识别。(2)农户贫困度多维精准识别实证结果显示,从多维致贫因素的角度来看,通过对有效样本的数据分析可知,当指标个数为3和4时,多维贫困中指标的贡献率为32.34%和24.65%,而当指标个数为5、6、7、8和9时,导致农户贫困的贡献率分别为8.39%、2.50%、1.65%、0.033%和0,即随着多维贫困中指标个数的增多,导致农户贫困的指标贡献率逐渐接近零值,表明所选研究区内有效样本农户极少发生在6个、7个、8个和9个指标同时导致贫困发生的现象。由单一致贫指标的贡献率可知,在承包林地指标和承包土地指标上导致农户贫困的平均贡献率最高,分别为68.50%和54.64%,然后是家庭在校人数指标和年人均收入指标对农户多维贫困的平均贡献率达到45.72%和45.39%。(3)本文构建的农户贫困度多维精准识别模型对贫困户的精准识别准确率为90.26%。通过对模型识别的准确率和多维指标同时导致农户贫困的贡献率分析,得出农户在各维度指标下的贫困程度,从而精准识别贫困户及其贫困状况。结果表明农户贫困度多维精准识别模型在贫困户的识别问题上具有精准识别能力及应用价值,通过对模型算法的实现,创造一个良好的贫困度精准识别应用环境,为助力扶贫工作、提高精准识别贫困户的准确率,提供了技术支撑。