论文部分内容阅读
摘要:Sentinel-2影像具有空间分辨率高,重訪周期短的优势。本研究探讨了基于Sentinel-2数据开展梨树县作物精准分类,进而进行种植结构分析的可行性。为此,收集了多时相的Sentinel-2影像和大量地面不同作物类型样点数据。基于以上数据,选择决策树法、最大似然法、支持向量机法等3种经典分类方法开展影像分类,并对它们的结果进行对比以选择最优分类方法。然后,利用最优分类方法获得的分类结果对梨树县作物种植结构进行分析。结果表明,基于时序Sentinel-2影像,利用作物的物候特征与其光谱特征之间的联系可实现对梨树县作物种植面积和空间分布信息的准确提取,从而对该县种植结构进行客观评价。3种分类方法中,决策树法的分类精度最高,其总体分类精度为93.53%,Kappa系数达到0.890 6 。
关键词:作物种植结构;Sentinel-2;光谱特征
中图分类号:S127文献标识码:A文章编号:1000-4440(2020)06-1428-09
Abstract: Sentinel-2 images have the advantages of high spatial resolution and short revisit cycle. This study investigated the feasibility of making accurate classification of crops and planting structure analysis in Lishu County based on Sentinel-2 data. Multi-temporal Sentinel-2 images and a large number of ground sample data of different crops were collected. Based on the above data, three classic classification methods including decision tree method, maximum likelihood method and support Vector machine method were selected in image classification, and their results were compared to select the best classification method. Then, the classification results obtained by the best method were used to analyze the crop planting structure of Lishu County. The results showed that based on time-series Sentinel-2 images, the planting area and spatial distribution information of crops in Lishu County could be extracted accurately by combining the phenological characteristics and spectral characteristics of the crops, then the planting structure of the county could be evaluated objectively. Among the three classification methods, the decision tree method got the best results, with the overall classification accuracy of 93.53% and the Kappa coefficient value of 0.890 6.
Key words:crop planting structure;Sentinel-2;spectral characteristics
作物的种植结构能够体现人们对某一地区农业生产资源的利用情况[1]。及时、准确地掌握作物种植结构可为区域作物结构调整和优化提供有效依据[2]。梨树县是中国重要的商品粮生产基地[3],素有“东北粮仓”和“松辽明珠”之称,因此掌握梨树县作物的种植结构信息对农业生产管理、农业可持续发展及保障农民收益最大化等都具有重要意义。
对于农作物种植结构的研究主要有数据统计和遥感监测2种方法。其中,数据统计法采用区域逐层汇总统计的步骤,存在主观因素较大,容易造成统计不准确的缺陷,并且当统计对象区域范围较大时,该方法耗时耗力。遥感监测是基于卫星遥感影像,根据不同作物反射光谱信息的差异来进行分类,进而获取研究区农作物的空间分布信息。与统计方法相比,其结果更为客观,而且效率更高。目前,已有大量基于遥感技术对县级尺度作物进行分类的报道。基于多时相Landsat8影像,张荣群等[4]根据曲周县主要农作物的物候特征,通过分析NDVI的时序变化,提取了该县主要农作物的空间分布及面积;刘珺等[5]基于多时相HJ卫星CCD影像获取了嘉祥县主要秋收作物的种植结构信息。已有的类似研究大多基于MODIS、AVHRR、Landsat、HJ等遥感数据源,使用它们的时序数据并利用不同作物物候信息的差异展开分类。与以上提及的数据源相比,Sentinel-2数据具有空间分辨率高,重访周期短的优势。Sentinel-2卫星服役时间不长,其数据在土地覆盖监测、生物量估计、风险灾害预测等方面的应用正在陆续开展中[6-9]。王大钊等[10]为了监测鄱阳湖的洪涝灾害情况,分别利用Sentinel-2和Landsat8影像提取了湖泊的水体分布信息,结果显示使用Sentinel-2影像的提取精度相较于Landsat8高4%,体现了Sentinel-2数据在地物面积提取方面的优势。刘怀鹏等[11]基于Sentinel-2A数据,利用光谱指数密度分割法与光谱波段分类法成功提取了内蒙古五原县郊区的村落面积。这些研究推动了Sentinel-2数据的应用,但总的来说还需要开展广泛的验证,以评估其在农作物分类方面的能力和应用潜力。 基于多时相Sentinel-2影像,本研究以梨树县为试验区,探讨基于Sentinel-2数据开展梨树县农作物分类,进行种植结构分析的可行性,以期推动高分辨Sentinel-2影像应用于县域尺度作物分类,提高作物分类、种植结构分析等相关研究的精度。
1材料与方法
1.1研究区概况
梨树县隶属于吉林省四平市(123°45′~124°53′ E,43°02′~43°46′ N),辖15个镇、6个乡,面积为4 209 km2。其位于长白山区向草原过渡地带[12],地势成阶梯状分布,南部地区为低山丘陵,中部及北部地区为平原。属北温带半湿润大陆季风性气候,日照时间长,降水充沛,且雨热同季[13]。梨树县土壤肥沃,有机质含量多,主要类型为黑土和黑钙土[14],适宜一年一熟作物的生长,主要种植玉米、水稻、大豆、蔬菜等。研究区的地理位置如图1所示。
1.2数据源
1.2.1遥感数据及预处理本研究采用的是Sentinel-2影像数据。它含有2A和2B两颗卫星,两星组网后重访周期为5 d[15]。Sentinel-2卫星携带的多光谱成像仪(MSI)共有13个波段,能形成10 m、20 m、60 m 3种分辨率的影像,本研究在进行作物分类时,使用了10 m分辨率的影像,它的波段为B2(蓝波段)、B3(绿波段)、B4(红波段)、B8(近红外波段)。影像数据下载自网站https://earthexplorer.usgs.gov。对梨树县来讲,共需要4景影像来覆盖整个研究区。考虑到作物生长季是5-10月,剔除云量过多、不同景影像拼接色差大的数据,最终使用的影像信息如表1所示。此外,从上述网站上下载的影像是只经过几何精校正的L1C级数据,还需进行辐射定标和大气校正。本研究基于欧洲航天局发布的开源软件SNAP软件对影像进行辐射定标和大气校正,以生成L2A级数据,然后进行波段合成、拼接、裁剪处理,以获取研究区影像。
1.2.2数字高程数据本研究还使用了数字高程数据(Digital Elevation Model, DEM),用于计算坡度信息,进行研究区内山区面积的提取。数据下载自地理空间数据云平台(http://www.gscloud.cn)。
1.2.3地面调查数据地面调查在2018年8月5-10日开展,借助当地农机技术推广站工作人员的经验,选择调查路线以使考察经过最多的植被类型。调查时,基于选定的路线,随机选择样点,记录样点的植被类型、经纬度等信息并拍照。考察中共获取玉米样点245个,大豆样点38个,水稻样点64个,蔬菜样点68个,林地样点56个,其他样点(建筑、道路、水体等)62个。所有样点的位置分布如图1所示。
1.3数据分析方法
影像分类时,采用了决策树分类、最大似然分类和支持向量机分类3种常用的分类方法。首先,将所有采集到的样点随机选择2/3作为训练样本,1/3作为验证样本,然后基于训练样本分别建立3种方法下的分类模型,最后基于模型来进行分类并利用验证样本对分类结果进行验证,以比较3种方法的优劣。
1.3.1基于決策树的分类决策树是一种由内部节点判断属性,分支代表结果输出,叶节点代表类别的树状结构。其分类规则是实现决策树分类的关键,而获取分类规则主要通过专家先验知识、数理归纳统计或者根据CART、ID3、C4.5等算法自动获取[16]。本研究基于训练样本中不同植被类型波段反射率和各种光谱指数的差异,归纳统计确定它们之间区分的阙值,从而基于阙值构建决策树分类模型。
由于梨树县东南部为丘陵区,山区地物光谱特征与平原会有所差异,因此在分类过程中首先基于DEM数字高程数据计算坡度,然后利用坡度将研究区分为山区与平原区。根据水体、建筑、道路、林地等非农业用地光谱特征的差异,在山区与平原区中分别提取出这些非农业用地面积。最后,再根据山区与平原区主要作物的物候特征,找出它们之间的光谱特征差异,提取出区域内的各种作物面积,并根据研究目的,通过合并将所有地物分为玉米、大豆、水稻、蔬菜、其他经济作物、非农业用地共6类。
技术路线图如图2所示,各类地物提取流程详述如下。首先提取非农业用地的面积,非农业用地包括水体、建筑、道路和林地。对于非农业用地,山区与平原区的提取流程是一样的,但所用阙值有所不同。首先,利用归一化水体指数(NDWI)[17]将水体面积提取出来,其计算过程如公式(1)所示。其中,在山区选择的阙值为0.02,在非山区选择的阙值为0.04。其次,利用比值植被指数(RVI)[18]提取建筑用地、道路的面积,其计算过程如公式(2)所示。分析不同地物的RVI时序曲线,发现建筑用地、道路等的RVI值比较低,且不会随时间有太大波动(图3)。8月,大部分植被都处于生长旺盛阶段,RVI值较高,与建筑用地、道路等这些非植被地物相比,差异很大。因此,根据8月份的RVI信息可以将建筑用地、道路的面积提取出来。其中,在山区选择的阙值为0
关键词:作物种植结构;Sentinel-2;光谱特征
中图分类号:S127文献标识码:A文章编号:1000-4440(2020)06-1428-09
Abstract: Sentinel-2 images have the advantages of high spatial resolution and short revisit cycle. This study investigated the feasibility of making accurate classification of crops and planting structure analysis in Lishu County based on Sentinel-2 data. Multi-temporal Sentinel-2 images and a large number of ground sample data of different crops were collected. Based on the above data, three classic classification methods including decision tree method, maximum likelihood method and support Vector machine method were selected in image classification, and their results were compared to select the best classification method. Then, the classification results obtained by the best method were used to analyze the crop planting structure of Lishu County. The results showed that based on time-series Sentinel-2 images, the planting area and spatial distribution information of crops in Lishu County could be extracted accurately by combining the phenological characteristics and spectral characteristics of the crops, then the planting structure of the county could be evaluated objectively. Among the three classification methods, the decision tree method got the best results, with the overall classification accuracy of 93.53% and the Kappa coefficient value of 0.890 6.
Key words:crop planting structure;Sentinel-2;spectral characteristics
作物的种植结构能够体现人们对某一地区农业生产资源的利用情况[1]。及时、准确地掌握作物种植结构可为区域作物结构调整和优化提供有效依据[2]。梨树县是中国重要的商品粮生产基地[3],素有“东北粮仓”和“松辽明珠”之称,因此掌握梨树县作物的种植结构信息对农业生产管理、农业可持续发展及保障农民收益最大化等都具有重要意义。
对于农作物种植结构的研究主要有数据统计和遥感监测2种方法。其中,数据统计法采用区域逐层汇总统计的步骤,存在主观因素较大,容易造成统计不准确的缺陷,并且当统计对象区域范围较大时,该方法耗时耗力。遥感监测是基于卫星遥感影像,根据不同作物反射光谱信息的差异来进行分类,进而获取研究区农作物的空间分布信息。与统计方法相比,其结果更为客观,而且效率更高。目前,已有大量基于遥感技术对县级尺度作物进行分类的报道。基于多时相Landsat8影像,张荣群等[4]根据曲周县主要农作物的物候特征,通过分析NDVI的时序变化,提取了该县主要农作物的空间分布及面积;刘珺等[5]基于多时相HJ卫星CCD影像获取了嘉祥县主要秋收作物的种植结构信息。已有的类似研究大多基于MODIS、AVHRR、Landsat、HJ等遥感数据源,使用它们的时序数据并利用不同作物物候信息的差异展开分类。与以上提及的数据源相比,Sentinel-2数据具有空间分辨率高,重访周期短的优势。Sentinel-2卫星服役时间不长,其数据在土地覆盖监测、生物量估计、风险灾害预测等方面的应用正在陆续开展中[6-9]。王大钊等[10]为了监测鄱阳湖的洪涝灾害情况,分别利用Sentinel-2和Landsat8影像提取了湖泊的水体分布信息,结果显示使用Sentinel-2影像的提取精度相较于Landsat8高4%,体现了Sentinel-2数据在地物面积提取方面的优势。刘怀鹏等[11]基于Sentinel-2A数据,利用光谱指数密度分割法与光谱波段分类法成功提取了内蒙古五原县郊区的村落面积。这些研究推动了Sentinel-2数据的应用,但总的来说还需要开展广泛的验证,以评估其在农作物分类方面的能力和应用潜力。 基于多时相Sentinel-2影像,本研究以梨树县为试验区,探讨基于Sentinel-2数据开展梨树县农作物分类,进行种植结构分析的可行性,以期推动高分辨Sentinel-2影像应用于县域尺度作物分类,提高作物分类、种植结构分析等相关研究的精度。
1材料与方法
1.1研究区概况
梨树县隶属于吉林省四平市(123°45′~124°53′ E,43°02′~43°46′ N),辖15个镇、6个乡,面积为4 209 km2。其位于长白山区向草原过渡地带[12],地势成阶梯状分布,南部地区为低山丘陵,中部及北部地区为平原。属北温带半湿润大陆季风性气候,日照时间长,降水充沛,且雨热同季[13]。梨树县土壤肥沃,有机质含量多,主要类型为黑土和黑钙土[14],适宜一年一熟作物的生长,主要种植玉米、水稻、大豆、蔬菜等。研究区的地理位置如图1所示。
1.2数据源
1.2.1遥感数据及预处理本研究采用的是Sentinel-2影像数据。它含有2A和2B两颗卫星,两星组网后重访周期为5 d[15]。Sentinel-2卫星携带的多光谱成像仪(MSI)共有13个波段,能形成10 m、20 m、60 m 3种分辨率的影像,本研究在进行作物分类时,使用了10 m分辨率的影像,它的波段为B2(蓝波段)、B3(绿波段)、B4(红波段)、B8(近红外波段)。影像数据下载自网站https://earthexplorer.usgs.gov。对梨树县来讲,共需要4景影像来覆盖整个研究区。考虑到作物生长季是5-10月,剔除云量过多、不同景影像拼接色差大的数据,最终使用的影像信息如表1所示。此外,从上述网站上下载的影像是只经过几何精校正的L1C级数据,还需进行辐射定标和大气校正。本研究基于欧洲航天局发布的开源软件SNAP软件对影像进行辐射定标和大气校正,以生成L2A级数据,然后进行波段合成、拼接、裁剪处理,以获取研究区影像。
1.2.2数字高程数据本研究还使用了数字高程数据(Digital Elevation Model, DEM),用于计算坡度信息,进行研究区内山区面积的提取。数据下载自地理空间数据云平台(http://www.gscloud.cn)。
1.2.3地面调查数据地面调查在2018年8月5-10日开展,借助当地农机技术推广站工作人员的经验,选择调查路线以使考察经过最多的植被类型。调查时,基于选定的路线,随机选择样点,记录样点的植被类型、经纬度等信息并拍照。考察中共获取玉米样点245个,大豆样点38个,水稻样点64个,蔬菜样点68个,林地样点56个,其他样点(建筑、道路、水体等)62个。所有样点的位置分布如图1所示。
1.3数据分析方法
影像分类时,采用了决策树分类、最大似然分类和支持向量机分类3种常用的分类方法。首先,将所有采集到的样点随机选择2/3作为训练样本,1/3作为验证样本,然后基于训练样本分别建立3种方法下的分类模型,最后基于模型来进行分类并利用验证样本对分类结果进行验证,以比较3种方法的优劣。
1.3.1基于決策树的分类决策树是一种由内部节点判断属性,分支代表结果输出,叶节点代表类别的树状结构。其分类规则是实现决策树分类的关键,而获取分类规则主要通过专家先验知识、数理归纳统计或者根据CART、ID3、C4.5等算法自动获取[16]。本研究基于训练样本中不同植被类型波段反射率和各种光谱指数的差异,归纳统计确定它们之间区分的阙值,从而基于阙值构建决策树分类模型。
由于梨树县东南部为丘陵区,山区地物光谱特征与平原会有所差异,因此在分类过程中首先基于DEM数字高程数据计算坡度,然后利用坡度将研究区分为山区与平原区。根据水体、建筑、道路、林地等非农业用地光谱特征的差异,在山区与平原区中分别提取出这些非农业用地面积。最后,再根据山区与平原区主要作物的物候特征,找出它们之间的光谱特征差异,提取出区域内的各种作物面积,并根据研究目的,通过合并将所有地物分为玉米、大豆、水稻、蔬菜、其他经济作物、非农业用地共6类。
技术路线图如图2所示,各类地物提取流程详述如下。首先提取非农业用地的面积,非农业用地包括水体、建筑、道路和林地。对于非农业用地,山区与平原区的提取流程是一样的,但所用阙值有所不同。首先,利用归一化水体指数(NDWI)[17]将水体面积提取出来,其计算过程如公式(1)所示。其中,在山区选择的阙值为0.02,在非山区选择的阙值为0.04。其次,利用比值植被指数(RVI)[18]提取建筑用地、道路的面积,其计算过程如公式(2)所示。分析不同地物的RVI时序曲线,发现建筑用地、道路等的RVI值比较低,且不会随时间有太大波动(图3)。8月,大部分植被都处于生长旺盛阶段,RVI值较高,与建筑用地、道路等这些非植被地物相比,差异很大。因此,根据8月份的RVI信息可以将建筑用地、道路的面积提取出来。其中,在山区选择的阙值为0