论文部分内容阅读
矢量数据结构和栅格数据结构是地理信息系统中常用的两种数据结构,也是空间数据的主要表达方式。矢量结构具有“位置明显,属性隐含”的特点,栅格结构具有“属性明显,位置隐含”的特点,在实际应用与操作过程中,两种结构的数据需经常相互转换。近几年,随着地理空间信息采集技术(遥感和全球定位系统)及计算机技术的不断发展,栅格数据日益成为各行业的主要数据源格式。因此矢量数据结构向栅格数据结构的转换受到了密切的关注,栅格化技术也成为了热点话题。矢量数据栅格化是一个有信息损失的过程,包括形状、位置、面积等的变化,即有误差的产生。其中面积变化是各个行业相关学者研究的重点。在进行栅格化操作过程中通常有三种像元编码方法,即中心点法、面积最大值法、组合面积最大值法三种编码方法,采用这三种编码方法会造成不一样的误差。然而,涉及不同像元编码方法造成的栅格化误差对比工作做地很少,且针对不同编码方法产生不同误差的机理探讨更没有。鉴于此,本文以2018年京津冀地区1:10万土地利用矢量数据为例,鉴于数据量大小及处理速度选择在50m~6km等13个尺度上在ArcGIS软件中分别采用三种编码方法栅格化,然后采用了加权平均法和基于栅格单元的评价方法进行了栅格化面积误差评价,并进一步分析探讨了不同编码方法的误差机理。本文的主要分析工作和结论如下:(1)基于加权平均法的误差评价方法从区域总体上对比分析了不同编码方法的误差。加权平法所评定的栅格化误差实际上反映数据整体的面积变化,即栅格化前后研究区边界的变化。其中,在所选栅格化尺度范围内,中心点法的栅格化误差最小(0.04%~-0.10%),其误差随着尺度增加在0值附近上下波动;组合面积最大值法栅格化误差次之(-0.003%~-0.976%);面积最大值法栅格化误差最大(-0.0004%~-1.209%),且后二者误差随着尺度变化不断增大。(2)分析探究了基于加权平均法的栅格化误差机理。不同编码方法产生不同误差的根本原因在于,栅格化后三者对于边界线上栅格的取舍情况不一样。对于中心点法的栅格化,研究区边界线上栅格单元的中心点落在边界线内、外的概率均为1/2,保留的栅格单元数量与丢失的栅格单元数量接近,正负相抵,因此,其误差最小,在0上下波动;对于组合面积最大值法和面积最大值法的栅格化,研究区边界线上的栅格单元分边界线内和边界线外两部分,边界线内的土地属性斑块面积大于边界线外的空白区面积的概率都小于1/2,保留的栅格单元数量少于丢失的栅格单元数量,并且随着栅格尺度增大,保留的栅格单元数量不断变小,负大于正,因此其误差越来越大,误差值是负值。其中,组合面积最大值法由于组合的优点,其保留的概率大于面积最大值法的概率,组合面积最大值法的误差小于面积最大值法的误差。(3)基于栅格单元的误差评价方法(Error Evaluation Method Based on Grid Cells,EEM-BGC)对比分析了三种编码方法的误差分布及其误差原因。其中,在所选栅格尺度范围内,中心点法的误差最大(9.26%-55.04%),面积最大值法次之(7.051%-43.92%),组合面积最大值法误差最小(5.96%-36.84%)。其误差原因在于EEM-BGC法是局部误差即一个栅格单元的误差。研究区整体面积变化来源于每个栅格单元的面积变化,在一个栅格单元中,组合面积最大法总能代表此栅格内的最大地物,其面积所占栅格的比例总能保持最大比例,因此其栅格化误差最小,面积最大值法次之,中心点法只能代表每个栅格单元里处于中心点位置的地物,其面积所占栅格的比例无法确定,但可以确定的是小于或等于前两者的比例,因此其栅格化误差最大。(4)对比分析了两种误差评价方法的栅格化误差大小。采用不同误差评价方法,其结果差异较大。对于三种编码方法而言,EEM-BGC法的栅格化误差都明显大于加权平均法的误差,前者的误差变化随着尺度的变化更加明显。(5)两种评价方法结果都显示,在200m~800m的尺度区间,栅格化误差变化最为缓慢,其误差可以预测与控制,建议对于京津冀地区的土地利用矢量数据,栅格化可选择的适宜尺度是200m~800m。综上,本文利用加权平均法和基于栅格单元的评价方法,计算了三种像元编码方法的栅格化误差,对比分析了误差分布,并进一步探讨了其误差机理。本文的结论以及研究思路对今后的矢栅转换研究具有较好的参考价值。