袁玉娟12, 尹云鹤1**, 戴尔阜1, 刘荣高3, 吴绍洪1

1. 中国科学院地理科学与资源研究所,中国科学院陆地表层格局与模拟重点实验室,北京 100101
2. 中国科学院大学,北京 100049
3. 中国科学院地理科学与资源研究所,资源与环境信息系统国家重点实验室,北京 100101

Forest cover classification based on remote sensing threshold consistent with statistics in Heilongjiang Province

YUAN Yujuan12, YIN Yunhe1*, DAI Erfu1, LIU Ronggao3, WU Shaohong1

1. Key Laboratory of Land Surface Pattern and Simulation, Institute of Geographic Sciences and Natural Resources Research, CAS, Beijing 100101, China
2. University of Chinese Academy of Sciences, Beijing 100049, China
3. State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, CAS, Beijing 100101, China

通讯作者:尹云鹤(1979-),女,山东德州人,副研究员,硕导,主要从事气候变化影响与适应研究,E-mail: yinyh@igsnrr.ac.cn

全球变化背景下,准确获取森林覆盖是监测森林资源动态、实现林业可持续发展的重要基础。为将省级尺度森林资源清查面积资料空间化,以黑龙江省为例,利用1999-2003年该省森林资源清查面积数据,结合2000年500 m分辨率的MODIS数据,构建了基于阈值分割的森林类型遥感识别方法。该方法利用不同地表覆被类型归一化植被指数时间序列的季节分异特征,以森林资源清查面积为标准,设定森林类型的划分阈值,识别了黑龙江省森林类型的空间分布。最后,基于分层随机抽样和精度评价方法,表明森林类型识别结果与地面参考数据具有较高的一致性,总体分类精度为78.1%;特别是季节特征明显的落叶林,精度可达80%以上。本文所构建的方法可将森林清查统计数据进行准确的空间定位,同时结合多期森林资源连续清查资料和遥感信息,可为识别并量化区域生态系统生物量和碳库变化等提供科技支撑。

关键词: 森林资源清查 ; 遥感 ; 阈值 ; 精度评价 ; 黑龙江省


Accurately identifying spatial distribution of forest is critically important for dynamic monitoring and sustainable management of forest resources. In this article, in order to acquire a spatially explicit forest cover classification based on the national forest inventory (NFI) statistics at the provincial scale, we developed an identification method using threshold values based on forest area from NFI statistics in 1999-2003 and the Moderate Resolution Imaging Spectroradiometer (MODIS) surface reflectance data in 2000 with a spatial resolution of 500 m for Heilongjiang Province. Based on the seasonal difference of Normalized Difference Vegetation Index (NDVI) of various forest types, threshold values between different forest types in satellite data were set using the NFI statistical data as criteria. Four forest types were differentiated: evergreen needleleaf, deciduous broadleaf, deciduous needleleaf, and mixed forests. Due to the stratified random sampling method used in this study and reliable threshold identification, the accuracy assessment result shows that the spatial pattern of forest cover classifications is highly consistent with the ground reference map, with an overall classification accuracy of 78.1%. Specifically, the applied method resulted in higher classification accuracy for deciduous forests that have distinct seasonal variations of NDVI (with user accuracy above 80%). The study provides a practical method for spatially explicit forest coverage estimation, and for quantifying changes in biomass and carbon stock in the ecosystem at the regional scale based on several periods of NFI statistics and remote sensing data.

Keywords: forest inventory ; remote sensing ; threshold ; accuracy assessment ; Heilongjiang Province


1 引言

森林是陆地生态系统的关键组成部分,不仅能提供重要资源和栖息地,而且在调节全球及区域水循环和碳循环中起着关键作用(FAO, 2010; Pan et al, 2011; Fang et al, 2014)。森林空间分布可反映区域中的森林重要性,其变化通常由植树造林或砍伐毁林等导致(Shi et al, 2011)。陆地表层森林覆盖信息的准确识别是评估森林资源变化、辨识人类活动影响的重要基础(Erb et al, 2007; Hansen et al, 2013)。因此,准确获取森林类型空间分布是全球变化研究的热点问题之一。

森林资源清查是基于地面调查数据获得森林资源信息的传统方法(肖兴威, 2005)。中国森林资源清查始于20世纪70年代,每五年开展一次,通常以行政区为统计单元发布森林面积、蓄积量及结构统计数据,为及时准确掌握森林资源现状和变化提供了科学依据(中国森林编辑委员会, 1997)。森林资源清查统计数据已广泛应用于估算森林生物碳储量和物种分布等研究(Schroeder et al, 1997; Fang et al, 2001; Guo et al, 2010; Pan et al, 2011; Hernández et al, 2014)。然而,目前可获取的森林清查数据通常以行政区为统计单元,但当前研究对空间精度要求越来越高。

遥感作为一种先进的对地观测手段得到普遍应用,可提供大范围、较高时空分辨率的森林空间分布(Myneni et al, 2001; 李虎等, 2003; Jia et al, 2014; 夏浩铭等, 2015)。植被遥感指数,例如归一化植被指数(NDVI),可有效地反映植物生长状况和生物量等,在土地覆盖分类中具有重要作用(Tucker, 1979; Defries et al, 1994; Viana et al, 2012)。为充分利用森林清查资料,将其与遥感数据相结合进行空间格局研究具有重要意义。一方面可发挥遥感数据的空间定位准确的优势,另一方面能体现出地面详查资料定量准确的优势(刘双娜等, 2012)。

近年来,森林清查资料与遥感数据相结合的技术在森林植被类型覆盖识别和森林植被碳源/汇的空间分布定量估算等方面得到较广泛应用(Päivinen et al, 2001; Kennedy et al, 2002; 刘双娜等, 2012)。目前,常见研究大致可分为以下两类:一是根据现有森林分布图和资源清查统计两者面积之间的比例关系,利用迭代算法调整森林分布,从而使森林面积与区域清查统计数据相一致或误差最小(Päivinen et al, 2001, 2003; Schuck et al, 2003; Tröltzsch et al, 2009);二是融合土地利用图和统计资料,揭示区域或全球土地利用变化,具体算法包括最大似然估计和优度拟合(Hurtt et al, 2006)、误差最小分配算法(Erb et al, 2007)以及二分迭代法(Liu et al, 2010)等。总体上,目前研究多基于已有植被空间格局信息,而较少直接利用遥感影像数据进行基于两类数据结合的森林类型识别。


2 数据与方法

2.1 研究区概况

本文以位于中国东北部温带气候区的黑龙江省为研究区(43°26′~53°33′N,121°11′~135°05′E),土地总面积为4540万 hm2(图1)。该区属东亚季风气候,水热条件的季节变化和空间分布差异明显,年平均气温约为-4~5℃,年降水量约为400~650 mm。黑龙江省植被类型主要为森林、草原和农田,其中森林资源丰富,森林面积达1962万hm2,森林覆盖率达43.16%(国家林业局, 2010)。由于黑龙江省位于中高纬度地区,气候和植被的季节差异特征尤为明显,因此是进行森林类型遥感识别研究的理想 区域。

图1   研究区空间位置和边界示意图

Fig.1   Location and boundary of the study area

天然林资源是黑龙江省森林资源的主体,主要分布在大兴安岭、小兴安岭、以及张广才岭和老爷岭等东部山地。大兴安岭山地北部属寒温带落叶针叶林区,以兴安落叶松(Larix gmelinii)为优势树种,乔木层结构较为简单,还分布有樟子松(Pinus sylvestris)和红皮云杉(Picea koraiensisi),但面积不大,伴生有白桦(Betula platyphylla)和山杨(Populus davidiana)等。小兴安岭和东部山地属中温带针阔叶林区,针叶树种以红松(Pinus koraiensis)为主,阔叶树种有蒙古栎(Quercus mongolica)、紫椴(Tilia amurensis)、色木槭(Acer mono)等。人类活动的不断加剧及火灾活动的频发导致樟子松逐渐减少,而且随着白桦等阔叶次生林的生长,逐步形成了针阔混交林(中国科学院中国植被图编辑委员会, 2007)。

2.2 研究数据

2.2.1 森林资源清查数据

本文采用的黑龙江省森林面积数据来自《全国森林资源统计》(1999-2003年)(国家林业局森林资源管理司, 2005)。参考《国家森林资源清查主要技术规定》(国家林业局, 2014)和《中国森林》(中国森林编辑委员会, 1997),将森林资源统计中的各乔木优势树种划分为4种类型,即常绿针叶林(ENF)、落叶针叶林(DNF)、落叶阔叶林(DBF)和混交林(MF),其面积分别为83.82万hm2、394.89万hm2、1198.28万hm2和115.19万hm2

2.2.2 MODIS NDVI数据

研究区2000年的MODIS地表反射率数据(MOD09A1)为500 m空间分辨率,8 d合成的三级产品,通过NASA Land Processes Distributed Active Archive Center(LPDAAC)获取。MOD09A1产品已经进行了云和气溶胶等校正(Vermote et al, 2015)。NDVI由红外反射率(ρRed)和近红外反射率(ρNIR)通过式(1)计算得到:


数据经过云检测、插值和统计,得到NDVI及近红外波段反射率的年最小值(NDVIn,NIRn)、NDVI最大值(NDVIx)、生长旺季(NDVI达最大值前后96 d时段)NDVI均值(NDVIa)(Liu et al, 2013)。

2.2.3 MODIS土地覆盖数据

本文采用2001年MODIS土地覆盖数据进行森林类型遥感识别结果的对比分析。MODIS土地覆盖数据(MCD12Q1)空间分辨率为500 m,同样来自NASA LPDAAC。MCD12Q1是基于大量高精度训练数据,采用监督分类方法形成的,包括自2001年至今逐年土地覆盖数据(Friedl et al, 2010)。MCD12Q1的森林分类与植被图分类体系一致。

2.2.4 中国植被图

本文以1:100万中国植被图作为地面参考数据来评价森林类型遥感识别精度。数据来自中国科学院资源环境科学数据中心(http://www.resdc.cn/data.aspx?DATAID=122)。该植被图基于大量野外调查,反映了20世纪90年代中国主要植被类型及其分布格局(中国科学院中国植被图编辑委员会, 2007),与本文所识别的2000年森林类型时段相近。本文将植被图中的森林分为常绿针叶林(ENF)、常绿阔叶林(EBF)、落叶针叶林(DNF)、落叶阔叶林(DBF)及混交林(MF),并进行投影转换和栅格化,使之与MODIS空间分辨率相匹配。

2.3 研究方法

2.3.1 阈值分割方法

阈值分割方法是遥感识别土地覆盖类型的常用方法之一。该方法首先选择不同类型之间存在显著差异的指标,再确定相关指标的阈值,进而达到识别土地覆盖类型空间信息的目的(王志慧等, 2013; DeVries et al, 2015)。在较大空间尺度上,遥感植被结构特征(如NDVI)在不同覆盖类型间存在显著差异 (Running et al, 1995; Nemani et al, 1997)。通常草地NDVI在生长季明显低于森林;相对于常绿林,落叶林的NDVI则具有明显的季节分异性。近年来,基于NDVI季节特征进行土地覆盖类型识别的研究越来广泛(贾明明等, 2014; 杨存建等, 2014)。阈值分割方法的难点和关键在于阈值的准确选取(吴健生等, 2013; 姜洋等, 2014; 雷光斌等, 2014)。本文利用遥感NDVI的季节特征,依据森林资源清查数据确定阈值,进行森林类型遥感识别。

首先,根据NDVIa区分森林与其他土地覆盖类型。多年生森林与一年生农作物和草地的最显著区别是非生长季地上活动生物量能否存在(Running et al, 1995)。一般情况下,NDVI高值代表高度植被覆盖,并具有较高地上生物量。因此,生长季森林相比其他植被类型通常具有较高的NDVIa

其次,利用NDVIx-n(年内NDVIxNDVIn的差值)区分落叶林和常绿林。遥感植被指数的时相变化可表征高纬度地区植被物候变化(Zhang et al, 2003),这是一个区别落叶林和常绿林的重要特征(Nemani et al, 1997)。一般情况下,落叶林NDVI年内变化较为明显,而常绿林NDVI年内变化相对不明显。混交林的NDVI变化则为落叶林和常绿林特征(Olofsson et al, 2014)的平均值。此处,利用上一过程提取的森林作为掩膜,在森林分布区以NDVIx-n为分类指标。

最后,采用近红外地表反射率区分针叶林和阔叶林。由于叶片结构的差异,针叶林和阔叶林反射率差别较大,阔叶林的反射率高于针叶林,尤其是在近红外波段反射率差异更为明显(Nemani et al, 1997)。因此,本文以NIRn作为进一步区分针叶林和落叶林的指标。


图2   基于阈值分割的森林类型遥感识别方法流程图

Fig.2   Flowchart of remote sensing forest cover classification based on threshold values consistent with statistics


2.3.2 精度评价方法

利用植被图作为参照数据是目前进行精度评价的主要且可靠的方法(李俊祥等, 2005; 顾娟等, 2010)。本文采用1:100万中国植被图作为地面参考数据,并结合基于概率的分层随机抽样方法,对森林类型遥感识别结果开展精度评价。随机抽样方法中采用分层设计,允许指定每个层的样本量,以确保每层获得一个精确的估计(Olofsson et al, 2014)。基于森林类型识别结果,设计4层抽样,随机选择489个样本(图3),同时确保每层样本量与该层的面积成正比(常绿针叶林41个,混交林87个,落叶针叶林145个和落叶阔叶林216个)。研究区内的样点分布如图3所示。参考Olofsson等(2014)的方法计算混淆矩阵,以制图精度和总体精度来评估本文的分类精度。其中某类型的制图精度以划分为某类森林面积占参考植被图中该类森林面积的比例来表征,总体精度表示分类类型一致的栅格面积占总采样点面积的比例。

图3   分层随机抽样选取的样点分布

Fig.3   Distribution of samples using probability-based stratified random sampling method in Heilongjiang Province

3 结果分析

3.1 森林类型识别结果


图4   黑龙江省森林类型空间分布图

Fig.4   Forest cover classification of Heilongjiang Province

3.2 精度评价



表1   森林类型的遥感识别结果与地面参照数据的混淆矩阵和精度评价

Tab.1   Confusion matrix and accuracy assessment of the present forest cover classification compared to the ground reference for Heilongjiang Province





表2   本文结果和MCD12Q1产品森林覆盖面积对比

Tab.2   Comparison of forest areas between the present forest cover classification and MCD12Q1 for Heilongjiang Province

落叶针叶林 (DNF)394.8722.04113.506.64
常绿针叶林 (ENF)83.824.688.190.48
常绿阔叶林 (EBF)


4 结论与讨论

4.1 结论


通过以黑龙江省为例,利用2000年MODIS NDVI生长旺季均值,NDVI年内差值及最小近红外反射率作为识别指标,并利用1999-2003年该省森林资源清查中的乔木优势种面积统计资料来设定森林类型划分阈值,以此为基础识别出黑龙江省常绿针叶林、落叶针叶林、落叶阔叶林和混交林的空间分布格局。进一步以植被图作为地面参考数据,通过分层随机抽样方法选取489个样点开展了定量化的精度评价。分析表明,森林类型遥感识别结果的总体分类精度较高(78.1%),其中落叶林分类精度可达80%以上。总体上,基于阈值分割的森林类型遥感识别方法具有较高精度,但仍存在不确定性。不确定性主要源于数据和识别方法,主要包括遥感植被指数代表性、遥感影像空间分辨率及不同分类体系中森林定义的差异。

4.2 讨论


该方法对森林类型的判别阈值较为敏感,结果的不确定性主要来自遥感数据。NDVI是常用来表征植被覆盖和生长状况的植被指数(Myneni et al, 1997; Walker et al, 2012),国内外众多学者从不同尺度开展的研究表明,利用MODIS NDVI时间序列数据可获得的土地覆盖分类结果精度较高(Lunetta et al, 2006; 付安民等, 2010; 顾娟等, 2010; Zhao et al, 2013; Lin et al, 2016; Shao et al, 2016)。然而NDVI的局限性也不可忽视,例如它对高水平的生物量和叶绿素浓度易饱和(Huete et al, 2002),易受水汽和气溶胶的污染(Jeganathan et al, 2010)。此外,病虫害和森林火灾等也可能会对NDVI产生影响(George et al, 2006)。

遥感影像的分辨率问题是另一个不确定性来源,特别是在土地覆盖类型较破碎的地区。采用500 m分辨率的MODIS数据,混合像元可能会在一定程度上影响植被遥感识别的精度(Chen et al, 2013)。本文基于MODIS遥感数据进行了方法探索,主要目的是解决目前植被遥感识别研究中,森林识别面积与国家森林清查公布的统计数据间存在较大差异的问题。未来研究将借助更高空间分辨率的遥感影像,以提高对区域尺度森林类型空间分布的识别能力。

森林资源清查数据的精度也是影响研究结果的主要因素之一。尽管本文中黑龙江省森林资源清查的样地设计精度可达95%(肖兴威, 2005),然而外业调查的抽样方案、调查手段与工具,调查结果的统计方法及其他主观因素仍会影响森林清查数据的精度,从而在一定程度上影响本文识别结果精度。此外,不同分类体系中的森林定义不同,也可能影响精度评价结果。例如在MCD12Q1产品中,混交林定义为阔叶林和针叶林均不超过60%(Friedl et al, 2010);而在森林资源清查中,混交林定义为针叶树种或阔叶树种总蓄积量占35%~65%(国家林业局, 2014)。

Forests are one of the most important components of the global biosphere and have critical influences on the Earth's ecological balance. Regularly updated forest cover information is necessary for various forest management applications as well as climate modeling studies. However, map products are not widely updated at continental or national scales because the current land cover products have overly coarse spatial resolution or insufficiently large training data sets. This study presents the results of forests distribution and variation information over China using Moderate Resolution Imaging Spectroradiometer (MODIS) Normalized Difference Vegetation Index (NDVI) time series data with the first layer of MODIS Land Cover Type product (MODIS LC-1). The NDVI time series histogram characteristic curves for forestland were estimated from MODIS LC-1 and MODIS NDVI time series data. Based on the differences of histograms among different forests, we obtained the 2001-2011 forests distribution for China at a spatial resolution of 500-m x 500-m. The overall accuracy of validation was 80.4%, an increase of 12.8% relative to that obtained using MODIS LC-1 data. The 2001-2011 forestland pure and mixed pixels of China accounted for an average of 33.72% of all pixels. There is a gradual increase in China's forestland coverage during 2001-2011; however, the relationship is not statistically significant.
