地理科学进展  2016 , 35 (12): 1494-1505 https://doi.org/10.18306/dlkxjz.2016.12.006

Orginal Article

多元统计回归及地理加权回归方法在多尺度人口空间化研究中的应用

王珂靖12, 蔡红艳1**, 杨小唤1

1. 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京 100101
2. 浙江省测绘科学技术研究院,杭州 310012

Multiple scale spatialization of demographic data with multi-factor linear regression and geographically weighted regression models

WANG Kejing12, CAI Hongyan1*, YANG Xiaohuan1

1. State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, CAS, Beijing 100101, China
2. Zhejiang Academy of Surveying & Mapping, Hangzhou 310012, China

通讯作者:  蔡红艳(1983-),女,黑龙江五常人,助理研究员,研究方向为人文要素建模、土地利用变化的人文因素分析, E-mail:caihy@igsnrr.ac.cn

版权声明:  2016 地理科学进展 《地理科学进展》杂志 版权所有

基金资助:  国家自然科学基金项目(41271173,41301155)国家科技支撑计划项目(2012BAI32B06)

作者简介:

作者简介:王珂靖(1988-),女,山东文登人,硕士研究生,主要从事社会经济数据空间化建模研究,E-mail:wkj_3210@163.com

展开

摘要

对统计型人口数据进行格网形式的空间化可更直观地展示人口的空间分布,但不同的人口空间化建模方法和不同的格网尺度在表达人口空间化结果方面存在差异。本文在人口特征分区的基础上,引入DMSP/OLS夜间灯光对城镇用地进行再分类,采用多元统计回归和地理加权回归方法(GWR),开展人口统计数据空间化多尺度模型研究,生成1 km、5 km和10 km等3个尺度的2010年安徽省人口空间数据,并对3个尺度下2个模型结果进行精度评价与比较。结果表明:人口空间数据精度不仅与建模所用方法关系密切,还受到建模格网尺度大小的影响。基于多元统计回归方法的模型估计人口数与实际人口的平均相对误差值随着尺度的增加而降低,而基于GWR方法获得的人口空间数据误差值随着尺度的增加而升高。整体来看,基于GWR方法的1 km研究尺度的人口空间数据平均相对误差最低(22.31%)。区域地形地貌条件与人口空间数据误差有较强的关联,地貌类型复杂的山区人口空间数据误差较大。

关键词: 人口分布 ; 空间化 ; 多尺度 ; 多元统计回归 ; 地理加权回归法 ; 安徽省

Abstract

Population distribution data are essential for socioeconomic and environmental studies, such as population estimation, spread of disease, natural disaster relief, and environmental protection. Existing research has proved that spatialized population grid data can precisely delineate the spatial pattern of population distribution, while model selection and size of grids may influence the accuracy of population distribution modeling. It is therefore important to estimate population distribution using appropriate models and at a proper spatial scale. This study mainly focused on the spatialization modeling of Anhui Province county-level population census data in 2010 at three grid scales. Anhui Province was selected for the study due to its complex landforms and significant difference of population distribution within its area. Population regionalization was carried out as a preprocessing step: 78 counties in Anhui Province were divided into four groups. Combining with land-use data and nighttime light (DMSP/OLS), urban residential areas were reclassified to reflect regional differences. Based on the population regionalization, multi-factor linear regression (MFLR) and geographically weighted regression (GWR) models were employed to integrate the reclassified urban residential land-use data with the rural residential land-use data. This study established three population spatial datasets at 1 km, 5 km, and 10 km gird scales. Comparing the two models’ precision at each scale, the results show that the modeling and grid scale have much influence on the accuracy of the spatialization result, which increased with the grid scale by using the MFLR model and the highest accuracy was achieved in the 10 km grid datasets. For the GWR model, the accuracy decreased as the grid scale increased, and the highest model accuracy was obtained at the 1 km scale. Overall, the GWR model had a higher accuracy (22.31%) than the MFLR model when taking into account the geographic location and local modeling. This study may provide a scientific basis for the production and application of population spatial data and provide a reference of spatialization for other types of statistical data in the future.

Keywords: population distribution ; spatialization ; multi-scales ; multi-factor linear regression ; Geographically Weighted Regression (GWR) ; Anhui Province

0

PDF (21461KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

王珂靖, 蔡红艳, 杨小唤. 多元统计回归及地理加权回归方法在多尺度人口空间化研究中的应用[J]. , 2016, 35(12): 1494-1505 https://doi.org/10.18306/dlkxjz.2016.12.006

WANG Kejing, CAI Hongyan, YANG Xiaohuan. Multiple scale spatialization of demographic data with multi-factor linear regression and geographically weighted regression models[J]. 地理科学进展, 2016, 35(12): 1494-1505 https://doi.org/10.18306/dlkxjz.2016.12.006

1 引言

人口统计数据空间化可打破地域限制,实现以行政区域为单元的人口数据向规则格网形式的人口空间数据转换,从而模拟现实的人口分布情况,再现人口实际分布,对解决自然资源环境与人口耦合问题、制定国家宏观经济决策具有重要的意义(江东等, 2002)。

基于不同的人口分布影响因子及各种辅助数据,发展了多种人口统计数据空间化方法,主要包括:空间插值法(Linard et al, 2011)、多源数据融合法(王雪梅等, 2004; Yang, Huang et al, 2009; 杨续超等, 2013)、遥感估算法(卓莉等, 2005; 曹丽琴等, 2009; Azar et al, 2013)、基于土地利用建模方法(杨小唤等, 2002; 田永中等, 2004; Yang, Ma, 2009)等。其中,土地利用/覆盖的空间格局与人口的空间分布关系紧密,基于土地利用类型与人口分布的关系,建立多元统计回归模型进行人口空间分布模拟的方法应用最为广泛。在此基础上,为体现同一土地利用类型内部人口空间分布的差异性,部分学者通过分析不同地理区位的同一土地利用类型人口分布特征的差异,对土地利用数据进行特征分类以提高原有模型精度(杨小唤等, 2006);有些学者引入夜间灯光数据或其他辅助数据,对土地利用数据进行重分类或特征提取,优化原有模型方法(Zeng et al, 2011; 陈晴等, 2015; 王珂靖等, 2015)。考虑到传统多元统计回归建模方法是全局性建模分析,部分学者开始利用局部回归建模的方法进行人口数据空间化研究,如张建辰等(2014)利用地理加权回归(Geographically Weighted Regression, GWR)的局部分析方法对湖北鹤峰县村级人口统计数据进行人口空间分布模拟,取得了较好效果。

大量研究表明,尺度依赖性存在于各种地理学现象或过程中(李双成等, 2005)。因此,在进行人口统计数据空间化研究时,地理格网尺度问题同样十分重要且不可忽视。目前,在人口数据空间尺度问题方面多集中在格网形式的多尺度,常利用相关性分析和空间自相关方法进行尺度分析(杜国明等, 2007; 王培震等, 2012),模型的研究尺度多依据原始建模数据特征确定,往往是针对某种单一模型方法的多尺度研究(叶靖等, 2010; 王静等, 2012; 李月娇等, 2014)。因此,考虑到尺度效应对模型研究方法及结果的影响,还需针对不同建模方法进行多尺度的系统比较。

本文面向人口统计数据空间化模型方法的多尺度问题,针对2010年安徽省县级人口统计数据,在利用DMSP/OLS夜间灯光数据加强城镇居民地内部人口分布特征差异的基础上,结合农村居民地,建立多元统计回归和GWR等2种人口空间化模型,并设置1 km、5 km和10 km等3种格网尺度刻画人口空间分布,通过系统对比和误差分析,揭示不同模型方法在不同研究尺度上的差异。本文的模型方法对比和格网尺度分析,既可为人口空间数据的生产和应用提供科学依据,也可为今后其他类型的统计数据空间化研究提供方法借鉴。

2 研究区概况与数据处理

2.1 研究区概况

安徽省位于中国经济最发达的长江三角洲外围地区,经济发展较快,但省内自身经济发展不均衡,靠近江浙及铁路沿线交通便利地区经济水平较高,西北部平原地区经济发展较缓慢。全省地貌类型多样,海拔差异明显。主要地形特点为:山地、丘陵、平原各占1/3且相间排列,其中山地和丘陵多分布在南部和西部,如皖南丘陵山地和皖西丘陵山地,而平原地区多分布在长江和淮河流域。安徽省共有78个县市(16个地级市市辖区、62个县)。根据第六次全国人口普查数据,截至2010年底,安徽省常住总人口为5950万。全省城乡人口分布不均,城镇常住人口和乡村常住人口分别占总人口的43.01%和56.99%,且平原和丘陵地区人口分布密集,山地人口分布稀少。

2.2 数据源与数据处理

本文使用的基础数据主要包括:人口统计数据、行政区划数据、土地利用数据、DMSP/OLS夜间灯光数据、GDP统计数据、DEM及河流、坡度等基础地理信息数据。数据类型和数据来源见表1

表1   人口数据空间化数据源

Tab.1   Data sources for spatialization of population distribution

数据名称数据时相数据类型空间数据比例尺/分辨率数据来源
县级人口统计数据2010年表格/2010年人口普查资料
县级GDP统计数据2010年表格/安徽省社会经济统计年鉴
县级行政边界数据2010年矢量1:100万中国科学院资源环境科学数据中心
河流、交通数据2008年矢量1:100万中国科学院资源环境科学数据中心
地貌数据2009年矢量1:100万中国科学院资源环境科学数据中心
ASTER-DEM1999年栅格30 m中国科学院资源环境科学数据中心
土地利用数据2010年栅格1 km×1 km中国科学院资源环境科学数据中心
DMSP/OLS(F182010)2010年栅格1 km×1 km(重采样后)http://www.ngdc.noaa.gov

新窗口打开

其中,DMSP/OLS夜间灯光数据采用美国国家地球物理数据中心(NGDC)的F182010平均稳定灯光强度数据,其灰度值范围为0~63,本文主要用于城镇用地再分类处理。土地利用数据为1 km栅格,每个栅格中记录了1 km2内某种土地利用类型的面积比例,该数据主要用于构建人口空间化模型。其余数据用于人口特征分区及误差分析比较。

数据处理主要包括数据整合校对、统计数据和空间数据匹配以及投影转换和重采样。各地级市市辖区人口数由该市所辖所有区合并得到。如合肥市市辖区包括瑶海区、庐阳区、蜀山区、包河区4区,本文将4个行政区划进行合并,整体作为合肥市辖区,再将空间数据属性与合肥市辖区的统计人口数进行关联。以Albers(双标准纬线等面积割圆锥投影)为投影标准,统一对矢量数据(行政区划图)和栅格数据(土地利用数据和夜间灯光数据)进行投影转换。所有栅格数据均裁剪为安徽省范围且采用最邻近重采样法采样成1 km×1 km分辨率数据。

本文还依据夜间灯光数据对城镇居民地内部进行差异划分处理。DMSP/OLS夜间灯光数据灯光强度值对人口空间分布具有指示作用,可作为分级标准对城镇居民地进行重分类,利用重分类后的数据再进行基于土地利用的人口数据空间化处理,结果精度也明显提高。参考王珂靖等(2015)的研究,针对各分区的夜间灯光数据特征设置分级阈值,分别进行夜间灯光数据分级提取,得到反映不同城镇地区特点的夜间灯光分级图。将各分区的夜间灯光分级图与城镇用地进行叠加,实现基于DMSP/OLS夜间灯光对城镇用地的再分类,得到灯光强度值较低、经济相对落后且人口密度较小的城镇用地第一分级,以及灯光强度值高、经济水平相对发达且人口密度大的城镇用地第二分级(图1)。

图1   安徽省城镇用地再分类

Fig.1   Reclassified urban land-use data of Anhui Province

考虑到各地生态环境和经济发展水平不同,人口分布差异明显,采用同一个空间化模型进行人口空间建模,精度会受到限制,故本文在人口空间建模前预先开展区域人口特征一致性分区。依据王珂靖等(2015)的研究,以人口密度指标进行人口特征第一次分区,并选取多种相关指标构建人口分布特征指数,对其进行第二次分区。安徽省人口特征分区结果如图2所示,各分区人口主要特征情况见表2。从分区结果可以看出,从分区1到分区4,整体呈现出经济发展水平由高到低、人口密度由高到低、地势由平原到山地的变化趋势。该分区结果能够体现安徽省不同地区区域特点,满足人口分区建模要求。

图2   安徽省人口特征分区图

Fig.2   Population regionalization in Anhui Province

表2   安徽省各分区因素特征统计

Tab.2   Statistics of regionalization factors in Anhui Province

分区
序号
分区名称县(市、区)个数人口密度/(人/km2)GDP密度/(万元/km2)河流密度/(km/km2)坡度/°高程/m耕地面积
比例/%
城镇建设用地面积比例/%
1人口密度高值市辖区82414135061.023284830
2中北部平原较高人口密度地区285317830.982237815
3中部台地较低人口密度地区253346070.87458597
4南部山地低人口密度地区171552910.5815345192

新窗口打开

3 研究方法

在人口特征分区基础上,分别进行基于土地利用类型的统计分析建模;并引入夜间灯光数据(DMSP/OLS)进行分级,实现城镇用地再分类;并在此基础上分别采用多元统计回归和GWR等2种方法,针对各自模型特点建立了3种尺度的人口空间数据集,从而系统分析不同模型方法在各种尺度上的精度差异。本文总技术流程如图3所示。

图3   本文技术流程

Fig.3   Flow chart of the study

3.1 基于土地利用数据的多元统计回归方法

假设研究区内同一土地利用类型内部人口呈均匀分布,以不同土地利用面积为自变量,人口统计数据为因变量,建立多元统计回归模型,得到各土地利用类型的人口分布系数,据此模拟县级人口分布模式。模型的一般形式如式(1):

Pi=j=1naj×Sij+b(1)

式中: Pi为某分区下第i(i=1,2,3,…,m)县(市)的统计人口数; ajj(j=1,2,3,…,n)类土地利用下的人口分布系数/(人/km2); Sij为第i县(市) j类土地利用的面积/km2。根据“无土地则无人口”的原则,常数项b值为0。多元统计回归建模在SPSS软件中实现,具体以城镇用地第一分级、城镇用地第二分级和农村居民点用地面积为自变量(去掉常数项),以各县(市)人口统计数据为因变量进行建模。

3.2 GWR方法

GWR模型是对普通线性回归模型的扩展,即在回归参数中加入了数据的空间地理信息(Fotheringham et al, 2002)。通过加权最小二乘方法在局部范围内实现逐点参数估计,根据地理空间位置不断发生变化的参数估计值进行回归分析,进而直观地探测因地理位置不同而导致的变量之间关系或结构的差异,即空间非平稳性(Spatial Nonstatinarity)。该方法原理简单,便于操作,且估计分析结果清晰,能够进行统计检验,可与普通线性回归模型进行方法对比。

GWR是建立局部回归,在全局模型中加入地理位置的权重函数(不同观测点处的权重不同,一般与距离观测点的距离成反比,即距离观测点越近的观测值权重越大,反之越小),使得模型参数在回归过程中不断变化。形式如式(2):

yi=β0(ui,vi)+k=1pβk(ui,vi)xik+εi(2)

式中: (ui,vi)是第 i个采样点的坐标; β0(ui,vi)是第 i个采样点统计回归的常数项; βk(ui,vi)是第 i个采样点上的第k个回归参数; xik为第个 i采样点上第k个变量; p为某一采样点上参与回归的变量个数; εi为误差项, εi~N(0,σ2), Cov(εi,εj)=0(ij)。可简写为式(3):

yi=βi0+k=1pβikxik+εi(3)

β1k=β2k==βik,则地理加权回归模型就是普通线性回归模型。

本文利用GWR4软件进行安徽省人口空间化建模,考虑到分区1的8个样本量难以满足建模要求,而且GWR本身在建模中考虑局部邻域的特征,因此,不依据人口特征分区结果进行分区建模,而是对全省各县的人口数据统一进行自动分区的局部回归GWR建模。GWR模型参数选择如下:选用自适应的二次平方自适应空间核函数(Bi-square)进行建模,选择默认的黄金分割搜索程序进行带宽选取,以赤池信息量准则AIC(Akaike Information Criterion)作为信息评价准则。人口建模因子设置如下:以行政区划代码为id索引值,以各县(市)行政区划所在质心点坐标(x, y)作为地理位置坐标输入,同样以城镇用地第一分级、城镇用地第二分级和农村居民点用地面积为自变量(去掉常数项),以各县(市)人口统计数据为因变量进行建模。

3.3 多尺度数据处理方法

本文选取的研究尺度有3种:分别为1 km、5 km和10 km。在进行多尺度人口格网数据转换时,为保证研究基础数据的一致性,需要确保县级统计单元内的土地利用面积不发生变化。传统的尺度转换方法会对土地利用面积产生压缩或增加的变化,而土地利用类型的种类数量对各类型的土地面积误差有相关影响(刘明亮等, 2001),为避免此现象发生,本文采用多尺度格网套合的方式:生成不同尺度大小的规则格网单元,并与土地利用数据进行套合,利用区域统计方法统计格网范围内各种土地利用的面积,进而利用数据转换的方法,将格网型数据转成栅格数据,由此得到不同尺度大小的土地利用数据。

3.4 模型精度验证和比较方法

不同尺度模型的精度主要采用平均相对误差和相对误差百分比指标进行评价。具体方法为:汇总研究区行政边界内的人口空间数据,与对应的普查人口统计数据进行对比,即依据平差校正前的格网人口,利用县级行政边界区域进行统计,将得到的统计值与县市人口统计数据作比较,从而进行模型对比和误差分析。其中,平均相对误差值MPE、相对误差百分比RE的计算式如式(4)-(5):

MPE=i=1mREim(4)

RE=POP模拟值-POP统计值POP统计值×100%(5)

式中: POP模拟值为格网统计得到的县市人口模拟值; POP统计值为县市的人口普查数据;i表示第i个县(市);m表示安徽省内县市个数。

为揭示不同尺度下模型的表现,将开展2方面的比较研究:一是基于同一模型生成不同大小格网的人口空间数据,比较分析区域边界栅格化的影响,探索同一模型的最优建模尺度;二是基于不同模型生成同样大小的格网人口数据,比较分析不同模型方法对人口空间数据精度的影响。

4 结果与分析

4.1 不同尺度下的人口空间分布

基于多元统计回归模型和GWR模型,分别开展1 km、5 km和10 km等3种尺度的人口空间化建模。所有模型均通过了显著性检验(p<0.001),模型的可决系数(R2)均高于0.8(表3)。

表3   模型系数显著性检验结果表

Tab.3   Significance test of coefficients

分区基于多元统计回归方法的R2Sig.基于GWR方法的R2Sig.
1 km5 km10 km1 km5 km10 km
分区10.980.980.980.000.820.830.810.00
分区20.930.940.930.00
分区30.900.900.910.00
分区40.830.840.820.00

新窗口打开

图4展示了基于多元统计回归模型和GWR模型得到3种尺度的人口空间化结果。从图4可以明显看出,不同格网尺度的人口空间数据所表达的信息特征不同:1 km尺度格网较细密,人口空间化结果显示效果较平滑,栅格颗粒性不明显(图4a-4b);5 km尺度格网较1 km尺度加大,可以较明显地表现出人口空间分布特点,同时栅格的颗粒性也凸显出来(图4c-4d);10 km尺度格网较为粗大,对人口空间分布的展现比较粗略,栅格颗粒性十分显著(图4e-4f)。对于同一个研究尺度,不同模型方法获得的人口空间化结果整体趋势大致相同,但在细微局部地区结果有差异。

图4   安徽省多尺度人口空间化结果图

Fig.4   Spatialized population distribution in Anhui Province at three scales by multi-factor linear regression and geographically weighted regression methods

4.2 不同尺度下的模型精度比较

为了获得最适宜安徽省人口空间化的模型方法和研究尺度,对由2种模型生成的不同格网尺度人口空间数据进行精度验证和误差分析。

表4   安徽省各分区的平均相对误差百分比统计表

Tab.4   Relative errors for each region in Anhui Province

分区基于多元统计回归方法的误差(RE)/%基于GWR方法的
误差(RE)/%
1 km5 km10 km1 km5 km10 km
分区118.5217.1514.5117.7112.0018.09
分区219.9419.4022.1016.8916.4318.30
分区327.2026.5720.2724.0224.1822.18
分区429.4629.9229.6730.8634.5535.86
全省均值24.2023.7623.3822.3122.4123.35

新窗口打开

在3种尺度下同一方法的结果对比表明(表4):对于多元统计回归方法,从全省整体均值相对误差来看,10 km尺度的平均相对误差百分比最小,模型精度相对较高。此外,3种尺度都基本呈现从分区1到分区4相对误差逐渐增大的情况,反映出在山区人口空间化精度明显低于平原地区以及市辖区,有可能是山区地貌类型复杂所致。对于利用GWR方法获取的格网人口数据,从全省整体均值相对误差来看,在1 km尺度的平均相对误差百分比最小,模型精度相对较高。同样,3种尺度都基本呈现从分区1到分区4相对误差值逐渐增大的情况。2种方法在同一尺度的模型精度对比表明:基于GWR方法的整体平均相对误差在3个尺度上均低于基于多元统计回归的方法。随着尺度的增加,基于多元统计回归方法的误差值逐渐减小,在10 km尺度达到最小值23.38%;而基于GWR方法的误差值则逐渐增大,在10 km尺度达到最大值23.35%。最终在1 km尺度上2种方法的误差值相差最大,相差达1.89%;其次为5 km尺度,相差1.35%;相差最小的是在10 km,仅相差0.03%。单从整体平均相对误差值角度来看,基于GWR模型的人口空间化方法生成的人口空间化数据误差较低,模型精度较高,且在1 km尺度达到模型误差最低。

表5   误差分布范围分段统计表

Tab.5   County statistics for each error range

模型方法尺度误差范围/%县个数占总数比例/%
基于夜间
灯光数据
再分类的
多元统计
回归方法
1 km<102430.77
10~202126.92
20~30911.54
>302430.77
5 km<102126.92
10~202430.77
20~301316.67
>302025.64
10 km<102633.33
10~202228.21
20~301114.10
>301924.36
基于夜间
灯光数据
再分类的
GWR方法
1 km<102633.33
10~201924.36
20~301316.67
>302025.64
5 km<102430.76
10~202228.21
20~301012.82
>302228.21
10 km<102228.21
10~201924.36
20~301620.51
>302126.92

新窗口打开

从误差分段统计表可知(表5),1 km尺度上,基于GWR方法的误差在<10%的范围区县分布明显高于基于多元统计回归方法,并且误差在>30%的范围区县分布明显降低,因此从整体误差来看基于GWR模型方法要小于基于多元统计回归方法;对于5 km尺度,虽然基于GWR方法的误差在<10%的范围区县分布仍高于基于多元统计回归方法,但误差在>30%的范围区县分布则较多,因此从整体误差来看基于GWR模型方法虽小于基于多元统计回归方法,但是二者差距与1 km尺度相比有所减少;对于10 km尺度,基于多元统计回归方法的误差在<10%的范围区县分布比例最多33.33%,明显高于基于GWR方法,且误差在>30%的范围区县分布又明显降低,因此从整体误差来看2种方法差距最小,仅相差0.03%。综上可知,对于3种尺度,基于GWR模型方法同多元统计回归方法相比精度较高,且GWR模型在1 km尺度获取的人口空间化结果的误差值最低(22.31%)。

4.3 模型精度的影响因素

为进一步探讨地形地貌因素对于模型精度的影响,比较了不同高程、坡度及地貌类型分布下模型的误差分布情况。

2种模型方法都呈现由分区1(多市辖区、平原地区)到分区4(山区)误差值逐渐增大的趋势,说明市辖区以及平原地区的人口数据空间化精度要优于偏远山区,地貌类型因素很可能是导致人口空间化误差的原因。按照不同高程和坡度阈值范围,计算各阈值范围内所有区县的平均相对误差百分比,并依据模型方法和格网尺度进行汇总(表6)。

表6可知,随着高程和坡度的增大,无论是基于多元统计方法还是基于GWR模型方法,在相同尺度的误差值都基本呈现逐渐增大的趋势,但针对不同的高程和坡度范围,不同模型的误差值也有一定规律:在1 km和5 km尺度,高程值<150 m或坡度值<6°的区县,采用GWR模型方法的误差值均低于采用多元统计回归方法的误差值,说明此时GWR模型更具优势;而当高程值>150 m或坡度值>6°时,采用GWR模型方法的误差值均高于采用多元统计回归方法的误差值,说明此时多元统计回归方法更具优势。在10 km尺度,高程值<50 m或坡度值<3°的区县,采用GWR模型方法的误差值均低于采用多元统计回归方法的误差值,说明此时GWR模型更具优势;而高程值>50 m或坡度值>3°时,采用GWR模型方法的误差值均高于采用多元统计回归方法的误差值,说明此时多元统计回归方法更具优势。由此可见,不同的高程和坡度对模型方法产生的人口误差影响不同。

为进一步研究人口误差与地貌类型之间的关系,绘制人口误差空间分布图,并与安徽省地貌类型图进行对比。参考周成虎等(2010)对中国地貌图集的研究成果,绘制安徽省地貌类型(图5),以及基于2种方法在不同尺度的误差空间分布图(图6)。

图5   安徽省地貌类型图

Fig.5   Map of landforms in Anhui province

图6   安徽省1 km、5 km和10 km尺度误差空间分布图

Fig.6   Spatial distribution of error at three scales by multi-factor linear regression and geographically weighted regression methods in Anhui Province

对比图5图6可知,安徽省人口误差空间分布同该省的地貌类型关系密切:人口误差值空间上呈现北部低南部高的趋势,从地貌类型复杂程度上看,北部地貌类型相对单一,多为平原或台地,而南部地貌类型十分复杂,多为地面起伏度变化巨大的山地。不难看出,人口误差值大的地区其地貌类型复杂程度也较高。具体而言,对于多元统计回归方法,误差值大于40%的区县在整个安徽省分布分散,多数分布在南部山区(如金寨县、石台县等地),但在部分低海拔台地地区也有出现(如定远县);对于GWR方法,误差值大于40%的区县在整个安徽

省分布较为集中,主要在南部山区(如金寨县),在北部几乎没有分布,原因很可能是由于南方地貌类型复杂,在土地利用数据解译过程中难免出现漏分和错分的情况,从而造成土地利用数据精度低于平原地区,这对基于土地利用数据进行多元统计回归方法或者GWR方法的人口数据空间化模型精度产生影响。

需要指出的是,在利用多元统计回归方法时,长丰县地貌类型仅有台地和平原2种类型,虽同南部山区相比相对简单,但误差值在3个尺度上都异常偏高。可见,除了地貌类型外,地理位置也可能导致误差产生:因为长丰县地处合肥市辖区和淮南市辖区之间,虽然人口特征分区时将长丰县划分为分区2,但其真实的人口分布难免会受到2个分区1的市辖区影响,所以当同其他分区2的区县一起进行人口空间化建模后,其人口模拟值就与真实值出现较大差异。可见,本文所采用的人口特征分区能将研究区域按照相似的社会经济发展水平以及地理环境划分,与按照全省统一建模相比可在整体精度方面有明显提升;但对于某些情况复杂的区域可能描述不够准确,导致个别误差异常值的出现。

表6   按照高程和坡度误差汇总表

Tab.6   Error statistics by elevation and slope

分级阈值
/(m/°)
县数量
/个
多元统计方法误差百分比/%GWR方法误差百分比/%
1 km5 km10 km1 km5 km10 km
高程0~504918.7817.2419.8316.6015.1516.98
50~1501134.7836.6818.8330.5532.8429.38
>1501832.3433.5232.2532.9435.9737.42
坡度0~33520.4017.9623.7317.6315.8317.41
3~61920.7721.7515.0617.1516.8018.58
>62432.4433.8526.2333.2736.4535.79

新窗口打开

5 结论与讨论

本文在人口特征分区的基础上,以DMSP/OLS夜间灯光数据灯光强度值作为分级标准对城镇居民地进行重分类,并基于多元统计回归和地理加权回归(GWR)2种方法进行人口统计数据空间化建模处理,生成1 km、5 km和10 km等3种尺度的人口空间数据,针对结果进行模型精度比较和误差分析。研究表明:

(1) 人口空间化数据精度不仅与建模所用的方法关系密切,还会受到生成的格网尺度大小影响。在本文中,随着尺度的增加,基于多元统计回归方法的人口空间数据误差值逐渐减小,而基于GWR方法的误差值则逐渐增大。从整体平均相对误差来看,基于GWR模型方法同多元统计回归方法相比精度较高,且在1 km尺度达到模型误差最小值22.31%。由此可见,加入地理位置的GWR模型方法更能够体现局部特征,尤其是在1 km精细尺度下,相对于普通多元统计回归方法模型精度有进一步的提升。

(2) 2种模型在不同高程和坡度组合的地理环境下表现有所差异。多元统计回归模型在10 km尺度、高程值<50 m或坡度值<3°的研究区域更具优势,而GWR模型方法在1 km和5 km尺度、高程值<150 m或坡度值<6°的研究区域更具优势。这种差异说明研究区域的高程和坡度特点也是影响人口空间化建模方法选择的一个重要因素,尤其是地理差异性显著的地区,应考虑综合多种模型方法,有针对性地实现空间化。

区域地形地貌条件与人口空间数据误差有较强的关联,地貌类型复杂的山区相对平原地区人口误差较大。本文主要是基于土地利用数据进行人口统计数据空间化处理,因此土地利用数据的精度对人口空间分布结果影响显著。在土地利用数据生产过程中,对于地形相对复杂的山区及平原山地过渡地区,遥感影像的解译精度会受到地形地貌的影响,而土地利用数据精度没有平原地区高,所以造成基于同一种模型方法不同地貌类型的人口精度差异显著。可见,数据源质量对于人口空间化精度十分重要,在当今科学技术迅速发展时代,选用高分辨率的遥感数据对于提高人口空间化精度是一个不错的选择。在未来的研究中,将考虑集成更高分辨率的土地利用数据及其他多源数据开展多尺度人口空间化研究。

The authors have declared that no competing interests exist.


参考文献

[1] 曹丽琴, 李平湘, 张良培. 2009.

基于 DMSP/OLS夜间灯光数据的城市人口估算: 以湖北省各县市为例

[J]. 遥感信息, (1): 83-87.

https://doi.org/10.3969/j.issn.1000-3177.2009.01.016      URL      [本文引用: 1]      摘要

城市人口数据是了解城市发展的重要园素,对研究城市环境等方面也有重要意义.随着GIS和遥感技术的发展,利用大面积、多时相的遥感数据研究城市人口的技术也日渐成熟.本文借助遥感数据和GIS手段分析2000年湖北省各县市DMSP/OLS卫星的夜间灯光数据亮度值与各县市城镇人口之间的关系,建立相应的模型模拟湖北省2002年76个县市城区人口,其结果预测吻合度为98.94%,平均相对误差为10.95%,说明利用夜间灯光数据对城镇人口做短期的预测可以达到很好的效果.

[Cao L Q, Li P X, Zhang L P.2009.

Urban population estimation based on the DMSP/OLS night-time satellite data: A case of Hubei Province

[J]. Remote Sensing Information, (1): 83-87.]

https://doi.org/10.3969/j.issn.1000-3177.2009.01.016      URL      [本文引用: 1]      摘要

城市人口数据是了解城市发展的重要园素,对研究城市环境等方面也有重要意义.随着GIS和遥感技术的发展,利用大面积、多时相的遥感数据研究城市人口的技术也日渐成熟.本文借助遥感数据和GIS手段分析2000年湖北省各县市DMSP/OLS卫星的夜间灯光数据亮度值与各县市城镇人口之间的关系,建立相应的模型模拟湖北省2002年76个县市城区人口,其结果预测吻合度为98.94%,平均相对误差为10.95%,说明利用夜间灯光数据对城镇人口做短期的预测可以达到很好的效果.
[2] 陈晴, 侯西勇. 2015.

集成土地利用数据和夜间灯光数据优化人口空间化模型

[J]. 地球信息科学学报, 17(11): 1370-1377.

https://doi.org/10.3724/SP.J.1047.2015.01370      URL      Magsci      摘要

人口统计数据空间化是解决统计数据与自然要素数据融合分析的有效途径.随着RS和GIS技术的发展,人口统计数据空间化方法推陈出新,其中,土地利用数据、夜间灯光数据是人口空间化研究中普遍利用的数据源,但各有优、缺点:土地利用数据中的城镇用地、农村居民点能准确表示人口分布的空间范围,却不能反映其内部的人口密度差异特征;夜间灯光数据的强度信息能体现人口分布的疏密程度,但其像元溢出问题显著夸大人口分布范围,像元过饱和现象也影响着人口数据空间化结果的精度.本研究以中国大陆沿海区域为例,尝试集成土地利用数据和夜间灯光数据优化人口空间化方法,设计了基于精度阈值和动态样本的渐进回归与分区建模的方法,获得了中国沿海2000、2005、2010年1km分辨率人口空间化数据.结果表明,优化模型显著提高了研究区整体的精度,尤其适用于人口空间结构内部差异较为显著的区域.

[Chen Q, Hou X Y.2015.

An improved population spatialization model by combining land use data and DMSP/OLS data

[J]. Journal of Geo-Information Science, 17(11): 1370-1377.]

https://doi.org/10.3724/SP.J.1047.2015.01370      URL      Magsci      摘要

人口统计数据空间化是解决统计数据与自然要素数据融合分析的有效途径.随着RS和GIS技术的发展,人口统计数据空间化方法推陈出新,其中,土地利用数据、夜间灯光数据是人口空间化研究中普遍利用的数据源,但各有优、缺点:土地利用数据中的城镇用地、农村居民点能准确表示人口分布的空间范围,却不能反映其内部的人口密度差异特征;夜间灯光数据的强度信息能体现人口分布的疏密程度,但其像元溢出问题显著夸大人口分布范围,像元过饱和现象也影响着人口数据空间化结果的精度.本研究以中国大陆沿海区域为例,尝试集成土地利用数据和夜间灯光数据优化人口空间化方法,设计了基于精度阈值和动态样本的渐进回归与分区建模的方法,获得了中国沿海2000、2005、2010年1km分辨率人口空间化数据.结果表明,优化模型显著提高了研究区整体的精度,尤其适用于人口空间结构内部差异较为显著的区域.
[3] 杜国明, 张树文, 张有全. 2007.

城市人口分布的空间自相关分析: 以沈阳市为例

[J]. 地理研究, 26(2): 383-390.

https://doi.org/10.3321/j.issn:1000-0585.2007.02.020      URL      Magsci      [本文引用: 1]      摘要

为探测经典城市人口密度模型在微观层面上的适用性,本文通过计算基于格网的沈阳市人口景观密度,利用地统计学的理论与方法来分析其空间自相关性和变异性.研究发现:在10种不同采样粒度上人口密度半变异函数都符合球状模型,表征着城市人口分布具有较强的空间自相关性和变异性;但由于粒度不同,人口密度的空间自相关尺度不同,块金值不同,基台值不同,块金值与基台值的比值差异较大,证明人口分布的空间自相关具有较强的尺度依赖性;对于700m粒度而言,通过计算不同方向的半变异函数曲线可以发现,沈阳市人口密度呈现典型的带状异向性,反映出人口分布在不同方向上具有不同的结构特征.因此,研究城市人口分布时,可以城市人口分布的自相关性和变异性分析为基础,并须充分注意适宜尺度的选择和结构特征的识别.

[Du G M, Zhang S W, Zhang Y Q.2007.

Analyzing spatial auto-correlation of population distribution: A case of Shenyang City

[J]. Geographical Research, 26(2): 383-390.]

https://doi.org/10.3321/j.issn:1000-0585.2007.02.020      URL      Magsci      [本文引用: 1]      摘要

为探测经典城市人口密度模型在微观层面上的适用性,本文通过计算基于格网的沈阳市人口景观密度,利用地统计学的理论与方法来分析其空间自相关性和变异性.研究发现:在10种不同采样粒度上人口密度半变异函数都符合球状模型,表征着城市人口分布具有较强的空间自相关性和变异性;但由于粒度不同,人口密度的空间自相关尺度不同,块金值不同,基台值不同,块金值与基台值的比值差异较大,证明人口分布的空间自相关具有较强的尺度依赖性;对于700m粒度而言,通过计算不同方向的半变异函数曲线可以发现,沈阳市人口密度呈现典型的带状异向性,反映出人口分布在不同方向上具有不同的结构特征.因此,研究城市人口分布时,可以城市人口分布的自相关性和变异性分析为基础,并须充分注意适宜尺度的选择和结构特征的识别.
[4] 江东, 杨小唤, 王乃斌, . 2002.

基于RS、GIS的人口空间分布研究

[J]. 地球科学进展, 17(5): 734-738.

https://doi.org/10.3321/j.issn:1001-8166.2002.05.016      URL      Magsci      摘要

<p>人口的空间分布问题涉及人口学、经济学、地理学等多个学科,统计型人口数据的空间化是&quot;数字地球&quot;的重要研究内容。阐述了人口地域分布的基本理论,回顾了人口空间分布的研究进展,结合研究实践,提出了在遥感、GIS技术支持下,统计型人口数据空间化的研究思路和技术流程,并对该方法的特点和应用前景做了展望。</p>

[Jiang D, Yang X H, Wang N B, et al.2002.

Study on spatial distribution of population based on remote sensing and GIS

[J]. Advance in Earth Sciences, 17(5): 734-738.]

https://doi.org/10.3321/j.issn:1001-8166.2002.05.016      URL      Magsci      摘要

<p>人口的空间分布问题涉及人口学、经济学、地理学等多个学科,统计型人口数据的空间化是&quot;数字地球&quot;的重要研究内容。阐述了人口地域分布的基本理论,回顾了人口空间分布的研究进展,结合研究实践,提出了在遥感、GIS技术支持下,统计型人口数据空间化的研究思路和技术流程,并对该方法的特点和应用前景做了展望。</p>
[5] 李双成, 蔡运龙. 2005.

地理尺度的转换若干问题的初步探讨

[J]. 地理研究, 24(1): 11-18.

https://doi.org/10.11821/yj2005010002      URL      Magsci      [本文引用: 1]      摘要

<p>大量研究证实,地理学研究对象格局与过程及其时空特征均是尺度依存的,随着研究工作的不断深入,尺度问题越来越展示出其重要性。针对地理学各个分支学科都不同程度存在诸如概念模糊、转换模式不统一、转换效果评价缺乏客观标准等与尺度相关问题,本文对一些有关尺度转换的议题进行了探讨。在评述了尺度及其转换研究的地理学意义后,着重阐述了地理学尺度研究理论框架的内容和对象,提出了地理科学中需要解决的10个关键尺度问题,并给出了初步的解决方案。</p>

[Li S C, Cai Y L.2005.

Some scaling issues of geography

[J]. Geographical Research, 24(1): 11-18.]

https://doi.org/10.11821/yj2005010002      URL      Magsci      [本文引用: 1]      摘要

<p>大量研究证实,地理学研究对象格局与过程及其时空特征均是尺度依存的,随着研究工作的不断深入,尺度问题越来越展示出其重要性。针对地理学各个分支学科都不同程度存在诸如概念模糊、转换模式不统一、转换效果评价缺乏客观标准等与尺度相关问题,本文对一些有关尺度转换的议题进行了探讨。在评述了尺度及其转换研究的地理学意义后,着重阐述了地理学尺度研究理论框架的内容和对象,提出了地理科学中需要解决的10个关键尺度问题,并给出了初步的解决方案。</p>
[6] 李月娇, 杨小唤, 王静. 2014.

基于景观生态学的人口空间数据适宜格网尺度研究: 以山东省为例

[J]. 地理与地理信息科学, 30(1): 97-100.

https://doi.org/10.7702/dlydlxxkx20140120      URL      摘要

以山东省为研究区,在100m、200m、300m、400m、500m、600m、700m、800m、900m、1km 10个格网尺度人口格网数据的基础上,引入景观生态学的相关指数和方法,探索不同格网尺度表达人口空间分布的适宜性。结果表明:在用传统的基于土地利用/覆被的人口数据空间化方法进行人口空间化的过程中,并不是尺度越精细所能表达的信息越细致、完整,400m是一个人口尺度变化上的特征点,所反映的人口分布信息最细致且完整性好。由此可得,在进行山东省人口空间化的过程中,400m是一个比较适宜的尺度。

[Li Y J, Yang X H, Wang J.2014.

Grid size suitability of population spatial distribution in Shandong Province based on landscape ecology

[J]. Geography and Geo-Information Science, 30(1): 97-100.]

https://doi.org/10.7702/dlydlxxkx20140120      URL      摘要

以山东省为研究区,在100m、200m、300m、400m、500m、600m、700m、800m、900m、1km 10个格网尺度人口格网数据的基础上,引入景观生态学的相关指数和方法,探索不同格网尺度表达人口空间分布的适宜性。结果表明:在用传统的基于土地利用/覆被的人口数据空间化方法进行人口空间化的过程中,并不是尺度越精细所能表达的信息越细致、完整,400m是一个人口尺度变化上的特征点,所反映的人口分布信息最细致且完整性好。由此可得,在进行山东省人口空间化的过程中,400m是一个比较适宜的尺度。
[7] 刘明亮, 唐先明, 刘纪远, . 2001.

基于1 km格网的空间数据尺度效应研究

[J]. 遥感学报, 5(3): 183-190.

https://doi.org/10.3321/j.issn:1007-4619.2001.03.005      URL      Magsci      [本文引用: 1]      摘要

由全国1∶10万比例尺资源环境遥感数据库生成的1km格网土地利用/土地覆盖成分数据,分析了依据面积最大原则生成1km单一属性值栅格数据与原始成分类型数据之间的误差分布。研究了按照面积最大和中心属性值法从1km栅格数据粗化为4,8和10km栅格数据过程中的误差分布特征,并探讨了地貌特征对这种尺度效应的影响。结果显示,1km单一属性栅格数据压缩了城镇及居民点的实际面积(减少多于60%),而增加了林地和旱地的面积;对于每单元栅格而言,各类型的面积误差(成分面积与尺度转换后保留的单一类型面积之间的差值)与相应尺度栅格范围内的土地利用复杂程度是对应的;由最大面积法的数据尺度转换引起的误差是随着尺度的增大而增加,而中心属性值法转换过程的误差呈现近似随机分布。应用面积最大法转换空间数据尺度中的误差分布受地貌类型的影响是显著的,水田与旱地面积在数据粗化过程中产生的误差在山地和丘陵区明显高于在其他地貌类型上的误差。中心属性值法数据粗化受地貌类型的影响并不显著。

[Liu M L, Tang X M, Liu J Y, et al.2001.

Research on scaling effect based on 1 km grid cell data

[J]. Journal of Remote Sensing, 5(3): 183-190.]

https://doi.org/10.3321/j.issn:1007-4619.2001.03.005      URL      Magsci      [本文引用: 1]      摘要

由全国1∶10万比例尺资源环境遥感数据库生成的1km格网土地利用/土地覆盖成分数据,分析了依据面积最大原则生成1km单一属性值栅格数据与原始成分类型数据之间的误差分布。研究了按照面积最大和中心属性值法从1km栅格数据粗化为4,8和10km栅格数据过程中的误差分布特征,并探讨了地貌特征对这种尺度效应的影响。结果显示,1km单一属性栅格数据压缩了城镇及居民点的实际面积(减少多于60%),而增加了林地和旱地的面积;对于每单元栅格而言,各类型的面积误差(成分面积与尺度转换后保留的单一类型面积之间的差值)与相应尺度栅格范围内的土地利用复杂程度是对应的;由最大面积法的数据尺度转换引起的误差是随着尺度的增大而增加,而中心属性值法转换过程的误差呈现近似随机分布。应用面积最大法转换空间数据尺度中的误差分布受地貌类型的影响是显著的,水田与旱地面积在数据粗化过程中产生的误差在山地和丘陵区明显高于在其他地貌类型上的误差。中心属性值法数据粗化受地貌类型的影响并不显著。
[8] 田永中, 陈述彭, 岳天祥, . 2004.

基于土地利用的中国人口密度模拟

[J]. 地理学报, 59(2): 283-292.

https://doi.org/10.3321/j.issn:0375-5444.2004.02.015      URL      Magsci      摘要

<p>土地利用数据综合了影响人口分布的众多因素的信息。根据分县控制、分城乡、分区建模的思路,建立基于土地利用的中国1km栅格人口模型。对农村人口采用线性加权模型进行模拟,根据全国12个农业生态区内人口与各类农业用地之间的相关关系选取指标,采用逐步回归计算各指标的回归系数,并结合土地的生产力及其与人口的相关性,确定各指标的加权系数。对城市人口,建立基于城镇规模的人口距离衰减加幂指数模型。结果分析表明,&ldquo;胡焕庸&rdquo;线以东人口占全国的94.58%,人口密度是该线以西的21倍;东部人口集中于黄淮海地区、四川盆地、长江中下游、东北平原及沿海地区,东南沿海又表现为&ldquo;点轴&rdquo;分布的特点。验证表明,模拟结果具有较高的精度。</p>

[Tian Y Z, Chen S P, Yue T X, et al.2004.

Simulation of Chinese population density based on land use

[J]. Acta Geographica Sinica, 59(2): 283-292.]

https://doi.org/10.3321/j.issn:0375-5444.2004.02.015      URL      Magsci      摘要

<p>土地利用数据综合了影响人口分布的众多因素的信息。根据分县控制、分城乡、分区建模的思路,建立基于土地利用的中国1km栅格人口模型。对农村人口采用线性加权模型进行模拟,根据全国12个农业生态区内人口与各类农业用地之间的相关关系选取指标,采用逐步回归计算各指标的回归系数,并结合土地的生产力及其与人口的相关性,确定各指标的加权系数。对城市人口,建立基于城镇规模的人口距离衰减加幂指数模型。结果分析表明,&ldquo;胡焕庸&rdquo;线以东人口占全国的94.58%,人口密度是该线以西的21倍;东部人口集中于黄淮海地区、四川盆地、长江中下游、东北平原及沿海地区,东南沿海又表现为&ldquo;点轴&rdquo;分布的特点。验证表明,模拟结果具有较高的精度。</p>
[9] 王静, 杨小唤, 石瑞香. 2012.

山东省人口空间分布格局的多尺度分析

[J]. 地理科学进展, 31(2): 176-182.

https://doi.org/10.11820/dlkxjz.2012.02.006      URL      Magsci      [本文引用: 1]      摘要

人口空间分布具有一定的尺度依赖性,从不同尺度上对人口空间分布格局进行分析,可以更确切、真实地揭示人口的空间分布规律,为制定区域发展规划、灾害评价、环境保护等提供科学依据。本文以山东省为研究区,运用空间自相关方法和统计相关分析方法,比较市级、县级、1 km三个尺度上人口分布的空间自相关性及其与环境—经济因子的统计相关性,试图探讨不同尺度下人口的空间分布模式及影响(指示)因素,从不同尺度揭示人口的空间分布格局特征。结果表明:①从不同尺度对人口的空间分布格局进行分析,可以得到从宏观到微观不同详细程度的信息。从市级尺度分析,可以得到山东省整体的人口空间分布特征;从县级尺度分析,可以得到山东省各市内部的人口空间分布特征;从1 km尺度分析,可以得到山东省各县内部的人口空间分布特征。②不同尺度上,人口的空间分布格局特征不同。市级和县级尺度上,人口分布受环境—经济因子的影响表现出与一些因子显著相关,而受空间集聚的作用较小;1 km尺度上,人口分布与环境—经济因子的相关性较小,而主要受空间集聚的作用,在县内部,人口往往集中分布于某一区域,呈现出典型的集聚分布模式。

[Wang J, Yang X H, Shi R X.2012.

Spatial distribution of the population in Shandong Province at multi-scales

[J]. Progress in Geography, 31(2): 176-182.]

https://doi.org/10.11820/dlkxjz.2012.02.006      URL      Magsci      [本文引用: 1]      摘要

人口空间分布具有一定的尺度依赖性,从不同尺度上对人口空间分布格局进行分析,可以更确切、真实地揭示人口的空间分布规律,为制定区域发展规划、灾害评价、环境保护等提供科学依据。本文以山东省为研究区,运用空间自相关方法和统计相关分析方法,比较市级、县级、1 km三个尺度上人口分布的空间自相关性及其与环境—经济因子的统计相关性,试图探讨不同尺度下人口的空间分布模式及影响(指示)因素,从不同尺度揭示人口的空间分布格局特征。结果表明:①从不同尺度对人口的空间分布格局进行分析,可以得到从宏观到微观不同详细程度的信息。从市级尺度分析,可以得到山东省整体的人口空间分布特征;从县级尺度分析,可以得到山东省各市内部的人口空间分布特征;从1 km尺度分析,可以得到山东省各县内部的人口空间分布特征。②不同尺度上,人口的空间分布格局特征不同。市级和县级尺度上,人口分布受环境—经济因子的影响表现出与一些因子显著相关,而受空间集聚的作用较小;1 km尺度上,人口分布与环境—经济因子的相关性较小,而主要受空间集聚的作用,在县内部,人口往往集中分布于某一区域,呈现出典型的集聚分布模式。
[10] 王珂靖, 蔡红艳, 杨小唤, . 2015.

基于城镇居民用地再分类的人口数据空间化方法研究: 以长江中游4省为例

[J]. 遥感技术与应用, 30(5): 987-995.

https://doi.org/10.11873/j.issn.1004-0323.2015.5.0987      URL      Magsci      摘要

基于土地利用数据的人口统计数据空间化方法,在处理过程中会出现同一土地利用类型下人口难以细分的情况,从而影响人口空间数据精度.引入夜间灯光信息并提出了一种基于夜间灯光强度对城镇居民地再分类的人口空间化方法,以改善人口空间数据精度.基于DMSP/OLS夜间灯光及土地利用数据,以长江中游4省为研究区进行方法试验.研究结果显示:利用夜间灯光数据对城镇居民地再分类后,各分区模型的调整R2都提高到了0.8以上,人口空间数据总体平均相对误差较重分类前降低了12.32%.说明该方法在提高传统人口数据空间化模型精度的基础上能够细化城镇居民地人口空间分布.

[Wang K J, Cai H Y, Yang X H, et al.2015.

Spatialization method for census data based on reclassifying residential land use in urban areas: A case study in the middle reaches of the Yangtze River Watershed

[J]. Remote Sensing Technology and Application, 30(5): 987-995.]

https://doi.org/10.11873/j.issn.1004-0323.2015.5.0987      URL      Magsci      摘要

基于土地利用数据的人口统计数据空间化方法,在处理过程中会出现同一土地利用类型下人口难以细分的情况,从而影响人口空间数据精度.引入夜间灯光信息并提出了一种基于夜间灯光强度对城镇居民地再分类的人口空间化方法,以改善人口空间数据精度.基于DMSP/OLS夜间灯光及土地利用数据,以长江中游4省为研究区进行方法试验.研究结果显示:利用夜间灯光数据对城镇居民地再分类后,各分区模型的调整R2都提高到了0.8以上,人口空间数据总体平均相对误差较重分类前降低了12.32%.说明该方法在提高传统人口数据空间化模型精度的基础上能够细化城镇居民地人口空间分布.
[11] 王培震, 石培基, 魏伟, . 2012.

基于空间自相关特征的人口密度格网尺度效应与空间化研究: 以石羊河流域为例

[J]. 地球科学进展, 27(12): 1363-1372.

https://doi.org/10.11867/j.issn.1001-8166.2012.12.1363      URL      Magsci      [本文引用: 1]      摘要

<p>以石羊河流域为例,运用GCAWI法、空间自相关指数以及考虑空间自相关性的多(单)中心指数模型等实现了乡镇单元向格网单元图层的转化、适宜格网大小的确定以及人口密度的空间模拟。结果表明:①石羊河流域人口密度的空间分布差异较大而又相对集中,具有&ldquo;3点4线3区&rdquo;的&ldquo;点&mdash;线&mdash;区&rdquo;状空间结构;②不同单元大小的格网图层提高了流域整体的空间自相关性,Moran&rsquo;s I指数表现出较大的差异性和偶然性;③石羊河流域人口密度空间分布存在明显的正空间自相关,8 000~10 000 m是表现流域人口密度空间分布特征的最优选择范围;④空间自相关性影响下的人口密度空间化多(单)中心模型大大提高传统指数模型的精度,却改变了距离衰减系数的性质和大小,多中心和单中心模型模拟系数的差异主要是由金昌人口密度中心引起的。</p>

[Wang P Z, Shi P J, Wei W, et al.2012.

Grid scale effect and spatialization of population density based on the characteristics of spatial autocorrelation in Shiyang River Basin

[J]. Advances in Earth Science, 27(12): 1363-1372.]

https://doi.org/10.11867/j.issn.1001-8166.2012.12.1363      URL      Magsci      [本文引用: 1]      摘要

<p>以石羊河流域为例,运用GCAWI法、空间自相关指数以及考虑空间自相关性的多(单)中心指数模型等实现了乡镇单元向格网单元图层的转化、适宜格网大小的确定以及人口密度的空间模拟。结果表明:①石羊河流域人口密度的空间分布差异较大而又相对集中,具有&ldquo;3点4线3区&rdquo;的&ldquo;点&mdash;线&mdash;区&rdquo;状空间结构;②不同单元大小的格网图层提高了流域整体的空间自相关性,Moran&rsquo;s I指数表现出较大的差异性和偶然性;③石羊河流域人口密度空间分布存在明显的正空间自相关,8 000~10 000 m是表现流域人口密度空间分布特征的最优选择范围;④空间自相关性影响下的人口密度空间化多(单)中心模型大大提高传统指数模型的精度,却改变了距离衰减系数的性质和大小,多中心和单中心模型模拟系数的差异主要是由金昌人口密度中心引起的。</p>
[12] 王雪梅, 李新, 马明国. 2004.

基于遥感和GIS的人口数据空间化研究进展及案例分析

[J]. 遥感技术与应用, 19(5): 320-327.

https://doi.org/10.3969/j.issn.1004-0323.2004.05.006      URL      Magsci      摘要

人口数据对于全球、洲际、区域尺度的人与环境交互作用研究的重要性已经被广泛地认知.但基于行政单位的人口统计数据难以与基于自然单位的环境数据相匹配,必须通过建模对人口数据进行空间化分布.人口数据空间化建模的基本思路是将人口数据和地球表面的地理因子关联起来,遥感和地理信息系统提供了有效的工具.介绍了国内外基于遥感和GIS的人口空间化研究的主要项目和方法思路.以黑河流域为研究区,在流域尺度上把典型的人口估计结果GPW、UNEP/GRID、LandScan和中国1 km格网的人口资料与政府人口统计数据进行比较分析,可以看出国内外的研究机构和研究人员已做了大量的相关工作.国外研究主要包括从遥感解译信息反演人口数据、从DMSP-OLS夜间灯光数据反演人口数据和从遥感获取的光谱特征直接反演人口数据.国内研究尽管起步较晚但发展很快,主要是根据土地利用数据和其它地理因子(如高程、道路、居民区等)建立回归模型.黑河流域人口空间分布的比较结果表明中国1 km格网人口数据是几种数据中与实践情况最相符合的.

[Wang X M, Li X, Ma M G.2004.

Advance and case analysis in population spatial distribution based on remote sensing and GIS

[J]. Remote Sensing Technology and Application, 19(5): 320-327.]

https://doi.org/10.3969/j.issn.1004-0323.2004.05.006      URL      Magsci      摘要

人口数据对于全球、洲际、区域尺度的人与环境交互作用研究的重要性已经被广泛地认知.但基于行政单位的人口统计数据难以与基于自然单位的环境数据相匹配,必须通过建模对人口数据进行空间化分布.人口数据空间化建模的基本思路是将人口数据和地球表面的地理因子关联起来,遥感和地理信息系统提供了有效的工具.介绍了国内外基于遥感和GIS的人口空间化研究的主要项目和方法思路.以黑河流域为研究区,在流域尺度上把典型的人口估计结果GPW、UNEP/GRID、LandScan和中国1 km格网的人口资料与政府人口统计数据进行比较分析,可以看出国内外的研究机构和研究人员已做了大量的相关工作.国外研究主要包括从遥感解译信息反演人口数据、从DMSP-OLS夜间灯光数据反演人口数据和从遥感获取的光谱特征直接反演人口数据.国内研究尽管起步较晚但发展很快,主要是根据土地利用数据和其它地理因子(如高程、道路、居民区等)建立回归模型.黑河流域人口空间分布的比较结果表明中国1 km格网人口数据是几种数据中与实践情况最相符合的.
[13] 杨小唤, 江东, 王乃斌, . 2002.

人口数据空间化的处理方法

[J]. 地理学报, 57(S1): 70-75.

[本文引用: 1]     

[Yang X H, Jiang D, Wang N B, et al.2002.

Method of pixelizing population data

[J]. Acta Geographica Sinica, 57(Sl): 70-75.]

[本文引用: 1]     

[14] 杨小唤, 刘业森, 江东, . 2006.

一种改进人口数据空间化的方法: 农村居住地重分类

[J]. 地理科学进展, 25(3): 62-69.

https://doi.org/10.3969/j.issn.1007-6301.2006.03.008      URL      Magsci      摘要

<p>人口( 统计) 数据空间化是解决统计数据与自然要素数据融合分析的有效途径。本文在论 述已有人口空间化方法的基础上, 认为遥感影像得到的居民地数据是表达人口分布的最好指标。 为了使居民地数据更好地应用于人口空间化的研究, 论文在分析各种与人口居住密度相关指标 的基础上, 确定了用农村居民地面积所占百分比对农村居民地进行重新分级, 然后应用于人口空 间化的计算。结果检验表明, 人口空间分布数据的误差从分级前的17.4%降到分级后的12%, 尤 其是误差高于30%的乡镇个数从8 个减少到1 个, 该方法有效地提高了人口空间数据的精度。</p>

[Yang X H, Liu Y S, Jiang D, et al.2006.

An enhanced method for spatial distributing census data: Re-classifying of rural residential

[J]. Progress in Geography, 25(3): 62-69.]

https://doi.org/10.3969/j.issn.1007-6301.2006.03.008      URL      Magsci      摘要

<p>人口( 统计) 数据空间化是解决统计数据与自然要素数据融合分析的有效途径。本文在论 述已有人口空间化方法的基础上, 认为遥感影像得到的居民地数据是表达人口分布的最好指标。 为了使居民地数据更好地应用于人口空间化的研究, 论文在分析各种与人口居住密度相关指标 的基础上, 确定了用农村居民地面积所占百分比对农村居民地进行重新分级, 然后应用于人口空 间化的计算。结果检验表明, 人口空间分布数据的误差从分级前的17.4%降到分级后的12%, 尤 其是误差高于30%的乡镇个数从8 个减少到1 个, 该方法有效地提高了人口空间数据的精度。</p>
[15] 杨续超, 高大伟, 丁明军, . 2013.

基于多源遥感数据及DEM的人口统计数据空间化: 以浙江省为例

[J]. 长江流域资源与环境, 22(6): 729-734.

URL      Magsci      [本文引用: 1]      摘要

利用DMSP/OLS遥感夜间灯光数据进行人口等社会经济数据的 空间化时,往往受到其较低的空间分辨率、像元过饱和以及像元溢出现象的影响.植被指数(如NDVI)与不透水面呈负相关关系,与夜间灯光数据在反映人类活 动、提取建成区方面可以互补,将这两种数据融合可以有效减少夜灯数据像元过饱和等因素引起的误差.通过进一步融合DEM数据对基于DMSP/OLS夜间灯 光数据和NDVI构建的人居指数进行了海拔修正,基于修正后的人居指数与统计人口之间很强的线性相关建立人口空间化模型,获得2010年浙江省1 km×1 km分辨率下的人口密度空间分布.模拟结果显示,浙江省平均人口密度为515人/km2,模拟的平均相对误差为18.3%,相比海拔订正前的模拟误差减少 约5%,表明利用多源遥感数据融合后的人居指数在省级尺度上模拟人口空间分布的精度较高.

[Yang X C, Gao D W, Ding M J, et al.2013.

Modeling population density using multi-sensor remote sensing data and DEM: A case study of Zhejiang Province

[J]. Resources and Environment in the Yangtze Basin, 22(6): 729-734.]

URL      Magsci      [本文引用: 1]      摘要

利用DMSP/OLS遥感夜间灯光数据进行人口等社会经济数据的 空间化时,往往受到其较低的空间分辨率、像元过饱和以及像元溢出现象的影响.植被指数(如NDVI)与不透水面呈负相关关系,与夜间灯光数据在反映人类活 动、提取建成区方面可以互补,将这两种数据融合可以有效减少夜灯数据像元过饱和等因素引起的误差.通过进一步融合DEM数据对基于DMSP/OLS夜间灯 光数据和NDVI构建的人居指数进行了海拔修正,基于修正后的人居指数与统计人口之间很强的线性相关建立人口空间化模型,获得2010年浙江省1 km×1 km分辨率下的人口密度空间分布.模拟结果显示,浙江省平均人口密度为515人/km2,模拟的平均相对误差为18.3%,相比海拔订正前的模拟误差减少 约5%,表明利用多源遥感数据融合后的人居指数在省级尺度上模拟人口空间分布的精度较高.
[16] 叶靖, 杨小唤, 江东. 2010.

乡镇级人口统计数据空间化的格网尺度效应分析: 以义乌市为例

[J]. 地球信息科学学报, 12(1): 40-47.

URL      Magsci      摘要

格网尺度效应是统计型人口数据空间化研究的基础性问题之一。针对资源环境研究领域和全球变化区域模型对各种尺度的空间型人口数据的需求,人们对人口数据空间化进行了大量研究。综观现有研究成果,缺乏针对具体应用需求的数据源选择方法和对数据产品适宜性的分析。因此,数据在实际应用中,特别是县市、二、三级流域等尺度上的应用中,存在较多的不确定性。本文重点研究人口数据空间化的格网尺度效应分析方法。以浙江省义乌市为例,利用CBERS、IRS-P5卫星影像,提取了研究区土地利用信息;在地理信息系统技术支持下,对乡镇统计人口进行空间化建模,生成20m至1km系列的格网人口数据;通过比较不同格网人口与乡镇统计人口的误差,分析人口数据空间化的格网尺度效应。分析结果表明,采用CBERS数据源进行人口数据空间化,其数据产品即格网人口的适宜尺度是200m,抽样精度为76%;采用P5数据源进行人口数据空间化,其格网人口的适宜尺度是100m,抽样精度为84%。

[Ye J, Yang X H, Jiang D.2010.

The grid scale effect analysis on town leveled population statistical data spatialization

[J]. Journal of Geo-Information Science, 12(1): 40-47.]

URL      Magsci      摘要

格网尺度效应是统计型人口数据空间化研究的基础性问题之一。针对资源环境研究领域和全球变化区域模型对各种尺度的空间型人口数据的需求,人们对人口数据空间化进行了大量研究。综观现有研究成果,缺乏针对具体应用需求的数据源选择方法和对数据产品适宜性的分析。因此,数据在实际应用中,特别是县市、二、三级流域等尺度上的应用中,存在较多的不确定性。本文重点研究人口数据空间化的格网尺度效应分析方法。以浙江省义乌市为例,利用CBERS、IRS-P5卫星影像,提取了研究区土地利用信息;在地理信息系统技术支持下,对乡镇统计人口进行空间化建模,生成20m至1km系列的格网人口数据;通过比较不同格网人口与乡镇统计人口的误差,分析人口数据空间化的格网尺度效应。分析结果表明,采用CBERS数据源进行人口数据空间化,其数据产品即格网人口的适宜尺度是200m,抽样精度为76%;采用P5数据源进行人口数据空间化,其格网人口的适宜尺度是100m,抽样精度为84%。
[17] 张建辰, 王艳慧. 2014.

基于土地利用类型的村级人口空间分布模拟: 以湖北鹤峰县为例

[J]. 地球信息科学学报, 16(3): 435-442.

https://doi.org/10.3724/SP.J.1047.2014.00435      URL      Magsci      [本文引用: 1]      摘要

<p>在人口分布及其相关研究中,常常会遇到小尺度人口数据部分缺失的问题。本文以湖北省鹤峰县为例,在分析土地利用与人口分布关系的基础上,从全局与局部、线性回归与非线性回归考虑,基于土地利用类型,分别利用地理加权回归(GWR)方法、格网方法、BP神经网络方法对缺失数据的行政村人口数据进行模拟,并进行了多角度精度对比验证。研究结果表明:(1)各种土地利用类型中,耕地、林地、城镇村及工矿用地、交通用地是影响研究区村级人口分布的主要因素;(2)30个调查村中,3种方法模拟的人口总数误差小于3%,通过每个村的模拟值与实际值相比,BP神经网络方法能更好地模拟研究区村级人口的分布,格网方法次之,GWR方法最差;(3)研究区各村人口分布呈现较高的空间正相关性,各乡镇的人口密度在空间上并不独立,而是呈现紧密的集聚特征。</p>

[Zhang J C, Wang Y H.2014.

Simulation of village-level population distribution based on land use: A case study of Hefeng County in Hubei Province

[J]. Journal of Geo-Information Science, 16(3): 435-442.]

https://doi.org/10.3724/SP.J.1047.2014.00435      URL      Magsci      [本文引用: 1]      摘要

<p>在人口分布及其相关研究中,常常会遇到小尺度人口数据部分缺失的问题。本文以湖北省鹤峰县为例,在分析土地利用与人口分布关系的基础上,从全局与局部、线性回归与非线性回归考虑,基于土地利用类型,分别利用地理加权回归(GWR)方法、格网方法、BP神经网络方法对缺失数据的行政村人口数据进行模拟,并进行了多角度精度对比验证。研究结果表明:(1)各种土地利用类型中,耕地、林地、城镇村及工矿用地、交通用地是影响研究区村级人口分布的主要因素;(2)30个调查村中,3种方法模拟的人口总数误差小于3%,通过每个村的模拟值与实际值相比,BP神经网络方法能更好地模拟研究区村级人口的分布,格网方法次之,GWR方法最差;(3)研究区各村人口分布呈现较高的空间正相关性,各乡镇的人口密度在空间上并不独立,而是呈现紧密的集聚特征。</p>
[18] 周成虎, 程维明. 2010.

《中华人民共和国地貌图集》的研究与编制

[J]. 地理研究, 29(6): 970-979.

https://doi.org/10.11821/yj2010060002      URL      Magsci      摘要

是全面反映我国地貌宏观规律、揭示区域地貌空间分异的国家级基本比例尺基础性图集.本文回顾了我国地貌制图的发展历程,阐述了全国百万数字地貌遥感综合解译和地貌图集编制的过程,从图集内容结构、数值地貌分类体系、数据基础、地貌遥感解析技术、数字地貌数据库共享系统、地貌图图例系统、图集编制及印刷技术、图集蝴蝶装帧技术等方面详细分析了地貌图集的研究内容和编制特色.地貌图集研究成果已在全国土地调查、区域规划、环境保护和灾害监测等多个方面得到广泛应用.

[Zhou C H, Cheng W M.2010.

Research and compilation of the geomorphological atlas of the People's Republic of China

[J]. Geographical Research, 29(6): 970-979.]

https://doi.org/10.11821/yj2010060002      URL      Magsci      摘要

是全面反映我国地貌宏观规律、揭示区域地貌空间分异的国家级基本比例尺基础性图集.本文回顾了我国地貌制图的发展历程,阐述了全国百万数字地貌遥感综合解译和地貌图集编制的过程,从图集内容结构、数值地貌分类体系、数据基础、地貌遥感解析技术、数字地貌数据库共享系统、地貌图图例系统、图集编制及印刷技术、图集蝴蝶装帧技术等方面详细分析了地貌图集的研究内容和编制特色.地貌图集研究成果已在全国土地调查、区域规划、环境保护和灾害监测等多个方面得到广泛应用.
[19] 卓莉, 陈晋, 史培军, . 2005.

基于夜间灯光数据的中国人口密度模拟

[J]. 地理学报, 60(2): 266-276.

https://doi.org/10.3321/j.issn:0375-5444.2005.02.010      URL      Magsci      [本文引用: 1]      摘要

<p>人口密度网格化比人口密度行政单元化更接近人口的实际分布,而且是实现人口数据与其他社会经济统计数据、资源数据、环境数据复合,提高人口、资源、环境综合管理能力的重要途径之一。选用专门针对亚洲地区开发的DMSP/OLS非辐射定标夜间灯光平均强度遥感数据模拟了中国的人口密度:基于灯光强度信息模拟了灯光区内部的人口密度,基于人口&mdash;距离衰减规律和电场叠加理论模拟了灯光区外部的人口密度,是应用DMSP/OLS夜间灯光数据模拟人口密度研究的拓展和深入,研究结果与其他研究基本一致,但所需数据量较少,更适合于大尺度人口密度的快速估算,为决策提供参考依据。结果表明,DMSP/OLS夜间灯光强度数据具有实现人口以及其他社会经济数据空间网格化的巨大潜力。</p>

[Zhuo L, Chen J, Shi P J, et al.2005.

Modeling population density of China in 1998 based on DMSP/OLS nighttime light image

[J]. Acta Geographica Sinica, 60(2): 266-276.]

https://doi.org/10.3321/j.issn:0375-5444.2005.02.010      URL      Magsci      [本文引用: 1]      摘要

<p>人口密度网格化比人口密度行政单元化更接近人口的实际分布,而且是实现人口数据与其他社会经济统计数据、资源数据、环境数据复合,提高人口、资源、环境综合管理能力的重要途径之一。选用专门针对亚洲地区开发的DMSP/OLS非辐射定标夜间灯光平均强度遥感数据模拟了中国的人口密度:基于灯光强度信息模拟了灯光区内部的人口密度,基于人口&mdash;距离衰减规律和电场叠加理论模拟了灯光区外部的人口密度,是应用DMSP/OLS夜间灯光数据模拟人口密度研究的拓展和深入,研究结果与其他研究基本一致,但所需数据量较少,更适合于大尺度人口密度的快速估算,为决策提供参考依据。结果表明,DMSP/OLS夜间灯光强度数据具有实现人口以及其他社会经济数据空间网格化的巨大潜力。</p>
[20] Azar D, Engstrom R, Graesser J, et al.2013.

Generation of fine-scale population layers using multi-resolution satellite imagery and geospatial data

[J]. Remote Sensing of Environment, 130: 219-232.

https://doi.org/10.1016/j.rse.2012.11.022      URL      摘要

A gridded population dataset was produced for Pakistan by developing an algorithm that distributed population either on the basis of per-pixel built-up area fraction or the per-pixel value of a weighted population likelihood layer. Per-pixel built-up area fraction was calculated using a classification and regression trees (CART) methodology integrating high- and medium-resolution satellite imagery. The likelihood layer was produced by weighting different geospatial layers according to their effect on the likelihood of population being found in the particular pixel. The geospatial layers integrated into the likelihood layer were: 1) proximity to remotely sensed built-up pixels, 2) density of settlement points in a fixed kernel, 3) slope, 4) elevation, and 5) heterogeneity of landcover types found within a search radius. The method for weighting these layers varied according to settlement patterns found in the provinces of Pakistan. Differences in zonal population estimates generated from the 100-meter gridded population layer resulting from this study, Oak Ridge National Laboratory's LandScan (2002) , and CIESIN's Gridded Population of the World and Global Rural Urban Mapping Project (GPW and GRUMP) are examined. Population estimates for small areas produced using this paper's method were found to differ from census counts to a lesser degree than those produced using LandScan, GPW, or GRUMP. The root mean square error (RMSE) for small area population estimates for this method, LandScan, GPW, and GRUMP were 31,089, 48,001, 100,260, and 72,071, respectively.
[21] Fotheringham A S, Brunsdon C, Charlton M.2002.

Geographically weighted regression: The analysis of spatially varying relationships

[M]. New York: Wiley.

[本文引用: 1]     

[22] Linard C, Gilbert M, Tatem A J.2011.

Assessing the use of global land cover data for guiding large area population distribution modelling

[J]. GeoJournal, 76(5): 525-538.

https://doi.org/10.1007/s10708-010-9364-8      URL      PMID: 3617592      摘要

Gridded population distribution data are finding increasing use in a wide range of fields, including resource allocation, disease burden estimation and climate change impact assessment. Land cover information can be used in combination with detailed settlement extents to redistribute aggregated census counts to improve the accuracy of national-scale gridded population data. In East Africa, such analyses have been done using regional land cover data, thus restricting application of the approach to this region. If gridded population data are to be improved across Africa, an alternative, consistent and comparable source of land cover data is required. Here these analyses were repeated for Kenya using four continent-wide land cover datasets combined with detailed settlement extents and accuracies were assessed against detailed census data. The aim was to identify the large area land cover dataset that, combined with detailed settlement extents, produce the most accurate population distribution data. The effectiveness of the population distribution modelling procedures in the absence of high resolution census data was evaluated, as was the extrapolation ability of population densities between different regions. Results showed that the use of the GlobCover dataset refined with detailed settlement extents provided significantly more accurate gridded population data compared to the use of refined AVHRR-derived, MODIS-derived and GLC2000 land cover datasets. This study supports the hypothesis that land cover information is important for improving population distribution model accuracies, particularly in countries where only coarse resolution census data are available. Obtaining high resolution census data must however remain the priority. With its higher spatial resolution and its more recent data acquisition, the GlobCover dataset was found as the most valuable resource to use in combination with detailed settlement extents for the production of gridded population datasets across large areas.
[23] Yang X H, Huang Y H, Dong P L, et al.2009.

An updating system for the gridded population database of China based on remote sensing, GIS and spatial database technologies

[J]. Sensors, 9(2): 1128-1140.

https://doi.org/10.3390/s90201128      URL      PMID: 22399959      [本文引用: 2]      摘要

The spatial distribution of population is closely related to land use and land cover (LULC) patterns on both regional and global scales. Population can be redistributed onto geo-referenced square grids according to this relation. In the past decades, various approaches to monitoring LULC using remote sensing and Geographic Information Systems (GIS) have been developed, which makes it possible for efficient updating of geo-referenced population data. A Spatial Population Updating System (SPUS) is developed for updating the gridded population database of China based on remote sensing, GIS and spatial database technologies, with a spatial resolution of 1 km by 1 km. The SPUS can process standard Moderate Resolution Imaging Spectroradiometer (MODIS L1B) data integrated with a Pattern Decomposition Method (PDM) and an LULC-Conversion Model to obtain patterns of land use and land cover, and provide input parameters for a Population Spatialization Model (PSM). The PSM embedded in SPUS is used for generating 1 km by 1 km gridded population data in each population distribution region based on natural and socio-economic variables. Validation results from finer township-level census data of Yishui County suggest that the gridded population database produced by the SPUS is reliable.
[24] Yang X H, Ma H Q.2009.

Natural environment suitability of China and its relationship with population distributions

[J]. International Journal of Environmental Research and Public Health, 6(12): 3025-3039.

https://doi.org/10.3390/ijerph6123025      URL      PMID: 20049243      [本文引用: 1]      摘要

The natural environment factor is one of the main indexes for evaluating human habitats, sustained economic growth and ecological health status. Based on Geographic Information System (GIS) technology and an analytic hierarchy process method, this article presents the construction of the Natural Environment Suitability Index (NESI) model of China by using natural environment data including climate, hydrology, surface configuration and ecological conditions. The NESI value is calculated in grids of 1 km by 1 km through ArcGIS. The spatial regularity of NESI is analyzed according to its spatial distribution and proportional structure. The relationship of NESI with population distribution and economic growth is also discussed by analyzing NESI results with population distribution data and GDP data in 1 km by 1 km grids. The study shows that: (1) the value of NESI is higher in the East and lower in the West in China; The best natural environment area is the Yangtze River Delta region and the worst are the northwest of Tibet and southwest of Xinjiang. (2) There is a close correlation among natural environment, population distribution and economic growth; the best natural environment area, the Yangtze River Delta region, is also the region with higher population density and richer economy. The worst natural environment areas, Northwest and Tibetan Plateau, are also regions with lower population density and poorer economies.
[25] Zeng C Q, Zhou Y, Wang S X, et al.2011.

Population spatialization in China based on night-time imagery and land use data

[J]. International Journal of Remote Sensing, 32(24): 9599-9620.

https://doi.org/10.1080/01431161.2011.569581      URL      [本文引用: 1]      摘要

ABSTRACT

/