研究论文

基于最大熵模型的深圳市内涝影响因素分析及内涝风险评估

  • 何珮婷 ,
  • 刘丹媛 ,
  • 卢思言 ,
  • 何小钰 ,
  • 李桦 ,
  • 杨柳 ,
  • 林锦耀 , *
展开
  • 广州大学地理科学与遥感学院,广州 510006
*林锦耀(1989— ),男,广东广州人,博士,副教授,主要从事地理建模与遥感应用研究。E-mail:

何珮婷(2001— ),女,广东韶关人,本科生,主要从事资源环境与城乡规划研究。E-mail:

收稿日期: 2022-02-21

  修回日期: 2022-07-03

  网络出版日期: 2022-12-28

基金资助

国家自然科学基金项目(41801307)

广东省科技创新战略专项(“攀登计划”专项资金)(pdjh2021a0390)

广州市科技计划项目(202201010289)

Influencing factors of waterlogging and waterlogging risks in Shenzhen City based on MAXENT

  • HE Peiting ,
  • LIU Danyuan ,
  • LU Siyan ,
  • HE Xiaoyu ,
  • LI Hua ,
  • YANG Liu ,
  • LIN Jinyao , *
Expand
  • School of Geography and Remote Sensing, Guangzhou University, Guangzhou 510006, China

Received date: 2022-02-21

  Revised date: 2022-07-03

  Online published: 2022-12-28

Supported by

National Natural Science Foundation of China(41801307)

Special Fund for Scientific and Technological Innovation Strategy of Guangdong Province(pdjh2021a0390)

Guangzhou Municipal Science and Technology Project(202201010289)

摘要

城市内涝是最常见的自然灾害之一,深入剖析其影响因素并进行风险评估对内涝防治具有重要意义。以往研究表明,城市内涝是由自然因素(如地形)和人为因素(如土地利用)共同引起的。在土地利用方面,相关学者主要关注二维空间因素对内涝的影响,较少顾及土地利用的三维建筑格局。此外,在研究方法的选取上,尽管已有学者利用随机森林、神经网络等模型对内涝影响因素进行研究,然而传统方法在负样本(不发生内涝的地点)的选取上存在不确定性。为解决这2点不足,论文引入最大熵(MAXENT)模型,以深圳市为研究案例,通过MAXENT剖析各潜在影响因子与内涝风险的关系。结果表明,影响内涝风险的主导环境因子为不透水面比例、绿地比例、人口密度、暴雨峰值雨量、地表起伏度。而对内涝发生有重要影响的三维因子为容积率、建筑形状系数、平均高度。通过MAXENT评估的内涝风险结果可知,深圳潜在高风险区的面积约为491 km²,占市域面积的24.58%,主要位于龙华区、南山区、龙岗区北部、光明区、福田区。进一步对潜在高风险区进行空间自相关分析,结果发现过往并不存在内涝点的南山区北部、福田区西部、罗湖区中部等部分区域风险概率出现高—高集聚现象,表明上述地区的内涝风险会受到周围地区的正向影响,因此在内涝的监测与防治中应当重点关注高风险地区以实现更精准的防控。由于内涝风险评估是城市灾害管理的重要组成部分,因此论文提出的相关建议不仅可作为防灾减灾的重要参考依据,还能为国土空间规划的优化提供新思路。

本文引用格式

何珮婷 , 刘丹媛 , 卢思言 , 何小钰 , 李桦 , 杨柳 , 林锦耀 . 基于最大熵模型的深圳市内涝影响因素分析及内涝风险评估[J]. 地理科学进展, 2022 , 41(10) : 1868 -1881 . DOI: 10.18306/dlkxjz.2022.10.008

Abstract

Urban waterlogging is one of the most common natural disasters. In-depth analysis of its influencing factors and estimation of high-risk waterlogging areas are of great significance for waterlogging prevention and management. Although some studies have approached these issues through advanced machine learning methods such as random forest and neural network, the identified influencing factors are mainly related to the two-dimensional space. Moreover, while traditional methods require both accurate positive and negative samples, there is an inevitable subjectivity in the selection of negative samples. To address these disadvantages, this research took Shenzhen City as the study area and employed the MAXENT model, which does not require negative samples, to explore the relationship between potential influencing factors (including three-dimensional building factors) and waterlogging risk during 2015-2019. The results show that the dominant environmental factors behind the density of waterlogging hotspots were the proportion of impervious surface, the proportion of green space, population density, rainstorm peak rainfall, and fluctuation of the terrain. With regard to the three-dimensional building factors, building congestion, average building height, and building shape coefficient have a crucial impact on urban waterlogging. According to the waterlogging probability estimated by MAXENT, the total area of potential high-risk waterlogging areas in Shenzhen is approximately 491 km², accounting for 24.58% of the total area of the city. These areas are mainly located in Longhua District, Nanshan District, the north of Longgang District, Guangming District, and Futian District. Through the spatial autocorrelation analysis of the potential high-risk areas, we found that some areas in the north of Nanshan District, the west of Futian District, and central Luohu District where there were no waterlogging hotspots in the past, exhibit high concentration levels. This indicates that the waterlogging probability in these areas would be positively affected by the surrounding areas. Therefore, focus should be placed on high-risk areas for achieving more accurate waterlogging prevention and management. Urban waterlogging risk assessment is an important part of disaster management. The assessment results of waterlogging risk not only can provide support for disaster prevention and risk mitigation, but also are essential for protecting people's lives and the sustainable development of cities.

城市内涝是指城市低洼地区由于雨量过多产生大量积水,从而影响城市正常运作的现象。城市内涝已成为中国最常见、影响最严重的灾害之一,其造成的人员伤亡数和经济损失在自然灾害中均居首位[1-2]。近年来随着城市化进程的加快,城市内涝发生愈加频繁,已成为制约城市发展的重要障碍[3-5]。中国住房和城乡建设部对全国351个城市的专项调查表明,近年来绝大部分城市均发生过不同程度的内涝[6]。在此背景下,分析内涝的关键影响因素并进行内涝风险评估成为了研究热点。
城市内涝是由自然因素和人为因素共同引发的[7]。在自然因素方面,气候变化导致的极端降水事件会显著增加内涝发生的概率。除不可控的自然因素外,不合理的国土空间规划也是引发内涝的重要原因[8]。城市不透水面的面积急剧增加,导致地表径流难以下渗,削弱了生态系统的雨洪调节能力[9]。已有大量研究证实不透水面密度与内涝概率存在显著的相关关系[10-12]。如李彬烨等[13]发现1990—2010年广州市不透水面密度与暴雨内涝点核密度之间呈显著的正相关关系,且相关程度随城市化发展逐渐增强,表明不透水面密度对暴雨内涝点的时空演变有较大的影响;叶超凡等[14]通过分析特大暴雨后北京市五环内的积水状况,总结出北京市区内涝频发的原因,指出城市不透水面的增加会导致雨水径流迅速增长,不透水面密集的区域以及地势较低的立交桥区内涝严重;吴健生等[15]结合皮尔逊相关性分析、多元逐步回归分析方法阐明了深圳市各土地利用类型与内涝风险的关系,发现住宅用地等建设用地对内涝的影响最大,其面积比例的增加会加剧区域内涝程度,且与降雨量等自然因素相比,不透水率等人为因素对内涝的影响程度更大。上述研究均表明城市发展与内涝发生概率密切相关,因此合理的空间规划有助于降低内涝风险[16]
在土地利用方面,相关研究主要关注二维空间因素对内涝的影响,较少顾及土地利用的三维建筑格局。实际上,从二维空间已难以全面反映城市扩张的实际情况,从三维建筑角度定量研究城市扩张对解决各类城市问题具有更关键的意义[17]。大量研究表明,城市三维建筑的形态与布局对城市热岛有显著影响[18]。由于地表温度也是影响水循环过程的重要因素,因此三维建筑格局极有可能与城市水文状况及内涝的发生密切相关。尽管已有较多学者构建了城市建筑三维空间形态与布局的评价体系[19-22],然而却较少顾及其对城市内涝的重要影响。
另一方面,内涝风险评估主要采用历史统计法、水文模型、多准则决策以及机器学习等4类方法[23-24],如Tang等[25]利用机器学习中的贝叶斯分类器估算内涝发生概率,张菲菲等[26]将管流模型与地表漫流模型耦合建立水动力学模型进行洪水危险性模拟。然而这4类方法均存在一定局限性。历史统计法和水文模型对水文数据的完整性与连续性要求较高;多准则决策中的指标选取与权重确定具有较大的主观性;虽然机器学习能较好地解决以上问题,但目前较为热门的模型如随机森林、神经网络,均依赖于准确的正样本(即发生内涝的地点)和负样本(不发生内涝的地点[27])。以往研究通常会在未曾发生灾害的区域随机选取负样本,例如围绕历史灾害点建立一定范围的缓冲区,缓冲区外的区域即为负样本采集范围[28]。此外,可根据地理学第三定律等理论提高负样本质量,例如通过滑坡灾害正样本的地理环境特征推算负样本的不确定性[27]。由于城市的地理环境特征是快速动态变化的,尤其极端暴雨事件极易导致新的内涝点出现,因此无法判断负样本处将来是否会发生内涝,难以保证负样本的绝对准确性。而最大熵(MAXENT)模型能有效解决上述不足,其特点是在仅有正样本(presence-only)的情况下,仍能获得较理想的物种分布预估结果,所得分析更具客观性[29]。MAXENT模型多用于预测物种分布,只需结合物种的正样本与区域环境变量,即可分析物种分布的关键影响因素并模拟物种的潜在空间分布。然而目前少有研究将MAXENT模型运用于内涝的影响因素分析及风险评估。
因此,本文提出将“内涝”类比为物种,创新性地运用MAXENT模型分析地形因素、土地利用情况、三维建筑指标等与内涝风险的关系。随后借助MAXENT模型基于内涝的主导影响因素分析城市内涝的潜在分布区域,对内涝风险情况进行评估,得出各类影响因子的重要性以及贡献率。通过各因子的响应曲线进一步阐明内涝风险概率随影响因子的变化规律。研究结果可以为城市国土空间规划的优化提供理论依据,从而降低城市内涝的风险,推动海绵城市、韧性城市的建设。

1 数据与方法

1.1 研究区域

深圳市位于中国南部沿海亚热带地区(图1),年平均降水量高达1933.3 mm。作为改革开放的重点城市,深圳市自1978年来建设用地迅速扩张。截至2020年底,深圳已建成200 m以上的摩天大楼约110座,位列全球第一。城市内部建筑景观差异显著,具有较高的代表性。随着气候变化和快速城市化影响加剧,深圳市极端暴雨事件频发,城市内涝风险日益增大。因此,从三维国土空间规划的角度缓解内涝风险,已成为相关部门的迫切任务。
图1 深圳市行政区划

Fig.1 Administrative division of Shenzhen City

1.2 数据来源与处理

本文对2015—2019年的深圳市内涝点数据进行分析。首先,在深圳市水利局、气象局、深圳市海绵城市建设规划图集获取共1167个内涝点,选取反复出现的584个点作为研究样本,以确保样本的代表性[30](图2a),然后在高德地图(https://www.amap.com)获取建筑信息(含详细的占地面积和楼层数)。其次,利用DEM(30 m)生成各类地形因子,包括坡度、地表粗糙度和地形起伏度(图2b~2e),接着在中国科学院资源环境科学与数据中心(https://www.resdc.cn/)获取归一化植被指数(NDVI)(图2f)。随后,分别在WorldPop和清华大学[31]获取人口数据(图2g)、土地利用数据(图2h~2j)。最后,在中国科学数据网站(http://www.csdata.org/)获取暴雨数据,包括暴雨次数、暴雨峰值雨量(通过因子共线性检验以及因子重要性、贡献率测度筛选)(图2k~2l)。在高德地图上拾取立交桥,计算立交桥的欧氏距离(图2m)。本文所用数据的详细信息见表1,研究流程见图3
图2 本研究所用的空间数据

Fig.2 Spatial data used in this study

表1 本文所用空间数据的详细信息

Tab.1 Details of the spatial data used in this study

一级数据 二级数据 详细信息 来源
内涝点 深圳市水务局、深圳市气象局、深圳市海绵城市建设规划图集
建筑信息 建筑指标 建筑位置、楼层数 高德地图
土地利用 不透水面比例 30 m分辨率 清华大学
绿地比例
水体比例
DEM 高程 30 m分辨率 地理空间数据云平台
坡度
地表起伏度
地面粗糙度
人口 人口密度 100 m分辨率 WorldPop
NDVI 1000 m分辨率 中国科学院资源环境科学与数据中心
暴雨 暴雨次数、暴雨峰值雨量 1000 m分辨率 中国科学数据网
立交桥 离立交桥距离 高德地图
图3 本研究流程

Fig.3 Flowchart of this study

1.3 研究方法

1.3.1 三维建筑指标

以往研究已提出一系列三维建筑指标衡量建筑的形态与布局[32-33],发现许多指标与各种地理现象如城市热环境效应[34]、空气污染浓度[35]等存在显著的相关关系。本文从中选取关键指标反映深圳市三维建筑特征(表2)。
表2 对内涝有潜在影响的三维建筑指标

Tab.2 Potential three-dimensional influencing factors of waterlogging

因子 公式 描述
建筑物密度(DB)
平均建筑高度(MBH) M B H = 1 N i = 1 N H i
建筑高度标准差(SDBH) S D B H = 1 N i = 1 N H i - M B H 2 反映建筑高度的分散和变化程度
平均建筑体积(MBV) M B V = 1 N i = 1 N V i
建筑体积标准差(SDBV) S D B V = 1 N i = 1 N V i - M B V 2 反映建筑体积的分散和变化程度
容积率(FAR) F A R = 1 A i = 1 N F i × A i 总建筑面积与所在地块面积之比
建筑覆盖率(BCR) B C R = 1 A i = 1 N A i 建筑覆盖面积与所在地块面积之比
建筑形状系数(BSC) B S C = 1 N i = 1 N 1 V i ( P i × H i + A i ) 建筑表面积与体积之比,是决定热损失和增益的重要因素
建筑拥挤度(BCD) B C D = i = 1 N V i m a x H i × A 所有建筑体积占城市体积百分比的总和

注:N是建筑物的数量;A是格网土地总面积;Hi是建筑i的高度;Ai是建筑i的建筑面积;Pi是建筑i的底面周长;Fi是建筑i的楼层数量;Vi是建筑i的体积。

由于三维建筑因子数量较多,如因子之间存在共线性,则在建模过程中可能会出现过拟合的现象。本文借助建筑因子的相关系数矩阵来判断共线性,若2个因子的相关性系数绝对值|r|≥0.8,则表明2个因子之间存在共线性[36]。在若干存在共线性的因子中仅保留与内涝相关性最大的一个,经过检验,最终保留的建筑因子如图4所示。
图4 最终选取的建筑因子

Fig.4 Building factors adopted in this study

1.3.2 最大熵(MAXENT)模型

MAXENT模型立足于由Jaynes[37]在1957年提出的最大熵原理(maximum entropy principle)。最大熵原理指出,当预测一个随机事件的概率分布时,只有在外部全部己知条件准备充分以及不做任何主观假设的条件下,得到的概率分布才会最均匀,预测风险也最小,即此时概率分布的信息熵最大,最接近真实状态的概率分布[38]。MAXENT模型可以根据已知样本点分布和分布地区的各类环境变量运算得出预测模型,对预测目标在目标地区的潜在分布做出预测[39]
最大熵模型是将最大熵原理运用到概率分布问题的模型,给其确定一个训练数据集(x1, y1),(x2,y2),…,(xn, yn),可以确定联合分布P(X,Y)的经验分布和边缘分布P(X)的经验分布,分别记为 P - X = x , Y = y P - X = x
P - X = x , Y = y = v ( X = x , Y = y ) n
P - X = x = v ( X = x ) n
式中: v ( X = x , Y = y )表示训练集中样本 ( x , y )同时出现的次数, v ( X = x )表示训练集中x出现的次数,n表示训练样本容量[39]
输入x和输出y之间的关系可以用特征函数 f(x,y)来表示:
f x , y = 1 x y 0
E p - f表示特征函数 f(x,y)关于经验分布 P - X , Y的期望值:
E p - f = x , y P - x , y f x , y
E P f表示特征函数 f(x,y)关于模型P(Y|X)与经验分布 P - X的期望值:
E P f = x , y P - x P y | x f ( x , y )
如果模型能够获取训练数据中的信息,则可以假设以上2个期望值相等,即
x , y P - x , y f x , y = x , y P - x P y | x f x , y
上述即为最大熵模型学习的约束条件。如果有n个特征函数,则有n个约束条件。
假设满足所有约束条件的模型集合为:
E p - f i = E P f i , i = 1,2 , , n
且定义在条件概率分布 P ( Y | X )上的条件熵为:
H P = - x , y P - x P y | x l n P y | x
则模型集合中使得H(P)最大的模型即为最大熵模型[40]
本文采用MAXENT软件构建最大熵模型,运行10次取其平均值作为结果。其中每次运算均随机抽取75%的内涝点作为训练数据,其余25%作为测试数据,迭代次数设置为1000,最终通过ROC曲线对评估结果进行精度检验。此外,还创建响应曲线以分析不同自变量对内涝风险概率的影响。

1.3.3 随机森林模型

随机森林是由Breiman[41]提出的一种基于分治法原理的集成学习策略,是若干决策树集成的分类器。它通过随机选择向量生长成决策树,每棵树都会完全生长,在生成决策树时,每个节点都是从随机选出的几个变量中最优分裂产生;生成所有决策树之后,用投票的方法对所有决策树的分类结果进行综合,得出最终结果[42]
本文通过随机森林预测内涝风险概率,将其与MAXENT模型的预测结果对比,为内涝风险防控提供更精确的意见。

1.3.4 空间自相关分析

全局空间自相关是对地理要素属性值在整个区域的空间特征描述,通常采用对全局莫兰指数、G观测值等统计量的估计来分析区域总体空间关联和空间差异的平均程度[43]。本文使用全局莫兰指数来研究深圳内涝风险概率的空间自相关性,莫兰指数的取值范围为[-1, 1],其计算公式为:
M o r a n ' s I = i = 1 n j = 1 n w i j x i - x ¯ x j - x ¯ S 2 i = 1 n j = 1 n w i j
S 2 = 1 n i = 1 n x i - x ¯ 2 , x ¯ = 1 n i = 1 n x i
式中: M o r a n ' s I为全局莫兰指数;n为样本量,即空间位置的个数;xixj是空间位置ij的观察值;wij为空间权重, S 2为标准方差。
局部空间自相关指标LISA用于度量某空间单元与周围邻近单元的空间差异程度。用局部莫兰指数来计算,其公式为:
I i = x i - x ¯ S 2 j = 1 m w i j x j - x ¯
式中: I i为局部莫兰指数,m为空间单元i的邻近单元个数。

2 研究结果分析

2.1 MAXENT模型精度检验

MAXENT模型的精度由ROC曲线及其线下面积AUC评估。通常认为,AUC<0.6时模型精度较低,AUC>0.8则精度较高[44]。本文的ROC曲线由MAXENT软件进行10次运算并取均值所得(图5)。由图5可知,AUC为0.806,说明该模型预测结果较好,具有较高的准确性与可靠性,可以为内涝风险防治与城市国土空间规划提供合理的参考。
图5 MAXENT结果的ROC检验

Fig.5 ROC test of the MAXENT result

2.2 各影响因子对内涝建模的贡献率与重要性

表3为18个内涝潜在影响因子对MAXENT建模的贡献率,排名前5位的分别为不透水面比例、绿地比例、暴雨峰值雨量、人口密度、水体比例。而从建筑因子来看,6个建筑因子的相对贡献率相对不高,贡献率最大的为建筑容积率。
表3 不同影响因子对内涝的贡献率

Tab.3 Contribution rate of different influencing factors to waterlogging (%)

因子 贡献率 因子 贡献率 因子 贡献率
不透水面比例 49.7 暴雨次数 3.3 离立交桥距离 1.3
绿地比例 11.5 地表起伏度 2.8 建筑体积标准差 1.3
暴雨峰值雨量 5.0 粗糙度 2.7 建筑平均体积 1.2
人口密度 4.5 高程 2.6 坡度 1.2
水体比例 4.2 建筑容积率 1.8 建筑数量 1.1
NDVI 3.6 建筑平均高度 1.4 建筑形状系数 1.1
18个因子对城市内涝建模的重要性和排序如表4,排名前5位的分别为不透水面比例、绿地比例、人口密度、粗糙度、暴雨峰值雨量。单从建筑因子上看,建筑容积率重要性较大。
表4 不同影响因子对内涝的重要性

Tab.4 Importance of different influencing factors to waterlogging (%)

因子 重要性 因子 重要性 因子 重要性
不透水面比例 21.6 建筑容积率 5.7 水体比例 3.0
绿地比例 11.4 坡度 4.2 暴雨次数 2.9
人口密度 7.7 DEM 4.0 离立交桥距离 2.6
粗糙度 6.5 建筑形状系数 3.9 建筑平均体积 2.5
暴雨峰值雨量 6.4 建筑平均高度 3.7 建筑数量 2.2
地表起伏度 6.3 NDVI 3.5 建筑体积标准差 2.0
将因子贡献率以及重要性排名均靠前的影响因子视为主导因子,即不透水面比例、绿地比例、人口密度、暴雨峰值雨量、地表起伏度为内涝的关键影响因素。由图6可知:① 内涝风险概率随着不透水面比例的上升而增大,最终风险概率峰值会达到0.8左右;② 风险概率随着绿地比例的变化变动较小,起初风险概率随绿地比例的增大略有减小,后基本不变;③ 风险概率随着人口密度的增大而增大,达到峰值0.75左右稍有回落;④ 风险概率随着暴雨峰值雨量的增大骤增,后持续保持在峰值水平(0.65左右);⑤ 风险概率随地表起伏度的增大持续减小。
图6 各主导因子与内涝风险概率的响应曲线

Fig.6 Response curve of waterlogging risk probability to each dominant factor

由于不透水面比例的重要性和贡献率均占绝对主导地位,且不透水面包含平面和三维2个维度,故本文也同时考虑三维因子的作用。虽然结果显示三维因子较其他因子贡献率低,但模型的精度在考虑三维因子后有所提高。其中,容积率、建筑形状系数、平均高度为主导三维因子。由图7可知:① 风险概率随着建筑容积率的增大而增大,稍有回落后继续增大,达到峰值概率为0.80左右;② 风险概率随着建筑形状系数的增大稍有增大,达到峰值后持续减小;③ 风险概率随着建筑平均高度的增大而减小,达到最低值(0.3左右)后开始增强。
图7 各主导建筑因子与内涝风险概率的相应曲线

Fig.7 Response curve of waterlogging risk probability to each dominant building factor

2.3 内涝风险评估

当MAXENT模型应用于物种分布预测时,所得的适生范围通常会被分为4个等级:非适生区、低适生区、中适生区、高适生区[45-46]。因此参考物种分布研究,将MAXENT模型得到的内涝风险结果按照自然断点法划分为低风险、较低风险、中风险以及高风险地区(图8)。由图8可知:① 内涝潜在高风险区多位于经济发达、建筑密集的龙华区、南山区、龙岗区北部、光明区、福田区;中风险区大多位于宝安区中部、龙岗区中部和坪山区;盐田区则大多属于内涝低风险区。② 内涝高风险区的总面积约为491 km²,占深圳总面积的24.58%;内涝中风险区的总面积约为443 km²,占深圳总面积的22.18%。可见,深圳超过45%的范围为内涝中高风险区。
图8 MAXENT内涝风险评估结果

Fig.8 Waterlogging risk probability by MAXENT

2.4 内涝风险概率的空间自相关性

对MAXENT模型得到的内涝风险结果进行全局空间自相关分析,用全局莫兰指数衡量内涝风险概率的空间自相关程度,结果显示,内涝风险概率的莫兰指数为0.698(P<0.001),表明深圳内涝风险概率存在较强的空间依赖性,表现为空间正相关,即内涝风险概率高的区域在空间上显著集聚。进一步对内涝风险结果进行局部空间自相关分析,得出LISA分布图(图9)。可以看出,风险概率呈高—高集聚的地区主要集中在福田区、罗湖区、龙岗区中部、光明区北部、南山区中部。值得注意的是,南山区北部、福田区西部、罗湖区中部等部分区域过往并不存在内涝点,而在内涝风险预测的局部空间自相关结果中却出现了高—高集聚现象,表明这些地区的内涝发生概率会受到周围地区的正向影响。随着人口的快速增长和城市化进程的加快,城市内涝灾害发生频率将越来越高[47-48]。因此,通过MAXENT模型预估内涝高风险区可起到动态监测作用,对内涝的防控具有重要意义。
图9 内涝风险概率的局部空间自相关结果

Fig.9 Local spatial autocorrelation result of waterlogging risk probability

3 讨论

3.1 本文方法与相关研究的对比

以往相关研究主要通过随机森林、神经网络等常规机器学习方法进行洪涝风险评估,该类方法通常需使用等量的正样本和负样本,前者来源于历史数据,而后者采集于尚未有灾害报告的区域。如Mojaddadi等[49]结合支持向量机模型和频率比方法预测洪涝风险,其中负样本在高海拔等未曾发生过洪涝灾害的地区随机选取;赖成光等[50]对比随机森林与支持向量机模型预测洪灾风险的效果,其中负样本是在未有历史洪水记录的区域均匀选取。正样本的数量通常仅有数百个,而负样本则可多达数万个。为了实现样本等量通常会对负样本进行欠采样(under-sampling)操作,但欠采样过程会造成部分重要信息的丢失,进而影响机器学习的准确性[51]。尽管有学者尝试改善负样本的质量,如Tang等[52]提出重复随机欠采样方法,根据特定的阙值选择多次采样下的负样本以实现对负样本的优化;再如Tang等[51]提出优化种子传播算法,根据历史内涝点和地理环境特征模拟潜在的正样本,以此选择更多的负样本。然而,即使通过特定算法可改善负样本的质量,也无法保证负样本采集处将来一定不发生内涝。这是因为城市的地理环境特征是快速动态变化的,极端暴雨事件极易导致新的内涝点出现,负样本处将来可能也会发生内涝现象。故负样本的选取过程仍极大影响以往相关方法的准确度和可靠性。由于MAXENT模型在仅有正样本的情况下,仍能获得较为理想的物种分布预估结果,因此本文提出将MAXENT模型应用于城市内涝风险评估中。

3.2 本文结果与相关研究的对比

本文在仅清楚真实内涝点的情况下,根据MAXENT模型评估深圳市城市内涝风险情况。除将常规的自然条件、土地利用情况、极端降雨情况等作为内涝潜在影响因子外,还创新性地考虑了三维建筑指标。拟合结果的AUC值达到0.806,说明模型评估精度较高。预测得到深圳市的内涝风险概率分布,并结合空间自相关方法对潜在高风险区进行分析,所得结果可以为缓解城市内涝问题和推动海绵城市建设提供理论依据。
为将本文结果与传统方法的结果进行对比分析,进一步运用随机森林预测城市内涝风险。根据随机采集的负样本构建随机森林模型,结果显示精度为74%,表明模型拟合效果较好。随后利用校验后的模型预测深圳市的内涝风险概率(图10)。与MAXENT的结果对比发现,许多潜在的高风险区域未能被随机森林识别,如光明区、南山区、福田区、龙岗区部分地区(图8)。原因可能在于该地区存在负样本,导致随机森林模型结果难以识别出上述潜在高风险区域,而MAXENT模型可以有效避免该问题的发生。尽管MAXENT模型的结果可能存在一定误报率,但是随机森林等传统方法所得结果存在的漏报率更不利于内涝灾害的防治。因此根据MAXENT的预测结果提前采取预防措施,可以有效减少城市内涝的负面影响。此外,虽然本文仅以深圳市2015—2019年的数据为基准,若有其余地区或其余年份的数据,该方法同样适用。
图10 随机森林内涝风险评估结果

Fig.10 Waterlogging risk probability by random forest

3.3 本研究的不足

本文也存在一定不足,如利用MAXENT模型对深圳市内涝风险进行评估时,只选取了部分较为有代表性的影响因子。而在现实生活中内涝的影响因素会更为复杂,不仅会受到自然环境条件的限制,也会受到其他因素如雨水管网设施的影响。在未来的研究中可将更多相关的影响因子考虑在内。此外,由于测量仪器不同和数据类型的原因,数据精度和准确度也存在一定不足,未来需要获取更高分辨率的土地利用和暴雨等数据进行分析。

4 结论

内涝会给城市带来较大的排水压力,对社会经济造成极大影响,甚至直接危害人们的生命安全。如何进行内涝风险评估是预防灾害、降低灾害风险的重点与热点问题。为解决以往研究的不足,本文以深圳市作为研究案例,通过MAXENT剖析内涝与各潜在影响因子的关联性,探究各因子对内涝风险的重要程度,并对内涝风险概率的空间分布进行分析,主要结论与建议如下:
(1) 不透水面比例、绿地比例、人口密度、暴雨峰值雨量、地表起伏度是影响内涝发生的主导因素。不透水面比例与绿地比例对内涝风险具有显著影响,内涝风险概率随不透水面比例的增加而提高,峰值达0.8左右。因此在城市建设中,需要控制不透水面的无序蔓延,关注现有内涝点周围新开发的低洼建设用地,如下凹式立交桥、老旧街道。
(2) 由响应曲线可知,极端降雨事件也是影响内涝风险的重要因素,暴雨次数、暴雨峰值雨量均对建模的贡献率较大。随着暴雨峰值雨量的增大,内涝风险不断增加。此外,内涝风险概率随着人口密度的增大而提高,随着地表起伏度的增大而减小。虽然人口密度难以进行宏观调控,地形地势条件也无法改变,但相关部门可以采取积极的措施如合理配置土地资源、进行城市功能区规划,以减轻人类活动对内涝的负面影响。
(3) 虽然与其余影响因子相比,三维建筑指标的贡献率并不突出,但容积率、平均建筑高度也对内涝风险概率产生一定影响。建筑的过度聚集容易导致人为热量和凝结核的过量排放,从而引发“雨岛效应”,致使城市微气候发生改变,增加局部地区短期极端降水的频率和强度。因此,应尽量避免建筑的大量聚集,以降低内涝风险概率。在未来城市规划中,相关部门也应当从三维的角度思考如何更合理规划建筑格局,从而更好地缓解内涝问题,实现防灾减灾。
(4) 通过对内涝概率的评估得出潜在高风险区,发现潜在高风险区多位于福田区、罗湖区、龙岗区中部、光明区北部、南山区中部;且原本以往较少内涝点的南山区北部、福田区西部、罗湖区中部等部分区域在风险评估的局部空间自相关结果中却出现高—高集聚现象,表明这些地区的内涝风险概率会受到周边地区的正向影响,未来极有可能出现新的内涝点。因此在内涝的监测与防治中,应当重点关注上述地区以更好地实现内涝防控。
[1]
Lin L, Wu Z N, Liang Q H. Urban flood susceptibility analysis using a GIS-based multi-criteria analysis framework[J]. Natural Hazards, 2019, 97(2): 455-475.

DOI

[2]
薛丰昌, 朱一晗, 顾人颖, 等. Floodarea模型的城市内涝可视化数值模拟[J]. 测绘科学, 2020, 45(8): 181-187, 198.

[Xue Fengchang, Zhu Yihan, Gu Renying, et al. Visual numerical simulation of urban waterlogging based on Floodarea model. Science of Surveying and Mapping, 2020, 45(8): 181-187, 198. ]

[3]
Bertilsson L, Wiklund K, de Moura Tebaldi I, et al. Urban flood resilience: A multi-criteria index to integrate flood resilience into urban planning[J]. Journal of Hydrology, 2019, 573: 970-982.

DOI

[4]
胡文燕, 李梦雅, 王军, 等. 暴雨内涝影响下的城市道路交通拥挤特征识别[J]. 地理科学进展, 2018, 37(6): 772-780.

DOI

[Hu Wenyan, Li Mengya, Wang Jun, et al. Urban traffic congestion caused by rainstorms and innudation. Progress in Geography, 2018, 37(6): 772-780. ]

DOI

[5]
王志寰, 朱立俊, 王建中, 等. 长江倒灌鄱阳湖原因及发生条件的量化指标[J]. 水科学进展, 2020, 31(2): 203-213.

[Wang Zhihuan, Zhu Lijun, Wang Jianzhong, et al. Reverse flow from Yangtze River to Poyang Lake: Causes and occurrence conditions quantization index. Advances in Water Science, 2020, 31(2): 203-213. ]

[6]
赵广英, 李晨, 刘淑娟. 城市内涝问题的规划改善途径研究: 以湖南省为例[J]. 现代城市研究, 2016(12): 51-61.

[Zhao Guangying, Li Chen, Liu Shujuan. Urban waterlogging planning research of improving ways: A case study of Hunan Province. Modern Urban Research, 2016(12): 51-61. ]

[7]
黄华兵, 王先伟, 柳林. 城市暴雨内涝综述特征、机理、数据与方法[J]. 地理科学进展, 2021, 40(6): 1048-1059.

DOI

[Huang Huabing, Wang Xianwei, Liu Lin. A review on urban pluvial floods: Characteristics, mechanisms, data, and research methods. Progress in Geography, 2021, 40(6): 1048-1059. ]

DOI

[8]
唐钰嫣, 潘耀忠, 范津津, 等. 土地利用景观格局对城市内涝灾害风险的影响研究[J]. 水利水电技术(中英文), 2021, 52(12): 1-11.

[Tang Yuyan, Pan Yaozhong, Fan Jinjin, et al. The influence of landscape pattern on the risk of urban waterlogging disaster. Water Resources and Hydropower Engineering, 2021, 52(12): 1-11. ]

[9]
赵丽元, 韦佳伶. 城市建设对暴雨内涝空间分布的影响研究: 以武汉市主城区为例[J]. 地理科学进展, 2020, 39(11): 1898-1908.

DOI

[Zhao Liyuan, Wei Jialing. Impact of urban development on the risk of flooding: A case study of Wuhan City, China. Progress in Geography, 2020, 39(11): 1898-1908. ]

DOI

[10]
李孝永, 匡文慧. 北京城市土地利用/覆盖变化及其对雨洪调节服务的影响[J]. 生态学报, 2020, 40(16): 5525-5533.

[Li Xiaoyong, Kuang Wenhui. Urban land use/cover change and its impact on urban flood regulation ecosystem service in Beijing. Acta Ecologica Sinica, 2020, 40(16): 5525-5533. ]

[11]
梁志承, 赵耀龙, 付迎春. 耦合蚁群算法和SCS-CN水文模型的城市不透水面空间格局优化[J]. 地球信息科学学报, 2017, 19(10): 1315-1326.

DOI

[Liang Zhicheng, Zhao Yaolong, Fu Yingchun. Optimization of spatial pattern of urban imperviousness based on the integration of SCS-CN hydrological model and the ant colony algorithm. Journal of Geo-information Science, 2017, 19(10): 1315-1326. ]

[12]
张华, 尹占娥, 殷杰, 等. 基于土地利用的城市暴雨内涝灾害脆弱性评估: 以上海浦东新区为例[J]. 上海师范大学学报(自然科学版), 2011, 40(4): 427-434.

[Zhang Hua, Yin Zhane, Yin Jie, et al. Vulnerability assessment of urban rainstorm water-logging in pudong of Shanghai in terms of land use. Journal of Shanghai Normal University (Natural Sciences), 2011, 40(4): 427-434. ]

[13]
李彬烨, 赵耀龙, 付迎春. 广州城市暴雨内涝时空演变及建设用地扩张的影响[J]. 地球信息科学学报, 2015, 17(4): 445-450.

DOI

[Li Binye, Zhao Yaolong, Fu Yingchun. Spatio-temporal characteristics of urban storm waterlogging in Guangzhou and the impact of urban growth. Journal of Geo-information Science, 2015, 17(4): 445-450. ]

[14]
叶超凡, 张一驰, 程维明, 等. 北京市区快速城市化进程中的内涝现状及成因分析[J]. 中国防汛抗旱, 2018, 28(2): 19-25.

[Ye Chaofan, Zhang Yichi, Cheng Weiming, et al. Analysis on urban pluvial floods and causes during rapid development in Beijing. China Flood & Drought Management, 2018, 28(2): 19-25. ]

[15]
吴健生, 张朴华. 城市景观格局对城市内涝的影响研究: 以深圳市为例[J]. 地理学报, 2017, 72(3): 444-456.

DOI

[Wu Jiansheng, Zhang Puhua. The effect of urban landscape pattern on urban waterlogging. Acta Geographica Sinica, 2017, 72(3): 444-456. ]

DOI

[16]
Bautista S, Mayor Á G, Bourakhouadar J, et al. Plant spatial pattern predicts hillslope semiarid runoff and erosion in a Mediterranean landscape[J]. Ecosystems, 2007, 10(6): 987-998.

DOI

[17]
李柳华, 刘小平, 欧金沛, 等. 基于随机森林模型的城市扩张三维特征时空变化及机制分析[J]. 地理与地理信息科学, 2019, 35(2): 53-60.

[Li Liuhua, Liu Xiaoping, Ou Jinpei, et al. Spatio-temporal changes and mechanism analysis of urban 3D expansion based on Random Forest Model. Geography and Geo-Information Science, 2019, 35(2): 53-60. ]

[18]
于晓雨, 许刚, 刘樾, 等. 长江三角洲地区城市建筑三维形态对地表热环境的影响[J]. 中国环境科学, 2021, 41(12): 5806-5816.

[Yu Xiaoyu, Xu Gang, Liu Yue, et al. Influences of 3D features of buildings on land surface temperature: A case study in the Yangtze River Delta urban agglomeration. China Environmental Science, 2021, 41(12): 5806-5816. ]

[19]
Xu Y, Liu M, Hu Y M, et al. Analysis of three-dimensional space expansion characteristics in old industrial area renewal using GIS and Barista: A case study of Tiexi District, Shenyang, China[J]. Sustainability, 2019, 11(7): 1860. doi: 10.3390/su11071860.

DOI

[20]
陈探, 刘淼, 胡远满, 等. 沈阳城市三维景观空间格局分异特征[J]. 生态学杂志, 2015, 34(9): 2621-2627.

[Chen Tan, Liu Miao, Hu Yuanman, et al. Differentiation characteristics of three-dimensional landscape pattern in Shenyang. Chinese Journal of Ecology, 2015, 34(9): 2621-2627. ]

[21]
乔伟峰, 刘彦随, 王亚华, 等. 2000年以来南京城市三维空间扩展特征[J]. 地理研究, 2015, 34(4): 666-676.

DOI

[Qiao Weifeng, Liu Yansui, Wang Yahua, et al. Analysis on the characteristics of three-dimensional urban space expansion in Nanjing since 2000. Geographical Research, 2015, 34(4): 666-676. ]

DOI

[22]
杨俊, 国安东, 席建超, 等. 城市三维景观格局时空分异特征研究: 以大连市中山区为例[J]. 地理学报, 2017, 72(4): 646-656.

DOI

[Yang Jun, Guo Andong, Xi Jianchao, et al. Spatial-temporal differentiation of three-dimensional urban landscape pattern: A case study of Zhongshan District in Dalian. Acta Geographica Sinica, 2017, 72(4): 646-656. ]

DOI

[23]
刘勇, 张韶月, 柳林, 等. 智慧城市视角下城市洪涝模拟研究综述[J]. 地理科学进展, 2015, 34(4): 494-504.

DOI

[Liu Yong, Zhang Shaoyue, Liu Lin, et al. Research on urban flood simulation: A review from the smart city perspective. Progress in Geography, 2015, 34(4): 494-504. ]

DOI

[24]
张会, 李铖, 程炯, 等. 基于“H-E-V”框架的城市洪涝风险评估研究进展[J]. 地理科学进展, 2019, 38(2): 175-190.

DOI

[Zhang Hui, Li Cheng, Cheng Jiong, et al. A review of urban flood risk assessment based on the framework of hazard-exposure-vulnerability. Progress in Geography, 2019, 38(2): 175-190. ]

DOI

[25]
Tang X Z, Shu Y Q, Lian Y Q, et al. A spatial assessment of urban waterlogging risk based on a Weighted Naïve Bayes classifier[J]. Science of the Total Environment, 2018, 630: 264-274.

DOI

[26]
张菲菲, 谭琳珊, 赵强强, 等. 基于水动力模型的城市内涝灾害研究: 以宁波市白鹤社区为例[J]. 自然灾害学报, 2021, 30(6): 209-218.

[Zhang Feifei, Tan Linshan, Zhao Qiangqiang, et al. Research on urban waterlogging disaster based on hydrodynamic model: Take Baihe community in Ningbo City as an example. Journal of Natural Disasters, 2021, 30(6): 209-218. ]

[27]
朱阿兴, 闾国年, 周成虎, 等. 地理相似性: 地理学的第三定律?[J]. 地球信息科学学报, 2020, 22(4): 673-679.

DOI

[Zhu Axing, Lv Guonian, Zhou Chenghu, et al. Geographic similarity: Third law of geography? Journal of Geo-information Science, 2020, 22(4): 673-679. ]

[28]
吴小君, 方秀琴, 任立良, 等. 基于随机森林的山洪灾害风险评估: 以江西省为例[J]. 水土保持研究, 2018, 25(3): 142-149.

[Wu Xiaojun, Fang Xiuqin, Ren Liliang, et al. Risk assessment of mountain torrents disaster based on Random Forest: A case study in Jiangxi Province. Research of Soil and Water Conservation, 2018, 25(3): 142-149. ]

[29]
Phillips S J, Dudík M. Modeling of species distributions with Maxent: New extensions and a comprehensive evaluation[J]. Ecography, 2008, 31(2): 161-175.

DOI

[30]
Yue Y J, Zhang P Y, Shang Y R. The potential global distribution and dynamics of wheat under multiple climate change scenarios[J]. Science of the Total Environment, 2019, 688: 1308-1318.

DOI

[31]
Gong P, Wang J, Yu L, et al. Finer resolution observation and monitoring of global land cover: First mapping results with Landsat TM and ETM+ data[J]. International Journal of Remote Sensing, 2013, 34(7): 2607-2654.

DOI

[32]
Zhang P F, Hu Y M, Xiong Z P. Extraction of three-dimensional architectural data from QuickBird images[J]. Journal of the Indian Society of Remote Sensing, 2014, 42(2): 409-416

DOI

[33]
何文文, 侯英姿. 多指标下大连市金普新区城市形态分析[J]. 国土与自然资源研究, 2017(6): 54-55.

[He Wenwen, Hou Yingzi. The analysis of Jinpu new area in Dalian City by multicriteria. Territory & Natural Resources Study, 2017(6): 54-55. ]

[34]
周伟奇, 田韫钰. 城市三维空间形态的热环境效应研究进展[J]. 生态学报, 2020, 40(2): 416-427.

[Zhou Weiqi, Tian Yunyu. Effects of urban three-dimensional morphology on thermal environment: A review. Acta Ecologica Sinica, 2020, 40(2): 416-427. ]

[35]
Tang R, Blangiardo M, Gulliver J. Using building heights and street configuration to enhance intraurban PM10, NO(X), and NO2 land use regression models[J]. Environmental Science & Technology, 2013, 47(20): 11643-11650.

DOI

[36]
麦鉴锋, 冼宇阳, 刘桂林. 气候变化情景下广东省降雨诱发型滑坡灾害潜在分布及预测[J]. 地球信息科学学报, 2021, 23(11): 2042-2054.

DOI

[Mai Jianfeng, Xian Yu-yang, Liu Guilin. Predicting potential rainfall-triggered landslides sites in Guangdong Province (China) using MaxEnt Model under climate changes scenarios. Journal of Geo-information Science, 2021, 23(11): 2042-2054. ]

[37]
Jaynes E T. On the rationale of maximum entropy methods[J]. Proceedings of the IEEE, 1982, 70(9): 939-952.

DOI

[38]
宋明顺, 杨铭, 方兴华. 基于最大熵分布的控制图改进与评价研究[J]. 中国管理科学, 2019, 27(12): 208-216.

[Song Mingshun, Yang Ming, Fang Xinghua. Improved control charts based on maximum entropy and their evaluations. Chinese Journal of Management Science, 2019, 27(12): 208-216. ]

[39]
Soilhi Z, Sayari N, Benalouache N, et al. Predicting current and future distributions of Mentha pulegium L. in Tunisia under climate change conditions, using the MaxEnt model[J]. Ecological Informatics, 2022, 68: 101533. doi: 10.1016/j.ecoinf.2021.101533.

DOI

[40]
李航. 统计学习方法[M]. 2版. 北京: 清华大学出版社, 2019: 80-83.

[Li Hang. Statistical methods. 2nd ed. Beijing, China: Tsinghua University Press, 2019: 80-83. ]

[41]
Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.

DOI

[42]
郭玉宝, 池天河, 彭玲, 等. 利用随机森林的高分一号遥感数据进行城市用地分类[J]. 测绘通报, 2016(5): 73-76.

[Guo Yubao, Chi Tianhe, Peng Ling, et al. Classification of GF-1 remote sensing image based on Random Forests for urban land-use. Bulletin of Surveying and Mapping, 2016(5): 73-76. ]

[43]
任平, 吴涛, 周介铭. 基于GIS和空间自相关模型的耕地空间分布格局及变化特征分析: 以成都市龙泉驿区为例[J]. 中国生态农业学报, 2016, 24(3): 325-334.

[Ren Ping, Wu Tao, Zhou Jieming. Analysis of spatial distribution pattern and evolutionary characteristics of cultivated lands based on spatial autocorrelation model and GIS platform: A case study of Longquanyi District, Chengdu, China. Chinese Journal of Eco-Agriculture, 2016, 24(3): 325-334. ]

[44]
颜明艳, 李琼珍, 宋洁, 等. 基于MAXENT模型评估北部湾潮间带中国鲎和圆尾鲎稚鲎的潜在地理分布及种群保育对策[J]. 生态学报, 2019, 39(9): 3100-3109.

[Yan Mingyan, Li Qiongzhen, Song Jie, et al. Prediction of potential distribution areas of Chinese horseshoe crab and mangrove horseshoe crab in the Beibu Gulf of Guangxi based on MAXENT model and their population conservation strategies. Acta Ecologica Sinica, 2019, 39(9): 3100-3109. ]

[45]
曹倩, 高庆波, 郭万军, 等. 基于MaxEnt模拟人类活动与环境因子对青藏高原特有植物祁连獐牙菜潜在分布的影响[J]. 植物科学学报, 2021, 39(1): 22-31.

[Cao Qian, Gao Qingbo, Guo Wanjun, et al. Impacts of human activities and environmental factors on potential distribution of Swertia przewalskii Pissjauk., an endemic plant in Qing-Tibetan Plateau, using MaxEnt. Plant Science Journal, 2021, 39(1): 22-31. ]

[46]
李安, 李良涛, 高萌萌, 等. 基于MaxEnt模型和气候变化情景入侵种黄顶菊在中国的分布区预测[J]. 农学学报, 2020, 10(1): 60-67, 76.

[Li An, Li Liangtao, Gao Mengmeng, et al. Distribution prediction of invasive species flaveria bidentis in China: Based on MaxEnt model and climate change scenario. Journal of Agriculture, 2020, 10(1): 60-67, 76. ]

[47]
张海行, 张伟, 杨文辉, 等. 基于水力排水模型的宁波海绵试点区内涝风险评估[J]. 中国给水排水, 2020, 36(12): 8-13.

[Zhang Haixing, Zhang Wei, Yang Wenhui, et al. Assessment of urban waterlogging risk in Ningbo sponge city pilot area based on hydraulic drainage model. China Water & Wastewater, 2020, 36(12): 8-13. ]

[48]
Lin J Y, He X Y, Lu S Y, et al. Investigating the influence of three-dimensional building configuration on urban pluvial flooding using random forest algorithm[J]. Environmental Research, 2021, 196: 110438. doi: 10.1016/j.envres.2020.110438.

DOI

[49]
Mojaddadi H, Pradhan B, Nampak H, et al. Ensemble machine-learning-based geospatial approach for flood risk assessment using multi-sensor remote-sensing data and GIS[J]. Geomatics, Natural Hazards & Risk, 2017, 8(2): 1080-1102.

[50]
赖成光, 陈晓宏, 赵仕威, 等. 基于随机森林的洪灾风险评价模型及其应用[J]. 水利学报, 2015, 46(1): 58-66.

[Lai Chengguang, Chen Xiaohong, Zhao Shiwei, et al. A flood risk assessment model based on Random Forest and its application. Journal of Hydraulic Engineering, 2015, 46(1): 58-66. ]

[51]
Tang X Z, Li J F, Liu W, et al. A method to increase the number of positive samples for machine learning-based urban waterlogging susceptibility assessments[J]. Stochastic Environmental Research and Risk Assessment, 2022, 36: 2319-2336.

DOI

[52]
Tang X Z, Hong H Y, Shu Y Q, et al. Urban waterlogging susceptibility assessment based on a PSO-SVM method using a novel repeatedly random sampling idea to select negative samples[J]. Journal of Hydrology, 2019, 576: 583-595.

DOI

文章导航

/