研究论文

起讫点建成环境对轨道交通高峰时段网络客流的作用机制分析

  • 庞磊 , 1 ,
  • 任利剑 , 1, * ,
  • 姜宇逍 1, 2 ,
  • 运迎霞 1
展开
  • 1.天津大学建筑学院,天津 300072
  • 2.香港城市大学建筑与土木工程系,香港 999077
*任利剑(1981— ),男,天津人,博士,副研究员,硕士生导师,研究方向为城市交通规划、国土空间规划。E-mail:

庞磊(1993— ),男,山东寿光人,博士生,研究方向为城市交通地理、时空大数据分析。E-mail:

收稿日期: 2024-01-05

  修回日期: 2024-03-28

  网络出版日期: 2024-09-25

基金资助

国家自然科学基金项目(52278070)

Mechanism of impact of the built environment of urban rail transit origin and destination stations on network ridership during peak hours

  • PANG Lei , 1 ,
  • REN Lijian , 1, * ,
  • JIANG Yuxiao 1, 2 ,
  • YUN Yingxia 1
Expand
  • 1. School of Architecture, Tianjin University, Tianjin 300072, China
  • 2. Department of Architecture and Civil Engineering, City University of Hong Kong, Hong Kong 999077, China

Received date: 2024-01-05

  Revised date: 2024-03-28

  Online published: 2024-09-25

Supported by

National Natural Science Foundation of China(52278070)

摘要

建成环境与轨道交通客流之间联系密切。然而既有研究主要致力于探究建成环境对轨道交通站点客流的影响,对网络客流的影响分析较少。与站点客流不同,网络客流的矢量性受起讫点建成环境的双重作用。论文基于多源地理空间数据构建“5D+N”维度的建成环境指标体系,采用可解释轻量级梯度提升机机器学习模型(LightGBM-SHAP)从特征贡献度、单变量非线性关系、双变量交互效应三个方面解析起讫点建成环境对高峰时段网络客流的影响。针对天津的案例研究表明:① 对早高峰网络客流重要度排序前5位的建成环境因素综合贡献达到13.22,其中讫点距市中心距离贡献度最大,从起讫点双重视角来看,讫点建成环境贡献度(20.86)大于起点建成环境贡献度(18.30);② 建成环境因素与早高峰网络客流的非线性关系差异显著,存在非线性正相关、非线性负相关等多种关系,阈值效应也存在单端阈值、多段阈值等多种情况;③ 对于早高峰网络客流,起点或讫点公交站点密度分别与讫点中介中心性有显著交互作用,公交站点密度在两者交互效应中处于主导地位。研究结果对引导站域建成环境更新及提升轨道交通客流效能提供了精准有效的策略指引。

本文引用格式

庞磊 , 任利剑 , 姜宇逍 , 运迎霞 . 起讫点建成环境对轨道交通高峰时段网络客流的作用机制分析[J]. 地理科学进展, 2024 , 43(9) : 1785 -1797 . DOI: 10.18306/dlkxjz.2024.09.008

Abstract

There exists a significant link between the built environment and rail transit ridership. However, the existing studies are mainly devoted to investigating the impact of the built environment on ridership at rail transit stations, and there are fewer analyses on the impact of network ridership. Unlike station ridership, the vectoral nature of network ridership is subject to the dual effects of the built environment at the origin and destination. In this study, we constructed a built environment indicator system with "5D+N" dimensions based on multi-source geospatial data, and used the LightGBM-SHAP model to analyze the impact of the built environment of the origin and destination stations on network ridership during peak hours from three aspects: the contribution of different characteristics, univariate nonlinear relationship, and bivariate interaction effect. The case study of Tianjin showed that: 1) The combined contribution of the top five built environment factors to the importance of network ridership in morning peak reached 13.22, among which the distance of the destination from the city center contributed the most, and the contribution of the built environment of the destination (20.86) was greater than the contribution of the built environment of the starting point (18.30). 2) The nonlinear relationship between built environment factors and morning peak network ridership varied significantly, with nonlinear positive correlation, nonlinear negative correlation, and so on, and the threshold effect also existed in a variety of cases, such as single-end threshold and multi-segment threshold. 3) For morning peak network ridership, origin or destination bus stop density significantly interacts with destination betweenness centrality, respectively, with bus stop density dominating the interaction effect. The results of the study provide a precise and effective strategy to guide the renewal of the built environment of the station area and to enhance the effectiveness of rail transit ridership.

随着中国城市化进程的快速推进,许多大城市的轨道交通进入网络化运营阶段[1]。客流特征是城市轨道交通网络化运营的基础,相较于传统轨道交通站点客流的特征分析,网络客流的研究可以识别轨道交通客流的流动性特征[2]。高峰时段往往集聚了大量城市通勤、通学客流,客流的时空集聚容易导致交通拥堵问题的产生[3-4]。轨道交通快捷、高效、运量大的优势特征对于提升高峰时段客流运输效率、解决交通拥堵具有重要作用[5],而轨道交通高峰时段网络客流的产生与出发地和目的地站点周边的建成环境因素联系紧密。因此,探究起讫点建成环境对轨道交通网络客流的潜在影响机制,准确识别轨道交通高峰时段网络客流的关键影响因素,对于引导城市建成环境有机更新、提升轨道交通客流效能以及提高城市精细化治理水平具有重要支撑作用。
近年来,随着智能交通刷卡数据和多源地理空间数据的出现,国内外学者开始探索建成环境对城市轨道交通客流的影响机制[6-10],既有研究主要集中在建成环境特征指标的选取与研究方法的选择两个方面。建成环境特征主要以Ewing等[11]提出的“5D”指标体系为框架,即混合度、密度、设计、目的地可达性和公交邻近性,通常采用的指标包括用地功能混合度、人口密度、就业岗位密度、开发强度、路网密度、公交站点密度等[12]。此外,“节点—场所模型”(node-place model)及其扩展模型也开始被应用于轨道交通站域建成环境特征分析之中[13-14],它从站点自身属性特征及周边环境属性特征等角度展开分析,这有助于更为全面地分析建成环境特征影响的差异性。对两者关系的研究方法主要采用线性与非线性回归模型。线性回归模型包括普通最小二乘法(ordinary least squares,OLS)、地理加权回归(geographically weighted regression,GWR)以及多尺度地理加权回归(multi-scale geography weighted regression,MGWR)等,例如Zhao等[15]利用OLS模型对南京地铁站点客流与OD (origin-destination)客流的影响因素进行了分析;彭诗尧等[16]利用GWR模型探究了土地利用特征与城市轨道交通站点客流量的依赖关系;庞磊等[17]利用MGWR模型探究了建成环境对站点客流量与站点通勤乘车率影响的差异性。与线性回归相比,非线性回归具有更高的表达和特征提取能力,它能够有效识别规划指标的阈值效应[18-20]。因此,新的机器学习方法被广泛用于解决非线性回归问题,例如崔叙等[21]利用梯度提升决策树(gradient boosting decision tree,GBDT)模型探究了建成环境与社会经济等因素对成都轨道交通站点客流量及出行时间的非线性作用机制;刘翔等[1]基于成长性视角,利用极限梯度提升决策树(extreme gradient boosting,XGBoost)模型探究了不同时期建成环境因素对轨道交通站点客流影响程度的差异。此外,鉴于机器学习模型的“黑箱”问题,也有学者开始引入Shapley可解释(Shapley additive explanations,SHAP)模型来辅助理解站点客流特征与建成环境的复杂关系,例如Du等[22]利用GBDT-SHAP模型从时空变化视角探究了可达性与站点客流量的非线性关系,李培坤等[23]利用XGBoost-SHAP模型探究了建成环境与站点出行距离的非线性关系。
综上所述,既有研究在建成环境特征指标选取和研究方法选择上已经取得了一定研究成果,但仍存在待完善的方向。一是既有研究对于建成环境特征指标的选取未形成统一框架,主要基于“5D”维度,对站点建设特征与复杂性特征相关指标有待进一步探究;二是既有研究主要以站点客流量为因变量,对起讫点建成环境与网络客流可能存在的非线性关系及阈值效应的研究仍不充分。因此,本文以建成环境“5D”特征为基础,引入站点自身属性特征(node attribute characteristics),构建“5D+N”的建成环境指标体系框架[24];以天津市为实证案例,利用可解释轻量级梯度提升机机器学习模型(LightGBM-SHAP),从特征贡献度、单变量非线性关系、双变量交互效应三个方面探究建成环境因素对早高峰网络客流的潜在作用机制。

1 研究数据

1.1 研究对象

本文选择天津作为研究区域。截至2020年12月,天津市共开通运营6条地铁线路、143个站点。既有研究通常以800 m作为轨道交通站点影响区半径[6],主要是根据人们可接受的步行时间(10~15 min)推算得出。同时,根据中国住房和城乡建设部颁布的《城市轨道沿线地区规划设计导则》要求,将站点周边800 m范围作为轨道交通功能紧密关联区。因此,本文同样以800 m作为轨道交通站点影响区半径。而中心城区站点分布较为紧密,相邻站点的影响区范围可能存在重叠区域,因此通过构建泰森多边形切割重叠区域,最终获得不含重叠区域的站点影响区范围(图1),相关建成环境指标在对应站点影响区内统计。
图1 研究区域

Fig.1 The study area

1.2 数据来源

本文使用的数据包括轨道交通刷卡数据、轨道交通站点与线网数据、手机信令数据、兴趣点(point of interest,POI)数据、建筑足迹数据、道路网数据、公交站点数据、交通等时圈数据等。具体见表1
表1 数据来源

Tab.1 Data Sources

数据名称 时间 数据来源
天津轨道交通智能刷卡数据 2020年(12月14—18日,周一到周五) 天津市市政工程院交通规划研究中心
天津轨道交通站点线网数据 2020年 百度地图平台与天津轨道交通网站(http://www.tjgdjt.com)
手机信令数据 2020年 中国联通
天津POI数据 2020年 通过百度地图API爬取
天津市道路网数据 2020年 通过Open Street Map采集
天津市公交站点数据 2020年 通过高德地图API爬取
交通等时圈数据 2020年 通过Mapbox Isochrone API获取(https://docs.mapbox.com/)
天津市建筑外轮廓数据 2020年 通过百度地图API爬取

2 研究框架与研究方法

2.1 研究框架

本文的技术路线主要包括三个部分:① 构建起讫点双重视角的多维度建成环境指标体系,利用Python与ArcGIS处理智能刷卡数据获取高峰时段网络客流;② 构建并筛选较优的决策树机器学习模型;③ 利用LightGBM-SHAP模型从特征贡献度、单变量非线性关系、双变量交互效应三个方面解析建成环境对高峰时段网络客流的潜在作用机制(图2)。
图2 研究框架

Fig.2 Analytical framework

2.2 建成环境因素测度与高峰时段网络客流分析

鉴于高峰时段网络客流的矢量性受到起讫点建成环境因素的共同作用,因此本文从起讫点双重视角测度建成环境因素,并以建成环境“5D”特征为基础,引入站点自身属性特征,构建“5D+N”的建成环境指标体系[24](表2)。其中,多样性通过POI混合度测度,既有研究表明POI混合度对站点客流量有负向作用[25]。密度通过居住人口密度、容积率测度,既有研究表明人口密度对站点客流量一般有显著正向作用[26],而容积率对出站客流量具有正向作用,用地开发强度的提高将增加就业人口数量,进而增加客流需求[7]。设计维度选取了路网密度与步行指数测度,其中步行指数表示以站点为起点的10 min步行等时圈面积[25],利用Python爬取Mapbox地图数据获得,这两项指标表征了交通可达性,可达性较高的区域轨道交通站点客流一般也较多。目的地可达性通过距市中心距离与多种POI设施密度测度,其中距市中心距离对站点客流量一般有显著负向作用[27]。公交邻近性通过公交站点密度测度,既有研究表明公交站点密度对站点客流量一般有正向作用[17]。站点属性则包括站点出入口数量的基本特征和轨道网络结构特征,本文选取度中心性、中介中心性、接近度中心性三项指标表征站点的重要性[28]。度中心性表示站点连接的线路边数,数量越多换乘越便捷;中介中心性表示网络中所有经过该站点的最短路径的数量比,数值越大说明中转效率越高、重要性越强;接近度中心性数值越大则表示与周围联系越密切,成为中心点的可能性越大[29]。为了提高模型泛化能力,防止模型过拟合,对自变量进行了多重共线性检验,经检验发现,VIF值均小于10,排除了强相关因素的干扰。
表2 变量定义

Tab.2 Definition of the variables

维度 指标 定义 平均值 VIF
起点 讫点 起点 讫点
多样性 POI混合度 表示POI类型的丰富性和复杂性 0.85 0.85 1.80 1.79
密度 居住人口密度 站点影响区内夜间手机信令数量与站点影响区面积之比(万人/km²) 2.14 2.16 2.26 2.30
容积率 站点影响区内总建筑面积与其面积之比 1.21 1.22 5.82 5.44
设计 路网密度 站点影响区内道路网长度与其面积之比(km/km²) 6.80 6.81 2.57 2.73
步行指数 站点10 min骑行等时圈面积(km²) 0.85 0.86 2.29 2.36
目的地
可达性
距市中心距离 各站点距离市中心的距离(本文以商业中心营口道为市中心,km) 8.38 8.46 2.74 2.81
行政办公设施POI密度 站点影响区内办公设施数量与其面积之比(个/km²) 27.65 28.74 6.34 6.65
商业服务设施POI密度 站点影响区内餐饮、购物等商业服务设施数量与其面积之比(个/km²) 92.78 95.33 4.62 4.67
商务办公设施POI密度 站点影响区内金融、企业等商务办公设施数量与其面积之比(个/km²) 76.81 81.04 3.91 4.03
医疗保健设施POI密度 站点影响区内医疗保健设施数量与其面积之比(个/km²) 21.62 21.30 4.55 4.69
文化教育设施POI密度 站点影响区内文化教育设施数量与其面积之比(个/km²) 6.21 6.11 4.56 4.79
公交
邻近性
公交站点密度 站点影响区内公交站点数量与其面积之比(个/km²) 4.92 4.96 2.49 2.50
站点属
性特征
站点出入口个数 站点已开通运营的出入口数量(个) 3.04 3.10 1.60 1.52
度中心性 与节点相连接的邻近节点数(个) 2.16 2.15 2.42 2.34
中介中心性 度量某节点出现在网络最短路径上的频率,表征节点作为中介的效率 0.09 0.09 3.61 3..66
接近中心性 从起始节点i到网络中其他所有节点的路径长度平均值的倒数,数值越大,成为中心点的可能性也越大 0.09 0.09 6.64 7.11
天津工作日轨道交通客流变化特征(图3a)表明客流集中在7:00~9:00与17:00~19:00时段,即早晚高峰的时间区间。因此利用Python提取并计算工作日早高峰与晚高峰时段每个OD的客流量,并利用ArcGIS进行空间可视化分析,按照自然间断点分类法分为5级,如图3b3c所示,可以看出,早晚高峰主要客流流向相似,形成以和平区为中心的放射性网络布局,其中东南与西北方向客流最为密集,而正南与正北方向客流较为稀疏。早高峰去向客流与晚高峰返向客流具有镜像特征,对比分析发现,互为镜像的早晚高峰OD段客流量,两者间相关性达到95%,但早高峰网络客流量(25.32万人)明显大于晚高峰网络客流量(20.65万人)。因此,本文主要针对早高峰网络客流展开分析,起点指乘客的出发地站点,讫点指乘客的目的地站点,因变量为早高峰各OD段客流量(表3),自变量为每段OD对应的出发地与目的地站点的周边建成环境。
图3 轨道交通客流时空可视化分析

Fig.3 Spatial and temporal analysis of urban rail transit ridership

表3 早高峰各OD段客流量统计

Tab.3 Morning peak OD ridership statistics

OD段 起点O
(出发地站点)
讫点D
(目的地站点)
客流量/人
(因变量)
天津南站—华苑 天津南站 华苑 856
华山里—小白楼 华山里 小白楼 622
华山里—南楼 华山里 南楼 604
…… …… …… ……

2.3 LightGBM模型与SHAP模型

2.3.1 基于LightGBM构建网络客流预测模型

LightGBM模型是对XGBoost模型的进一步优化,是一种基于Histogram的决策树算法。它将特征值离散化成Bin数据并构建直方图,遍历训练数据来统计每个离散值在直方图中的累积量,以此来构建决策树(图4)。与XGBoost不同的是,它使用了带有深度限制的按叶子生长(Leaf-wise)的决策树生长策略[30],可以更高效、更精准地进行并行计算,同时最大树深的限制也可以避免过拟合现象,因此LightGBM成为目前最优的算法之一。首先在LightGBM模型推导过程中定义损失函数与目标函数,设数据集样本数为N,决策树个数为Myi为第i个样本的真实值, y ^ i为预测值。损失函数 l y i , y ^ i表示真实值与预测值之间的误差,损失函数使用均方误差表示为:
l y i , y ^ i = y i - y ^ i 2
图4 LightGBM决策树模型构建流程

Fig.4 LightGBM decision tree model construction process

目标函数定义为:
o b j e c t i v e θ = 1 N i = 1 N l y i , y ^ i + Ω θ
式中:θ表示模型的参数; Ω θ表示正则化项,用于控制模型复杂度。
对目标函数进行泰勒展开和化简得到近似形式的目标函数:
o b j θ , g , h = 1 N i = 1 N g i f x i + 1 2 h i f 2 x i + Ω θ
式中:gihi分别表示样本i的一阶与二阶梯度信息,f(xi)表示第i个样本的预测值。
更新迭代公式为:
f m x i = f m - 1 x i + η h m ( x i )
式中:fm(xi)是第m次迭代后模型对样本xi的预测值,hm(xi)是第m颗树对样本xi的负梯度,η是学习率。
最终模型为:
f x = m = 1 M f m x

2.3.2 基于SHAP量化建成环境因素的影响程度

SHAP模型是一种基于博弈论和局部解释来估计每个特征贡献的解释机器学习模型预测方法,在SHAP模型中每个特征对模型输出的贡献根据其边际贡献进行分配[31]。机器学习模型内置生成的特征重要性只显示了特征重要性的排序,不能从局部解释每个特征对每个样本的贡献度。本文中,SHAP模型根据各项建成环境因素对通勤网络客流的影响程度来为各因素分配SHAP值,它不仅能从全局解释各项因素对总体样本贡献度的大小,还能从局部解释各项因素对每个样本的贡献度,从而将“黑箱”模型转换成了可解释的机器学习模型[32]。SHAP值的计算基于以下公式:
ϕ i f = S F \ I S ! × F - S - 1 ! F ! × f S i - f S
式中:F是所有特征的集合,S是不包含特征I的特征子集, ϕ i f是特征i的SHAP值,f(S)是模型在给定特征子集S时的预测输出。

3 结果与分析

3.1 机器学习模型参数调优与结果对比

本文将样本数据以7∶3划分为训练集和测试集,分别构建GBDT、XGBoost与LightGBM三种决策树模型,结合样本量与既有研究设置模型主要超参数范围[22-33],分别设最大决策树数量为500、1000、2000、5000,学习率为0.01、0.02、0.05,最大树深为3、5、7、10、14,采用网络搜索与五折交叉验证法来确定三个模型各自的最优超参数组合[33]。参数调优的目的是为了防止模型过拟合并控制其复杂度,基于各模型的最优超参数配置对比模型评估指标(表4),以此来选择最优模型。绝对误差(MAE)、均方误差(MSE)与均方根误差(RMSE)值越小表示模型预测效果越好,R²越大表示拟合程度越好,根据结果选择准确性与鲁棒性更高的LightGBM模型用于后续分析。
表4 不同决策树模型最优参数配置及评估指标结果

Tab.4 Optimal parameter configuration and evaluation index results of different decision tree models

模型类型 最大决策树数量 学习率 最大树深 测试集评估指标
MAE MSE RMSE R²
GBDT 2000 0.02 7 9.67 453.56 21.28 0.59
XGBoost 2000 0.05 7 9.64 447.86 21.16 0.60
LightGBM 2000 0.02 10 9.47 430.48 20.74 0.63

3.2 建成环境因素贡献度分析

本文利用LightGBM-SHAP模型计算各项自变量的平均绝对SHAP值及各个样本的SHAP值。图5显示了建成环境因素的贡献度排序及其对早高峰网络客流的正负反馈作用,位于SHAP值正区间的样本表示样本建成环境因素对早高峰网络客流具有正向贡献,若位于负区间则表示具有负向贡献。贡献度排序前5位的因素是讫点距市中心距离、讫点商务办公设施POI密度、讫点公交站点密度、起点距市中心距离、起点文化教育设施POI密度,综合贡献度达到13.22。以起讫点距市中心距离为例对其反馈作用进行解析,讫点距市中心距离对早高峰网络客流表现出近距离正向影响、中远距离负向影响,而起点距市中心距离对其则表现出近距离负向影响、中远距离正向影响。
图5 建成环境因素贡献度排序及其SHAP值分布

注:O代表起点,D代表讫点。

Fig.5 Ranking of built environment factor contribution and distribution of their SHAP values

各项特征贡献度的具体统计结果如表5所示,基于建成环境维度的视角,贡献度最大的是公交邻近性,其次为目的地可达性,说明公交接驳换乘便捷性与区位优势对早高峰网络客流量的影响最为显著;基于起讫点建成环境的双向作用视角,目的地对早高峰网络客流的贡献度(20.86)大于出发地的贡献度(18.30),这主要是因为早高峰网络客流的矢量方向主要表现为由城市外围分散的居住聚集区集中流向就业岗位密集的城市核心区,这与北京、广州等典型单中心大城市的早高峰客流特征一致[34]
表5 起讫点建成环境对早高峰网络客流的贡献度

Tab.5 Contribution of the built environment of the origin and destination stations to commuter network ridership

维度 起点 讫点 贡献度
指标 平均绝对
SHAP值
排序 指标 平均绝对
SHAP值
排序 总计 平均值
多样性 O_POI混合度 0.59 26 D_POI混合度 0.52 28 1.11 0.56
密度 O_居住人口密度 1.16 13 D_居住人口密度 1.11 14 5.01 1.25
O_容积率 1.91 12 D_容积率 0.83 19
设计 O_路网密度 0.73 22 D_路网密度 0.84 18 3.12 0.78
O_步行指数 0.74 21 D_步行指数 0.81 20
目的地可达性 O_距市中心距离 2.30 4 D_距市中心距离 3.68 1 19.12 1.60
O_行政办公设施POI密度 0.47 29 D_行政办公设施POI密度 2.05 6
O_商业设施POI密度 0.56 27 D_商业设施POI密度 0.63 25
O_商务办公设施POI密度 0.89 16 D_商务办公设施POI密度 2.73 2
O_医疗保健设施POI密度 1.45 11 D_医疗保健设施POI密度 1.53 9
O_文化教育设施POI密度 2.12 5 D_文化教育设施POI密度 0.71 23
公交邻近性 O_公交站点密度 1.82 7 D_公交站点密度 2.39 3 4.21 2.11
站点属性特征 O_出入口数量 0.20 32 D_出入口数量 0.43 30 6.59 0.82
O_度中心性 0.86 17 D_度中心性 0.30 31
O_中介中心性 1.50 10 D_中介中心性 1.66 8
O_紧密度中心性 1.00 15 D_紧密度中心性 0.64 24

3.3 单变量非线性关系分析

基于SHAP模型生成的部分依赖图能显示起讫点建成环境因素对早高峰网络客流影响的边际效应。本文选取贡献度排名前8位的因素进行分析:
(1) 图6a显示讫点距市中心距离与早高峰网络客流呈非线性负相关。这与既有研究结果一致,距离市中心越远,早高峰出站客流越少。可以看出,距离在0~3 km时对网络客流产生正向影响;当距离超过这个阈值后,对网络客流的正向作用强度迅速衰减;当距离超过5.5 km时对网络客流产生负向影响,但影响力较低且基本处于稳定状态。这主要是因为早高峰网络客流大多为通勤客流,其目的地主要是聚集在城市核心区的公司企业、科研办公场所,通勤客流在早高峰期间大量涌入市中心[25,35];而在城市中心地区外围及郊区地带,分布的就业集中区较少。
图6 单变量SHAP分布

注:图中浅灰色部分表示样本的频数分布状况。

Fig.6 Single variable SHAP distribution

(2) 图6b显示讫点商务办公设施POI密度与早高峰网络客流呈非线性正相关。POI密度在0~50个/km2时对网络客流产生负向影响;在50~70个/km2时影响较小;当POI密度在70个/km2左右时产生阈值效应,超过70个/km2后对网络客流产生正向影响,在70~180个/km2时局部效应稳定,但在180个/km2左右时有显著阈值效应,影响力急剧增强,之后局部效应基本保持稳定。讫点商务办公设施POI密度对早高峰网络客流的正向影响呈现双梯度特征,这主要是因为天津市商务办公就业集中地呈现一主多副的空间分布格局,主要集中分布在小白楼—营口道附近,出现高度聚集现象,其次分布在海光寺、西康路、华苑等地区。
(3) 图6c显示讫点公交站点密度与早高峰网络客流呈非线性正相关。公交站点密度在0~6个/km2时对网络客流产生负向影响,这主要是因为公交站点密度较低的轨交站点多位于城市外围地区,早高峰出站客流较少;公交站点密度在6~8个/km2时影响较小;在8个/km2左右时产生阈值效应,当超过8个/km2后对网络客流产生正向影响,且局部效应基本稳定,这主要是因为随着目的地公交站点密度的增加,方便到站客流选择“地铁—公交”的接驳换乘模式,进而提高了轨道交通出行吸引力,刺激了客流的增长。
(4) 图6d显示起点距市中心距离与早高峰网络客流呈先正相关后负相关的“倒U”形非线性关系。距离在0~6 km时对网络客流产生负向影响,距离在6~13 km时对网络客流产生正向影响,且局部效应基本稳定,距离在13~22 km时对网络客流产生负向影响,局部效应同样较为稳定。这主要是因为在市中心地区,居民基本能够在当地满足日常工作、生活需求,多以近距离出行为主,因此轨道交通出行需求相对较少;在中等距离地区,居住人口密度高,居民多以中远距离出行为主,因此轨道交通出行需求较大;而在郊区,站点周边开发强度低、居住人口密度小,总出行需求也相对较少[17]
(5) 图6e显示起点文化教育设施POI密度与早高峰网络客流呈非线性正相关。POI密度在0~5个/km2时对网络客流产生负向影响,说明过低的文化教育设施密度会抑制客流的产生;POI密度超过5个/km2时对网络客流产生正向影响,在5~13个/km2时的局部效应稳定,但在13个/km2之后影响力急剧增强,后保持相对稳定。这主要是因为起点附近的教育设施越多,其近距离通学、线下教育培训等特征优势明显,对居民的吸引力越大,较高的居住人口密度对早高峰网络客流的产生有正向作用。
(6) 图6f显示讫点行政办公设施POI密度与早高峰网络客流呈非线性正相关。POI密度在0~60个/km2时对网络客流产生较弱的负向影响;POI密度在90个/km2左右时产生阈值效应,当超过90个/km2时对网络客流有显著正向影响。这主要是因为行政办公设施高度聚集的区域主要分布在城市核心区,作为工作目的地在早高峰期间吸引了大量通勤客流。这也表明目的地站点周边行政办公设施POI密度对早高峰网络客流的吸引力有一定阈值限制,只有当其大于90个/km2时才会产生高强度吸引力。
(7) 图6g显示起点公交站点密度与早高峰网络客流呈非线性正相关。公交站点密度在0~4个/km2时对网络客流产生负向影响,说明出发地较低的公交站点密度也会抑制轨道交通客流的产生;在4~7个/km2时影响较小;在7、9个/km2左右时具有多段阈值效应,超过7个/km2时对网络客流产生正向影响,达到9个/km2时对客流的影响强度最大。这主要是因为随着出发地周边公交站点密度的增加,出发地的公交可达性增强,可以方便更多乘客选择“公交—地铁”出行模式,进而提高了轨道交通出行发生量。
(8) 图6h显示讫点的中介中心性与早高峰网络客流呈非线性正相关。中介中心性在0~0.1时对网络客流主要产生负向影响,超过0.13时对网络客流产生正向影响。这是因为中介中心性表征了站点在网络中作为“中介”的传导能力,体现了站点在网络中的重要作用。中介中心性较高的站点基本属于换乘枢纽中心(例如下瓦房、天津站、营口道、文化中心等),交通可达性强且多位于城市中心区,周围就业岗位密集,吸引了大量早高峰通勤客流。

3.4 双变量交互效应分析

上述研究分析了建成环境单变量与早高峰网络客流的非线性关联,为了进一步探究双变量对早高峰网络客流可能存在的交互效应,从公交与轨交相互协作的视角出发,选择贡献度较高的公交站点密度与轨道交通站点中介中心性作为交互因素,利用LightGBM生成的二维依赖图分析两项因素对早高峰网络客流的交互效应。
图7a显示,当且仅当起点中介中心性大于0.24时,起点公交站点密度与起点中介中心性存在一定交互效应,而此类站点仅有4个,说明两者之间整体上无显著交互效应;图7b显示起点公交站点密度大于7个/km2且讫点中介中心性大于0.09时,两者交互效应显著,当讫点公交站点密度大于9个/km2且讫点中介中心性大于0.2时,早高峰网络客流出现最大阈值为28~30人;图7c显示讫点公交站点密度与起点中介中心性的交互效应范围较小,同样不显著;图7d显示讫点公交站点密度大于8个/km2且讫点中介中心性大于0.1时,两者交互效应显著,当讫点公交站点密度大于8.5个/km2且讫点中介中心性大于0.2时,早高峰网络客流出现最大阈值为30~33人。表明起讫点的公交站点密度与讫点中介中心性均存在显著交互效应,而与起点中介中心性的交互效应并不显著。
图7 公交站点密度与轨交站点中介中心性的交互效应

注:图中等值线上数字表示交互效应下的高峰时段网络客流量。

Fig.7 Interaction effect of bus stop density and the betweenness centrality of urban rail transit stations

图8显示讫点公交站点密度、起点公交站点密度、讫点中介中心性三个变量的最大作用值分别为26、23、21人,而起点公交站点密度与讫点中介中心性两项变量联合作用的最大阈值为28~30人,讫点公交站点密度与讫点中介中心性两项变量联合作用的最大阈值为30~33人,均高于其单项指标作用的最大值,进一步说明了出发地或目的地的公交站点密度与目的地轨道交通站点的中介中心性对早高峰网络客流有较为显著的协同促进作用。这主要是因为随着出发地或目的地的公交站点密度的增加,区域交通可达性提升,“公交—地铁”“地铁—公交”接驳换乘的便捷性分别促进了轨道交通的进站客流量与出站客流量;同时,如果目的地轨道交通站点的中介中心性较高,则表明它具有较高换乘和通过性潜能,既有研究表明,高介数站点周边容易形成地区级的城市商业中心[36],从就业需求角度将进一步增强轨道交通客流吸引力。
图8 单变量作用范围

Fig.8 Univariate effect range of variables

4 结论与讨论

为了探究建成环境因素对轨道交通高峰时段网络客流的影响,本文基于“5D+N”维度构建了建成环境评价指标体系,并采用LightGBM-SHAP可解释性机器学习模型从特征贡献度、单变量非线性效应、双变量交互效应三个方面解析了起讫点双重视角下建成环境因素对轨道交通早高峰网络客流的作用机制。研究结果表明:
(1) 起讫点各项建成环境因素对早高峰网络客流的贡献度差异显著,贡献度排序前5位的因素是讫点距市中心距离、讫点商务办公设施POI密度、讫点公交站点密度、起点距市中心距离、起点文化教育设施POI密度,综合贡献度达到13.22;讫点建成环境贡献度(20.86)大于起点建成环境贡献度(18.30),表明早高峰轨道交通网络客流更易受目的地出行环境的影响。
(2) 起讫点各项建成环境因素与早高峰网络客流的非线性关系差异显著,存在非线性正相关、非线性负相关、非线性先正后负相关等多种关系,阈值效应也存在单端阈值、多段阈值等多种情况。识别起讫点建成环境因素对早高峰网络客流的阈值效应,对合理控制建成环境因素的优化范围提供了更为精准有效的指导。当目的地站点周边商务办公设施POI密度大于180个/km2或行政办公设施POI密度大于90个/km2或出发地站点周边文化教育设施POI密度大于13个/km2时,建成环境对早高峰网络客流具有显著正向作用;当公交站点密度处于8~9个/km2时,早高峰网络客流会有效提升。
(3) 改变某一建成环境因素会导致其他因素的影响发生变化,轨道交通站点周边建成环境的更新规划应综合考虑要素间的交互效应。起讫点公交站点密度与讫点中介中心性对早高峰网络客流存在显著交互作用,起讫点公交站点密度均可显著加强讫点中介中心性的影响程度,在两者交互效应中处于主导地位。合理、有效的要素分布有助于提高公交接驳换乘便捷性,从而进一步提升轨道交通早高峰网络客流效能。当起点公交站点密度大于7个/km2且讫点中介中心度大于0.09,或者讫点公交站点密度大于8个/km2且讫点中介中心性大于0.1时,均对早高峰网络客流的综合提升具有较大促进作用。
对上述轨道交通起讫点建成环境因素的非线性分析揭示了其对早高峰网络客流的影响特征,研究成果对引导站域建成环境更新及提升轨道交通客流效能提供了相关的策略指引:① 基于起讫点建成环境因素贡献度情况可以划定干预因素的优先级;② 基于起讫点建成环境与早高峰网络客流的非线性关系及阈值效应可以提供有效的因素干预范围;③ 基于起讫点建成环境因素的交互效应可以为最大化提升网络客流提供协同干预依据。
本文存在以下几点不足:第一,由于本文仅收集到单一年份的城市轨道交通刷卡及建成环境数据,只能探究起讫点建成环境与早高峰网络客流之间的非线性关系,而不能探究两者之间的因果关系,未来研究可通过收集历年的建成环境更新数据及轨道交通刷卡数据,建立纵向设计探索起讫点建成环境对轨道交通网络客流的因果关系;第二,本文仅关注了工作日高峰时段轨道交通出行行为,未来应增加工作日平峰时段、工作日全天以及休息日不同时段的轨道交通出行行为研究,通过对比分析,探究不同时段轨道交通出行特征及影响机制的差异性。
[1]
刘翔, 陈小鸿, 田茗舒. 成长性视角下建成环境对轨道交通站点客流影响分析[J]. 交通运输系统工程与信息, 2023, 23(2): 121-127.

[Liu Xiang, Chen Xiaohong, Tian Mingshu. Effects of built environment on metro ridership considering stage of growth. Journal of Transportation Systems Engineering and Information Technology, 2023, 23(2): 121-127. ]

[2]
张铭航, 韦锦, 范伟莉, 等. 城市轨道交通网络OD间路径旅行时间可靠性研究[J]. 城市交通, 2023, 21(2): 109-117, 72.

[Zhang Minghang, Wei Jin, Fan Weili, et al. Travel time reliability of OD routes in urban rail transit network. Urban Transport of China, 2023, 21(2): 109-117, 72. ]

[3]
李峰清, 张欣, 赵民. 城市规划中的“通勤”概念辨析及“通勤阈值”界定探讨[J]. 城市规划, 2023, 47(6): 13-19.

[Li Fengqing, Zhang Xin, Zhao Min. Exploration on the concept of "commuting" in urban planning and definition of "commuting threshold". City Planning Review, 2023, 47(6): 13-19. ]

[4]
柴彦威, 李彦熙, 李春江. 时空间行为规划: 核心问题与规划手段[J]. 城市规划, 2022, 46(12): 7-15.

[Chai Yanwei, Li Yanxi, Li Chunjiang. Spatiotemporal and behavioral planning: The key issue and planning strategies. City Planning Review, 2022, 46(12): 7-15. ]

[5]
张月朋, 王德. 上海市早高峰出行问题源头区识别[J]. 城市规划, 2021, 45(7): 83-90.

[Zhang Yuepeng, Wang De. Identification of the source of morning peak-hour traffic congestion in Shanghai. City Planning Review, 2021, 45(7): 83-90. ]

[6]
Li S Y, Lv D J, Liu X P, et al. The varying patterns of rail transit ridership and their relationships with fine-scale built environment factors: Big data analytics from Guangzhou[J]. Cities, 2020, 99: 102580. doi: 10.1016/j.cities.2019.102580.

[7]
高德辉, 许奇, 陈培文, 等. 城市轨道交通客流与精细尺度建成环境的空间特征分析[J]. 交通运输系统工程与信息, 2021, 21(6): 25-32.

[Gao Dehui, Xu Qi, Chen Peiwen, et al. Spatial characteristics of urban rail transit passenger flows and fine-scale built environment. Journal of Transportation Systems Engineering and Information Technology, 2021, 21(6): 25-32. ]

[8]
Liu X T, Wu J W, Huang J W, et al. Spatial-interaction network analysis of built environmental influence on daily public transport demand[J]. Journal of Transport Geography, 2021, 92: 102991. doi: 10.1016/j.jtrangeo.2021.102991.

[9]
An R, Wu Z H, Tong Z M, et al. How the built environment promotes public transportation in Wuhan: A multiscale geographically weighted regression analysis[J]. Travel Behaviour and Society, 2022, 29: 186-199.

[10]
Fang Z X, Zhang L P, Zheng M. Transferability analysis of built environment variables for public transit ridership estimation in Wuhan, China[J]. Transactions in Urban Data, Science, and Technology, 2022, 1(1/2): 56-85.

[11]
Ewing R, Cervero R. Travel and the built environment[J]. Journal of the American Planning Association, 2010, 76(3): 265-294.

[12]
罗雪瑶, 张文佳, 柴彦威. 15分钟生活圈的建成环境阈值效应研究[J]. 地理研究, 2022, 41(8): 2155-2170.

DOI

[Luo Xueyao, Zhang Wenjia, Chai Yanwei. Research on threshold effects of built environment settings in 15-minute life-circles. Geographical Research, 2022, 41(8): 2155-2170. ]

[13]
Zhou M Z, Zhou J L, Zhou J P, et al. Introducing social contacts into the node-place model: A case study of Hong Kong[J]. Journal of Transport Geography, 2023, 107: 103532. doi: 10.1016/j.jtrangeo.2023.103532.

[14]
Vale D S, Viana C M, Pereira M. The extended node-place model at the local scale: Evaluating the integration of land use and transport for Lisbon's subway network[J]. Journal of Transport Geography, 2018, 69: 282-293.

[15]
Zhao J B, Deng W, Song Y, et al. Analysis of Metro ridership at station level and station-to-station level in Nanjing: An approach based on direct demand models[J]. Transportation, 2014, 41(1): 133-155.

[16]
彭诗尧, 陈绍宽, 许奇, 等. 基于POI的土地利用与轨道交通客流的空间特征[J]. 地理学报, 2021, 76(2): 459-470.

DOI

[Peng Shiyao, Chen Shaokuan, Xu Qi, et al. Spatial characteristics of land use based on POI and urban rail transit passenger flow. Acta Geographica Sinica, 2021, 76(2): 459-470. ]

DOI

[17]
庞磊, 任利剑, 运迎霞. 建成环境对轨道交通站点客流量与通勤乘车率影响的差异化分析[J]. 交通运输系统工程与信息, 2023, 23(6): 206-214.

[Pang Lei, Ren Lijian, Yun Yingxia. Analysis of differential impact of built environment on passenger flow and commuter ridership rate of urban rail transit station. Journal of Transportation Systems Engineering and Information Technology, 2023, 23(6): 206-214. ]

[18]
杨红, 申犁帆, 胡议文, 等. 老年人地铁出行时空特征及与建成环境非线性关系: 以武汉市为例[J]. 地理科学进展, 2023, 42(3): 491-504.

DOI

[Yang Hong, Shen Lifan, Hu Yiwen, et al. Spatial and temporal characteristics of elderly people's metro travel behavior and its non-linear relationship with the built environment: A case study of Wuhan City. Progress in Geography, 2023, 42(3): 491-504. ]

DOI

[19]
汪成刚, 王波, 王琪智, 等. 城市活力与建成环境的非线性关系和阈值效应研究: 以广州市中心城区为例[J]. 地理科学进展, 2023, 42(1): 79-88.

DOI

[Wang Chenggang, Wang Bo, Wang Qizhi, et al. Nonlinear associations between urban vitality and built environment factors and threshold effects: A case study of central Guangzhou City. Progress in Geography, 2023, 42(1): 79-88. ]

DOI

[20]
张文佳, 李春江, 罗雪瑶, 等. 机器学习与社区生活圈规划: 应用框架与议题[J]. 上海城市规划, 2021(4): 59-65.

[Zhang Wenjia, Li Chunjiang, Luo Xueyao, et al. Machine learning and urban community life circle planning: Application framework and research topics. Shanghai Urban Planning Review, 2021(4): 59-65. ]

[21]
崔叙, 喻冰洁, 杨林川, 等. 城市轨道交通出行的时空特征及影响因素非线性机制: 基于梯度提升决策树的成都实证[J]. 经济地理, 2021, 41(7): 61-72.

[Cui Xu, Yu Bingjie, Yang Linchuan, et al. Spatio-temporal characteristics and non-linear influencing factors of urban rail transit: The case of Chengdu using the gradient boosting decision tree. Economic Geography, 2021, 41(7): 61-72. ]

[22]
Du Q, Zhou Y Q, Huang Y D, et al. Spatiotemporal exploration of the non-linear impacts of accessibility on metro ridership[J]. Journal of Transport Geography, 2022, 102: 103380. doi: 10.1016/j.jtrangeo.2022.103380.

[23]
李培坤, 陈旭梅, 鲁文博, 等. 基于XGBoost-SHAP的地铁建成环境与站点出行距离的非线性关系研究[J]. 铁道科学与工程学报, 2024, 21(4): 1624-1633.

[Li Peikun, Chen Xumei, Lu Wenbo, et al. Research on nonlinear relationship between subway built environment and travel distance of stations based on XGBoost-SHAP. Journal of Railway Science and Engineering, 2024, 21(4): 1624-1633. ]

[24]
夏正伟, 张烨. 从“5D”到“5D+N”: 英文文献中TOD效能的影响因素研究[J]. 国际城市规划, 2019, 34(5): 109-116.

[Xia Zhengwei, Zhang Ye. From "5D" to "5D+N": Research published in English on the factors influencing TOD performance. Urban Planning International, 2019, 34(5): 109-116. ]

[25]
庞磊, 任利剑, 张哲浩, 等. 基于乘降客流特征的轨道交通站点分类及客流量影响因素分析[J]. 交通运输系统工程与信息, 2023, 23(4): 184-193.

[Pang Lei, Ren Lijian, Zhang Zhehao, et al. Metro station classification based on boarding and alighting passenger flows and ridership impact factors. Journal of Transportation Systems Engineering and Information Technology, 2023, 23(4): 184-193. ]

[26]
Yang L C, Yu B J, Liang Y, et al. Time-varying and non-linear associations between metro ridership and the built environment[J]. Tunnelling and Underground Space Technology, 2023, 132: 104931. doi: 10.1016/j.tust.2022.104931.

[27]
马壮林, 杨兴, 胡大伟, 等. 城市轨道交通车站客流特征影响程度分析[J]. 清华大学学报(自然科学版), 2023, 63(9): 1428-1439.

[Ma Zhuanglin, Yang Xing, Hu Dawei, et al. Influence degree analysis of ridership characteristics at urban rail transit stations. Journal of Tsinghua University(Science and Technology), 2023, 63(9): 1428-1439. ]

[28]
Yu Z D, Zhu X L, Liu X T. Characterizing metro stations via urban function: Thematic evidence from transit-oriented development (TOD) in Hong Kong[J]. Journal of Transport Geography, 2022, 99: 103299. doi: 10.1016/j.jtrangeo.2022.103299.

[29]
Kopsidas A, Kepaptsoglou K. Identification of critical stations in a Metro System: A substitute complex network analysis[J]. Physica A: Statistical Mechanics and Its Applications, 2022, 596: 127123. doi: 10.1016/j.physa.2022.127123.

[30]
李心雨, 闫浩文, 王卓, 等. 街景图像与机器学习相结合的道路环境安全感知评价与影响因素分析[J]. 地球信息科学学报, 2023, 25(4): 852-865.

DOI

[Li Xinyu, Yan Haowen, Wang Zhuo, et al. Evaluation of road environment safety perception and analysis of influencing factors combining street view imagery and machine learning. Journal of Geo-information Science, 2023, 25(4): 852-865. ]

[31]
王梓蒙, 刘艳芳, 罗璇, 等. 基于多源数据的城市活力与建成环境非线性关系研究: 以双休日武汉市主城区为例[J]. 地理科学进展, 2023, 42(4): 716-729.

DOI

[Wang Zimeng, Liu Yanfang, Luo Xuan, et al. Nonlinear relationship between urban vitality and the built environment based on multi-source data: A case study of the main urban area of Wuhan City at the weekend. Progress in Geography, 2023, 42(4): 716-729. ]

DOI

[32]
吴莞姝, 马子迎, 郭金函, 等. 建成环境对街道活力的非线性效应: 基于XGBoost模型的多源大数据分析[J]. 中国园林, 2022, 38(12): 82-87.

[Wu Wanshu, Ma Ziying, Guo Jinhan, et al. Nonlinear effect of built environment on street vitality: A multi-source big data analysis based on XGBoost model. Chinese Landscape Architecture, 2022, 38(12): 82-87. ]

[33]
许奇, 李雯茜, 陈越, 等. 建成环境对城市轨道交通起讫点客流的非线性影响及阈值效应[J]. 交通运输系统工程与信息, 2023, 23(4): 290-297.

[Xu Qi, Li Wenxi, Chen Yue, et al. Nonlinear and threshold effects of built environment on origin-destination flows of urban rail transit. Journal of Transportation Systems Engineering and Information Technology, 2023, 23(4): 290-297. ]

[34]
冉江宇, 付凌峰, 阚长城, 等. 基于通勤大数据的城市职住分离度研究: 《2020年全国主要城市通勤监测报告》核心指标分析[J]. 城市交通, 2020, 18(5): 10-17.

[Ran Jiangyu, Fu Lingfeng, Kan Changcheng, et al. Urban job-residence separation based on big commuting data:Analysis of core indicators in the 2020 monitoring report on national commuting report for major cities in China. Urban Transport of China, 2020, 18(5): 10-17. ]

[35]
Wang J P, Zhang N, Peng H, et al. Spatiotemporal heterogeneity analysis of influence factor on urban rail transit station ridership[J]. Journal of Transportation Engineering, Part A: Systems, 2022, 148(2). doi: 10.1061/JTEPBS.0000639.

[36]
曹哲静. 城市商业中心与交通中心的叠合与分异: 基于复杂网络分析的东京轨道交通网络与城市形态耦合研究[J]. 国际城市规划, 2020, 35(3): 42-53.

[Cao Zhejing. Configuration of urban commercial centers and transport centers: Evidence from Tokyo transit network and urban morphology based on the complex network analysis. Urban Planning International, 2020, 35(3): 42-53. ]

文章导航

/