黄洁1, 王姣娥12, 靳海涛123, 金凤君12

1. 中国科学院地理科学与资源研究所,中国科学院区域可持续发展分析与模拟重点实验室,北京 100101
2. 中国科学院大学,北京 100049
3. 北京市交通信息中心,北京 100161

Investigating spatiotemporal patterns of passenger flows in the Beijing metro system from smart card data

HUANG Jie1, WANG Jiaoe12, JIN Haitao123, JIN Fengjun12

1. Institute of Geographic Sciences and Natural Resources Research, Key Laboratory of Regional Sustainable Development Modeling, CAS, Beijing 100101, China
2. University of Chinese Academy of Sciences, Beijing 100049, China
3. Beijing Transportation Information Center, Beijing 100161, China

城市轨道交通是居民绿色出行、缓解大城市交通拥堵的重要交通方式。研究大城市地铁客流时间和空间的分布特征,有利于深入了解大城市公共交通的需求,进而制定合理的交通需求管理政策。本文以北京市地铁为例,计算了431万条智能交通卡数据的出行时间和OD矩阵(Origin-Destination Matrix),研究其客流的时间和空间分布特征。研究发现:①全天、早高峰和晚高峰的出行时间分布符合Gamma分布,总体上离城市中心越远,平均出行时间越长;②从市辖区尺度和环路尺度分析,乘客流向和流量均呈现对称性;③从街道尺度来看,居民地铁出行强度的空间不均等性很强。

关键词: 城市轨道交通 ; 大数据 ; 客流分布 ; 时空格局 ; 北京市


Urban railway systems can reduce environmental footprints by residents' commuting and alleviate traffic congestion in mega-cities. Investigating the characteristics of the spatiotemporal distribution of passenger flows is significant in the examination of traffic demand in public transportation systems. Moreover, the study can help decision makers in traffic demand management. Taking the metro system of Beijing as an example, this study calculated the travel time of over 4 million trips and their origin-destination (OD) matrix. In the investigation of the spatiotemporal patterns, we found that: (1) travel time distribution of all trips and trips during the morning and afternoon peaks well fit with Gamma distribution; (2) patterns of passenger flows between districts or ring roads are symmetric; and (3) spatial inequity has been captured from the evaluation of average transit trips per person per day.

Keywords: urban railway system ; big data ; passenger flow distribution ; spatiotemporal pattern ; Beijing


1 引言

大城市人口规模庞大、交通需求巨大,需要高效、便捷的公共交通系统。目前,中国一线城市居民对交通便捷性和通畅性的评价普遍较差,交通需求分布的不合理引发长距离绕行、客流拥堵等问题。因此,宜居城市的建设应包括完善城市公共交通体系的建设,倡导居民绿色出行(张文忠等, 2016)。城市轨道交通是合理利用有限的城市土地资源、解决大城市交通拥堵的重要措施之一。研究大城市地铁客流的时空分布特征,有利于甄别大城市公共交通需求,进而制定合理的交通需求管理政策,实现公交优先发展。

从小世界网络模型提出以来(Watts et al, 1998),轨道交通网络的复杂性成为国内外学者的研究热点。国外学者运用无标度和小世界网络模型分析了30个大城市轨道交通网络的鲁棒性;梳理了波士顿、首尔、北京、南京、上海等城市的网络结构特征参数(Barthélemy, 2010;Derrible et al, 2010)。借鉴国际大城市轨道交通发展的经验和教训,基于可持续发展的框架和公交导向模式,国内学者研究了轨道交通对人口的聚集效应和运输效率,并且初步肯定了轨道交通对城市空间布局的引导和支撑作用(陆化普, 2006; 曹小曙等, 2008; 赵鹏军等, 2016)。

大城市轨道交通普遍采用自动收费系统,智能交通卡已被广泛使用。智能卡数据(Smart Card Data)作为具有地理标识和时刻信息的大数据(龙瀛等, 2012),在数据量、种类和准确性3个方面具备以下特点(Laney, 2001):①通常由大量的便携移动信息感应装置收集(例如,手机、交通卡、出租车GPS装置、SCD数据),数据的收集速度十分迅速,因此其第一个重要特征是数据量大;②大数据的兼容性逐渐提高,多种数据运用在同一研究问题中的方法层出不穷;③由于数据量大和覆盖范围广的特性,大数据具备了准确度高的特征。大数据在地理学研究,尤其在城市交通研究中的应用范围越来越广。例如,利用手机基站数据,研究者对城市道路交通流的分布进行了估计并探究了交通网络结构特征(吴健生等, 2012);利用GPS数据,有学者分析了居民日常活动空间和通勤弹性特征(申悦等, 2013),探究了城市空间形态与居民出行行为的关系(Zheng et al, 2014)。但是,运用手机、出租车等GPS装置的大数据挖掘,很难精确到公共交通出行的模式。

针对城市公共交通系统,国内外学者运用智能交通卡数据(SCD)研究美国、英国、韩国和新加坡的多个城市轨道交通的热点问题,包括城市交通规划、城市空间结构、居民出行与轨道交通的相互作用关系。首先,Utsunomiya等(2006)归纳了SCD挖掘个体出行行为的基本步骤、研究难点及其在交通宏观规划的研究内涵。随后,个体出行行为特征和交通仿真模型的验证一直是SCD数据发掘的热点问题。研究者们通过交通仿真模型发现乘客访问频次最好的站点符合固定的统计分布概率,能够推导少量乘客的社会经济属性和不同群体的出行规律(Hasan et al, 2013; Lee et al, 2014; Manley et al, 2016)。其次,由于城市轨道交通规划与城市空间结构息息相关,因此学者们运用SCD分析客流分布的空间规律,揭示城市空间结构特征,进而解释地铁客流量分布规律与周边建成环境的相互关系(Jang, 2010; Roth et al, 2011; Zhong et al, 2014)。再次,站点尺度的客流量分布成为站点类型划分的重要依据,学者们基于此分析了地铁站的周边建成环境(Choi et al, 2012; Reades et al, 2016; 尹芹等, 2016)。另外,SCD数据也是学者们研究职住平衡的重要支撑,包括职住分布特征、通勤效率优化问题等 (龙瀛等, 2012; Zhou et al, 2014; Long et al, 2015; Ma et al, 2017)。


2 数据与方法

2.1 研究数据

传统的问卷调查能够挖掘OD对的详细信息,常用于城市居民的出行行为和通勤特征的研究,例如:分析个人出行的活动范围,探究出行者的社会经济属性和通勤时间的关系,居民出行行为选择的空间分布(周素红等, 2010; Zhao et al, 2011; Zhou et al, 2013)。赵晖等(2011)从租住房和自购房居民的角度分析了地铁沿线和非地铁沿线的通勤特征。将通勤行为调查和街区土地利用特征相结合,周素红等(2006)从微观视角对宏观的城市空间进行解读。同样基于问卷调查的数据,学者们研究了公共交通可达性与居民出行行为的关系以及“交通网络—出行行为—出行碳排量”的影响机制(曹小曙等, 2013; 罗依等, 2016)。综上所述,深入研究OD信息不仅可以研究城市居民的出行行为特征,还可以研究不同出行方式和城市空间、交通网络和城市发展之间的关系。但是,依赖于问卷调查的OD信息,包含严格的样本选取和具有先验性的发放过程,在时空流特征的研究中具有2个不足之处:第一,发放问卷的人力物力消耗较大,问卷调查的样本大小受到限制;第二,对于地铁客流时空分布,很难获取所有出发点(Origin)和目的地(Destination)的信息,无法了解完整的OD分布。


因此,本文整理了2014年4月14日北京市政智能交通卡(①数据来源:北京市交通信息中心),当年的轨道交通线路、站点分布和北京市第六次人口分街道普查数据(②数据来源:全国第六次人口普查)。地铁智能交通卡数据结构如表1所示,每条数据记录了智能交通卡卡号、检入线路、检入站点、刷卡时间、刷卡次序、检出线路、检出站点和检入时间,并且保存了是否包含终点信息的逻辑判断。值得说明的是,该检票系统以刷卡时间和次序为基准生成数据,即乘客每趟出行记录将生成2条数据记录。这2条数据记录具有相同的卡号、检入线路、检入站点、检入时间,如表1所示。考虑到少量无效数据,北京市地铁SCD包括的OD记录数量等于数据记录总量的40%~50%,与近期研究的数据规律一致(Ma et al, 2017)。以2014年4月14日为例,当天检票系统有超过900万人次,包括使用单次地铁卡的乘客;相当于400多万OD出行记录。该数据量远大于传统抽样调查的样本数量,可以充分反映客流的时空分布特征。因此,431万条OD出行记录将作为本文分析客流时间和空间分布特征的全样本。

表1   北京市智能交通卡刷卡数据示例

Tab. 1   Examples of data records of smart cards in Beijing metro system

0000000213332014/04/14 10:44:007387916344002014/04/14 10:44:000
0000000213332014/04/14 11:22:2773888581933312014/04/14 10:44:001



2.2 研究区域

2014年,北京市地铁东延6号线、7号线、14号线,西延15号线,空间范围和网络密度不断增加,总计17条线路,运营总里程达到527 km,包括256个站点,日均客运量达到900万人次。根据北京市统计局数据,北京市分为首都功能核心区、城市功能拓展区、城市发展新区和生态涵养发展区。本文的研究区域定为2014年北京市17条地铁线路和256个站点分布的首都功能核心区、城市功能拓展区和城市发展新区,包括西城、东城、朝阳、海淀、石景山、丰台、昌平、顺义、通州、大兴和房山共11个区(图1)。

图1   研究区域与北京市地铁线路和站点分布图

Fig.1   Map of municipal districts studied and the metro system in Beijing

2.3 研究方法

本文针对431万条记录完整的数据,对北京市地铁客流的时空格局进行系统性分析。从智能交通卡数据中,运用SQL Server逐个统计客流,得到256维双向客流的OD矩阵。时空特征分析的具体方法如下:①时间维度,从全天、早高峰、晚高峰3个时段研究乘客出行时间的分布,并且从站点尺度分析时间分布的空间规律;②空间上,从市辖区尺度、环路尺度、街道尺度和站点尺度,层层深入地分析了其空间特征。

地铁出行作为绿色出行和城市通勤的主要方式之一,探究不同区域居民乘坐地铁的可达性具有重要意义。研究地铁网络可达性是从供给的角度研究城市公共交通出行的空间分布特征(黄晓燕等, 2104)。同时,研究地铁出行的便捷性和可达性也要从需求的角度出发(Huang et al, 2015),了解不同区域居民乘坐地铁出行的频率。对于街道 i,人均每天乘坐地铁出行次数为 Si的计算方式为:


式中:属于街道 i的地铁站点数量总计为 k; dk表示从站点 k出发的乘客数量; ak表示到达站点 k的乘客数量; pi表示街道 i的总人口数。公式(1)设计的指标可以反映以街道为单元的居民对于地铁出行的依赖程度。在计算中,运用ArcGIS合并分布在同一街道的所有地铁站,将属于该街道的地铁站客流信息总计为该街道的客流信息,即 dk+ak

3 研究结果

3.1 客流的时间分布规律

3.1.1 全样本统计规律


图2   北京市地铁分时段进出乘客数量

Fig.2   Total passengers in every 30 minutes in the Beijing metro system

3.1.2 分时段出行时间分布特征


表2   乘客出行时间的基本属性

Tab.2   Statistic attributes of travel time



出行时间的统计分布特征具有很高研究价值,能够显示出不同出行时间的具体数量。全天、早高峰和晚高峰乘客出行时间分布均符合Gamma分布(图3),概率密度分布函数( PDF)如下:


式中, k表示分布的形状参数; θ表示分布的比例参数; x表示自变量乘客出行时间。运用Matlab中gamfit工具,Gamma分布的形状参数、比例参数和95%置信区间如表3所示。

图3   乘客出行时间分布及Gamma分布拟合结果

Fig.3   Distribution of travel time and fitting results from Gamma distribution

表3   Gamma分布拟合系数和置信区间

Tab.3   Fitting parameters of Gamma distribution and 95% confidence interval



根据乘客的出行时间分布,可以发现北京市地铁内部乘客出行时间主要分布在20~40 min之内,占样本总数的40.81%;只有少部分乘客的出行超过1 h,占14.31%;很少有乘客的出行超过2 h。早高峰乘客出行集中在20~40 min的比例比全样本高,占44.26%;晚高峰时段的这一比例是43.09%。短时间出行的乘客(行程时间小于20 min)主要在早晚高峰时段出行,占短时间出行乘客数量的61.23%。这也进一步论证了早晚高峰时段的平均出行时间略低于全样本,主要原因为:第一,早晚高峰的发车频率远高于其余时段,乘客的站台等待时间相应缩短;第二,通勤乘客的出行步伐一般快于休闲出行的乘客(如购物、娱乐)。另外,长时间出行的乘客趋向于避开早晚高峰,行程时间大于40 min的乘客59.71%都不在早晚高峰出行。

3.1.3 进站点客流的平均出行时间分布特征

基于地铁站点尺度统计每个站点出发乘客的平均出行时间,可以反映乘客的出行空间范围。本文将全样本按照进站点分类,乘客在各站点的平均出行时间如图4所示。总体来说,呈现离市中心越远,出行时间越长的趋势。二环以内,93.55%地铁站点的乘客平均出行时间低于35 min以内。以地铁出行平均3 min一站路计算,二环以内的乘客平均出行范围在12个地铁站点以内,按北京市地铁平均站间距1.5 km(③ 数据来源:www.bjsubway.com),空间范围在18 km以内。二环到三环之间,虽然乘客平均出行范围也是12个地铁站以内,但是其中42.86%地铁站点的乘客平均出行时间在35~40 min以内。三环到四环之间,乘客平均出行时间是35.9 min,49.18%地铁站点的乘客平均出行范围超过12个站点,最大范围达到15个站点。四环到五环之间乘客平均出行时间为42 min,约为14个站点,最大出行时间达到52 min。五环到六环之间乘客平均出行时间达到51 min,约为17个站点,245 km。总的来说,四环以内的平均出行时间增长较慢;五环和六环的出行时间增加明显,增幅分别为5.8 min和9.5 min。

图4   基于进站点的平均出行时间分布

Fig.4   Distribution of average travel time at each metro station

3.2 客流出行的时空分布规律

3.2.1 市辖区尺度


图5   北京市辖区人口与地铁客流相关性

Fig.5   The correlation between population size and the number of passengers in municipal districts in Beijing


图6   北京地铁客流的时空分布

Fig.6   Origin-destination (OD) flows of the metro system in Beijing




3.2.2 环路尺度



3.2.3 街道尺度


图7   基于街道人口的平均乘坐地铁出行强度分析

Fig.7   Analysis of commuting frequencies by transit in street-based communities



4 结论与讨论






