手机信令数据的出行测度准确性分析——基于与居民出行调查数据的比较
王德(1963— ),男,教授,博士生导师,主要从事城市规划方法论、空间与行为、城市大数据、城市模型领域的教学与研究。E-mail: dewang@tongji.edu.cn |
收稿日期: 2023-08-17
修回日期: 2024-03-01
网络出版日期: 2024-05-28
基金资助
国家自然科学基金项目(52378069)
Accuracy analysis of mobile signaling data in measuring travel indices: Based on the comparison with household travel survey
Received date: 2023-08-17
Revised date: 2024-03-01
Online published: 2024-05-28
Supported by
National Natural Science Foundation of China(52378069)
传统的居民出行调查是城市交通规划的基础数据,是城市居民出行行为的最权威记录。随着信息技术发展,以手机信令数据为代表的位置大数据,在时空行为研究领域展现出巨大的潜力。然而,手机信令数据能否取代出行调查数据却存在较大的争议。焦点在于:手机信令数据的出行准确性难以评估,其识别结果在多大程度上可信、能否较为准确地测度居民出行特征等问题有待回答。论文利用上海居民出行调查数据及时间相近的手机信令数据,比较两类数据在出行强度、出行时间分布、出行空间分布、出行目的等出行特征的差异,并分析归纳两类数据产生偏差的程度及原因。研究揭示手机信令数据在描述出行人口人均出行次数及街道以上尺度的出行OD分布等方面准确度较高,在出行时耗、通勤出行比例方面准确度较低。研究认为手机信令数据产生偏差的原因主要由手机信令数据位置记录不完整等数据质量、停留时间阈值、基站密度不均与空间阈值的影响,以及职住地识别偏差引起。研究认为可通过样本筛选、数据链修复、识别方法改进等手段提高手机信令数据识别的精度。
王德 , 韩滨鹂 , 张天然 , 游智敏 , 李心恬 . 手机信令数据的出行测度准确性分析——基于与居民出行调查数据的比较[J]. 地理科学进展, 2024 , 43(5) : 854 -869 . DOI: 10.18306/dlkxjz.2024.05.002
Traditional household travel survey provides the basic data for urban traffic planning and the most authoritative record of urban residents' travel behaviors. With the development of information technology, position data represented by mobile signaling data have shown great potential in the field of temporal-spatial behavior research. However, whether the mobile signaling data can replace the travel survey data is controversial because the travel data accuracy of mobile signaling data is difficult to assess. How credible the identification results are and whether the travel characteristics of residents can be accurately measured remains to be answered. In this study, the travel survey data of Shanghai residents and mobile signaling data with similar dates were used to compare the differences in intensity, time, spatial distribution, purpose, and other characteristics of travels. This study also analyzed the degree of deviation and summarized the causes of errors. The research revealed that the mobile signaling data are more accurate in describing the per capita travel times of the travel population and the travel origin-destination (OD) distribution at the scale above the street, but less accurate in describing the travel time distribution and travel purposes. Our research suggests that the main reasons for the deviation in mobile phone data are the impact of incomplete location records on data quality, the impact of retention time thresholds, spatial thresholds, and home and workplace identification. Due to the above systematic errors, mobile signaling data cannot replace household travel survey data. Nevertheless, the accuracy of mobile signaling data analysis can be improved by sample screening, trip chain data recovery, and improvement of identification methods.
Key words: travel indices; trip chain; trip distance; deviation; correction; Shanghai
表1 数据信息构成及可比较指标的选择Tab.1 Composition of data and selection of comparable indices |
指标 | 手机信令数据 | 居民出行调查 | 可比性判断 | |
---|---|---|---|---|
个体信息 | ||||
家庭结构 | — | ○ | × | |
交通工具拥有 | — | ○ | × | |
居住地 | ○ | ○ | √ | |
就业地 | ○ | ○ | √ | |
年龄 | — | ○ | × | |
性别 | — | ○ | × | |
职业 | — | ○ | × | |
户籍类型 | — | ○ | × | |
出行信息 | ||||
起讫点位置 | ○ | ○ | √ | |
起讫点时间 | ○ | ○ | √ | |
出行距离 | ○ | ○ | √ | |
出行时耗 | ○ | ○ | √ | |
出行目的 | ○ | ○ | √ | |
出行方式 | — | ○ | × | |
同行人数 | — | ○ | × | |
出行费用 | — | ○ | × |
注: ○ 表示手机信令数据可识别的信息、出行调查包含的信息;— 表示不包含相关信息;√ 表示具有可比性;× 表示无法进行比较。 |
表2 出行指标定义Tab.2 Definition of travel indices |
出行特征 | 量化指标 | 指标定义 |
---|---|---|
出行强度 | 人均出行次数 | 某地区或城市居民的单日人均出行次数,即出行次数和总人口的比值 |
出行人口 | 某地区或城市居民当日有出行行为的人口数量 | |
出行人口出行次数 | 某地区或城市中所有人口的出行总量与出行人口总数的比值 | |
出行比例 | 是指某地区或城市中有出行的人口总数与该地区人口总数的比值 | |
出行时间 | 出行时耗 出发时刻分布 | 指一次出行所耗费的时间 按一天各个时段统计的每个时段出行量占当天出行总量的比例 |
出行空间 | 平均出行距离 | 某地区或城市居民的出行总距离与出行次数的比值 |
出行距离分布 | 不同出行距离的出行次数占出行总次数的比例 | |
出行OD | 出行首末点位置分布 | |
出行目的 | 通勤出行 | 如果一次出行的两端停留点分别只为家和工作地(学校)而无其他活动,则该次出行称为1次通勤出行 |
表3 出行强度特征比较Tab.3 Comparison of travel intensity indices |
指标 | 全市 | 杨浦区 | 松江区 | ||||||
---|---|---|---|---|---|---|---|---|---|
MSD | HTS | MSD | HTS | MSD | HTS | ||||
日均出行比例/% | 66 | — | 66 | 80 | 64 | 78 | |||
人均出行次数 /(次/(人·d)) | 常住人口 | 1.52 | 2.16 | 1.56 | 1.87 | 1.47 | 1.89 | ||
(-30%) | (-17%) | (-22%) | |||||||
出行人口 | 2.31 | — | 2.33 | 2.31 | 2.24 | 2.36 | |||
(+1%) | (-5%) |
注:括号中的百分数表示手机信令数据计算得到的人均出行次数相对出行调查数据的偏差。 |
表4 杨浦区通勤人口通勤出行比例比较Tab.4 Percentage of commute of commuters in Yangpu District |
数据类型 | 上班(上学)比例/% | 下班(放学)比例/% | 通勤出行比例/% | 人均通勤次数/次 | 人均出行次数/次 |
---|---|---|---|---|---|
MSD | 21 | 12 | 33 | 0.85 | 2.61 |
HTS | 46 | 45 | 90 | 1.95 | 2.16 |
表5 杨浦区高质量样本筛选Tab.5 High-quality samples of Yangpu District |
指标 | 样本1 | 样本2 | 样本3 | 样本4 |
---|---|---|---|---|
日间活跃时段记录时段数 | 全样本 | 12 h及以上 | 14 h及以上 | 16 h及以上 |
样本数量/万人 | 642 | 498 | 445 | 370 |
占全样本比例/% | 100.00 | 81.27 | 71.57 | 57.21 |
表6 杨浦区通勤人口出行起讫点占比Tab.6 Characteristics of starting points for commuting population in Yangpu District (%) |
地点 | 日出行链起点 | 日出行链终点 |
---|---|---|
家 | 74 | 55 |
工作地 | 18 | 13 |
其他地点 | 8 | 28 |
丢失出行起讫点 | 0 | 4 |
表7 出行链不完整情况修正方法Tab.7 Correction methods for incomplete trip chains |
前日末点 | 后日首点 | 修正 | |
---|---|---|---|
可修正 | 其他地方O | 家H | 增加“O-H”出行 |
家H | 其他地方O | 增加“H-O”出行 | |
可信(第二住所) | 其他地O | 其他地O | 确定可信 |
不确定 | 其他地M | 其他地N | 增加“M-N”出行 |
表8 杨浦区各组别职住距离占比分布Tab.8 Distribution of commuting distance by groups in Yangpu District (%) |
数据 类型 | 0~500 m | 500~ 1000 m | 1000~ 1500 m | 1500~ 2000 m | 2000 m 以上 |
---|---|---|---|---|---|
MSD | 13.01 | 17.30 | 8.03 | 5.27 | 56.39 |
HTS | 7.84 | 8.85 | 7.48 | 5.15 | 70.68 |
[1] |
柴彦威, 申悦, 肖作鹏, 等. 时空间行为研究动态及其实践应用前景[J]. 地理科学进展, 2012, 31(6): 667-675.
[
|
[2] |
王德, 谢栋灿, 王灿, 等. 个体时空行为的规律性与可预测性研究: 以上海市居民工作日活动为例[J]. 地理科学进展, 2021, 40(3): 433-440.
[
|
[3] |
钮心毅, 岳雨峰, 李凯克. 长三角城市群中心城市与周边城市的城际出行特征研究[J]. 上海城市规划, 2020(4): 1-8.
[
|
[4] |
丁亮, 钮心毅, 宋小冬. 利用手机数据识别上海中心城的通勤区[J]. 城市规划, 2015, 39(9): 100-106.
[
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
郭莉, 周军, 梁宇豪. 手机信令数据与传统居民出行调查的对比及扩样方法研究: 以深圳为例[C]// 中国城市规划学会城市交通规划学术委员会. 交通治理与空间重塑:2020年中国城市交通规划年会论文集. 北京, 2020: 1890-1897.
[
|
[12] |
陈小鸿, 陈先龙, 李彩霞, 等. 基于手机信令数据的居民出行调查扩样模型[J]. 同济大学学报(自然科学版), 2021, 49(1): 86-96.
[
|
[13] |
|
[14] |
李明高, 杨冠华, 刘剑锋, 等. 手机数据在城市居民出行特征分析中的应用实践[C]// 中国城市规划学会城市交通规划学术委员会. 创新驱动与智慧发展:2018年中国城市交通规划年会论文集. 青岛, 2018: 1084-1091.
[
|
[15] |
|
[16] |
周洋, 杨超. 基于时空聚类算法的轨迹停驻点识别研究[J]. 交通运输系统工程与信息, 2018, 18(4): 88-95.
[
|
[17] |
杨飞, 姜海航, 姚振兴, 等. 基于手机信令数据的出行端点识别效果评估[J]. 西南交通大学学报, 2021, 56(5): 928-936.
[
|
[18] |
上海市城乡建设和交通发展研究院. 上海市第五次综合交通调查主要成果[J]. 交通与运输, 2015, 31(6): 15-18.
[Shanghai urban and rural construction and Transportation Development Research Institute. The main results of the fifth comprehensive traffic survey in Shanghai. Traffic & Transportation, 2015, 31(6): 15-18.]
|
[19] |
李娜, 董志国, 薛美根, 等. 上海市第五次综合交通调查新技术方法实践[J]. 城市交通, 2016, 14(2): 35-42, 50.
[
|
[20] |
张艳, 柴彦威. 基于居住区比较的北京城市通勤研究[J]. 地理研究, 2009, 28(5): 1327-1340.
[
|
[21] |
张文佳, 柴彦威. 基于家庭的城市居民出行需求理论与验证模型[J]. 地理学报, 2008, 63(12): 1246-1256.
[
|
[22] |
周素红, 闫小培. 基于居民通勤行为分析的城市空间解读: 以广州市典型街区为案例[J]. 地理学报, 2006, 61(2): 179-189.
[
|
[23] |
方家, 王德, 谢栋灿, 等. 上海顾村公园樱花节大客流特征及预警研究: 基于手机信令数据的探索[J]. 城市规划, 2016, 40(6): 43-51.
[
|
[24] |
肖志权, 张子民, 毛曦, 等. 基于手机信令数据居民出行链提取算法[J]. 北京测绘, 2019, 33(10): 1192-1195.
[
|
[25] |
邹戴晓, 过秀成, 樊钧, 等. 基于手机信令数据的苏州市域职住空间和通勤出行分析[J]. 现代城市研究, 2018(12): 16-21.
[
|
[26] |
张维. 基于手机定位数据的城市居民出行特征提取方法研究[D]. 南京: 东南大学, 2015.
[
|
[27] |
王蓓, 王良, 刘艳华, 等. 基于手机信令数据的北京市职住空间分布格局及匹配特征[J]. 地理科学进展, 2020, 39(12): 2028-2042.
[
|
[28] |
谢栋灿, 王德, 钟炜菁, 等. 上海市建成环境的评价与分析: 基于手机信令数据的探索[J]. 城市规划, 2018, 42(10): 97-108, 120.
[
|
[29] |
|
[30] |
王德, 李丹, 傅英姿. 基于手机信令数据的上海市不同住宅区居民就业空间研究[J]. 地理学报, 2020, 75(8): 1585-1602.
[
|
[31] |
李元. 基于多源大数据的居民出行调查校核体系研究[D]. 西安: 长安大学, 2017.
[
|
[32] |
杨超, 朱荣荣, 涂然. 基于智能手机调查数据的居民出行活动特征分析[J]. 交通信息与安全, 2015, 33(6): 25-32.
[
|
/
〈 |
|
〉 |