基于手机信令数据的非就业活动目的识别——以上海市为例
殷振轩(1990—),男,博士生,主要从事时空行为、城市大数据研究。E-mail: yinzx1990@gmail.com |
收稿日期: 2024-06-04
修回日期: 2024-11-19
网络出版日期: 2025-03-24
基金资助
国家自然科学基金项目(52378069)
Inferring non-work activity purposes from mobile phone signaling data: Insights from Shanghai
Received date: 2024-06-04
Revised date: 2024-11-19
Online published: 2025-03-24
Supported by
National Natural Science Foundation of China(52378069)
手机信令数据在时空行为研究中得到了广泛应用,但由于缺乏活动目的的语义信息,限制了其在城市规划中的应用潜力。为了解决这一问题,论文提出一种改进方法,用于推断手机信令数据中非就业活动目的。该方法融合了居民交通出行调查数据和活动地到访频率等多源数据,并采用多项logit模型探究活动目的与个体属性信息、活动时间特征和活动地空间属性之间的关联规律。此外,论文创新性地引入了反映长周期行为模式的到访地频率变量。实证结果表明,加入到访频率后,模型拟合优度从0.265提高至0.442,整体预测准确率从58.0%升至69.2%。这种方法在保持模型解释性的同时,提升了非就业活动识别的准确率,为深入理解居民时空行为需求提供了新的途径。研究成果可以为公共设施规划、交通需求预测和商业布局优化等领域提供有力的数据支持和决策参考。
殷振轩 , 王德 , 翟宝昕 , 张天然 , 晏龙旭 . 基于手机信令数据的非就业活动目的识别——以上海市为例[J]. 地理科学进展, 2025 , 44(3) : 583 -593 . DOI: 10.18306/dlkxjz.2025.03.011
Mobile phone signaling data have been widely used in spatiotemporal behavior research, but their potential application in urban planning is limited due to the lack of information on activity purposes. To address this issue, this study proposed a method to infer the purposes of non-work activities from mobile phone signaling data. The method integrates multisource data, and employs a multinomial logit model to explore the relationship between activity purposes and individual attributes, temporal characteristics, and spatial properties of activities. The key innovation lies in the introduction of a location visit frequency variable that reflects long-term behavioral patterns. Empirical results show that incorporating visit frequency significantly improves the model's goodness of fit from 0.265 to 0.442, and increases the overall prediction accuracy from 58.0% to 69.2%. While maintaining interpretability, this method substantially enhances the accuracy of non-work activity identification, providing new insights into residents' spatiotemporal behavior patterns. The findings offer valuable data support and decision-making references for public facility planning, traffic demand forecasting, and business spatial layout optimization.
表2 特征变量Tab.2 Characteristic variables |
类别 | 变量 | 变量取值 |
---|---|---|
个体属性 | 年龄 | 1=20~34岁;2=35~49岁; 3=50~64岁;4=65岁及以上 |
性别 | 1=男性;2=女性 | |
时间属性 | 日期 | 1=工作日;2=休息日 |
开始时间 | 1=6:00~9:00;2=9:00~18:00; 3=18:00~22:00;4=22:00~6:00 | |
持续时间 | 连续变量 | |
到访频率 | 连续变量 | |
空间属性 | 活动地距家距离 | 连续变量 |
活动地距城市中心距离 | 连续变量 | |
是否有医院 | 0=没有;1=有 | |
A类用地内建筑面积 | 连续变量 | |
B类用地内建筑面积 | 连续变量 | |
G类用地面积 | 连续变量 |
表3 拟合优度度量指标Tab.3 Goodness indicators of fit metrics |
评价指标 | 基准模型 | 改进模型 |
---|---|---|
McFadden's R2 | 0.265 | 0.442 |
AIC | 2.158 | 1.672 |
BIC | -6679.947 | -7339.962 |
表4 以休闲类活动为效用基础项的活动目的识别模型估计结果Tab.4 Estimation results of model parameters based on "leisure" activity |
类别 | 业务 | 就医 | 日常生活 | |||||
---|---|---|---|---|---|---|---|---|
系数 | Z值 | 系数 | Z值 | 系数 | Z值 | |||
个体属性 | ||||||||
年龄(壮年:35~49岁) | 0.866** | 2.93 | -0.302 | -0.75 | 0.581* | 1.97 | ||
年龄(中年:50~64岁) | -0.277 | -0.98 | 0.640* | 2.19 | 0.385 | 1.36 | ||
年龄(老年:65岁及以上) | -1.978** | -4.15 | 1.381** | 4.30 | 0.158 | 0.52 | ||
性别(女) | -1.129** | -4.64 | 0.303 | 1.46 | 0.166 | 0.96 | ||
时间属性 | ||||||||
日期(休息日) | -1.072** | -4.33 | -0.871** | -3.79 | -0.005 | -0.03 | ||
开始时间(日间:9:00~18:00) | 0.026 | 0.10 | -0.627** | -2.73 | -0.793** | -4.03 | ||
开始时间(晚间:18:00~22:00) | -0.894 | -1.84 | -4.217** | -4.70 | -1.367** | -4.48 | ||
开始时间(夜间:22:00~6:00) | 6.798** | 7.53 | -10.398** | -13.53 | 0.107 | 0.10 | ||
持续时间 | -0.057 | -1.24 | -0.202** | -4.79 | -0.625** | -5.95 | ||
到访频率 | -10.593** | -12.48 | -5.225** | -8.58 | -0.038 | -0.89 | ||
空间属性 | ||||||||
活动地距家距离 | 0.037* | 2.00 | 0.009 | 0.47 | -0.030 | -1.13 | ||
活动地距城市中心距离 | 0.015 | 1.39 | -0.004 | -0.39 | 0.009 | 1.11 | ||
是否有医院(有) | -0.638 | -1.43 | 1.586* | 2.01 | 0.999* | 2.28 | ||
A类用地建筑面积 | -1.535** | -2.87 | 1.179** | 2.90 | -0.667 | -1.62 | ||
B类用地建筑面积 | 0.278 | 1.39 | -0.527* | -2.46 | -0.436 | -1.54 | ||
G类用地面积 | -1.340* | -2.29 | -2.426** | -4.07 | -1.359** | -3.22 | ||
常数项 | 3.875** | 6.16 | 0.807 | 0.90 | 1.051 | 1.88 |
注:表中将青年(20~34岁)、男性、工作日、早间(6:00~9:00)和活动地周边无医院,分别设置为年龄、性别、活动日期、活动开始时间和活动地周边是否有医院的参照水平;**、*分别表示P<0.01和P<0.05。 |
[1] |
张文佳, 柴彦威. 基于家庭的城市居民出行需求理论与验证模型[J]. 地理学报, 2008, 63(12): 1246-1256.
[
|
[2] |
卢银桃. 基于日常服务设施步行者使用特征的社区可步行性评价研究: 以上海市江浦路街道为例[J]. 城市规划学刊, 2013(5): 113-118.
[
|
[3] |
陈小鸿, 陈先龙, 李彩霞, 等. 基于手机信令数据的居民出行调查扩样模型[J]. 同济大学学报(自然科学版), 2021, 49(1): 86-96.
[
|
[4] |
吴杭彬, 陈茜茜, 靳慧玲, 等. 基于手机导航轨迹数据的城市大规模人群出行模式分析[J]. 同济大学学报(自然科学版), 2023, 51(7): 1002-1009.
[
|
[5] |
王德, 王灿, 谢栋灿, 等. 基于手机信令数据的上海市不同等级商业中心商圈的比较: 以南京东路、五角场、鞍山路为例[J]. 城市规划学刊, 2015(3): 50-60.
[
|
[6] |
王德, 谢栋灿, 王灿, 等. 个体时空行为的规律性与可预测性研究: 以上海市居民工作日活动为例[J]. 地理科学进展, 2021, 40(3): 433-440.
[
|
[7] |
|
[8] |
崔梦妍. 基于共享单车数据的出行目的推断及其时空特征分析研究[D]. 西安: 长安大学, 2023.
[
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
赵鹏军, 曹毓书. 基于多源地理大数据与机器学习的地铁乘客出行目的识别方法[J]. 地球信息科学学报, 2020, 22(9): 1753-1765.
[
|
[18] |
|
[19] |
|
[20] |
王德, 韩滨鹂, 张天然, 等. 手机信令数据的出行测度准确性分析: 基于与居民出行调查数据的比较[J]. 地理科学进展, 2024, 43(5): 854-869.
[
|
[21] |
翟宝昕, 朱玮. 家庭生活圈使用模式及其差异特征研究: 以上海市为例[J]. 人文地理, 2024, 39(2): 64-71,123.
[
|
[22] |
晏龙旭, 涂鸿昌, 王德, 等. 基于深度学习的建筑识别技术在城市体检中的应用[J]. 上海城市规划, 2022(1): 39-46.
[
|
[23] |
陈博文, 周素红, 姜超. 活动视角下建成环境对广州居民通勤效率的影响[J]. 城市规划学刊, 2016(4): 67-74.
[
|
[24] |
|
[25] |
冯建喜, 杨振山. 南京市城市老年人出行行为的影响因素[J]. 地理科学进展, 2015, 34(12): 1598-1608.
[
|
[26] |
|
/
〈 |
|
〉 |