地理科学进展  2018 , 37 (7): 880-889 https://doi.org/10.18306/dlkxjz.2018.07.002



杨喜平1, 方志祥2*

1. 陕西师范大学地理科学与旅游学院, 陕西省旅游信息科学重点实验室,西安 710119
2. 武汉大学测绘遥感信息工程国家重点实验室,武汉 430079

Recent progress in studying human mobility and urban spatial structure based on mobile location big data

YANG Xiping1, FANG Zhixiang2*

1. School of Geography and Tourism, Shaanxi Normal University, Shaanxi Key Laboratory of Tourism Informatics, Xi'an 710119, China
2. State Key Laboratory of Information Engineering in Surveying, Mapping and Remote Sensing, Wuhan University, Wuhan 430079, China

通讯作者:  通讯作者:方志祥(1977-),湖北咸宁人,教授,博导,主要研究方向为时空GIS与行人智慧导航,Email: zxfang@whu.edu.cn

收稿日期: 2017-09-5

修回日期:  2018-01-22

网络出版日期:  2018-07-28

2018 地理科学进展

基金资助:  国家自然科学基金项目(41231171,41771473,41571135)中国博士后科学基金项目(2017M623112)中央高校基本科研业务费资助项目(GK201803049,2042017kf0235)国家重点研发计划项目(2017YFB0503802)


作者简介:杨喜平(1986-),山西运城人,讲师,研究方向为时空轨迹大数据挖掘与人群移动行为,E-mail: xpyang@snnu.edu.cn




关键词: 移动定位大数据 ; 人群移动行为 ; 城市空间结构 ; 研究进展


Understanding human mobility patterns and spatial structure is of great important to urban planning, traffic management, emergence response, and so on. With the development of information and communication technologies, it is possible to collect large-scale, long-term human tracking data, which brings great opportunities and challenges for human mobility behavior studies. This article first introduces the main datasets being used for studying human mobility patterns, then reviews the recent progress from the perspectives of human travel behavior and urban spatial structure respectively. We found that most studies follow the route of "data-human travel behavior-urban spatial structure," mining and understanding human mobility patterns from the datasets and further giving insights on the characteristics of urban spatial structures. However, there exist few studies on the influence of urban spatial structure on human travel behavior. In the future, it is necessary to integrate multi-source spatiotemporal data to understand the interaction between human mobility and urban spatial structure, develop spatiotemporal analysis theory and models for dealing with mobile location big data, and focus on understanding the coupling relationship between human mobility and urban spatial structure.

Keywords: mobile location big data ; human mobility ; urban spatial structure ; progress


杨喜平, 方志祥. 移动定位大数据视角下的人群移动模式及城市空间结构研究进展[J]. 地理科学进展, 2018, 37(7): 880-889

YANG Xiping, FANG Zhixiang. Recent progress in studying human mobility and urban spatial structure based on mobile location big data[J]. Progress in Geography, 2018, 37(7): 880-889

1 引言


传统的人群移动行为和空间结构研究多采用出行日志调查数据,获取该数据需要巨大的财力和劳动力,但数据的样本量较小、时间跨度短、更新速度慢,因此无法全面及时地反映城市人群活动的时空规律,同时由于问卷设计和受访者的主观性影响,数据准确性也值得商榷。随着信息通讯技术的发展(ICT),人类进入了大数据时代,各种传感器和定位技术的普及,使得收集和存储大规模的、长时间序列和高精度的群体移动定位大数据(如手机数据、公交刷卡数据和出租车数据等)(陆锋等, 2014)成为可能,这些数据中蕴含丰富的个体时空活动信息,有助于从更精细的时空尺度理解人群移动模式和城市空间结构及其两者之间的相互作用。

事实上,人群移动时空行为研究是地理学、信息科学、统计物理科学、人文社会科学等多学科交叉的课题,不同学科背景的学者们开始采用移动定位大数据从不同的角度研究城市中人群移动时空行为和城市空间结构,旨在帮助解决日益凸显的城市问题。例如,郑宇(2015)从计算机的角度提出了城市计算的概念和框架,并讨论了城市计算在城市规划、智能交通、环境保护、能源消耗以及社交娱乐等方面的应用。李清泉(2017)以地球空间信息学为基础,提出了城市信息学的概念,利用城市大数据、信息论和系统论,致力于解决复杂的城市问题和构建可持续发展的智慧城市。Liu Y等(2015)提出了“社会感知”的概念,认为这些人群移动感知数据包含丰富的信息,如城市不同空间之间的交互强度和位置的潜在语义信息等,这是传统遥感数据捕获不到的,可作为遥感数据的补充用于进行地理分析。

目前已有一些文献对移动定位大数据支持下的人群移动行为研究进行综述(刘瑜等, 2011; Yue et al, 2014; 李婷等, 2014; 陆锋等, 2014; 牟乃夏等, 2015)。本文在这些文献的基础上,以理解城市人群移动时空行为和城市空间结构关系为主题,重点对地理学领域近3年国内外相关研究的进展进行归纳和总结。首先概述了目前研究采用较多的4种主要移动定位大数据源的特点,接着从人群移动时空行为和城市空间结构特征及其两者关系的角度综述国内外最新研究进展,最后提出目前研究中存在的问题和未来发展展望。

2 移动定位大数据源及特征


2.1 手机数据

手机的使用已经非常普及,尤其是在城市中,手机给居民带来方便的同时,也能感知人群在城市中的位置随时间的变化,使得采集海量的长时间的个体时空轨迹数据成为可能。根据记录过程中是否受到用户主观行为的影响,手机数据分为主动式和被动式定位数据。手机通话数据(Call detail records, CDRs)是主动式定位数据的典型代表。通讯公司为了计费,当用户进行通话或短信活动时记录用户的活动开始时间、结束时间以及所服务的基站位置。被动式定位数据是通讯公司为了检查故障等原因定时的扫描城市中每个基站服务的人群,包括用户ID、记录时间和基站的位置,故将该数据称为手机位置数据。由于该数据是规则采样的数据,能更加完整地反映出个体出行连续的时空变化。

虽然手机数据已经成为研究城市人群移动模式的重要数据源,但在使用时还需注意:①由于手机数据可时刻跟踪用户的行为轨迹,因此在使用 时一定要考虑用户隐私保护问题(Yin et al, 2015);②CDRs数据只有当用户发生通讯活动时才记录用户的位置,因此该数据受到用户使用手机习惯的影响较大,并不能完全构建出用户的出行轨迹。Zhao等(2016)借用3个指标详细分析了CDRs数据在研究人群移动中存在的缺陷,发现该数据低估了人群的出行距离和移动熵,但能很好地反映用户出行的回旋半径;③手机数据是采用基站进行定位,并非用户精确位置,受到基站分布的影响较大,一般在市中心区域基站的服务范围为100~500 m,而在郊区可达几公里左右。

2.2 浮动车数据

出租车是城市居民出行的一种重要交通工具。目前,在中国许多大中城市中为了管理和运营,都在出租车上安装了GPS定位系统,每隔一定的时间记录出租车的位置信息,主要包括时间、经纬度、方向、速度以及出租车载客状态。与手机数据相比,出租车的时间采样间隔约30~60 s左右,能详细记录车辆在城市道路上行驶的路径信息,因此该数据已经被广泛用于道路通行能力评估(张希瑞等, 2015)、行程时间预测(Sanaullah et al, 2016)、车道信息探测(唐炉亮等, 2016)等。另外,通过提取出租车乘客上下客位置,可分析城市居民出行的OD流和出行空间结构(Liu X et al, 2015)。然而由于出租车出行费用较高,只能覆盖城市部分居民,大部分居民乘坐公交车和地铁出行,并且超过90%的居民乘坐出租车出行的距离小于20 km,居民一般选择地铁和公交的方式进行远距离的出行(Wang et al, 2015)。

2.3 社交媒体签到数据

近年,随着网络的发展,社交媒体极大地丰富了人们的生活,同时也为我们研究城市居民出行时空活动提供了一种新的机遇和挑战(Rashidi et al, 2017)。目前大部分社交媒体平台(Facebook、Twitter、新浪微博等)都具有地理位置签到功能,用户每到一个位置可在平台上上传照片、评论文字等,这样就形成了带有位置信息的签到记录,研究者可通过网络爬虫手段来获取用户的签到数据。该数据的数据量较大,并能覆盖到全国全球尺度,时间跨度较长,自用户注册后即可记录其在平台上发布的每条信息,同时从签到内容中还可提取出签到位置的语义信息,学者通过将签到数据与问卷调查数据进行比较分析,证实签到媒体数据可以用来研究人群移动模式(Steiger et al, 2015)。此外,由于微博数据中包含用户对活动的描述信息,可用于感知城市旅游流空间网络特征以及游客的情感与气候舒适度的关系(李君轶等, 2015)。但社交媒体签到数据也有以下局限性:一是社交媒体用户主要集中于年轻群体,并不能全面覆盖所有年龄段人群;二是由于用户使用社交媒体的习惯(如签到频率、签到位置)差异较大,导致不同用户签到记录数量差异较大,所以生成的轨迹稀疏程度与用户签到频次密切相关(陆锋等,2014)。

2.4 公共交通刷卡数据

在城市中,公交和地铁承担了大部分居民的出行客流,为了方便居民出行,管理部门在公交和地铁上安装了自动刷卡系统,用于记录用户出行交易数据如时间、类型、费用等,公交刷卡数据能反映城市不同区域居民出行需求,已被广泛地用于优化城市公共交通运营、研究通勤行为与职住关系等(Long et al, 2015; Sun et al, 2015)。由于计费方式不同,公交刷卡记录也存在差异,如北京市按乘车距离计费,因此上下车都需要刷卡;而大多数城市采用一票制,只需要上车进行刷卡即可,因此还需根据刷卡记录来推断乘客上车或下车站点,从而构建用户出行的OD矩阵(龙瀛等, 2015; 宋晓晴等, 2016)。


3 具体内容现状


图1   人群移动时空行为与城市空间结构关系

Fig.1   Relationship between human mobility and urban spatial structure

3.1 人群移动行为研究


3.1.1 人群移动韵律分析

从时间的角度看,城市居民的出行具有很强的节奏性和周期性(Sevtsuk et al, 2010)。城市郊区的居民通勤具有很强的规律,无论是工作、上学、服务还是休闲等活动,人群每天的移动都遵循相似的时间节奏(Ahas et al, 2010)。在世界上不同的地方由于地域文化差异,人群每天活动的时间存在差异性,手机数据使得我们可以轻易地比较世界不同地方的人群活动的时空地理文化差异(Ahas et al, 2015)。人群移动模式具有很强的时间规律性,为检测这种规律在任何时间尺度下的稳定性,Zhong等(2016)分别采用新加坡、伦敦、北京的公交刷卡数据分析不同时间尺度下这种规律的稳定性,发现规律性的变化与时间分辨率存在非线性的关系。

3.1.2 群体移动时空模式

人群的移动具有很强的动态节奏性,由于城市空间结构功能存在差异,在城市不同的区域移动模式存在差异,识别城市中群体移动时空模式有助于深入理解城市不同空间结构与人群移动之间的关系。多数研究通过构建描述人群动态变化指标的时间序列,然后运用不同的方法被用来识别提取出城市中典型的人群移动时空模式,并进一步分析群体移动模式与城市土地利用的关系(Liu et al, 2012; Yang, Fang et al, 2016; 杨喜平等, 2016; Gong et al, 2017)。

3.1.3 锚点提取与活动类型识别

轨迹中的锚点是指人在移动过程中重要的停留驻点,表示人为了从事某种活动在这些地方进行了停留;而人对活动需求是产生移动的根本原因,锚点对人来说是一些比较重要的和有意义的地方。在人的时空间移动行为研究中,大多数研究工作主要关注的是人群移动的部分,忽略了人移动过程中停留行为的分析(萧世伦等, 2014),因此还需多关注城市人群的停留模式(徐金磊等, 2015)。从轨迹中识别出人的移动行为和停留行为,构建人群移动出行网络结构模型,可帮助深入理解人的出行结构特征(Schneider et al, 2013)。移动和停留是轨迹中2个重要组成部分,从轨迹中识别出活动锚点,结合地理空间环境的语义信息,推测出停留锚点的活动类型,丰富轨迹的语义信息,帮助理解人们出行的活动需求,从而根据活动类型之间的变化预测人群的移动(Huang et al, 2015)。

从轨迹中识别出人的停留锚点,需进一步确定人们在锚点处所从事的活动类型,人们对这些活动的需求才是决定其出行的潜在动力因素,因此有必要识别出锚点的活动类型,来丰富轨迹的语义信息(Alvares et al, 2007)。学者们通过利用实际的地理空间环境信息(POI),结合出行问卷调查数据,通过建立概率模型来推测锚点的活动类型(Furletti et al, 2013;Diao et al, 2015; Gong et al, 2016)。识别人群的活动目的给轨迹添加语义标签非常有意义,但目前只能从概率上推测人群的活动类型,并且识别的结果仍未能得到准确的验证。

3.1.4 人群活动空间分析

活动空间是由人一天中所访问的位置所构成的空间活动范围,是人的时空间行为研究中的一个重要的内容,可用来衡量居民对城市空间的利用状况(柴彦威等, 2008)。传统的活动空间研究主要采用出行文件调查数据,最近移动定位技术的发展为其提供了新的数据采集方法。柴彦威(2013)将传统问卷调查和GPS技术结合对北京2个居住区的样本居民进行了为期一周的时空数据采集,并对采集的数据质量进行评价。随后利用采集的数据对城市居民的日常活动空间进行一系列研究,如社区居民工作日和休息日的日常活动空间及对城市空间利用的影响因素,城市不同社区居民的日常活动的时空分布及社区分异性等(张艳等, 2014)。大数据使得分析大规模群体的活动空间成为可能。王波等(2014)利用新浪微博签到大数据分析了南京市区活动空间的总体特征,认为在信息时代距离的二重作用可能使城市活动空间出现极化。最近,手机数据也被应用于城市居民活动空间的研究。Xu等(2015)基于深圳市手机数据识别出用户居住位置,并采用回旋半径衡量用户基于居住位置的活动空间,分析了城市不同区域人群基于家的活动空间的差异,发现深圳市人群的活动空间具有非常明显的南北差异特性,与该城市的经济发展和交通特点一致。此外,他还采用3个指标(每天的活动范围、活动锚点的数量和移动频率)来比较深圳和上海2个城市的人群的活动空间差异(Xu et al, 2016)。大规模的时空轨迹数据还可使研究者分析城市人群活动空间的分布模型,可分析城市中不同性别群体和不同年龄群体对城市空间的使用情况(Yuan et al, 2016)。

3.1.5 人群移动时空预测性研究

2017年,《Science》期刊专门针对时空活动预测研究出了一期“Prediction and its limits”为主题的专题研究报告,收集了大数据在政治经济、人口、政策和冲突等方面的以数据为驱动的预测研究,并指出预测人类行为是未来重要的研究前沿问题(Jasny et al, 2017)。轨迹大数据为人群时空移动行为预测提供了良好的机遇。传统认为个体的移动具有很大的随机性,可用一些随机模型或Lévy飞行模型来对其解释,而学者们通过利用手机数据发现人群移动具有很强的规律性和可预测性(Gonzalez et al, 2008; Song et al, 2010)。在群体移动预测方面,方志祥等(2017)基于海量手机轨迹数据,运用时空概率转移矩阵来定量化描述城市不同区域间人群流动时空特征,结合马尔科夫链和贝叶斯定理预测城市不同区域上基站服务用户数量,为通讯公司优化基站布局提供参考。

3.2 城市空间结构研究


3.2.1 热点区域的探测及语义分析

人群活动热点区域是指人群的活动显著高于其邻近区域的地方,这些热点可帮助我们了解到城市中吸引力较高、人群出行需求较高、交通设施中较关键的区域。在城市中,由于不同的活动对时间的依赖程度不同,如工作、购物、休闲等活动对人群吸引的时间段是不一样的,故城市中热点区域对时间具有依赖性(Yue et al, 2009)。城市内旅游景点具有很强的吸引力,基于新浪微博签到数据,采用空间聚类方法可识别出城市旅游热点区域(Shao et al, 2017)。在识别人群出行需求热点方面,学者们基于核密度提出了不同的方法来识别人群出行热点(Hu et al, 2014; Yang, Zhao et al, 2016; Zhao et al, 2017)。在交通关键设施方面,Zhou等(2015)采用武汉市出租车轨迹数据,结合核密度和等高线来识别城市中路网中功能关键的热点位置,并分析了这些关键位置网络结构随时间的动态变化模式。

网络文本中蕴含着丰富的地理信息,通过利用数据挖掘技术从网络文本中发现有意义的地理知识,是地理信息发展的一个新的方向(余丽等, 2015)。最近,社交网络数据开始被广泛应用于人群活动的研究,一些学者用社会调查数据来衡量Twitter数据是否能作为研究人群移动的指标,尝试将社交网络数据整合到地理信息系统(Steiger et al, 2015; Andris 2016)。社交网络数据包含用户的一些社会属性信息,如年龄、性别及发布消息的位置和时间等信息,因此可用于研究城市中不同社会群体活动的时空模式和城市空间结构等(Longley et al, 2015; Huang et al, 2016)。社交文本中包括用户对所参与活动的描述信息,利用自然语言处理技术从文本中挖掘出这些活动信息,提取出城市中用户感兴趣的区域,并添加地理语义主题标签,了解城市中不同位置群体所从事的主要活动信息(Hu et al, 2015; Kim et al, 2016;谢永俊等,2017)。

3.2.2 土地利用类型识别

城市土地利用与人群移动时空模式之间密切相关,不同的土地利用会产生不同的人群移动模式。学者们开始利用手机数据、出租车和公交刷卡数据、社交媒体签到数据来推测城市的功能区域。总体的思路为:先将城市分割成不同的空间分析单元,构建每个单元内人群活动的时间序列,然后采用机器学习中分类方法(如模糊C均值等)对时间序列进行分类;再根据每一类人群的变化模式来分析其土地利用类型(Pei et al, 2014)。通过将出租车轨迹数据与城市POI结合,或考虑不同区域间的交互模式,利用主题推断模型或EM算法进行聚类,从而推测出土地利用类型(Liu et al, 2016; Gao et al, 2017)。此外,Zhi等(2016)采用社交媒体签到数据,采用矩阵分解和K-means聚类方法联合探测出5种典型的城市功能区。即使在同一种功能用地上,人群的活动也是随时间不断变化的,通过融合多源人群活动数据可提高对城市功能的了解(Tu et al, 2017)。

3.2.3 城市多中心结构研究

人群在城市中不同区域间移动可反映这些区域之间的交互关系,这种交互关系潜在地反映城市不同区域的联系紧密程度以及城市多中心结构。通过分析人群在城市中的空间分布,可识别城市中心及多中心结构(钮心毅等, 2014; Sun et al, 2016)。城市中人群的移动可反映出城市不同区域之间的交互强度,从轨迹数据中提取出用人群移动的OD位置,构建基于人群移动流量的网络,利用复杂网络中的社区探索算法进行社区发现,从而可以发现网络中交互强度较大的人群移动局部紧密社区,发现城市中潜在的居民出行多中心社区结构,为城市规划提供参考(Liu X et al, 2015; Kang et al, 2016)。为了减小可塑性面积单元问题(MAUP),Zhu等(2017)利用北京市出租车数据,以街道作为分析单元分析城市人群移动时空模式和社区结构,发现城市街道可作为面单元的一个补充来缓解MAUP问题。

3.2.4 职住空间分布结构研究

城市居民职住空间分布和平衡一直是交通领域研究的重点,随着居民活动大数据的兴起,职住关系的研究也进入新的阶段,通过从人群活动数据中识别居民的居住位置和工作位置,这种大规模的人群活动数据能够使我们全面了解城市职住空间分布特征。目前,学者们用大数据进行职住分布的研究主要包括:职住地识别方法研究(许宁等, 2014; 曹瑞等, 2016),职住关系的平衡(Long et al, 2015),通勤圈的识别(丁亮等, 2015)和就业中心体系测度(丁亮等, 2016)。基于识别的居民职住位置,构建居民出行的OD矩阵,通过分析居民出行起点和终点的分布特征,设计聚类算法来对其进行聚类,发现城市中不同区域居民出行的主要空间交互模式和出行量的时空特征(Zhu et al, 2014; 程静等, 2016)。

3.2.5 城市空间的可达性研究

可达性是衡量城市空间中某一地方到其他地方便捷性的一种指标,可用于反映城市空间结构中区位的公平性和优先级(陈洁等, 2007)。浮动车数据不仅能反映城市不同区域人群的出行起点和终点,同时也可反映城市道路网的动态路况等信息,因此被广泛应用于可达性研究(Cui et al, 2016)。城市路网的交通状况是随着时间和空间不断变化的,因此可达性也是不断变化的。考虑城市道路网的实时速度和城市道路网行程时间的不确定性,可计算城市POI和特定位置的动态可达性(Chen et al, 2017)。此外,手机数据也被用于衡量可达性,如可定量分析非洲居民到公共健康设施的可达性及对健康预防的影响(Wesolowski et al, 2015)。

4 结论与展望


(1) 由于使用目的和感知设备的差异,不同的数据源在采样规模、群体类型和时空分辨率等方面具有各自特点,这些数据在研究人群移动模式时也具有各自优缺点,因此在研究人群移动时出现偏见(Lu et al, 2017)。在未来,通过融合多源轨迹数据能更全面更详细地了解城市居民出行的全过程,深入理解居民出行行为特点和对城市空间的使用规律。

(2) 随着时空轨迹数据的丰富,时空分析已成为研究人群出行行为的重要手段。时间地理学理论为分析个体时空行为奠定了理论基础,已经能初步在GIS中对个体之间行为进行表达和分析(陈洁等, 2016),但对于更复杂的个体活动和交互行为(如活动的碎片化、多活动同时进行或虚拟空间的活动等)仍难以实现,因此,还需要进一步丰富时空行为分析的理论和方法。

(3) 轨迹大数据只是记录了个体在城市中移动的时空位置信息,缺乏个体出行过程中参与活动的语义信息和城市环境信息的描述,在人群活动的属性信息描述方面无法与传统调查数据相比,所以还需深入研究完整的时空语义建模理论。


The authors have declared that no competing interests exist.


