地理科学进展  2017 , 36 (9): 1149-1157 https://doi.org/10.18306/dlkxjz.2017.09.011

专辑:城市文化感知与计算

城市交通热点区域的空间交互网络分析

秦昆12, 周勍3, 徐源泉1, 徐雯婷1, 罗萍1

1. 武汉大学遥感信息工程学院,武汉 430079
2. 地球空间信息技术协同创新中心,武汉 430079
3. 广州市城市规划勘测设计研究院,广州 510060

Spatial interaction network analysis of urban traffic hotspots

QIN Kun12, ZHOU Qing3, XU Yuanquan1, XU Wenting1, LUO Ping1

1. School of Remote Sensing and Information Engineering, Wuhan University, Wuhan 430079, China
2. Collaborative Innovation Center of Geospatial Technology, Wuhan University, Wuhan 430079, China
3. Guangzhou Urban Planning & Design Survey Research Institute, Guangzhou 510060, China;

版权声明:  2017 地理科学进展 《地理科学进展》杂志 版权所有

基金资助:  国家重点研发计划项目(2017YFB0503604)国家自然科学基金项目(41471326)

作者简介:

作者简介:秦昆(1972-),湖北随州人,教授,主要研究方向为时空大数据分析与挖掘、空间人文社会学,Email:qink@whu.edu.cn

展开

摘要

城市热点区域是人们频繁活动的体现,利用人们的出行可构建空间交互网络。目前的相关研究主要集中于对热点提取方法及其动态变化的研究,对交通热点的交互作用及其构成的空间交互网络的研究还很少。本文以武汉市的出租车轨迹为数据源,利用基于时空数据场的聚类方法提取城市交通热点区域;基于复杂网络理论与方法,分析城市交通热点区域之间的空间交互作用。通过研究发现:①节假日,热点区域之间的往返交互较多;工作日,热点区域之间的交互较少;②节假日,影响力较大的节点为车站、机场等;工作日,影响力较大的节点是社区和工作地;③社团探测发现,工作日跨越长江的交互较多,非工作日跨越长江的交互较少。上述研究结论可为交通管理部门针对节假日和工作日分别制定不同的交通管理政策和方法提供参考。

关键词: 城市交通热点 ; 空间交互网络 ; 复杂网络 ; 社区探测 ; 轨迹聚类 ; 时空数据场 ; 武汉市

Abstract

Urban traffic hotspots refer to the areas where residents visit frequently. Travels of urban residents generate interactions between urban areas, which form a spatial interactive network. Existing research mainly focuses on hotspot extraction and their dynamic change, but there are few studies that examine the interaction of traffic hotspots and the spatial interaction network. Based on the taxi trajectory data in Wuhan City, we detect the urban traffic hotspots by spatiotemporal data field clustering and further analyze the spatial interaction among urban hotspots based on the complex network theory. The results show that: (1) There is a large amount of interaction between the hotspots on holidays, and less interaction between the hotspots on weekdays; (2) The nodes with great influence are the bus and train stations, airports, and so on, on holidays, and the nodes with great influence are normally residential communities, workplace, and so on, on weekdays; (3) The results of community detection found that there is more interaction across the Yangtze River on weekdays, and little interaction across the Yangtze River on holidays. The study results can provide a reference for traffic management to develop different management strategies and methods for holidays and workdays. Investigating the interaction of human behaviors with urban environment, transportation, and geographical regions from the viewpoint of spatial interaction network is an innovative interdisciplinary research field crossing geographical information science, management science, and humanities and social sciences

Keywords: urban traffic hotspots ; spatial interaction network ; complex network ; community detection ; rajectory clustering ; spatiotemporal data field ; Wuhan City

0

PDF (30928KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

秦昆, 周勍, 徐源泉, 徐雯婷, 罗萍. 城市交通热点区域的空间交互网络分析[J]. , 2017, 36(9): 1149-1157 https://doi.org/10.18306/dlkxjz.2017.09.011

QIN Kun, ZHOU Qing, XU Yuanquan, XU Wenting, LUO Ping. Spatial interaction network analysis of urban traffic hotspots[J]. 地理科学进展, 2017, 36(9): 1149-1157 https://doi.org/10.18306/dlkxjz.2017.09.011

1 引言

城市交通热点区域,是指商业较发达、居民出行次数较多、交通流量较大的区域,是人们密集出行的体现 (Zheng et al, 2009; Chang et al, 2010; Zhao et al, 2017)。对城市交通热点区域进行提取和分析,有助于城市规划合理性分析,可为居民出行提供规避高峰和目的地选择的参考,为公共交通站点(地铁出入口、公交车站等)选址、交通规划和公共安全等提供辅助支持 (李婷等, 2014; 杨格格等, 2016)。

出租车轨迹既是乘客和司机行为模式的记录,又是城市区域规划和城市交通状况的反映。利用出租车轨迹进行城市热点区域提取,可发现城市的活跃区域。乘客的上下车点数据中含有丰富的时空信息,可利用时空聚类方法根据数据聚集性进行类簇划分。探测城市热点区域的过程,就是提取出租车上下车点聚集区域的过程,时空轨迹聚类是其基本方法(龚玺等, 2011)。目前,已有众多国内外学者对基于浮动车的城市热点区域提取进行研究。例如,Zou等人(2010)利用浮动车数据分析城市交通状态,可用于发现城市道路网络的热点和冷点区域,从而为城市交通控制与规划提供辅助和支持。Scholz等(2014)定义了一种热点区域动态变化的生命周期,并提出对热点区域的动态模式进行描述和预测的方法。这些研究主要集中于对热点提取的方法及其动态变化,而对交通热点的交互作用及其构成的空间交互网络的研究还很少。本文重点对城市各区域间出行形成的交通热点区域之间的交互关系,以及由此构成的城市区域空间交互网络进行研究。复杂网络(Fortunato, 2010)已成为分析网络结构和功能的一种有效手段。城市空间交互网络的研究分为城市与城市层面的交互网络和城市内部各子区域之间的交互网络两种。城市间交互的研究主要以城市为节点。例如,Rae(2009)通过空间网络图的构建,利用图划分等复杂网络理论与方法从英国2001年人口普查数据中挖掘城市间人口迁移模式,从而分析区域交互发展情况。城市内部区域交互的研究主要以各特征子区域为节点。例如Zhou等(2015)从武汉市出租车轨迹数据中,提取出前100个交通流量较大、道路通达性较广的交叉路口,并以此为节点,以交通流量为边构建城市空间交互网络,分析城市内对居民出行影响较大交叉路口。

武汉市是常住人口超过1000万的特大城市,被长江、汉江分隔成三部分,城市交通压力大,城市交通热点研究具有迫切性。以武汉市出租车轨迹为数据源,针对工作日与非工作日的出租车轨迹上下车点数据,结合行政区划等基础地理信息数据,探测城市热点区域及其时空分布模式,分析热点区域热度的变化趋势和规律等;基于复杂网络的理论与方法,构建城市空间区域网络,分析热点区域重要性、热点区域间及与行政区划间的交互关系,探讨武汉市各行政区之间、城市交通热点区域之间的空间交互作用,以期为改善城市交通管理提供参考,同时在理论上也是从一个全新的视角——空间交互网络分析角度——研究人们的出行与城市环境、交通和地理区域之间的相互关系,是用地理信息科学、管理科学和人文社会科学等学科交叉方法进行研究的一个尝试。

2 研究区域及研究方法

2.1 研究区域概况

武汉市是中国中部地区的中心城市,总面积8494.4 km2,2016年末常住人口1076.6万。长江及其最大支流汉江横贯武汉市区,将市区划分为武昌、汉口、汉阳三大区域,形成了武汉市独特的地理格局,也对城市交通造成一定影响。武汉市有13个市辖区,包括7个中心城区和6个新城区;全市有出租车约1.2万辆,出租车的主要活动范围集中在三环内的7个中心城区,覆盖了武昌区、江汉区、汉阳区、洪山区、硚口区、江岸区、青山区等主城区。

2.2 出租车轨迹及其预处理

出租车轨迹数据采集一天24个小时不间断,采样间隔为1 min。每一天的数据存储为一个文本文件,每行代表一个轨迹点信息,记录了采样时刻的车辆ID、时间、经度、维度、方向、速度、ACC状态、运营状态等数据项,涵盖了时间、位置、载客状态等信息。

出租车轨迹预处理主要包括数据格式转换、异常数据清理、上下车点提取等步骤。

(1) 数据格式转换:将每天的txt轨迹数据转换为一个Shapefile格式的文件,从而将文本数据空间化。

(2) 异常数据清理:由于车载GPS设备记录以及后台数据传输等系统原因,原始数据中含有异常属性值,造成属性数据无法正常对应,将此类异常记录剔除。

(3) 上下车点提取:将车辆轨迹数据按照车辆ID和时间排序,状态信息从“空车”变为“重车”的轨迹点标注为上车点,从“重车”变为“空车”的轨迹点标注为下车点。

2.3 基于时空数据场的城市热点区域提取方法

场在物理学中用来描述物体间非接触的相互作用。李德毅等人将物理学中场的概念推广到数域空间,认为数域空间中每个数据对象都相当于一个点电荷或质点,其周围存在一个作用场,位于场中的任何其他数据对象都将受到影响,因此,整个数域空间就构成一个数据场(李德毅等, 2003)。通过模拟数据对象在数据场中的相互作用可以进行数据对象的自组织类簇划分,从而实现数据对象的类别划分和聚集区域的探测(淦文燕等, 2006)。

传统的数据场势值计算中没有考虑时间对场的影响,仅以距离作为轨迹点相似性度量的标准,不适用于时空数据的相似性度量。因此,利用数据场理论进行出租车轨迹的聚集性分析首先需要对势函数进行时空扩展。目前已有相关研究者针对包含时域信息的动态数据,提出了时变数据场的思想(李德毅等, 2005; 吴涛, 2012)。引入归一化的时差系数作为权重参与数据场势值计算,可描述两点间势值随时间和空间的衰减效应,从而实现对数据场的时空扩展。

对于时空 Ω中的两点 A=(xA,yA,tA)B=(xB,yB,tB),BA的势值影响计算如式(1)所示:

φAB=mB×e-(|A-B|σ)2×1tAB(1)

式中: mB表示数据对象B的质量; |A-B|表示对象AB之间的距离; σ为影响因子; tABAB两点归一化后的时差系数,其计算如式(2)所示:

tAB=tAB-tmintmax-tmin(2)

式中: tAB为点A和点B的时间差值; tmin为时空中任意两点时间差值集合中的最小值; tmax为时空中任意两点时间差值中的最大值。时空 Ω中某点(如点A)的总势值就是所有其他点对该点的势值之和。

由式(1)可计算出各上(下)车车点的势值,再将势值相等的点连接成线构成等势线,由等势线的分布可知,在场势的作用范围内,若两个上(下)车点间的势值相差越小,则它们被划分为同一类的可能性越大,可利用数据势场中等势线的自然嵌套结构对数据对象进行分类。因此,利用时空数据场可以对上(下)车点数据的聚集区域进行探测,从而实现热点区域的提取和分析(Qin et al, 2017)。

2.4 基于复杂网络的城市空间交互网络分析方法

(1) 复杂网络的基础特性与统计量

复杂网络具有两个主要特性,即小世界特性和无标度特性。小世界特性(Watts et al, 1998)是指即使网络规模很大,网络中任意两个节点间能通过较短的路径实现连接的现象。无标度特性(Barabasi et al, 1999)是指一个网络中与其他节点有大量连接的节点往往占少数,多数节点的连接比较少,即节点的度数满足幂律分布。复杂网络的基本统计量主要包括度、度分布、聚类系数、平均路径长度等,反映了网络的连通性、紧密度以及通行效率等性能。其中平均路径长度和聚类系数是衡量网络是否具有小世界特性的指标,度分布是衡量网络无标度特性的指标。

在复杂的交互网络中,不同节点间的不同连接对网络结构稳定性及网络流量传播具有不同的贡献,对节点重要程度进行衡量能反映节点或边在网络中的地位,据此可进一步分析网络结构及其与网络运转交互之间的特征和关系。网络中心性的相关指标主要包括度中心性、接近中心性、介数中心性、特征向量中心性、PageRank中心性,分别从连接其他节点数目、与其他节点的接近程度、经由该节点的最短路径个数、影响能力及其演变形式等方面描述节点在网络中的重要程度。

本文旨在基于度中心性对城市内部区域交互网络中各热点区域节点或行政区节点的重要性进行度量。度中心性可理解为节点入度和出度之和,其中节点的入度即由其他节点出发连向该节点的边数,出度即由该节点出发连向其他节点的边数。

(2) 社团探测

社团或社区是指网络中的节点内聚子图,子图内部的节点间存在较多的连接,不同子图的节点间连接相对稀少。网络中的社区结构划分是对网络节点的聚类探测,是网络模块化与异质性的反映。研究和挖掘网络的社区结构,有助于揭示庞大网络中存在着哪些相对独立或具有交互关系的类簇,有助于进一步分析网络结构和功能的特性。常用的方法包括模块度方法(Newman et al, 2004)、随机游走方法和基于边介数(Betweenness)方法等。

(3) 有向加权网络统计指标

很多行为与流动都具有方向和强度意义,所以需要利用有向加权网络来进行抽象。有向加权网络常用的统计指标包括节点强度、加权聚类系数等。本文所构建的城市区域空间交互网络中的连边,是以具有实际意义的出租车上下车次数为边权值的有向加权网络,若两个区域节点间具有较大的边权值,可认为该两个区域往来交互相对紧密,可采用节点强度指标度量网络节点间的交互。

在有向网络中,节点的强度根据连边的指向不同,分为节点入强度和出强度(Barrat et al, 2004),由此衍生出了节点的净流量比(Zhong et al, 2014; 赵鹏祥, 2015),如式(3)-(5)所示:

式中: Sinvi为入强度; Soutvi为出强度; Vin(vi)为指向节点i的节点集合; Vout(vi)为从节点i指向其他节点的节点集合; w(vj,vi)为连接节点i与节点j的边的权重;NFR为净流量比,当NFR>0时,表明该区域的热度在增强,反之热度减少。

3 结果与分析

3.1 武汉市热点区域分布

城市居民活动集中区域与居民出行目的及城市功能区的类别而不相同。在不同的日期,城市活动的集中也有不同的分布,居民有不同的出行目的和习惯,从而导致热点区域在不同时间有不同的分布。节假日、工作日和周末休息日是一年中三种基本的日期类型。选取2015年5月1日(节假日)、6日(普通工作日)和9日(周末休息日)三天的数据为例,对节假日、普通工作日和周末休息日的热点区域的空间交互作用进行初步探索。这三天武汉的气温均在20℃左右,天气晴朗或有少量降雨,无干扰居民出行的异常事件,具有一定的代表性。将这三天的轨迹数据利用基于时空数据场的轨迹聚类分别进行聚类,分析出租车上下车点的时空聚类模式。进一步通过不同日期和不同时段的比较,分析武汉市城市热点区域的时空分布差异。

利用基于时空数据场的聚类分析方法,对2015年5月1日、6日和9日三天的上下车数据进行热点提取,形成交通热点图(图1),左下鹰眼部分是天河机场区域。按照每个热点类簇势值总和的不同,对热度进行区分,其中势值总和越大,该区域的出租车上下车点越密集,该区域越具有吸引力、热度越强。以递进的颜色进行热度区分,越偏蓝色表示热度越强,越偏橙黄色,表示热度越弱。

图1   武汉市热点区域提取结果

Fig.1   Hotspots in Wuhan City

通过三天出租车上下车轨迹的聚类实验,提取武汉市的主要热点区域。在这些不同时段的热点类簇中,2015年5月1日聚出105个热点区域,5月6日聚出92个热点区域,5月9日聚出98个热点区域。武汉多个已成型传统商圈是其常现的热点区域,包括:武昌的光谷商圈、街道口商圈、中南商圈、徐东商圈;汉口的王家墩商圈、武广商圈、江汉路商圈、武汉天地商圈和菱角湖商圈;汉阳的王家湾商圈和钟家村商圈等。从热点提取结果中也可探测出一些逐渐新兴的商圈,包括:楚河汉街商圈、古田商圈、宗关商圈、香港路商圈、杨春湖商圈和后湖商圈等。

3.2 武汉市热点区域网络交互强度

基于时空数据场的聚类分析方法提取的城市热点区域为时空热点类簇,其结果在空间上存在重叠现象,因此需要对热点区域进行空间上的合并。本文将重叠度大于30%的热点类簇进行合并,并将被合并的类簇势值总和作为新类簇的势值。然后按势值大小对热点区域进行编号,即热点区域的势值越大,其编号越大。为便于可视化和后续分析,求取各类热点区域的中心坐标作为其位置坐标,并根据覆盖热点区域的社区、商圈等区域,将该热点区域与实际代表的地理范围进行匹配,不同日期得到的热点区域所匹配的地理范围大致相似,可据此进行比较分析。

以合并后的城市热点区域为节点,出租车在热点区域的行驶路径为边,上下车次数为边权值,构建城市热点区域空间交互网络(简称“热点区域网络”)。2015年5月1日得到热点区域网络中包含51个节点、1923 条边;2015年5月6日得到热点区域网络中包含40个节点、1086 条边;2015年5月9日得到热点区域网络中包含46个节点、1473 条边。由此可见,在非工作日时,市民出行以及城市活动相对活跃,热点数量较工作日多。

不同日期各热点区域在城市网络中空间交互情况的分析如下(图2-3、表1):

(1) 节点出入强度分析

热点区域网络中,各节点出入强度的差别体现了该区域的吸引力。分别对三天热点区域网络中各节点的出入强度进行分析,并按照节点强度从大到小的顺序编号,如图2所示。

图2   热点区域网络节点强度统计图

Fig.2   Statistics of node strength of hotspots

(2) 边权值分析

节点的强度与连边权重值直接相关,本文所构建的边为有向边,从出租车上车点所在热点区域指向下车点所在区域,进一步对边权空间可视化如图3所示。

图3   热点区域网络连边空间可视化图

Fig.3   Visualization of edge weight of hotspots network

图3中可见,边权最大的连边多发生在汉口区域,相连的节点在地理位置上都比较接近。边权值最大的前3条边所连接的节点对如表1所示。

表1   边权值Top3统计表

Tab.1   Statistics of edge weights (top 3)

日期边权最大的前三个节点对
5月1日
(51个节点)
43→46,硚口路附近社区→武广商圈(世贸广场)
40→46,玉带街友谊社区→武广商圈(世贸广场)
45→51,菱角湖万达广场→汉口火车站
5月6日
(40个节点)
24→22,武广商圈(创世纪广场、湖北省地质局)→中山大道附近社区
24→34,武广商圈(创世纪广场、湖北省地质局)→雪松路和劲松巷附近社区
24→26,武广商圈(创世纪广场、湖北省地质局)→宝丰一路附近社区
5月9日
(46个节点)
45→39,武广商圈(创世纪广场)→幸福社区
45→42,武广商圈(创世纪广场)→硚口路与宝丰一路周边生活办公区
26→28,黄鹤楼→武昌火车站

新窗口打开

根据热点区域空间交互网络中边权分析,在工作日,市民的出行更多的是“居住地—工作地”的通勤模式;在非工作日,多为“居住地—休闲地”或“休闲地—休闲地”出行模式。

3.3 武汉市热点区域网络节点重要性

类似社交网络中的“人缘”分析,度中心性便是区域网络中的“区域缘”分析。该指标体现了该热点区域与其他热点区域的交互多样性,表明该区域的活跃性。本文采用度中心性来分析热点区域网络中节点的重要性。三天热点交互网络的节点度中心性大小的空间可视化如图4所示。

图4   武汉市出入度统计分析图

Fig.4   Statistical analysis of in-degree and out-degree in Wuhan City

选取热点区域网络中度中心性最大的前5个节点,如表2所示。

表2   度中心性Top5统计表

Tab.2   Statistics of degree centrality (top 5)

日期热点区域(前5)
5月1日
(51个节点)
51号热点区域(汉口火车站)、48号热点区域(武汉站)、33号(天河机场),50号热点区域(付家坡客运站)、36号热点区域(武昌火车站)
5月6日
(40个节点)
4号热点区域(武汉科技大学附属汉阳医院及其周边社区)、19号热点区域(三眼桥路附近社区)、3号(常青花园社区)、13号热点区域(光谷步行街)、16号热点区域(武汉市中级法院和金雅公园附近)
5月9日
(46个节点)
26号热点区域(黄鹤楼景区)、28号热点区域(宏基客运站)、34号(楚河汉街)、32号热点区域(武汉站)、45号热点区域(武广商圈(创世纪广场))

新窗口打开

表2可见,在五一节假日,度中心性较大的节点所在区域多为车站、火车站和机场等公共交通站点,工作日度中心性较大的节点多为社区和工作地;休息日度中心性较大的节点多为步行街和景区。该结果与边权值分析结论相一致。显然,市民更倾向于在五一小长假进行长距离出行,从而导致车站会与更多的热点区域有往来交互关系。在非长假的周末休息日,步行街和景区等区域的活跃性体现了市民休息日的选择。而在工作日,“住宅区—工作地”的出行模式使得各大社区和工作地成为与更多区域有相连关系的集中节点。

3.4 武汉市热点区域网络社团探测

选用随机游走模型对三天的热点区域网络进行社团探测。通过将连接较频繁紧密的节点归为一类,来分析热点区域之间交互的抱团性。社团探测结果的空间可视化如图5所示,图5(a)、(b)、(c)分别为2015年5月1日、6日、9日的社团分类结果,图5(d)、(e)、(f)为其空间可视化结果。

图5   社团分类结果图

Fig.5   Community classification

图5可见,上述三天热点区域网络的探测结果均为两类。其中,在五一节假日和周六休息日的社团探测结果中,除天河机场及汉口火车站外,其余热点网络节点基本上以长江为界,划分为两类。但在工作日,社团的分类并没有严格地呈现地域界限特征,各社团成员在地域上相互“渗透”。分析结果表明,工作日时热点区域之间的交互在地域上更广,交互半径相对更长。可见,就出租车出行而言,在工作日的跨江出行,比非工作日的跨江出行更加频繁。

4 结论与讨论

出行活动使得城市热点区域之间具有时空交互性,从而可以通过热点区域之间的时空交互作用而构建一个空间交互网络。城市热点区域的空间交互网络受时间(节假日、工作日、周末等)、地理条件和地理环境(江河阻隔、道路交通等)的影响。以城市重要交通工具之一的出租车的轨迹为数据源,可探测城市的交通热点;利用复杂网络的理论与方法,可探测城市热点区域的空间交互作用模式。通过对节假日、工作日、周末等具有代表性的时段,探测不同时段的城市热点区域的不同分布模式,可为城市交通管理及社会管理等制定分时段的管理政策和措施提供参考。通过分析江河阻隔、道路交通等对城市热点区域的空间交互网络作用的影响,可为城市规划、交通规划,以及对人们的出行推荐等提供信息参考。

目前,关于城市热点区域提取与分析研究已经取得若干突破性进展,但对空间交互网络特性及其规律的研究还不多。未来空间交互网络的进一步研究的重点为:①未来,空间交互网络的表达与构建方法;②空间交互网络的测度与定量表示方法;③空间交互网络的结构识别方法(找规律);④空间交互网络的异常探测与分析方法(探异常)。

总体来说,人们的行为轨迹数据中蕴含着反映行为规律与社会交往活动的丰富知识,需进一步深入挖掘。以轨迹数据为数据源,同时结合环境、交通、社会经济等数据,从空间交互的角度,研究人与城市之间的相互影响和交互作用,是地理信息科学、管理科学和人文社会科学共同面临的挑战性课题,迫切需要在理论方法方面有所创新,才能促进其研究水平不断提升。

The authors have declared that no competing interests exist.


参考文献

[1] 淦文燕, 李德毅, 王建民. 2006.

一种基于数据场的层次聚类方法

[J]. 电子学报, 34(2): 258-262.

https://doi.org/10.3321/j.issn:0372-2112.2006.02.014      URL      Magsci      [本文引用: 1]      摘要

聚类分析是统计、模式识别和数据挖掘等领域中一个非常重要的研究课题,具有广泛的应用前景.受物理学中场论思想的启发,提出一种基于数据场的层次聚类方法.该方法将物质粒子间的相互作用及其场描述方法引入抽象的数域空间,通过模拟对象在虚拟数据场中的相互作用和运动实现数据对象的自组织层次聚集.实验显示,该方法不依赖于用户输入参数的仔细选择,能够发现任意大小和密度的非球形聚类,对噪声数据不敏感,且具有近似线性的收敛速度.

[Gan W Y, Li D Y, Wang J M.2006.

An hierarchical clustering method based on data fields

[J]. Acta Electronica Sinica, 34(2): 258-262.]

https://doi.org/10.3321/j.issn:0372-2112.2006.02.014      URL      Magsci      [本文引用: 1]      摘要

聚类分析是统计、模式识别和数据挖掘等领域中一个非常重要的研究课题,具有广泛的应用前景.受物理学中场论思想的启发,提出一种基于数据场的层次聚类方法.该方法将物质粒子间的相互作用及其场描述方法引入抽象的数域空间,通过模拟对象在虚拟数据场中的相互作用和运动实现数据对象的自组织层次聚集.实验显示,该方法不依赖于用户输入参数的仔细选择,能够发现任意大小和密度的非球形聚类,对噪声数据不敏感,且具有近似线性的收敛速度.
[2] 龚玺, 裴韬, 孙嘉, . 2011.

时空轨迹聚类方法研究进展

[J]. 地理科学进展, 30(5): 522-534.

https://doi.org/10.11820/dlkxjz.2011.05.002      URL      Magsci      [本文引用: 1]      摘要

时空轨迹(Trajectory)是移动对象的位置和时间的记录序列。作为一种重要的时空对象数据类型和信息源,时空轨迹的应用范围涵盖了人类行为、交通物流、应急疏散管理、动物习性和市场营销等诸多方面。通过对各种时空轨迹数据进行聚类分析,可以提取时空轨迹数据中的相似性与异常特征,并有助于发现其中有意义的模式。本文根据时空轨迹数据的特点,系统综述了时空轨迹聚类方法的研究进展。首先,从理论、可行性和应用的角度分析了时空轨迹数据及其聚类方法研究的重要性,并论述了时空轨迹的定义、模型与表达;然后,按照相似性度量所涉及的不同时间区间将现有的时空轨迹聚类方法划分为6 类,并对每一类方法的原理及特点进行了评述;最后,讨论了现有方法面临的主要问题和挑战,并对时空轨迹聚类研究的发展进行了展望。

[Gong X, Pei T, Sun J, et al.2011.

Review of the research progresses in trajectory clustering methods

[J]. Progress in Geography, 30(5): 522-534.]

https://doi.org/10.11820/dlkxjz.2011.05.002      URL      Magsci      [本文引用: 1]      摘要

时空轨迹(Trajectory)是移动对象的位置和时间的记录序列。作为一种重要的时空对象数据类型和信息源,时空轨迹的应用范围涵盖了人类行为、交通物流、应急疏散管理、动物习性和市场营销等诸多方面。通过对各种时空轨迹数据进行聚类分析,可以提取时空轨迹数据中的相似性与异常特征,并有助于发现其中有意义的模式。本文根据时空轨迹数据的特点,系统综述了时空轨迹聚类方法的研究进展。首先,从理论、可行性和应用的角度分析了时空轨迹数据及其聚类方法研究的重要性,并论述了时空轨迹的定义、模型与表达;然后,按照相似性度量所涉及的不同时间区间将现有的时空轨迹聚类方法划分为6 类,并对每一类方法的原理及特点进行了评述;最后,讨论了现有方法面临的主要问题和挑战,并对时空轨迹聚类研究的发展进行了展望。
[3] 李德毅, 杜鹢. 2005. 不确定性人工智能[M]. 北京: 国防工业出版社.

[本文引用: 1]     

[Li D Y, Du Y.2005. Artificial Intelligence with uncertainty[M]. Beijing, China: National Defense Industry Press.]

[本文引用: 1]     

[4] 李德毅, 淦文燕, 刘璐莹. 2003.

人工智能与认知物理学

[C]//中国人工智能学会第10届全国学术年会论文集. 广州: 中国人工智能学会.

[本文引用: 1]     

[Li D Y, Gan W Y, Liu L Y.2003.

Artificial intelligence and cognitive physics

[C]//Chinese artificial intelligence society national academic annual meeting. Guangzhou, China: Chinese Association for Artificial Intelligence.]

[本文引用: 1]     

[5] 李婷, 裴韬, 袁烨城, . 2014.

人类活动轨迹的分类、模式和应用研究综述

[J]. 地理科学进展, 33(7): 938-948.

https://doi.org/10.11820/dlkxjz.2014.07.009      URL      Magsci      [本文引用: 1]      摘要

各种传感器的应用与发展,如车载GPS、手机、公交卡、银行卡等,记录了人类的活动轨迹。这些海量的人类活动轨迹数据中蕴含着人类行为的时空分布模式。通过对这些轨迹的研究可以挖掘个体轨迹模式,理解人类动力学特征,进而为对轨迹预测、城市规划、交通监测等提供支持。因此,研究各类传感器记录的人类活动轨迹数据成为当前的研究热点。本文对人类活动轨迹的获取与表达方式进行剖析,并将人类的活动轨迹按照采样方式和驱动因素的不同分为基于时间间隔采样、基于位置采样和基于事件触发采样等3 类轨迹数据。由于各类轨迹数据均由起始点、锚点和一般节点等构成,因而将轨迹模式挖掘的研究按照锚点、出行范围、形状模式、OD流模式、时间模式等进行组织,研究成果揭示人类活动轨迹在时间、空间的从聚模式、周期性等特点。在此基础上,将人类活动轨迹在城市研究中的应用,按照用户轨迹预测、城市动态景观、城市交通模拟与监控、城市功能单元识别以及城市中其他方面的研究应用进行系统综述,认为人类活动模式挖掘是城市规划、城市交通、公共安全等方面应用的基础。

[Li T, Pei T, Yuan Y C, et al.2014.

A review on the classification, patterns and applied research of human mobility trajectory

[J]. Progress in Geography, 33(7): 938-948.]

https://doi.org/10.11820/dlkxjz.2014.07.009      URL      Magsci      [本文引用: 1]      摘要

各种传感器的应用与发展,如车载GPS、手机、公交卡、银行卡等,记录了人类的活动轨迹。这些海量的人类活动轨迹数据中蕴含着人类行为的时空分布模式。通过对这些轨迹的研究可以挖掘个体轨迹模式,理解人类动力学特征,进而为对轨迹预测、城市规划、交通监测等提供支持。因此,研究各类传感器记录的人类活动轨迹数据成为当前的研究热点。本文对人类活动轨迹的获取与表达方式进行剖析,并将人类的活动轨迹按照采样方式和驱动因素的不同分为基于时间间隔采样、基于位置采样和基于事件触发采样等3 类轨迹数据。由于各类轨迹数据均由起始点、锚点和一般节点等构成,因而将轨迹模式挖掘的研究按照锚点、出行范围、形状模式、OD流模式、时间模式等进行组织,研究成果揭示人类活动轨迹在时间、空间的从聚模式、周期性等特点。在此基础上,将人类活动轨迹在城市研究中的应用,按照用户轨迹预测、城市动态景观、城市交通模拟与监控、城市功能单元识别以及城市中其他方面的研究应用进行系统综述,认为人类活动模式挖掘是城市规划、城市交通、公共安全等方面应用的基础。
[6] 吴涛. 2012.

图像分割的认知物理学方法研究

[D]. 武汉: 武汉大学.

[本文引用: 1]     

[Wu T.2012.

Image segmentation methods based on cognitive physics

[D]. Wuhan, China: Wuhan University.]

[本文引用: 1]     

[7] 杨格格, 宋辞, 裴韬, . 2016.

北京对外交通枢纽乘客OD时空分布特征

[J]. 地球信息科学学报, 18(10): 1374-1383.

https://doi.org/10.3724/SP.J.1047.2016.01374      URL      Magsci      [本文引用: 1]      摘要

对外交通枢纽对城市内部的客流交通有重大影响,研究其乘客在市内的OD分布对优化设计地面接驳线路、沿线站点等有重要意义。本文基于北京出租车GPS数据,选取具有代表性的3类对外交通枢纽(机场、火车站、汽车客运站),采用标准差椭圆分析、核密度估计以及分时点统计等方法,研究了北京对外交通枢纽乘客OD时空分布特征。结果表明:(1)机场、火车站客流量远大于汽车客运站,其中首都国际机场与北京西站的对外出行客流量最大,南苑机场和北京北站的对外出行客流量较少;(2)机场乘客主要分布在四环以里大部分地区以及五环以里部分地区,时间上主要分布在除凌晨1-4时的各个时间段;火车站乘客主要分布在四环以里区域,时间上主要分布在6-21时;汽车客运站乘客主要分布在各客运站周边区域,时间上主要集中在6-17时;(3)北京南站与北京西站、北京站间的客流联系较多,可考虑开通北京南站与二者间的地面接驳专线。此外,抵离首都国际机场、南苑机场的乘客主要分布区域与新开通的机场往返市区的巴士线路站点较为一致,说明采用出租车数据进行乘客OD分析可为决策部门进行相关交通规划提供依据。

[Yang G G, Song C, Pei T, et al.2016.

Passengers' OD Temporal-spatial Distribution Characteristics of the External Traffic Hubs in Beijing

[J]. Journal of Geo-Information Science, 18(10): 1374-1383.]

https://doi.org/10.3724/SP.J.1047.2016.01374      URL      Magsci      [本文引用: 1]      摘要

对外交通枢纽对城市内部的客流交通有重大影响,研究其乘客在市内的OD分布对优化设计地面接驳线路、沿线站点等有重要意义。本文基于北京出租车GPS数据,选取具有代表性的3类对外交通枢纽(机场、火车站、汽车客运站),采用标准差椭圆分析、核密度估计以及分时点统计等方法,研究了北京对外交通枢纽乘客OD时空分布特征。结果表明:(1)机场、火车站客流量远大于汽车客运站,其中首都国际机场与北京西站的对外出行客流量最大,南苑机场和北京北站的对外出行客流量较少;(2)机场乘客主要分布在四环以里大部分地区以及五环以里部分地区,时间上主要分布在除凌晨1-4时的各个时间段;火车站乘客主要分布在四环以里区域,时间上主要分布在6-21时;汽车客运站乘客主要分布在各客运站周边区域,时间上主要集中在6-17时;(3)北京南站与北京西站、北京站间的客流联系较多,可考虑开通北京南站与二者间的地面接驳专线。此外,抵离首都国际机场、南苑机场的乘客主要分布区域与新开通的机场往返市区的巴士线路站点较为一致,说明采用出租车数据进行乘客OD分析可为决策部门进行相关交通规划提供依据。
[8] 赵鹏祥. 2015.

基于轨迹聚类的城市热点区域提取与分析方法研究

[D]. 武汉: 武汉大学.

[本文引用: 1]     

[Zhao P X.2015.

Research on the method of extracting and analyzing urban hotspots based on trajectory clustering[D].

Wuhan, China: Wuhan University.]

[本文引用: 1]     

[9] Barabási A L, Albert R.1999.

Emergence of scaling in random networks

[J]. Science, 286: 509-512.

URL      [本文引用: 1]     

[10] Barrat A, Barthélemy M, Vespignani A.2004.

Modeling the evolution of weighted networks

[J]. Physical Review E, 70(6): 066149.

https://doi.org/10.1103/PhysRevE.70.066149      URL      PMID: 15697476      [本文引用: 1]      摘要

Abstract: We present a general model for the growth of weighted networks in which the structural growth is coupled with the edges' weight dynamical evolution. The model is based on a simple weight-driven dynamics and a weights' reinforcement mechanism coupled to the local network growth. That coupling can be generalized in order to include the effect of additional randomness and non-linearities which can be present in real-world networks. The model generates weighted graphs exhibiting the statistical properties observed in several real-world systems. In particular, the model yields a non-trivial time evolution of vertices properties and scale-free behavior with exponents depending on the microscopic parameters characterizing the coupling rules. Very interestingly, the generated graphs spontaneously achieve a complex hierarchical architecture characterized by clustering and connectivity correlations varying as a function of the vertices' degree.
[11] Chang H W, Tai Y C, Hsu J Y J.2010.

Context-aware taxi demand hotspots prediction

[J]. International Journal of Business Intelligence and Data Mining, 5(1): 3-18.

https://doi.org/10.1504/IJBIDM.2010.030296      URL      [本文引用: 1]      摘要

ABSTRACT In an urban area, the demand for taxis is not always matched up with the supply. This paper proposes mining historical data to predict demand distributions with respect to contexts of time, weather, and taxi location. The four-step process consists of data filtering, clustering, semantic annotation, and hotness calculation. The results of three clustering algorithms are compared and demonstrated in a web mash-up application to show that context-aware demand prediction can help improve the management of taxi fleets.
[12] Fortunato S.2010.

Community detection in graphs

[J]. Physics Reports, 486(3-5): 75-174.

[本文引用: 1]     

[13] Newman M E J, Girvan M.2004.

Finding and evaluating community structure in networks

[J]. Physical Review E, 69(2): 026113.

URL      [本文引用: 1]     

[14] Qin K, Zhou Q, Wu T, et al.2017.

Hotspots detection from trajectory data based on spatiotemporal data field clustering

[C]//Proceedings of the 3rd international conference on spatial data mining and geographical knowledge services. in press.

[本文引用: 1]     

[15] Rae A.2009.

From spatial interaction data to spatial interaction information? Geovisualisation and spatial structures of migration from the 2001 UK census

[J]. Computers, Environment and Urban Systems, 33(3): 161-178.

https://doi.org/10.1016/j.compenvurbsys.2009.01.007      URL      摘要

In modern GIS applications, flow mapping and geodynamics are not particularly well represented. This is somewhat surprising given the potential of such approaches to shed light on the spatial characteristics associated with the movement of people and goods. Despite the attention of a select number of researchers whose contributions have been significant, however, the subject matter remains underdeveloped and the full potential of spatial interaction data remains largely unrealised. Therefore, this paper represents an attempt to popularise the use of flow mapping within a contemporary GIS, with a view to aiding and enhancing decision support at a range of different spatial scales. It discusses advances in flow mapping, proposes an approach to mapping a large migration matrix from the United Kingdom鈥檚 2001 census, and considers the ways in which this can add value to the understanding of geographical patterns of residential mobility. Subsequently, it considers possible dissemination methods via new developments in web-based geospatial technologies before offering some general principles and identifying future challenges. The findings indicate that it is now entirely feasible to map large spatial interaction datasets with common GIS software, that this has the benefit of producing instant, query-led information, and that the knowledge derived from this could be used to inform all kinds of local, regional and national policy formulation and evaluation.
[16] Scholz R W, Lu Y M.2014.

Detection of dynamic activity patterns at a collective level from large-volume trajectory data

[J]. International Journal of Geographical Information Science, 28(5): 946-963.

https://doi.org/10.1080/13658816.2013.869819      Magsci      摘要

Recent developments in pervasive location acquisition technologies provide the technical support for massive collection of trajectory data. Activity locations identified from trajectory data can be used to evaluate space-time activity patterns. However, the studies that explore activity patterns at collective levels often fail to address the temporal aspect. The traditional spatial statistics, which are commonly used for spatial pattern analysis, are limited in describing space-time interactions. This paper proposes a method to detect the dynamics of space-time development of urban activity patterns that are embedded in large volume trajectory data. Taxi cabs' trajectory data in the city of San Francisco were analyzed to identify activity instances, activity hot spots, and space-time dynamics of activity hot spots. The urban activity hot spots, evolving through different stages and across the city, provide a comprehensive depiction of the space-time activity patterns in the urban landscape. The dynamic patterns of the activity hot spots can be used to retrieve historical events and to predict future activity hot spots, which may be valuable for transportation and public safety management.
[17] Watts D J, Strogatz S H.1998.

Collective dynamics of ‘small-word’ network

[J]. Nature, 393: 440-442.

[本文引用: 1]     

[18] Zhao P X, Qin K, Ye X Y, et al.2017.

A trajectory clustering approach based on decision graph and data field for detecting hotspots

[J]. International Journal of Geographical Information Science, 31(6): 1101-1127.

https://doi.org/10.1080/13658816.2016.1213845      URL      [本文引用: 1]      摘要

(2016). A trajectory clustering approach based on decision graph and data field for detecting hotspots. International Journal of Geographical Information Science. Ahead of Print. doi: 10.1080/13658816.2016.1213845
[19] Zheng Y, Zhang L Z, Xie X, et al.2009.

Mining interesting locations and travel sequences from GPS trajectories

[C]//Proceedings of the 18th international conference on world wide web. Madrid, Spain: ACM: 791-800.

[本文引用: 1]     

[20] Zhong C, Arisona S M, Huang X F, et al.2014.

Detecting the dynamics of urban structure through spatial network analysis

[J]. International Journal of Geographical Information Science, 28(11): 2178-2199.

https://doi.org/10.1080/13658816.2014.914521      URL      Magsci      [本文引用: 1]      摘要

Urban spatial structure in large cities is becoming ever more complex as populations grow in size, engage in more travel, and have increasing amounts of disposable income that enable them to live more diverse lifestyles. These trends have prominent and visible effects on urban activity, and cities are becoming more polycentric in their structure as new clusters and hotspots emerge and coalesce in a wider sea of urban development. Here, we apply recent methods in network science and their generalization to spatial analysis to identify the spatial structure of city hubs, centers, and borders, which are essential elements in understanding urban interactions. We use a ‘big’ data set for Singapore from the automatic smart card fare collection system, which is available for sample periods in 2010, 2011, and 2012 to show how the changing roles and influences of local areas in the overall spatial structure of urban movement can be efficiently monitored from daily transportation. In essence, we first construct a weighted directed graph from these travel records. Each node in the graph denotes an urban area, edges denote the possibility of travel between any two areas, and the weight of edges denotes the volume of travel, which is the number of trips made. We then make use of (a) the graph properties to obtain an overall view of travel demand, (b) graph centralities for detecting urban centers and hubs, and (c) graph community structures for uncovering socioeconomic clusters defined as neighborhoods and their borders. Finally, results of this network analysis are projected back onto geographical space to reveal the spatial structure of urban movements. The revealed community structure shows a clear subdivision into different areas that separate the population’s activity space into smaller neighborhoods. The generated borders are different from existing administrative ones. By comparing the results from 302years of data, we find that Singapore, even from such a short time series, is developing rapidly towards a polycentric urban form, where new subcenters and communities are emerging largely in line with the city’s master plan. To summarize, our approach yields important insights into urban phenomena generated by human movements. It represents a quantitative approach to urban analysis, which explicitly identifies ongoing urban transformations.
[21] Zhou Y, Fang Z X, Thill J C, et al.2015.

Functionally critical locations in an urban transportation network: Identification and space-time analysis using taxi trajectories

[J]. Computers, Environment and Urban Systems, 52: 34-47.

https://doi.org/10.1016/j.compenvurbsys.2015.03.001      URL      摘要

This paper studies the space–time properties of locations that are critical to travel activities in an urban environment. Specifically, we analyze locations on the urban street network from the perspective of the distribution of people’s travel trajectories. We identify the intersections of an urban transportation network which are characterized by good connectivity, serving a high density of trip trajectories, and exhibiting multiple traversing patterns of trip trajectories as potential functionally critical network locations (FCNLs). A geospatial method is proposed to extract FCNLs from people’s moving trajectories based on the street network. Two groups of quantitative indices are introduced to measure the evolution of the spatial extent and temporal variation patterns of different criticality levels of FCNLs. A case study using taxi trajectory data from Wuhan, China has been implemented. The results show that the FCNLs are very powerful in uncovering the space–time traveling patterns of a particular population and studying the relationship between urban functional structures and people’s activities.
[22] Zou H X, Yue Y, Li Q Q, et al.2010.

A spatial analysis approach for describing spatial pattern of urban traffic state

[C]//Proceedings of the 13th international IEEE conference on intelligent transportation systems (ITSC). Funchal, Madeira Island, Portugal: IEEE: 557-562.

/