研究综述

基于机器学习的时空出行选择行为研究综述与展望

  • 王江波 , 1 ,
  • 连芝锐 1 ,
  • 冯涛 2 ,
  • 唐立 3 ,
  • 刘锴 , 1, *
展开
  • 1.大连理工大学经济管理学院,辽宁 大连 116024
  • 2.广岛大学先进理工系科学研究科,日本 东广岛 739-8511
  • 3.西华大学汽车与交通学院,成都 610031
* 刘锴(1978— ),男,江苏南京人,博士,教授,博士生导师,研究方向为先进交通信息系统、交通行为模型、城市和区域规划。E-mail:

王江波(1992— ),男,河南漯河人,博士,副教授,硕士生导师,研究方向为时空交通行为分析。E-mail:

收稿日期: 2023-07-30

  修回日期: 2024-06-02

  网络出版日期: 2024-08-22

基金资助

国家自然科学基金项目(52302404)

国家自然科学基金项目(52102384)

国家自然科学基金项目(71871043)

宁夏回族自治区揭榜挂帅重点项目(2023BBF01004)

A review and outlook of machine learning-based travel choice behavior research

  • WANG Jiangbo , 1 ,
  • LIAN Zhirui 1 ,
  • FENG Tao 2 ,
  • TANG Li 3 ,
  • LIU Kai , 1, *
Expand
  • 1. School of Economics and Management, Dalian University of Technology, Dalian 116024, Liaoning, China
  • 2. Graduate School of Advanced Science and Engineering, Hiroshima University, Higashi-Hiroshima 739-8511, Japan
  • 3. School of Automobile and Transportation, Xihua University, Chengdu 610031, China

Received date: 2023-07-30

  Revised date: 2024-06-02

  Online published: 2024-08-22

Supported by

National Natural Science Foundation of China(52302404)

National Natural Science Foundation of China(52102384)

National Natural Science Foundation of China(71871043)

Key R&D Program of Ningxia(2023BBF01004)

摘要

近年来,机器学习模型因其优越的预测性能和灵活性,被广泛引入时空出行行为建模与预测研究中,但其基础研究框架和技术路线尚未明晰。论文通过回顾2010—2022年相关领域发表的重要文献,梳理了机器学习算法的应用对时空出行选择行为研究范式的影响,总结了当前研究中亟待解决的关键问题及影响时空出行选择行为建模效果的潜在因素和作用机理,展望了未来研究中需要重点突破的方向。将机器学习算法有效应用于时空出行选择行为研究,不仅需要与决策场景相契合的模型架构和决策机理支撑,还应克服诸多机器学习过程及方法的固有缺陷,并充分考虑外部研究条件对时空选择行为模拟和预测效果的影响。现有的机器学习模型已能够契合大多数出行选择决策场景,多元化、高效率的机器学习算法必将有力推动出行选择行为研究的发展。有限的可解释性仍然是学者们难以广泛信任基于机器学习的时空出行选择行为模型的根本原因。面对大数据时代时空出行选择行为研究的机遇与挑战,充分融合机器学习算法和经典决策理论及模型各自的优势,同时提升时空出行选择行为的模拟精度和模型可解释性是重要发展趋势。

本文引用格式

王江波 , 连芝锐 , 冯涛 , 唐立 , 刘锴 . 基于机器学习的时空出行选择行为研究综述与展望[J]. 地理科学进展, 2024 , 43(8) : 1649 -1665 . DOI: 10.18306/dlkxjz.2024.08.014

Abstract

In recent years, machine learning models have been widely introduced into spatiotemporal travel behavior modeling and prediction research due to their superior predictive performance and flexibility, but their underlying research framework and technical routes are still unclear. This article reviewed the typical literature published in related fields from 2010 to 2022 to examine the impact of the application of machine learning algorithms on the spatiotemporal travel choice behavior research paradigm, summarize the key issues to be solved in the current application and the potential influencing factors and mechanisms that affect the effectiveness of spatiotemporal travel choice behavior modeling, and foresee the directions to be focused on in future research. The effective application of machine learning algorithms to the study of spatiotemporal travel choice behavior requires not only the support of model architectures and decision mechanisms that fit the decision scenarios, but also to overcome the inherent shortcomings of all learning processes and methods, and fully consider the impact of external research conditions on the simulation and prediction performance of spatiotemporal travel choice behavior. Existing machine learning models can already fit most spatiotemporal travel choice decision scenarios, and diversified and efficient machine learning algorithms will certainly give a strong impetus to the development of spatiotemporal travel choice behavior research. Limited model interpretability remains the fundamental reason why machine learning-based spatiotemporal travel behavior models are difficult to be widely trusted. Facing the opportunities and challenges of spatiotemporal travel choice behavior research in the era of big data, it will be an important development trend to fully integrate the respective advantages of machine learning algorithms and classical decision theories and models, while improving the simulation accuracy and model interpretability of spatiotemporal travel choice behavior.

时空出行选择行为模型是交通需求分析与预测的基石,为交通系统政策制定、运营管理和系统优化提供了可靠的决策支撑。20世纪60年代,McFadden[1]将可操作性极强的Logit模型和个人随机效用理论结合,时空出行选择行为的建模方法得到迅速发展。20世纪70年代,经典离散选择模型在旧金山湾沿岸高速铁道需求预测中的成功应用,使得非集计分析模型和方法在快速城市化进程中大显身手[2]。在随后的几十年中,学者们不断提出新的模型和建模方法,逐步放宽更多假设条件,更好地还原和分析了选择者面对的实际决策场景[3-4]。随着大数据技术的普及和人工智能技术的推广与应用,交通行为研究范式正在发生深刻的变革。
出行选择是多因素影响下复杂决策的结果,出行者根据个体偏好、社会经济属性和可选择方案属性等综合效应进行决策。时空出行选择行为研究旨在将观测到的交通行为与其存在因果关系的主要影响因素的关联性挖掘出来,理解影响因素与时空出行选择行为间的联系,预测出行者的选择行为[5]。从构建关联关系和预测选择行为的目标来看,时空出行选择行为本质上是一种分类问题[6],这也为引入擅长解决分类问题的机器学习模型创造了契机。
经典离散选择模型在解释出行者选择行为机理、调查支付意愿和政策响应分析方面有显著优势,因此,在过去几十年中得到广泛应用[3]。然而,由于无法实现复杂决策场景中快速、精准的预测任务[7],且受限于模型假设条件[3,8]、计算效率较低[9]、难以捕捉非线性影响效应[7]等缺陷,经典离散选择模型在面对更广泛、更灵活、更大规模数据和超高维输入特征的研究场景时显得力不从心[6,9-10]。为提高时空出行选择行为的预测精度,适应更加灵活的研究场景,近年来大量研究尝试将学习能力和灵活性更强的机器学习算法引入时空出行选择行为研究中[11]。研究结果证实,机器学习算法能有效提升个体行为的预测精度,但应用的机器学习算法并非基于严密的经济学理论推导,且在经济学和行为学关注的可解释性上缺乏充分的说服力[11-12],研究结果的可信度难以得到广泛认可。
随着信息技术的发展,交通大数据以几何级速度迅速积累。庞大的数据量必然会在研究设计、模型选择以及结果解释等多个方面推动时空出行选择行为研究范式的革新。机器学习算法在时空出行选择研究领域具有良好的应用前景和实践价值[11]。然而,现有研究更多强调机器学习模型的预测精度优势,极少关注模型机理与具体研究问题、场景和基础理论的关联性和适配性。由于研究背景、数据来源以及研究者的专业知识存在差异,因此很难获得具有一致性和一般性的结论[9,13]。一些学者已注意到可解释性“黑盒”是机器学习算法应用于以政策为导向的交通行为研究的最大障碍[11],并积极探索提升可解释性的可行途径。在大数据背景下,机器学习与经典离散选择模型的协同与融合将为时空出行选择行为研究的发展带来巨大机遇。然而,现有文献对于机器学习方法应用于时空出行选择行为研究中所面临的关键问题以及可行的解决方案缺乏系统性的梳理。
本文回顾2010年以来国内外基于机器学习算法研究时空出行选择行为的重要文献,总结主要应用的算法特征及其优劣势,系统梳理影响机器学习模型应用效果的关键因素,指出机器学习算法应用于出行选择研究中面临的共性问题,总结可能的解决方案,并展望未来应当重点关注的研究方向。

1 研究趋势

为了系统客观地对现有文献进行综述分析,本文采用文献综述中广泛应用的元分析文献检索筛选策略。检索中国知网、维普中文和万方三个中文期刊全文数据库和Web of Science(核心合集)英文数据库。检索词包括出行选择/出行行为和机器学习/强化学习。文献筛选标准如下:英文文献必须为SCI或SSCI收录。中文文献必须满足至少一种收录类型:《中文核心期刊要目总览》(北大核心)、《中文社会科学引文索引》(CSSCI)、中国科学引文数据库(CSCD)或Engineering Village,确保选取的文献来源具备广泛的学术认可和权威性,同时覆盖了国际知名的SCI/SSCI数据库和国内重要的中文学术检索资源,保证综述文献的质量和全面性。基于以上检索策略,本文共筛选出2010年以来应用机器学习算法的时空出行选择行为研究中、英文文献共计90篇,其中中文文献19篇、英文文献71篇。文献发表时间为2010年1月至2022年6月。不同时期的研究成果数量分布如图1所示。从发表期刊来看,大部分论文发表在交通和交通地理信息领域的主流期刊,如Transportation Research Part A/C/DTransport GeographyTravel Behaviour and Society,少量发表在计算机领域及综合类期刊中。
图1 不同时期的研究成果分布

Fig.1 Annual number of publications in different periods

本文基于筛选出的90篇文献,利用VOSviewer提取论文及期刊所属学科类别字段,构建基于机器学习算法的出行选择研究的学科共现网络图谱,发现在时空出行选择行为研究中,交通学科(transportation)与工程学科(engineering)的联系最为紧密。其次,数学(mathematics)、商业和经济(business & economic)、科学与技术(science & technology)等学科作为基础理论与工具,与交通学科也存在深度交叉。此外,由于机器学习算法的广泛应用,计算机科学(computer science)对时空出行选择行为研究的支撑作用也将愈发明显。
基于机器学习算法的时空出行选择行为研究呈现逐年增多的趋势。通过提取文献主题关键词聚类分析,总结出现有研究涵盖的主要研究主题,按论文数量从多到少依次为出行方式选择行为、出行行为分析(如步行频率等)、出行路径/路线选择行为、机器学习模型理论化和多阶段联合选择行为建模等(图2)。其中,在出行方式选择研究中应用机器学习算法的文献远多于其他方向,涉及集成学习、人工神经网络和支持向量机等7种主要机器学习算法;在联合选择行为研究中则最为单调,仅包括强化学习和人工神经网络模型。集成学习和人工神经网络因其强大的数据处理能力和模式识别能力,广泛应用于出行方式选择行为和出行行为分析;强化学习则因其在连续决策过程中的有效性,常用于出行路径/路线选择和多阶段联合选择行为中。
图2 主要研究主题及其中应用的机器学习算法

Fig.2 Main research topics and the machine learning algorithms applied

为解决机器学习模型缺乏经济学理论基础、可解释性差等问题,学者们对建模方法进行了改进,一方面将机器学习求解过程与基于效用理论的离散选择模型求解过程相互关联,如基于深度神经网络模型的经济学理论挖掘[14];另一方面构建经典离散选择模型和机器学习模型的融合框架,在保证机器学习模型优越的预测性能的同时,增强其可解释性,如融合经典决策理论的残差神经网络模型[10]
应用的机器学习算法几乎涵盖了所有分类(表1图3),包括集成学习、人工神经网络、支持向量机、决策树、朴素贝叶斯、广义可加模型等有监督学习算法,聚类算法、关联规则学习等无监督学习算法和强化学习算法。按照文献数量排序,时空出行选择行为研究中最常见的6类机器学习算法依次为决策树和基于树模型的集成学习算法、人工神经网络模型、聚类算法、强化学习算法、支持向量机和贝叶斯网络模型。
表1 应用的机器学习算法分类及主要文献

Tab.1 Classification of applied machine learning algorithms and the main related publications

分类 应用的算法及主要文献
有监督 集成学习[15-19]
人工神经网络[20-24]
支持向量机[25-29]
决策树[8,22,30-33]
贝叶斯网络[17,25,34-37]
广义可加模型[38]
无监督 聚类算法[31,39-42]
关联规则学习[30,43-44]
强化学习 强化学习[45-49]
图3 应用不同机器学习算法的文献数量占比

Fig.3 Distribution of publications using different machine learning algorithms

2 时空出行选择行为研究中常用的机器学习算法

本节梳理时空出行选择行为研究中最常用的6类机器学习算法,总结各算法主要研究主题及研究优劣势,并提炼各自典型的应用场景。

2.1 基于树模型的机器学习算法

决策树和基于树模型的集成学习算法是时空出行选择行为研究领域应用最广泛的机器学习算法,尤其是在出行方式选择和出行行为研究中(图2)。决策树是一种具有直观树结构的非参数有监督学习算法,广泛应用于分类(分类树)和回归问题(回归树)。集成学习是基于提升(boosting)、装袋(bagging)等技术,构建多个分类器(或回归器),并将各模型结果组合输出的一类有监督机器学习算法。基于树模型的集成算法如随机森林和梯度提升决策树算法在时空出行选择行为研究领域的应用最为广泛。
出行方式选择、出行路径选择问题是典型的分类问题[8,25,31]。Victoriano等[31]应用决策树检验了个人和家庭特征对出行策略的影响效应,分类结果较好地识别了与不同出行策略相关的重要社会经济和人口属性特征。Tang等[32]应用决策树算法对出行方式迁移行为进行建模,并在迭代过程中引入损失矩阵处理非平衡数据对预测结果的负面影响,结果证明,决策树模型显著优于多项Logit模型。Hagenauer等[25]对比常用的机器学习模型(包括三种基于树的集成学习算法)与经典多项Logit模型在出行方式选择中的表现,发现基于树的集成学习模型在预测效果和处理非平衡数据方面均有明显优势。
在出行行为分析研究中,决策树和基于树模型的集成学习算法常常也用于回归问题[50-51]。Xu等[50]应用随机森林算法(回归树)识别了拼车出行选择行为的关键影响因素,并探究了影响因素的非线性影响效应。在应用机器学习算法的出行行为研究中,一个重要研究方向是建成环境因素对居民长期出行习惯的影响,旨在通过挖掘建成环境对出行行为的非线性影响效应,揭示影响因素的阈值效应和协同/抵消效应,提高城市国土空间规划和交通系统规划与管理政策的制定的效率和效能[51-53]
决策树模型较好的可解释性[25,32]和对非线性影响效应的有效捕捉能力[25,32,53]得到广泛认可,但其对出行行为影响变量间的相关性和异常个体数据较为敏感,容易陷入过拟合[25]。基于树模型的集成学习算法可看作决策树模型的改进算法,能够在一定程度上降低过拟合风险,得益于较少的超参数和极强的灵活性,集成学习算法在时空出行选择行为研究中的应用最为广泛,现有研究通过与传统离散选择模型结果的对比证明其有较好的预测性能[11]。然而,基于树模型的集成学习算法并未完整保留决策树模型易于解释的特性[25,54],往往需要借助机器学习解释器挖掘输入特征的影响效应[53,55]

2.2 人工神经网络模型

人工神经网络模型是模拟人脑的神经系统对信息处理和外界刺激响应机制的有监督机器学习算法,在时空出行选择行为研究中的应用广度仅次于集成学习算法,主要应用于出行方式选择和出行行为的建模和预测,基于机器学习模型的时空出行选择行为建模理论研究也通常以人工神经网络模型为例(图2)。
Shmueli等[56]、Nijkamp等[57]将反馈式人工神经网络模型引入时空出行选择行为研究中,证明人工神经网络模型预测性能高于传统离散选择模型。Wang等[14]应用深度人工神经网络对新加坡和伦敦居民出行方式选择行为进行建模和预测,证明其预测精度高于经典离散选择模型。Golshani等[23]使用神经网络模型,对出行方式和出发时间联合选择行为模式进行建模和预测,通过与基于Copula的联合选择模型(Copula-based joint model)对比,发现考虑前序选择行为的神经网络模型在模型预测精度上具备更大优势,但遗憾的是无法提供输入特征边际效应的有效估计。在随后几十年中,越来越多的学者将更复杂的神经网络结构应用于时空出行选择行为研究领域[20,58],如深度学习网络[59]、长短期记忆神经网络[60]等。
放弃充分的先验理论知识,放松线性或广义线性的特征映射函数等强假设,能够较好地处理输入变量间的高度共线性,使得人工神经网络模型能适应更多数据分析场景[8,58]。此外,神经网络模型能够捕捉到输入变量之间高阶、复杂的交互效应,也是其广受学者们青睐一个重要原因。然而,该模型存在一些不足。Shmueli等[56]首次指出神经网络模型在变量效应解释上的巨大缺陷。神经网络模型的节点间权值难以解释,无法准确反映输入特征与输出结果的关联关系,也难以衡量输入特征的重要性[11]。其次,由于网络结构复杂,神经网络模型容易过拟合[61],超参数的选取和优化也相对困难[11]。为解决这些问题,一些学者将神经网络模型与传统效用理论进行融合,构建了可解释的深度人工神经网络框架,以平衡模型的预测性能和解释性能[10,14,59,62]。然而,融合模型的框架必然需要考虑和处理更多的不确定性,模型效果极大地依赖各自的模型设置,如效用函数的设定、超参数的选择等,需要同时规避和处理两类模型的过拟合问题。

2.3 无监督学习

聚类算法是出行选择研究中应用最为广泛的为无监督机器学习算法,常用于研究出行方式选择、出行行为分析和出行路线/路径选择的研究中(图2)。出行选择研究领域常用的聚类算法包括K均值聚类[63-64]、两阶段聚类[40,65]、粗糙集聚类[41-42]和潜在类别聚类模型[39]等。
Molin等[39]应用潜在类别聚类模型识别出行模式的潜在类别,并基于变量在各潜在类别中的分布探究社会经济属性、个体感知和态度等变量的影响效应。此外,聚类分析也常常作为一个辅助建模的工具,如在构建传统离散选择模型之前将出行者按照个体特征进行聚类和分组,有助于消减组内个体异质性[40,63,66]。温惠英等[40]首先应用二阶段聚类算法根据9类指标将实验群体进行聚类,并基于聚类结果构建出行方式选择模型,结果证明了模型预测性能显著优于未聚类的模型。聚类算法在出行路径选择研究中也常常用于生成路径选择集,Yao等[64]应用K均值聚类算法将可行路径集进行聚类,选取各类别路径属性的平均值代表这一类路径的特征,进而生成路径选择集。然而受限于无监督学习机制,现有研究中确定潜在分组数量往往过度依赖研究者的经验。其服务的主模型大多服从最大效用理论,模型的解释性通常没有损失,聚类中心在一定程度上加强了个体异质性的捕捉。

2.4 强化学习算法

强化学习算法是机器学习方法的一个重要分支,在出行路线/路径选择和出发时间选择多阶段联合选择行为的研究中得到最广泛应用。多阶段联合选择行为的建模需要考虑前后两次选择决策的关联性,基于经典离散选择模型的建模方法多采用嵌套Logit模型[67]和基于Copula函数的联合模型[23]
与有监督和无监督式学习不同,强化学习算法主要解决的问题是出行者如何在环境中通过选择不同的出行方式或路径,以最大限度地提高系统的累积奖励。与有监督学习类似,强化学习也有模型训练的过程,即通过不断观察出行选择决策执行后的效果,累积经验形成模型。而与有监督学习不同的是,各个决策一般没有直接标定的标签值作为正确与否的唯一判断,而是系统性地生成一个反馈信号。这种反馈信号具有延迟性,一般在所有决策完成一段时间后才能完全体现。个体时空出行选择行为对交通系统效率的影响具有一定滞后性,最终交通系统对个体决策行为产生反馈,并继续影响出行者的再决策行为,因此强化学习算法能较好地适用于这类动态联合选择行为的模拟和分析[47,49,68-69]
Li等[47]将强化学习应用于出行路径和出发时间联合选择行为的建模中,较好地模拟了出行者基于不确定信息进行选择决策,再基于已做的决策效果进行信息更新、学习到再决策调整的动态过程。赵思萌[49]使用强化学习算法,将节省的出行时间和交通费用作为奖励,引入学习因子和折扣因子,对出行者动态认知和决策的过程进行建模,模拟了出行者出行时间和出行方式联合选择行为。Perepelitsa[48]通过对个体在强化学习过程中做出的选择进行统计平均,构建了一系列选择行为模型,在强化学习过程中,允许决策者的选择有很短的K期记忆跨度,更加贴近出行者的实际决策场景。当前基于强化学习算法的时空出行选择行为研究相对较少,但与其他机器学习算法相比,强化学习本身刺激—反应的学习机理更容易与出行者决策心理过程相契合。研究结果证实了强化学习算法相比较经典离散选择模型有更高的预测精度,但遗憾的是难以对影响因子的作用方向和大小给出可靠的估计,因此无法挖掘背后的影响机制[23]

2.5 支持向量机模型

支持向量机模型因其卓越的分类性能,在出行方式选择行为研究中应用最为广泛[26,28-29](图2)。邓琼华等[29]应用最小二乘支持向量机对居民出行方式进行建模和预测,证明了其在分类准确率上明显优于多项Logit模型,并应用敏感性分析弥补支持向量机模型解释性上的缺陷。Yang等[27]基于多项选择模型筛选出影响居民出行行为的显著变量,并构建了多种支持向量机模型预测居民出行频率,发现仅包含显著变量的支持向量机模型拟合效果明显优于全变量支持向量机模型和多项Logit模型。此外,支持向量机模型对非平衡数据的预测性能较差。Allahviranloo等[28]提出了一种具有时间依赖关系的K-SVM(multi-class SVM)预测基于活动的出行模式,时间依赖结构的设置使得该模型能够更好地捕捉出行模式的时间序列特征。相对于人工神经网络模型,支持向量机在泛化预测能力方面具有一定优势,即不易陷入过拟合和局部最优[29]。然而,支持向量机本质上是一种二元分类器,即能够很好地适应二元出行选择场景。而时空出行选择行为的多选项场景则需要将多个向量机单元组装成有向无环结构,基于一对多(one-against-all)或一对一(one-against-one)原则逐一进行分类[27-28]
与大多数机器学习算法类似,支持向量机依然是“黑盒模型”,无法对输入特征的边际效应进行解释,甚至难以计算变量的重要性[28,70]。与人工神经网络模型不同,支持向量机模型对输入的特征变量有更高的敏感性,过多的无关特征输入会降低模型的预测性能[27-28],近年来支持向量机模型在出行选择研究领域中的应用呈现逐渐减少的趋势[11]

2.6 贝叶斯网络

贝叶斯网络是一种概率图模型,常常用于挖掘变量间的因果关系。其通过有向无环图(directed acyclic graph)来描述变量间的因果关系,并基于条件概率来量化因果效应[71]。与人工神经网络等机器学习中的黑盒模型相比,贝叶斯网络由于其有向图结构具有较强的可解释性。不同于擅长挖掘因果关系的结构方程模型,贝叶斯网络的因果关系是基于实际数据的关联性挖掘,而非预先设定[35]。此外,贝叶斯网络模型具有较强的灵活性和可拓展性,须增加相应的约束以确保学习到的网络结构不会产生反常识的关联关系[37]
然而,研究人员如何根据数据和相关理论基础,高效、准确地构建贝叶斯网络,是神经网络模型应用的难点[17]。为了避免构建的网络过于复杂,研究者往往需要借助其他算法对重要变量进行筛选。如Aghaabbasi等[17]在构建网约车出行行为模型时首先应用随机森林筛选出关键变量,并以此作为节点构建了网约车出行行为及其影响因素间的贝叶斯网络结构。贝叶斯网络的学习过程主要基于评分搜索或依赖性分析学习方法,但这些方法都存在一定的局限性,如搜索空间大、易陷入局部最优解、判断节点间独立性困难等[72]。为了减小学习方法的缺陷对研究结果的影响,一些学者对学习方法进行了改进,如Cooper等[72]改进了K2算法,以互信息指标度量节点间相互依赖关系的强弱,进而完成网络的修剪。鲜于建川等[73]应用基于改进K2算法的贝叶斯网络研究通勤出行方式选择和出行链模式安排及其相互作用效应,并基于敏感性分析讨论出行者社会经济属性等因素对出行方式和出行链模式安排的影响。此外,贝叶斯网络模型对连续变量的处理能力较弱,往往需要研究者自行离散化处理[35]。近10年来贝叶斯网络模型在交通行为分析领域的应用较少,而多集中在出行方式选择和出行行为分析与预测等方向的研究中[17.35-36,73]

2.7 小结

本节深入讨论当前出行选择研究中应用的主要机器学习算法的特点,总而言之,机器学习算法对出行行为与影响因素间非线性关联关系捕捉能力更强,不易受变量间相关性和共线性的影响,在研究中更加灵活,大多数研究发现机器学习算法对时空出行选择行为的预测精度高于传统离散选择模型。然而,机器学习模型并非时空出行选择行为研究的完美解决方案,可解释性差、外部研究条件多变时机器学习模型的不稳定性等机器学习模型的先天缺陷对研究结果将产生不可忽略的影响,应得到更多关注和深入研究。

3 影响时空出行选择行为模型表现的关键因素

针对上一节中指出的机器学习算法在时空出行选择行为研究应用中存在的问题,本节从黑盒模型固有缺陷和其他关键外部研究条件两个方面,分析其对时空出行选择行为建模的影响及作用机理,并针对性地总结现有研究中应用的潜在解决方案。

3.1 内部因素:黑盒模型的固有缺陷

3.1.1 模型的可解释性

在大多时空出行选择行为的研究场景中,研究者不仅要识别出行选择决策的影响因素,更要揭示这些因素对决策过程的影响效应(方向和大小)。模型缺乏解释性对于时空出行选择行为研究尤其致命。出行方式选择行为研究的目的是准确预测各出行方式分担率,而更重要的则是通过模型揭示变量和结果之间的关联关系乃至因果关系,理解出行者的选择决策机理,进而讨论价格弹性、替代方式的边际效益、社会福利和补贴机制等政策问题。纵观既有文献,机器学习算法缺乏解释性是其在时空出行选择行为研究领域仍未得到广泛信任的主要原因[7,11,59]。为了解决这个问题,学者们在以下两个方向进行了大量研究(图4):① 将机器学习模型计算过程与随机效用理论等价、关联及融合[10,14,59-60];② 开发和应用机器学习解释器[6,16,74]
图4 黑盒模型解释方法研究框架

Fig.4 Research framework of black box model interpretation method

(1) 学习过程理论化
Wang等[14]分解了深度人工神经网络算法,挖掘了算法计算过程对应的经济学意义,证明了虽然深度神经网络模型与传统离散选择模型的解释方法上存在差异,但理论上也具有完整的经济学意义。遗憾的是,由于预测结果对模型超参数的设定(如网络深度)等较为敏感[75],甚至同一组超参数多次训练可能产生不同的结果[14],其解释方法的有效性受到诸多因素的影响。Wang等[59]尝试从函数估计而非参数估计的角度,对深度神经网络模型进行解释,更加关注整体特征影响效应,较难具体解释单个特征的作用机制。
另有一些学者探索将机器学习优越的预测性能与传统离散选择模型丰富的解释性能相互融合的途径[10,60],从模型总体架构层面平衡可解释性和预测性能。一种具体的做法是构建联合效用函数,一部分由深度学习模型训练得到,另一部分基于最大效用理论计算得到,并通过控制两部分效用值的权重,针对具体研究问题采用不同的平衡策略。即在保证两部分权重之和为1的前提下分别调整各自权重,以适应不同的分析需求,但将两种算法融合的模型框架,必须保证能够同时解决两者单独求解时所要规避的问题,如深度学习模型的过拟合、离散选择模型的多重共线性等。另一种做法是将机器学习求解方法应用于传统离散选择模型,例如Ding等[18]将梯度提升(gradient boosting)求解方法应用于多项Logit模型,提出了梯度提升Logit模型,经验证,该模型能够充分学习变量间复杂交互效应。结果证明了该模型预测性能明显优于经典多项Logit模型,但在模型结果的可解释性方面的突破较为有限。
(2) 机器学习解释器
一些学者通过开发和应用解释器以完善黑盒模型的解释性能。这一类方法舍弃了出行选择决策的经济学理论基础,完全从数据挖掘的角度出发,探究选择行为与输入特征之间或线性、或非线性、或单调、或复杂的关联关系。具体工具主要包括部分依赖图(partial dependence plot)、个体条件期望(individual conditional expectation)、累积局部效应图(accumulated local effect)、置换特征重要性、全局代理模型、局部代理模型、Shapley值等方法。
Friedman[74]开发了部分依赖图,能够计算并清晰地展示一个或多个特征对机器学习出行选择结果预测的边际效应。该边际效应是基于所有观测数据计算得出,反映输入特征x的给定值对预测结果的平均边际效应[6,52,74],但该方法须满足一个严格的假设,即特征x与其他特征不存在相关关系[76]。如果更加关注个体异质效应,即研究某个特征改变时每个个体的时空出行选择行为将如何变化,个体条件期望图方法是最佳选择[77]。然而在大多数实证研究中,无法保证输入变量的严格独立性。当且仅当输入特征间相关性较低时,累积局部效应图能够精准地描述输入特征是如何影响机器学习模型预测的出行选择结果。与部分依赖图类似,累积局部效应图求解亦为平均边际效应,但其计算效率更高,且在输入特征间存在微弱相关性时,边际效应的计算结果更加可靠[16,50]。全局代理模型则利用已知的可解释模型代替难以解释的上层模型,旨在对黑盒模型进行替代和解释,其中的关键是找到一种合适的代理模型,并证明该代理模型能够较好地复制黑盒模型的预测效果。此外,如果希望解释某个特征对出行者出行决策结果的贡献率,则可以使用Shapley值法[76,78]。此外,机器学习相比经典离散选择模型的一个优势,是能够捕捉到输入特征之间潜在的高维交互效应,因而合格的解释器应具备能够解释交互效应的能力,目前几乎所有的软件包仅支持应用部分依赖图和累积局部效应图解释二阶交互效应。
在衡量特征重要性方面,Breiman[79]将置换特征重要性度量引入随机森林模型,Fisher等[80]将其发展为与模型无关的解释器版本。其基本原理是通过特征的置换,观测模型的预测误差增大或减小,进而得到特征的相对重要性。置换特征的重要性取决于对输入特征的改变,因此特征相关时,该方法将会低估相关联特征的重要性。另一个值得注意的问题是,在实际应用中输入特征的重要性排序在不同机器学习模型结果中表现出较大差异[6],这无疑增大了模型解释难度,降低了机器学习模型结果解释的可靠性。

3.1.2 模型时空可迁移性

时空可迁移性是时空出行选择行为模型的另一基本需求[81-82]。基于某一区域居民出行数据构建的时空出行选择行为模型能否应用于其他城市的出行行为预测(例如在目标城市没有可供训练的数据的情形下)?如果答案是否定的,那么在何种条件下该模型具备可迁移性?一个模型若不具备时空可转移性,其预测性能优势将无法得到有效发挥。现有文献较少涉及这一方向[81,83]
Tang等[83]讨论了神经网络模型的空间可移植性问题,他们基于华盛顿—巴尔的摩大都会区的交通调查数据,针对5个地区的区内出行分别建立了5个神经网络模型,并将训练后的模型应用于训练集以外的其他4个区域的出行预测中。结果表明:对于出行分担率本身相似的区域,直接移植即可取得不错的效果;对于分担率差异较大的区域则需要额外引入适应算法,并且移植效果与训练样本集的大小密切相关。构建的模型具有较差的时空可迁移性的一个主要原因是模型过度拟合了训练数据中的噪音和非重要特征。因此,一些学者提出,要验证机器学习模型的性能,时空可迁移性应成为一个检验指标[82-83]

3.1.3 最优超参数的不确定性

超参数的设定对机器学习模型预测性能有着不可忽视的影响,过拟合和欠拟合都会使模型对出行者选择行为特征的学习产生偏差。超参数与模型表现之间的不确定关系、多个超参数之间的复杂关联,使得最优参数的选取至今仍未出现一个被广泛信任的方法和流程[14,75,84]。最优超参数的选择甚至被比作“科学之艺术(more art than science)”,可见其重要性。无法保证超参数选择的唯一性,在时空出行选择行为的建模中甚至无法获得最优的机器学习模型设定,这无疑给模型结果的解释性又增加了一层系统不确定性[14,75]
目前使用较多的超参数优化方法主要包括网格搜索策略、随机搜索策略、爬山策略和贝叶斯优化策略等[52,76,85-86]。这些方法虽然能够在一定程度上降低机器学习模型参数选择的不确定性,使得模型表现向好的方向迭代,但仍然难以证明所选参数的最优性。

3.2 外部因素:影响模型效果的外部研究条件

虽然时空出行选择行为研究领域引入机器学习模型存在一系列新的问题,但现有研究一致认为其在一定程度上弥补了经典离散选择模型的局限性,例如在大数据量、固定输入数据范式、特征多重共线性等方面[8-9,13]图5概括了机器学习模型与经典离散选择模型对样本量、数据范式和输入特征等重要外部因素的敏感性。本节重点探讨这些外部因素对机器学习模型应用表现的潜在影响。
图5 机器学习算法与经典离散选择模型外部因素敏感性

Fig.5 Sensitivity of external factors of machine learning algorithms and classical discrete choice models

3.2.1 样本量

Wang等[9,13]比较了主流的机器学习算法和经典离散选择模型在多个出行选择行为数据集上的预测效果,发现经典多项选择模型(multinomial Logit, MNL)应用于大样本和高维特征空间时,计算效率明显低于机器学习模型。与经典离散选择模型相似,由于机器自动学习能力对超参数的选择、模型的非识别性和局部不规则性非常敏感,小样本会使得基于机器学习模型得到的本就脆弱的模型解释更加不可靠[14,59]
Liang等[26]检验了机器学习模型和MNL模型在不同样本量的预测精度,结果表明,随着样本量的增大,机器学习模型和MNL模型的预测精度均表现为先上下波动后趋于平稳的趋势(当样本量超过20000时,预测精度基本趋于稳定)。从精度变化曲线可以看出,虽然MNL模型的预测精度总是低于机器学习模型,但达到稳定状态所需要的样本量更小。此外,小样本也会对机器学习模型的时空可迁移性产生不利影响[83],这是由于小样本条件下局部数据抽样的随机性会对模型稳健性产生更大的影响,严重制约着模型的时空可迁移性。Wang等[59]的研究发现,要保证深度学习网络的预测精度明显好于传统离散选择模型,样本量至少需要达到10000。然而,可靠样本量的大小可能还与研究场景、目标任务、研究区域等因素存在潜在关联关系,未来研究应进一步明确。

3.2.2 数据范式

机器学习模型相比较经典离散选择模型具有更强的灵活性,这种灵活性体现在数据的输入格式、非平衡数据比例和属性信息缺失等方面。在数据输入格式方面,经典离散选择模型对数据输入格式有严格的要求,如分类变量需要处理成n-1个虚拟变量;而分类变量在机器学习模型中无需任何处理,数据输入格式更加灵活,最大限度保留了数据中的原始信息表达。
由于时空出行选择行为研究采样过程具有一定的随机性,研究数据难以避免非平衡分布的问题,即某一选项的样本数量可能显著小于其他选项[87]。基于此类非平衡数据的经典离散选择模型估计结果往往会产生有偏的参数估计[87]。虽然机器学习模型在属性信息缺失和非平衡数据的建模和预测上有显著优势[87],由于优势选项和劣势选项数量上的差异,以总体预测(分类)精度最大为目标,训练模型更趋向于捕捉优势选项的特征,导致弱势选项的预测精度较低[27,32,58,88]
针对非平衡数据的信息挖掘,已经成为机器学习领域的一个热点研究问题。现有研究一般通过以下三种方式降低非平衡信息表达的影响[88-89]:① 改变样本分布以降低或消除不平衡性;② 选取更能表达类间差异的特征,提高弱势选项的识别率;③ 提高弱势选项的错分代价,优化算法结构。当前基于机器学习框架的时空出行选择行为研究对数据范式影响的关注度显然不足。Wang等[87]的研究发现,当观测到的劣势选项占比超过5%时,梯度提升决策树的表现就不再显著受到非平衡数据的不利影响,并指出重采样技术可能有助于解决非平衡数据带来的不利影响。Zheng等[58]针对弱势样本预测精度低的问题,提出了考虑样本权重的绝对相关性正则算法来降低劣势样本的预测误差。

3.2.3 特征空间

在高维特征输入的问题上,经典离散选择模型多基于研究问题的基础理论或研究者自身的经验,并通过相关性分析筛选输入特征。而由于机器学习模型能够解决高维特征输入信息冗余的问题[8],现有研究往往较少考虑在输入层对特征空间进行降维[27,85]
在时空出行选择行为的研究中,共线性的特征输入造成的大量输入信息冗余,必然无谓地提升了模型复杂度,不仅增加了模型过拟合的风险,并且为本就困难的模型解释增加了更多不确定性。换言之,其中的一些输入特征可能对模型预测性能贡献微乎其微,删除非重要变量的模型,在理论上也能够获得相同或相近的模型精度。Cheng等[90]在出行模式选择模型中应用了一种随机特征选择方法,应用逐一替换的方式进行变量选择,而并非一次性使用所有特征,以解决输入特征的相关性给模型估计结果带来的不确定性。另外,从模型可解释性的角度来说,增加与关键变量共线性程度高的非关键变量,会面临稀释关键变量影响效应的风险。目前机器学习领域较为成熟的特征选择(降维)方法主要包括主成分分析、相关性滤波、单变量滤波、递归特征消除、遗传算法滤波和模拟退火算法等[85]。然而,输入特征筛选方法同样与研究问题所处的环境有着不可忽略的关联性。完全无人参与的自动化特征筛选方法,难以在政策导向的时空出行选择行为研究领域获得广泛认可。基于具体的时空出行选择行为研究基础理论,结合当前较为成熟的特征选择算法,进而识别和选择关键输入特征,可能是目前最少被诟病的方式[27]

3.3 小结

本节重点讨论了当前时空出行选择行为研究中,由于机器学习模型先天缺陷和研究外部环境导致的局限性,并深入分析了其对建模影响和作用机理,总结了潜在解决策略或方法。机器学习算法的引入为时空出行选择行为研究带来重要机遇,但想要更好地应用机器学习模型解释出行选择决策机理及改善行为预测的精度,就不得不慎重处理机器学习自身缺陷造成的可解释性局限,并主动适应更丰富、更灵活的外部研究场景,发展更多元、更科学的研究框架。

4 研究展望

随着大数据技术和人工智能算法的不断发展,时空出行选择行为研究将越来越多地采用机器学习模型来解析复杂的人类行为模式,并更大程度依赖于大数据和高性能计算技术。时空出行选择行为研究的范式在机器学习算法和原理的启发下,将进一步发展成为一个跨学科、高度集成的研究领域,并通过技术创新提升对人类行为模式的理解。毫无疑问,机器学习模型在预测精度和灵活性等方面的优势必定会为时空出行选择行为的研究提供强大助力。时空出行选择行为研究也将更加关注实际选择结果及其影响因素复杂交互效应的揭示,逐步革新研究框架。此外,时空出行选择行为研究还需充分关注模型的可解释性,确保研究成果能够为城市规划和交通管理提供实际可行的指导。

4.1 研究框架的发展趋势

传统的时空出行选择研究范式建立在经典离散选择模型的基础上,其数据收集、处理、建模思维和结果解释等方面并不能直接适用于基于机器学习算法的出行选择研究中。传统的研究逻辑逐渐转变为数据驱动的研究模式,从“问题(政策)导向和理论驱动→模型选择→数据采集→建模与结果分析”的研究逻辑,正在逐步转变为“问题(政策)导向→数据驱动→模型搭建→选择行为预测”[64],潜在研究框架及各部分关注的问题如图6所示。随着机器学习算法迭代和发展,模型选择对理解出行行为机理的增益效果逐渐弱化,模型的预测性能将得到越来越多的关注。
图6 基于机器学习算法的出行选择研究框架

Fig.6 Research framework of travel choice based on machine learning algorithm

在新的研究框架下,大规模数据的高效采集、融合和处理技术将对出行行为的研究产生更大的积极作用。自动获取数据的技术逐渐变得可靠且普遍[26],数据量的增加对传统出行选择模型在预测方面带来益处,但大规模数据同时也意味着更大的噪音以及更严重的数据丢失现象[46,90],同样对时空出行选择行为的建模是一个挑战。现有基于机器学习算法进行时空出行选择行为的研究,较少关注数据的有效性和均衡性。然而在大数据驱动的研究场景下,输入数据的有效特征表达将对研究结果产生举足轻重的作用,也更值得被谨慎处理。

4.2 模型可解释性研究展望

首先,可解释性本身的定义就是一个值得探讨的话题。例如在机器学习模型中,影响因素的重要性是基于数据和学习算法均衡计算得到,与经典行为选择模型中选择偏好基于效用理论推导得到,两者在模型激励原理上有本质区别,因此结论也往往不同。相当一部分文献应用与模型无关的黑盒解释器,完全从数据表征的特征出发,摒弃潜在的出行选择决策原理,描述选择行为与输入特征之间的关联性。考虑到出行选择研究的实践意义和政策导向,有限的可解释性仍然是现阶段机器学习算法难以被广泛信任的最根本原因。
把经济学理论融合到机器学习模型中的前期探索具有实际意义[14,75],同时也反映出了一些局限性,即融合的理论对提升机器学习算法的能力非常有限,并且解释效力并不稳健。大数据的复杂性,使得数据驱动与理论驱动模型的融合是极具现实意义的探索[14,75]。以机器学习为代表的数据驱动模型预测性能更好,但可解释性和鲁棒性差,以经典离散选择为代表的理论驱动模型则具有更强的可解释性能与鲁棒性,但预测性能较差[10],二者具有天然的互补性。在时空出行选择行为研究领域中广泛应用的机器学习模型,并未真正改变传统统计学模型建模和统计推断的基本思想[91],如同样使用样本数据推断总体特征的统计方法等。这些一致性与互补性是学者们开展机器学习模型与经典离散选择模型融合研究的前提和基础,两者的交叉融合有望为推动时空出行选择行为研究的发展提供机遇,尤其是创新统计理论、模型方法和工具。
机器学习模型将在变量选择、求解策略和非线性关系捕捉等方面为离散选择模型的发展提供重要思路和可用工具,解决经典统计模型在大数据场景下参数显著性检验失效(当样本量非常大时,显著的变量并不意味着充分的经济重要性)、高维解释变量建模“维度灾难”、大样本下求解效率有限和遗漏变量(非线性影响变量在线性相关检测时往往不显著)等问题,相关研究有待完善。
虽然机器学习模型自身可解释性较差,但对提升离散选择模型因果关系识别和测度的准确性有很大的潜力[91]。在大数据时代,挖掘时空出行选择行为的因果关系,通过改变影响因素来调控出行需求,仍旧是时空出行选择行为研究的主要目的,例如通过提高停车费降低私家车出行需求。因果关系指在其他因素不变的情况下,改变某种因素 x i而导致的某交通方式选择概率Pn的变化量。要识别和测度因果关系,需要同时进行两组实验(划分实验组和对照组),而对于时空出行选择行为分析研究,往往无法进行控制实验,需要对虚拟的实验组选择结果和概率进行预测,可利用机器学习模型优异的预测性能,提高虚拟实验组结果变量的预测精度,推动时空出行选择行为研究从相关性挖掘到因果关系解析的升华,整体提升时空出行选择行为模型的可解释性。
此外,基于机器学习算法的时空出行选择行为建模,尚未形成被广泛接受的建模系统框架(涵盖适用模型的选择、超参数的优化、必要的检验方法等)。对时空出行选择行为可靠的解析应基于稳健的模型估计结果,模型输出结果稳健性检验是传统离散选择模型建模过程中的基本环节之一,而当前大多数基于机器学习的研究并未讨论模型输出结果的稳健性和时空可迁移性,模型输出结果难以具备广泛的可信度。面对复杂多变的研究场景和多源异构的数据模式,基于机器学习算法建模系统框架的不断完善,将有力推动机器学习算法在出行选择研究中的应用和出行行为研究的发展。

5 结论

大规模数据的应用和多模式交通系统中日益复杂化的居民出行行为,对传统时空出行选择行为研究范式带来巨大冲击,机器学习模型因其优越的预测性能和更强的灵活性,为时空出行选择行为研究的发展提供了强大助力。本文通过回顾2010年以来应用机器学习算法进行时空出行选择行为研究的国内外主要文献,总结了广泛应用的机器学习算法的优势和面临的挑战。
机器学习算法的应用已广泛渗透到时空出行选择行为研究的各个主要领域,包括出行方式选择、出行时空行为、路径/路线选择、多阶段联合选择行为,以及算法驱动的出行者决策理论。特别是在出行方式选择行为研究中,机器学习算法的应用尤为广泛,涵盖了集成学习、神经网络、支持向量机等多种机器学习算法。相比之下,涉及多阶段决策的联合选择行为的研究中,机器学习算法的应用相对较少,主要集中在强化学习和神经网络模型上。在路径或路线选择的问题中,强化学习等算法被广泛采用,而出行行为分析则主要依赖于集成学习算法的强大数据处理能力。这些应用展示了机器学习在提高出行研究精度和深度方面的关键作用。应用机器学习算法研究时空出行选择行为的研究呈现逐年增加的趋势,已从应用研究上升到对应的理论基础研究,正在逐步改变时空出行选择行为研究框架。
通过对机器学习模型固有缺陷和其他关键外部研究条件影响机理的分析,总结了影响模型应用效果的关键因素,并为共性应用问题指出了可行的解决方案。这些问题不仅影响了模型的应用效果,也限制了其在政策制定和理论发展中的应用范围。面对这些挑战,本文提出了具体的未来研究方向:① 拓展适用于大规模多源数据融合的研究框架;② 挖掘融合机器学习与经典离散选择模型的可解释性行为机理。
随着大语言模型、深度学习等人工智能技术的迅速发展及其在智慧城市交通领域的应用,未来融合机器学习算法的时空出行选择行为研究将朝着满足精细化出行行为理解和动态时空需求预测与实时决策的方向发展。通过整合大规模、多源性的数据,如社交媒体、移动电话和传感器数据等,利用机器学习的优势,研究者能够深入探索出行行为的细微差异和背后的复杂因素,实现个体出行偏好和模式的个性化理解,进而提升对个体时空出行行为的预测能力。动态预测与实时决策能力的提升是交通系统未来发展的另一大趋势,随着时空出行大数据获取越来越便捷,基于个体出行选择模型的动态时空需求预测和基于预测结果的实时决策难度将越来越大,因此时空出行选择行为模型效率的提升将逐渐成为关键问题。
[1]
McFadden D. Conditional Logit analysis of qualitative choice behavior[M]// Zarembka P. Frontiers in Econometrics. New York, USA: Academic Press, 1973: 105-142.

[2]
McFadden D. The theory and practice of disaggregate demand forecasting for various modes of urban transportation[M]// McFadden D. Transport Economics. London, UK: Routledge, 2005: 39-60.

[3]
王灿, 王德, 朱玮, 等. 离散选择模型研究进展[J]. 地理科学进展, 2015, 34(10): 1275-1287.

DOI

[Wang Can, Wang De, Zhu Wei, et al. Research progress of discrete choice models. Progress in Geography, 2015, 34(10): 1275-1287.]

[4]
鲜于建川, 隽志才, 朱泰英. 后悔理论视角下的出行选择行为[J]. 交通运输工程学报, 2012, 12(3): 67-72, 100.

[Xianyu Jianchuan, Juan Zhicai, Zhu Taiying. Travel choice behavior based on regret theory view. Journal of Traffic and Transportation Engineering, 2012, 12(3): 67-72, 100.]

[5]
佐佐木邦明, 藤井聪, 山本俊行. 交通行为分析与建模[M].孙轶琳, 刘锴, 李昂, 译. 北京: 中国建筑工业出版社, 2022.

[Kuniaki Sasaki, Satoshi Fujii, Toshiyuki Yamamoto. Travel behaviour analysis and modelling. Translated by Sun Yilin, Liu Kai, Li Ang. Beijing, China: China Architecture & Building Press, 2022.]

[6]
Zhao X L, Yan X, Yu A, et al. Prediction and behavioral analysis of travel mode choice: A comparison of machine learning and logit models[J]. Travel Behaviour and Society, 2020, 20: 22-35.

[7]
Karlaftis M G, Vlahogianni E I. Statistical methods versus neural networks in transportation research: Differences, similarities and some insights[J]. Transportation Research Part C: Emerging Technologies, 2011, 19(3): 387-399.

[8]
Lindner A, Pitombo C S, Cunha A L. Estimating motorized travel mode choice using classifiers: An application for high-dimensional multicollinear data[J]. Travel Behaviour and Society, 2017, 6: 100-109.

[9]
Wang S H, Mo B C, Hess S, et al. Comparing hundreds of machine learning classifiers and discrete choice models in predicting travel behavior: An empirical benchmark[R/OL]. arXiv: 2102.01130. 2021 [2022-06-30]. http://arxiv.org/abs/2102.01130.

[10]
Wang S H, Mo B C, Zhao J H. Theory-based residual neural networks: A synergy of discrete choice models and deep neural networks[J]. Transportation Research Part B: Methodological, 2021, 146: 333-358.

[11]
Koushik A N P, Manoj M, Nezamuddin N. Machine learning applications in activity-travel behaviour research: A review[J]. Transport Reviews, 2020, 40(3): 288-311.

[12]
Brathwaite T, Vij A, Walker J L. Machine learning meets microeconomics: The case of decision trees and discrete choice[R/OL]. arXiv:1711.04826. 2017 [2022-06-30]. http://arxiv.org/abs/1711.04826.

[13]
Wang S H, Mo B C, Zhao J H. Predicting travel mode choice with 86 machine learning classifiers: An empirical benchmark study[C]// Proceedings of the 99th annual meeting of the Transportation Research Board. Washington D C, USA: Transportation Research Board of USA, 2020: 279-296.

[14]
Wang S H, Wang Q Y, Zhao J H. Deep neural networks for choice analysis: Extracting complete economic information for interpretation[J]. Transportation Research Part C: Emerging Technologies, 2020, 118: 102701. doi: 10.1016/j.trc.2020.102701.

[15]
Pisoni E, Christidis P, Cawood E N. Active mobility versus motorized transport? User choices and benefits for the society[J]. Science of the Total Environment, 2022, 806: 150627. doi: 10.1016/j.scitotenv.2021.150627.

[16]
Kim E J. Analysis of travel mode choice in Seoul using an interpretable machine learning approach[J]. Journal of Advanced Transportation, 2021, 6685004. doi: 10.1155/2021/6685004.

[17]
Aghaabbasi M, Shekari Z A, Shah M Z, et al. Predicting the use frequency of ride-sourcing by off-campus university students through random forest and Bayesian network techniques[J]. Transportation Research Part A: Policy and Practice, 2020, 136: 262-281.

[18]
Ding C, Wu X K, Yu G Z, et al. A gradient boosting logit model to investigate driver's stop-or-run behavior at signalized intersections using high-resolution traffic data[J]. Transportation Research Part C: Emerging Technologies, 2016, 72: 225-238.

[19]
韩皓, 谢天. 基于潜变量RF的通勤高峰期小汽车出行方式向公交转移行为研究[J]. 内蒙古大学学报(自然科学版), 2020, 51(2): 211-218.

[Han Hao, Xie Tian. Research on the transfer behavior of car travel mode to public transport during commuting peak period based on latent variable RF. Journal of Inner Mongolia University(Natural Science Edition), 2020, 51(2): 211-218.]

[20]
Buijs R, Koch T, Dugundji E. Using neural nets to predict transportation mode choice: Amsterdam network change analysis[J]. Journal of Ambient Intelligence and Humanized Computing, 2021, 12(1): 121-135.

[21]
Sifringer B, Lurkin V, Alahi A. Enhancing discrete choice models with representation learning[J]. Transportation Research Part B: Methodological, 2020, 140: 236-261.

[22]
Pitaksringkarn L, Kaewwichian P. Car ownership demand modeling using machine learning: Decision trees and neural networks[J]. International Journal of GEOMATE, 2019, 17: 219-230.

[23]
Golshani N, Shabanpour R, Mahmoudifard S M, et al. Modeling travel mode and timing decisions: Comparison of artificial neural networks and Copula-based joint model[J]. Travel Behaviour and Society, 2018, 10: 21-32.

[24]
靳文舟, 韩博文, 郝小妮, 等. 基于小波神经网络的定制公交目标乘客出行意愿预测[J]. 重庆交通大学学报(自然科学版), 2018, 37(8): 81-87.

[Jin Wenzhou, Han Bowen, Hao Xiaoni, et al. Prediction of target passengers' travel intention of customized public transport based on wavelet neural network. Journal of Chongqing Jiaotong University (Natural Science), 2018, 37(8): 81-87.]

[25]
Hagenauer J, Helbich M. A comparative study of machine learning classifiers for modeling travel mode choice[J]. Expert Systems with Applications, 2017, 78: 273-282.

[26]
Liang L L, Xu M, Grant-Muller S, et al. Household travel mode choice estimation with large-scale data: An empirical analysis based on mobility data in Milan[J]. International Journal of Sustainable Transportation, 2020, 15: 70-85.

[27]
Yang S, Deng W, Deng Q H, et al. The research on prediction models for urban family member trip generation[J]. KSCE Journal of Civil Engineering, 2016, 20(7): 2910-2919.

[28]
Allahviranloo M, Recker W. Daily activity pattern recognition by using support vector machines with multiple classes[J]. Transportation Research Part B: Methodological, 2013, 58: 16-43.

[29]
邓琼华, 何继宏. 基于LS-LSVM的居民出行方式选择预测模型及影响因素研究[J]. 武汉理工大学学报(交通科学与工程版), 2015, 39(4): 892-896.

[Deng Qionghua, He Jihong. Research of travel mode predication model and its influencing factors based on LS-SVM. Journal of Wuhan University of Technology (Transportation Science & Engineering), 2015, 39(4): 892-896.]

[30]
Zhang J J, Feng T, Timmermans H, et al. Improved imputation of rule sets in class association rule modeling: Application to transportation mode choice[J]. Transportation, 2023, 50: 63-106.

[31]
Victoriano R, Paez A, Carrasco J A. Time, space, money, and social interaction: Using machine learning to classify people's mobility strategies through four key dimensions[J]. Travel Behaviour and Society, 2020, 20: 1-11. doi: 10.1016/j.tbs.2020.02.004.

[32]
Tang L, Xiong C F, Zhang L. Decision tree method for modeling travel mode switching in a dynamic behavioral process[J]. Transportation Planning and Technology, 2015, 38(8): 833-850.

[33]
苏敏, 栾维新, 马瑜, 等. 京沪高速客运通道旅客出行选择影响因素研究[J]. 铁道运输与经济, 2019, 41(1): 58-63.

[Su Min, Luan Weixin, Ma Yu, et al. Passenger travel choice influencing factors on Beijing-Shanghai high-speed corridor. Railway Transport and Economy, 2019, 41(1): 58-63.]

[34]
Saxena N, Wang R, Dixit V V, et al. Frequentist and Bayesian approaches for understanding route choice of drivers under stop-and-go traffic[J]. Transportation Research Record: Journal of the Transportation Research Board, 2020, 2674(9): 371-382.

[35]
Li D W, Miwa T, Morikawa T. Modeling time-of-day car use behavior: A Bayesian network approach[J]. Transportation Research Part D: Transport and Environment, 2016, 47: 54-66.

[36]
谷剑锋, 陈鹏, 胡志勇. 基于贝叶斯网络的高速铁路旅客出行方式预测研究[J]. 铁道运输与经济, 2018, 40(4): 58-63.

[Gu Jianfeng, Chen Peng, Hu Zhiyong. High-speed railway passengers' travel mode prediction based on Bayesian network. Railway Transport and Economy, 2018, 40(4): 58-63.]

[37]
Ma T Y, Chow J Y J, Xu J. Causal structure learning for travel mode choice using structural restrictions and model averaging algorithm[J]. Transportmetrica A: Transport Science, 2017, 13(4): 299-325.

[38]
Wali B, Frank L D, Chapman J E, et al. Developing policy thresholds for objectively measured environmental features to support active travel[J]. Transportation Research Part D: Transport and Environment, 2021, 90: 102678. doi: 10.1016/j.trd.2020.102678.

[39]
Molin E, Mokhtarian P, Kroesen M. Multimodal travel groups and attitudes: A latent class cluster analysis of Dutch travelers[J]. Transportation Research Part A: Policy and Practice, 2016, 83: 14-29.

[40]
温惠英, 任倩. 基于Two-step Cluste的出行选择行为研究[J]. 公路工程, 2019, 44(2): 69-72.

[Wen Huiying, Ren Qian. Research on travel choice behaviors based on the two-step cluste. Highway Engineering, 2019, 44(2): 69-72.]

[41]
张瑞婷, 左大杰, 熊巧, 等. 基于Vague集的铁路旅客乘车选择行为研究[J]. 交通运输工程与信息学报, 2018, 16(2): 44-49.

[Zhang Ruiting, Zuo Dajie, Xiong Qiao, et al. Study on the behavior of railway passenger selection based on Vague Set. Journal of Transportation Engineering and Information, 2018, 16(2): 44-49.]

[42]
李海军, 李引珍, 周鹏, 等. 基于粗糙集聚类算法的铁路通道客运市场细分[J]. 交通运输系统工程与信息, 2018, 18(3): 9-14, 21.

[Li Haijun, Li Yinzhen, Zhou Peng, et al. The subdivision of railway passenger transport market based on rough clustering algorithm. Journal of Transportation Systems Engineering and Information Technology, 2018, 18(3): 9-14, 21.]

[43]
Kusumastuti D, Hannes E, Janssens D, et al. Scrutinizing individuals' leisure-shopping travel decisions to appraise activity-based models of travel demand[J]. Transportation, 2010, 37(4): 647-661.

[44]
Lu Y D, Kawamura K. Data-mining approach to work trip mode choice analysis in Chicago, Illinois, area[J]. Transportation Research Record: Journal of the Transportation Research Board, 2010, 2156(1): 73-80.

[45]
Yang Y, Jiang R, Han X, et al. Experimental study and modeling of departure time choice behavior in the bottleneck model with staggered work hours[J]. Travel Behaviour and Society, 2022, 27: 79-94.

[46]
Zimmermann M, Frejinger E. A tutorial on recursive models for analyzing and predicting path choice behavior[J]. EURO Journal on Transportation and Logistics, 2020, 9: 10004. doi: 10.1016/j.ejtl.2020.100004.

[47]
Li X Y, Li X M, Yang L R, et al. Dynamic route and departure time choice model based on self-adaptive reference point and reinforcement learning[J]. Physica A: Statistical Mechanics and its Applications, 2018, 502(3): 77-92.

[48]
Perepelitsa M. A model of discrete choice based on reinforcement learning under short-term memory[J]. Journal of Mathematical Psychology, 2020, 99: 102455. doi: 10.1016/j.jmp.2020.102455.

[49]
赵思萌. 基于强化学习算法原则的出行选择行为建模与仿真[J]. 大连交通大学学报, 2020, 41(6): 6-11.

[Zhao Simeng. Modeling and simulation of travel choice behavior based on reinforcement learning principles. Journal of Dalian Jiaotong University, 2020, 41(6): 6-11.]

[50]
Xu Y M, Yan X, Liu X Y, et al. Identifying key factors associated with ridesplitting adoption rate and modeling their nonlinear relationships[J]. Transportation Research Part A: Policy and Practice, 2021, 144: 170-188.

[51]
Tu M T, Li W X, Orfila O, et al. Exploring nonlinear effects of the built environment on ridesplitting: Evidence from Chengdu[J]. Transportation Research Part D: Transport and Environment, 2021, 93: 102776. doi: 10.1016/j.trd.2021.102776.

[52]
Yang L C, Ao Y B, Ke J T, et al. To walk or not to walk? Examining non-linear effects of streetscape greenery on walking propensity of older adults[J]. Journal of Transport Geography, 2021, 94: 103099. doi: 10.1016/j.jtrangeo.2021.103099.

[53]
Liu J X, Wang B, Xiao L Z. Non-linear associations between built environment and active travel for working and shopping: An extreme gradient boosting approach[J]. Journal of Transport Geography, 2021, 92: 103034. doi: 10.1016/j.jtrangeo.2021.103034.

[54]
Cheng L, Chen X W, De Vos J, et al. Applying a random forest method approach to model travel mode choice behavior[J]. Travel Behaviour and Society, 2019, 14: 1-10. doi: 10.1016/j.tbs.2018.09.002.

[55]
Cheng L, De Vos J, Zhao P J, et al. Examining non-linear built environment effects on elderly's walking: A random forest approach[J]. Transportation Research Part D: Transport and Environment, 2020, 88: 102552. doi: 10.1016/j.trd.2020.102552.

[56]
Shmueli D, Salomon I, Shefer D. Neural network analysis of travel behavior: evaluating tools for prediction[J]. Transportation Research Part C: Emerging Technologies, 1996, 4(3): 151-166.

[57]
Nijkamp P, Reggiani A, Tritapepe T. Modelling inter-urban transport flows in Italy: A comparison between neural network analysis and logit analysis[J]. Transportation Research Part C: Emerging Technologies, 1996, 4(6): 323-338.

[58]
Zheng Y H, Wang S H, Zhao J H. Equality of opportunity in travel behavior prediction with deep neural networks and discrete choice models[J]. Transportation Research Part C: Emerging Technologies, 2021, 132: 103410. doi: 10.1016/j.trc.2021.103410.

[59]
Wang S H, Wang Q Y, Bailey N, et al. Deep neural networks for choice analysis: A statistical learning theory perspective[J]. Transportation Research Part B: Methodological, 2021, 148: 60-81.

[60]
Liu Y, Tong L C, Zhu X, et al. Dynamic activity chain pattern estimation under mobility demand changes during COVID-19[J]. Transportation Research Part C: Emerging Technologies, 2021, 131: 103361. doi: 10.1016/j.trc.2021.103361.

[61]
Wang S H, Wang Q Y, Zhao J H. Multitask learning deep neural networks to combine revealed and stated preference data[J]. Journal of Choice Modelling, 2020, 37: 100236. doi: 10.1016/j.jocm.2020.100236.

[62]
Wang S H, Mo B C, Zhao J H. Deep neural networks for choice analysis: Architecture design with alternative-specific utility functions[J]. Transportation Research Part C: Emerging Technologies, 2020, 112: 234-251.

[63]
吴文静, 景鹏, 贾洪飞, 等. 基于K均值聚类与随机森林算法的居民低碳出行意向数据挖掘[J]. 华南理工大学学报(自然科学版), 2019, 47(7): 105-111.

DOI

[Wu Wenjing, Jing Peng, Jia Hongfei, et al. Low carbon travel intention data mining for residents based on K-means clustering and random forest algorithm. Journal of South China University of Technology (Natural Science Edition), 2019, 47(7): 105-111.]

[64]
Yao R, Bekhor S. Data-driven choice set generation and estimation of route choice models[J]. Transportation Research Part C: Emerging Technologies, 2020, 121: 102832. doi: 10.1016/j.trc.2020.102832.

[65]
胡郁葱, 陈杰, 邹小健, 等. 基于两阶段聚类的电动自行车出行者选择研究[J]. 广西师范大学学报(自然科学版), 2017, 35(3): 22-29.

[Hu Yucong, Chen Jie, Zou Xiaojian, et al. Research on mode choice of electric bicycle travelers based on two-step cluster method. Journal of Guangxi Normal University (Natural Science Edition), 2017, 35(3): 22-29.]

[66]
Deng Y L, Yan Y D. Propensity score weighting with generalized boosted models to explore the effects of the built environment and residential self-selection on travel behavior[J]. Transportation Research Record: Journal of the Transportation Research Board, 2019, 2673(4): 373-383.

[67]
杨励雅, 邵春福, Haghani A. 出行方式与出发时间联合选择的分层Logit模型[J]. 交通运输工程学报, 2012, 12(2): 76-83.

[Yang Liya, Shao Chunfu, Haghani A. Nested logit model of combined selection for travel mode and departure time. Journal of Traffic and Transportation Engineering, 2012, 12(2): 76-83.]

[68]
Wei F F, Ma S F. A day-to-day route choice model based on reinforcement learning[J]. Mathematical Problems in Engineering, 2014: 646548. doi: 10.1155/2014/646548.

[69]
吴学新, 凌帅, 李庚. 基于强化学习的限行政策下双模式出发时间选择仿真研究[J]. 交通信息与安全, 2017, 35(4): 52-62.

[Wu Xuexin, Ling Shuai, Li Geng. A simulation study of departure time selection in dual-modal with impacts of vehicle restriction policies based on reinforcement learning. Journal of Transport Information and Safety, 2017, 35(4): 52-62.]

[70]
彭辉, 王剑坡, 张娜. 基于SVM的高原川道型城市通勤者出行方式选择研究[J]. 重庆交通大学学报 (自然科学版), 2021, 40(11): 18-23.

[Peng Hui, Wang Jianpo, Zhang Na. Travel mode choice of commuters in corridor valley pattern city of Loess Plateau based on SVM. Journal of Chongqing Jiaotong University (Natural Science), 2021, 40(11): 18-23.]

[71]
Pearl J. Bayesian networks: A model of self-activated memory for evidential reasoning[J]. Proceedings of the Annual Meeting of the Cognitive Science Society, 1985, 7: 329-334.

[72]
Cooper G F, Herskovits E. A Bayesian method for the induction of probabilistic networks from data[J]. Machine Learning, 1992, 9(4): 309-347.

[73]
鲜于建川, 隽志才, 朱泰英. 基于贝叶斯网络的出行选择行为分析[J]. 交通运输系统工程与信息, 2011, 11(5): 167-172.

[Xianyu Jianchuan, Juan Zhicai, Zhu Taiying. Travel choice analysis by Bayesian networks. Journal of Transportation Systems Engineering and Information Technology, 2011, 11(5): 167-172.]

[74]
Friedman J H. Greedy function approximation: A gradient boosting machine[J]. Annals of Statistics, 2001, 29(5): 1189-1232.

[75]
Zhang Z C, Ji C Y, Wang Y N, et al. A customized deep neural network approach to investigate travel mode choice with interpretable utility information[J]. Journal of Advanced Transportation, 2020: 5364252. doi: 10.1155/2020/5364252.

[76]
Kong X Q, Zhang Y L, Eisele W L, et al. Using an interpretable machine learning framework to understand the relationship of mobility and reliability indices on truck drivers' route choices[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(8): 13419-13428.

[77]
Goldstein A, Kapelner A, Bleich J, et al. Peeking inside the black box: Visualizing statistical learning with plots of individual conditional expectation[J]. Journal of Computational and Graphical Statistics, 2015, 24(1): 44-65.

[78]
Štrumbelj E, Kononenko I. Explaining prediction models and individual predictions with feature contributions[J]. Knowledge and Information Systems, 2014, 41(3): 647-665.

[79]
Breiman L. Random forests[J]. Machine Learning, 2001, 45: 5-32.

[80]
Fisher A, Rudin C, Dominici F. All models are wrong, but Many are useful: Learning a variable's importance by studying an entire class of prediction models simultaneously[J]. Journal of Machine Learning Research, 2019, 20: 1-81.

[81]
Arentze T, Hofman F, Van Mourik H, et al. Spatial transferability of the albatross model system: Empirical evidence from two case studies[J]. Transportation Research Record: Journal of the Transportation Research Board, 2002, 1805(1): 1-7. doi: 10.3141/1805-01.

[82]
Yasmin F, Morency C, Roorda M J. Spatial transferability of activity-based models: Moving TASHA from Toronto to Montréal[C]// Proceedings of the 13th World Conference on Transport Research (WCTR). Rio de Janeiro, Brazil, 2013.

[83]
Tang L, Xiong C, Zhang L. Spatial transferability of neural network models in travel demand modeling[J]. Journal of Computing in Civil Engineering, 2018, 32(3): 04018010. doi: 10.1061/(ASCE)CP.1943-5487.0000752.

[84]
Probst P, Bischl B, Boulesteix A L. Tunability: Importance of hyperparameters of machine learning algorithms[J]. The Journal of Machine Learning Research, 2019, 20: 1934-1965.

[85]
Chang X M, Wu J J, Liu H, et al. Travel mode choice: A data fusion model using machine learning methods and evidence from travel diary survey data[J]. Transportmetrica A: Transport Science, 2019, 15(2): 1587-1612.

[86]
Lyu T, Wang P S, Gao Y N, et al. Research on the big data of traditional taxi and online car-hailing: A systematic review[J]. Journal of Traffic and Transportation Engineering, 2021, 8(1): 1-34.

[87]
Wang F R, Ross C L. Machine learning travel mode choices: Comparing the performance of an extreme gradient boosting model with a multinomial logit model[J]. Transportation Research Record: Journal of the Transportation Research Board, 2018, 2672(47): 35-45.

[88]
李艳霞, 柴毅, 胡友强, 等. 不平衡数据分类方法综述[J]. 控制与决策, 2019, 34(4): 673-688.

[Li Yanxia, Chai Yi, Hu Youqiang, et al. Review of imbalanced data classification methods. Control and Decision, 2019, 34(4): 673-688.]

[89]
黄海松, 魏建安, 康佩栋. 基于不平衡数据样本特性的新型过采样SVM分类算法[J]. 控制与决策, 2018, 33(9): 1549-1558.

[Huang Haisong, Wei Jian'an, Kang Peidong. New over-sampling SVM classification algorithm based on unbalanced data sample characteristics. Control and Decision, 2018, 33(9): 1549-1558.]

[90]
Cheng L, Lai X J, Chen X W, et al. Applying an ensemble-based model to travel choice behavior in travel demand forecasting under uncertainties[J]. Transportation Letters, 2020, 12(6): 375-385.

[91]
洪永淼, 汪寿阳. 大数据、机器学习与统计学: 挑战与机遇[J]. 计量经济学报, 2021, 1(1): 17-35.

DOI

[Hong Yongmiao, Wang Shouyang. Big data, machine learning and statistics: Challenges and opportunities. China Journal of Econometrics, 2021, 1(1): 17-35.]

DOI

文章导航

/