“ 写在前面
写在前面
潜在出行需求分析是定制公交市场推广的基础,然而现有相关研究多关注特定出行场景下的宏观需求特征或方式选择意愿,难以整体把握定制公交的各种适用场景与对应的潜在出行需求特点。结合大数据特征挖掘和小样本个体行为调查的各自优势,提出了一种场景导向的定制公交潜在出行需求宏微观数据嵌套分析方法:利用出行大数据挖掘出行需求的宏观特征,基于小样本调查数据提取微观个体的方式选择意愿,通过一致的出行场景实现上述两方面结论的嵌套连接,进而研判各场景下的定制公交潜在出行需求。以厦门市为例验证方法的可操作性及数据适用性。结果表明,可依据潜在出行需求特点将各种出行场景划分为“高需求量、高转移率”等4类,进而对应制定差异化的定制公交市场推广策略。
王子懿
同济大学道路与交通工程教育部重点实验室 同济大学城市交通研究院 在读硕士研究生
研究背景
定制公交是一种新兴的需求响应型公共交通服务,利用互联网平台收集乘客的出行需求,并基于需求特征进行线路规划及运营方案设计 [1-2] 。定制公交既保留了集约化特征,又可提供贴合居民个性化出行需求的服务。与此同时,通过移动互联网实现的在线需求征集和预约订座等形式,进一步提升了定制公交服务的响应效率、服务品质。近年来,尤其在新冠疫情中后期,全国诸多城市开展的定制公交服务实践达到了较为理想的客流水平 [3-5] ,形成对传统公共汽车的有效补充,充分体现了灵活、舒适、客流可控、可溯源 [6-7] 等优势。当前城市公共汽车的客流量回弹乏力,发展定制公交可作为一种可行手段,激活与丰富公共交通服务市场,提升公共交通对出行者的吸引力。
定制公交的潜在出行需求分析,是推进城市定制公交发展的基础。现有关于定制公交出行需求分析的研究,主要包括基于出行大数据的宏观特征分析 [8-13] 和基于样本调查的微观行为意愿 [14-15] 两方面。然而上述研究尚存在如下局限:在宏观特征分析方面,多数研究将城市内的出行需求作为整体进行讨论,或仅聚焦于通勤类需求,缺少考虑定制公交在不同场景下的时空需求特征差异;在微观行为意愿方面,受制于样本调查规模,现有研究仅针对特定出行场景的行为机理和出行意愿进行分析,难以把握定制公交需求规模及空间分布。定制公交的商业推广,需要充分发挥出行大数据和小样本行为调查的各自优势,从城市层面明确不同场景下,现状出行群体的潜在需求规模及时空分布,以及对于不同类型定制公交方式的接受意愿,并将上述结论进行有机结合。
本文提出了一种场景导向的定制公交潜在出行需求宏微观数据嵌套分析方法。首先,依据出行属性设定出行场景,构建以具体场景为导向的出行需求分析框架;其次,利用出行大数据挖掘出行需求的宏观特征,基于小样本调查获得微观个体的方式选择意愿,并通过一致的出行场景实现上述两方面结论的嵌套连接,进而研判各种场景下的定制公交潜在出行需求,为政府公共资源配置和定制公交企业运营提供决策参考。
既有研究方法文献综述
1
定制公交出行需求分析
出行大数据(或称“宏观数据”)与样本调查数据(或称“微观数据”),是出行需求分析采用的两种常见数据源。由于采集目的及手段、蕴含信息存在差异,前者多应用于宏观特征挖掘,后者应用于微观个体需求和方式选择意愿分析。宏、微观数据各自包含的信息存在边界,造成两类针对定制公交出行需求的研究存在局限。
基于出行大数据的宏观特征挖掘是目前研判定制公交潜在出行需求的主要方法。该方法基于居民出行数据提取某类出行OD信息,根据出行时空聚集特征对定制公交出行需求进行研判。一些研究 [8-9] 采用公交智能卡刷卡数据,通过出行链重构、通勤行为识别等方式获取通勤出行OD,其中陈汐 等 [8] 通过空间聚类方法识别定制公交需求热点区域,GUO Rongge 等 [9] 建立了效用指标,探讨定制公交的优势服务线路;部分研究 [10-12] 基于出租汽车GPS数据,通过出行空间聚类挖掘潜在乘坐群体、上下客热点车站等;YU Qing 等 [13] 在研究中讨论了基于手机信令数据的定制公交潜在服务线路设计方法。然而,上述数据记录并不包含个体属性信息,因无法对出行群体向定制公交的转移意愿进行分析,导致研究结论的可信度低。
基于小样本调查数据的定制公交选择意愿分析,关注特定人群对定制公交的选择意愿及出行需求。首先针对通勤群体展开RP与SP调查,随后基于离散选择模型等统计分析方法,讨论特定群体对定制公交的选择意愿及产生机理,实现了对个体层次行为及态度的研究 [14-15] 。然而,通过传统的问卷形式难以广泛地对不同出行群体进行调查,且难以将调查结果扩样至城市层面,阻碍了研究结论的大范围推广。
需要特别指出,多数研究将定制公交出行需求作为整体进行讨论 [10-13] ,或仅聚焦于通勤出行需求 [8-9, 14-15] ,缺少考虑定制公交的各种实际服务场景,以及不同场景下出行需求间的差异,实际上并没有从定制公交的多样化特性出发进行相关的需求分析,不利于指导定制公交实践落地。
2
场景导向思想
场景导向(或称“场景驱动”)思想来源于市场营销学。市场营销学认为,消费行为往往在日常生活中的特定场景下进行,消费者对产品和服务的感知同上述场景具有极强的关联;因此,区分场景对产品或服务进行设计,可更精准地满足消费者在不同场景下的个性化需求 [16] 。近年来,场景导向已逐步由市场营销过程向产品设计、智能制造、管理系统开发等更多领域扩展,转变为一种创新的发展模式;场景的概念也由消费场景、应用场景泛化为需求场景。
场景导向思想在交通领域的系统开发方面已经得到应用,例如:基于不同数据应用场景的交通大数据平台开发 [17] ,面向城市未来交通场景的信号控制仿真系统设计 [18] ,具体环境场景的自动驾驶系统研究 [19] ,等等。现有针对定制公交等新业态的出行需求分析方法,仍然沿用传统公共交通自上而下的分析模式,缺少从多样化出行服务产品提供的角度出发对多样化出行场景引起的需求差异的考虑。实际上,引入场景导向思想,将定制公交出行需求进行场景化差异分析,是利用市场化手段推进公交优先的重要基础性工作,也符合动态、精细、精准治理的发展方向 [20] 。
3
宏微观数据嵌套分析思想
宏微观数据嵌套(或称“大小数据结合”)分析思想伴随大数据的广泛应用而产生,可以有针对性地规避大数据的如下缺陷:首先,大数据属于“弱设计”式数据 [21] ,并非特定服务于科学研究 [22] ,其蕴含信息有限且观测存在边界;其次,由于缺少个体属性数据,导致大数据分析“重相关而轻因果” [23] ,难以对因果关系进行验证 [24] ;最后,大数据并非全样本数据 [22-24] ,无法代表全部社会群体。宏微观数据嵌套方法可以发挥大小数据各自优势,通过构建信息键实现大小数据的有效匹配,在宏观特征关联分析的同时进行微观行为机理验证 [21-24] 。
宏微观数据嵌套思想已在社会学、地理学等多个学科得到广泛应用。孙世超 [25] 以公交IC卡卡号作为链接键,构建了宏观公共汽车出行数据与微观个体调查数据的嵌套连接关系,从而实现对用户行为特征、态度特征的全面测量,进而以两维度完成用户市场细分。J. Blumenstock 等 [26] 针对卢旺达地区电话用户进行抽样调查,将测量得到的家庭资产信息作为标签,构建了以匿名电话记录大数据预测家庭资产状况的有监督学习模型,并完成对该地区整体的贫困状况分析。黄伟 等 [27] 通过问卷调查建立部分用户手机信令位置数据及其个体真实居住地间的映射关系,并以此构建了基于信令大数据预测居住地的有监督学习模型,进而分析居住地人口分布状况。秦萧 等 [24] 提出了EDCF,MFVE和AADSF三种大小数据结合的城市研究方法框架,用于讨论城市空间、居民行为活动之间的相互影响机理。应用上述分析框架,仇璟 等 [28] 采用微信热力大数据发现了常州市主城区存在的职住平衡与职住失衡两类空间,随后基于宏观POI数据及微观问卷调查数据建立回归分析模型,对两类空间的差异成因进行分析。
本文以定制公交潜在出行需求分析为例,结合传统微观样本调查方法,对相应出行者展开抽样调查,可为基于出行数据的出行需求宏观特征结论补充个体行为意愿依据,克服以单一数据源进行分析的片面性。
场景导向的宏微观数据
嵌套分析方法框架
1
基本逻辑
定制公交服务出现后,部分出行者可能从原方式转移至定制公交,而不同的出行场景可能导致出行者的定制公交出行需求呈现差异。定制公交的潜在出行需求同时取决于两方面因素:原出行方式的需求量(及特征)、出行者的转移意愿或转移率。
基于上述逻辑,结合场景导向及宏微观数据嵌套分析思想,本文提出定制公交潜在出行需求分析方法框架(见图1),具体包含研究对象选取与数据采集、出行需求场景化、宏微观数据分析、嵌套分析4个步骤。
图1 场景导向的定制公交潜在出行需求宏微观数据嵌套分析方法框架
2
研究对象选取与数据采集
选择现有某种交通方式的出行者作为研究对象并采集数据。记录个体出行活动的出行大数据(见表1)通常以公交IC卡、移动数字设备等进行采集;样本调查数据则基于对研究群体的抽样调查得到。建议选择数据获取难度较小的研究对象。
表1 出行大数据类型
方法框架对两类数据提出如下要求:宏观数据应至少可以从原始数据中提取完整出行OD信息;微观数据需关注抽样方法、样本规模与调查内容,以提升小样本调查数据的可信度。
1)抽样方法。
掌握目标群体的总体属性分布(例如性别、年龄等),以上述特征作为分层依据展开分层抽样。受到成本限制而无法开展分层抽样时,可对目标群体展开简单随机抽样,对照样本属性分布状况与总体状况的一致性来控制样本,以提升样本的代表性。
2)样本规模。
采用小样本调查无法达到居民出行调查的抽样率时,可依据精度要求对简单随机抽样所需的样本量进行计算。对常见的正态总体,研究对象的总体数量>5 000、置信度为95%的情况下,样本数量达到96可满足±10%的误差范围,样本数量达到384可满足±5%的误差范围,样本数量达到1 067可满足±3%的误差范围 [29] 。具体样本量依据所需的精度要求和成本确定。
3)调查内容。
应采集研究对象使用原交通方式出行的各类属性特征(包含出行目的、出行时段、出行距离等),以及在上述出行条件下,其由原方式转移至定制公交的意愿水平。考虑到定制公交仍未得到大范围普及,在进行SP调查前应对定制公交概念进行客观介绍,降低由于认知水平不足而产生的误差。
3
出行需求场景化
依据与出行相关的属性特征(记为“ P ”),将全部原方式出行需求细分为若干出行场景(记为“ S ”)。在本方法中,可选择出行目的、出行时段、出行距离等的一种或多种属性构成 P 。考虑到出行者的方式转移意愿通常受到多因素影响 [30-31] ,选择更多的出行属性构成 P ,可能降低后续出行者选择意愿分析方面的误差,然而过于复杂的 P 可能导致划分的场景失去代表性,增加实践难度。此外,定制公交本身仍具有公共服务特点,在前期潜在需求估计过程中无法考虑到全部的用户需求。
本文建议,依据城市计划开设的定制公交类型(如服务于枢纽接驳、休闲娱乐的线路)确定 P ,进行出行场景划分,实现针对性的分析;如条件允许,也可针对出行者的定制公交选择意愿展开预调查,分析主要影响因素后确定 P 。
4
宏微观数据分析
1)宏观数据分析。基于出行大数据中挖掘得到的OD时空特征信息,参考属性特征 P ,推断个体出行OD所属的出行场景 S 。随后通过集计等方式,提取并计算出行场景 S 下原方式的出行需求量(及特征)。
2)微观数据分析。基于样本调查获取研究对象的出行属性信息,参考属性特征 P ,筛选出行条件符合出行场景 S 的样本。随后集计计算出行场景 S 下原方式出行者向定制公交的转移率。
5
嵌套分析
通过同一出行场景 S ,构建宏、微观数据分析结论的嵌套连接。以上述过程,实现在各种具体的出行场景下对定制公交差异化出行需求的探讨。
实例分析
1
研究对象选取及数据采集
以厦门市为例对提出的方法框架进行验证。选取当地出租汽车订单数据用于宏观分析。该数据包含2019年5月31日至6月9日(工作日与节假日各5天)全市网约出租汽车及巡游出租汽车订单记录,OD数据格式如表2所示。经过清洗后的数据量约为460万条。
表2 出租汽车订单OD数据格式
对当地出租汽车乘客展开抽样调查,获取小规模样本数据用于微观分析。2021年7月,通过“问卷星”平台向目标群体发放调查问卷,根据方法框架中的数据要求,设计问卷内容如表3所示。最终回收得到200份有效样本。
表3 问卷调查内容
2
潜在出行需求分析
1)出行需求场景化。
对出租汽车出行场景进行划分。考虑到样本数量限制及OD所属场景的辨识难度,选择“出行目的”作为属性特征 P ,由此设置通勤、枢纽换乘(指城市对外交通枢纽)、休闲娱乐、景区旅行、看病就医5种主要出行场景,与定制公交的潜在服务场景相对应。
2)宏观分析。
对出租汽车订单数据中个体OD的出行目的进行推断,进而获取各种出行场景下的出租汽车出行需求特征。考虑到现有出行订单数据中往往不直接包含出行目的信息,本文基于用地性质与OD时变特征,对OD的出行目的进行辨识和验证。技术路线如图2,主要步骤如下:基于当地POI数据对交通小区用地性质进行判别 [32] ,与集计后的OD数据进行匹配;选取部分具有较强空间聚集性的OD(避免大量零散出行需求对场景推断的影响),基于时变特征、用地性质特征判断和验证出行目的,如表4所示。通过上述过程,得到各种出行场景下部分出租汽车出行需求量宏观特征(见图3)。
图2 出租汽车订单OD数据的出行目的推断
表4 出行目的推断
图3 各种出行场景下部分出租汽车出行需求量宏观特征
3)微观分析。
基于问卷调查数据,对各种出行场景下出租汽车乘客向定制公交的转移率进行计算。计算公式为
式中: P i 为第i种出行场景下出租汽车乘客向定制公交的转移率; S t i 为出行需求符合第 i 种出行场景的被调查者总数/人; S w i 为上述被调查者中选择“愿意”或“非常愿意”由原方式转移至定制公交的被调查者人数/人。计算结果如图4所示(虚线表示转移率的平均水平)。
图4 各种出行场景下被调查者向定制公交的转移率
4)宏微观数据嵌套分析。
图5展示了各种出行场景下出租汽车乘客向定制公交的转移率(横坐标)与原出租汽车方式出行需求量(纵坐标)的关系。依据两方面指标的一定阈值,对应不同出行场景,分析定制公交的差异化潜在出行需求类型:
图5 宏微观数据嵌套分析结论
第I象限代表“高需求量、高转移率”类场景。出租汽车出行需求具有较强的时空聚集性,乘客向定制公交转移的比例高。此时,对应类型的定制公交具备良好运营潜力,适合优先推广。
第II象限代表“高需求量、低转移率”类场景。出租汽车出行需求具有较强的时空聚集性,例如早高峰通勤出行、枢纽换乘出行、晚间休闲娱乐出行,而乘客向定制公交的转移率均低于平均水平。此时,服务于上述出行场景的定制公交可能对原出租汽车乘客吸引力不足。若计划推广此类定制公交,可关注票价、准点率等服务属性,增强客流吸引力。
第III象限代表“低需求量、低转移率”类场景。出租汽车出行需求时空聚集性不强,乘客群体向定制公交的转移意愿也较低,例如景区旅行。在此出行场景下,原出租汽车乘客并非定制公交的有利服务对象。
第IV象限代表“低需求量、高转移率”类场景。出租汽车出行需求未呈现较强聚集性,但出租汽车乘客向定制公交的转移意愿高,例如看病就医。出行需求量低可能反映两种情况:一是该类出行的绝对数量少;二是已存在类似定制公交的出行服务,使大量出行者不选择出租汽车。对此,如计划推广服务于此种场景的定制公交,应进一步调研对应出行者的方式选择现状,避免定制公交与现存交通方式的不利竞争。
写在最后
本文提出了一种场景导向的定制公交潜在出行需求宏微观数据嵌套分析方法:依据出行属性设定出行场景,构建以具体场景为导向的出行需求分析方法框架;发挥大小数据各自的优势,利用出行大数据挖掘出行需求的宏观特征,基于小样本调查获取微观个体的方式选择意愿,并通过一致的出行场景实现上述两方面结论的嵌套连接,对不同场景定制公交出行需求进行研判。以厦门市为例验证方法的可操作性及数据适用性。结果表明,可依据潜在出行需求特点将各种出行场景划分为“高需求量、高转移率”等4类,进而对应制定差异化的定制公交市场推广策略。
本文仍存在如下不足待改进与完善。其一,仅对出行场景进行定性描述而缺少量化方法;后续研究可构建定量指标,实现宏、微观数据更准确的匹配连接以及对定制公交运营潜力的深入分析。其二,受不可控因素限制,实例分析选取的研究群体有限。受新冠疫情的影响,暂时无法对现有定制公交客流来源进行调研,因此仅以出租汽车乘客作为嵌套分析示例;此外,微观调查样本量较小,分析结论存在局限。后续应结合现有定制公交客流来源调研,针对更具方式转移潜力的出行者群体(如公共交通乘客、共享单车用户)展开分析。