基于多源数据的地面公交下车站点估计文献综述

 2022-03-18 09:03

前言

在城市化的进程之下,居民出行需求量持续上升,同时机动车保有量不断增加,这也就导致绝大部分城市 ,尤其是大城市的交通拥堵现象日益严重,而这也变成了限制城市发展的主要原因之一。想要解决这个城市发展的难题,作为基本公共事业的城市交通与居民出行息息相关,由此发展城市公共交通不失为一个很好的解决办法。因此,在国家层面上,对城市公共交通的重视程度也日益提升。

优先发展公共交通可以有效缓解交通拥堵、改善民生并且促进社会公平,因此,在可靠的公交数据的基础上开展公共交规划设计和运营管理对公共交通系统来说及其重要。但是,目前在我国绝大部分城市均采用“一票制”公交刷卡制度,在如此制度之下,我们只能通过公交IC卡获取乘客的刷卡时间以及车辆编号等信息,而对于乘客下车站点等信息需要进行推断甚至猜测,这样获得的公交数据并不利于我们进行公共交通的规划与设计,也导致公交客流时空分布特征与公交OD矩阵的获得变成了一个难题。同时,由于部分城市的公交IC卡不区分站点乘客上车刷卡的形式,有的城市也给乘坐公共交通的乘客添加了福利,允许一张卡在短时间内多次刷卡,这又给乘客信息的获取增加了不少困难。

但事实上,公共交通基础数据资源需要进行科学、合理、有效的采集方式,传统的基础数据采集方式--人工调查不仅会消耗大量的人力、物力、财力,同时调差得出的数据也存在着样本量低、数据精度差、不能及时进行数据更新等许多缺陷。由此一来,我们需要通过现代信息技术的信息采集方式,通过公共交通系统中公交IC卡和CPS数据进行城市居民公交出行的数据调查,虽有许多困难,但却比传统人工方式改进了不少。

正文

一、地面公交乘客上车站点获取

根据陈学武(2014)、梁学荣(2012)教授的方法,通过公交车载 GPS 数据与公交线路站点数据的数据融合,可以获取公交车辆经过特定站点的时间信息,形成公交车辆到站时刻表,并采用基于密度聚类的算法对公交车载 GPS 数据与公交线路站点数据进行基础地理定位坐标系的修正。通过公交车辆到站时刻表与公交 IC 刷卡数据进行匹配,可以识别公交乘客的上车站点[1,2]。城市公交 IC 刷卡自动收费系统中,与公交出行者联系最为紧密的是公交 IC 卡片与公交车载刷卡终端,其中公交车载刷卡终端通常设置与公交车的车门前门位置,在公交IC 刷卡自动收费系统中主要完成公交出行者乘车扣费与刷卡数据记录的工作,并将数据记录在车载存储器中。公交出行者上车时,通过刷公交 IC 卡的行为将个人出行信息记录于车载存储器中,并经由数据收集器将设备保存的数据传输至公交公司的数据库管理系统中。 公交IC刷卡数据具有较高的时空覆盖率,在时间上能够提供具有较长时间跨的、连续的公交出行者刷卡记录,在空间上覆盖了安装公交车载刷卡终端的所有公交车辆走行线路。在数据传输与数据存储上,公交 IC 刷卡数据通过车载终端设备自动收集并进行传输,在精细的数据分析与处理技术支撑下,IC 刷卡数据可以进行高效的集约处理;在现有存储设备与技术支持下,能够进行海量公交 IC 刷卡数据的存储;在后期特定场景的数据分析层面下,任何获得数据准入授权的安装了数据库管理平台的终端设备均能实现对公交 IC 刷卡数据的操作管理;在数据处理稳定性与数据安全方面,通过数据库管理系统的权限合理分配,能够保证公交 IC 刷卡数据的稳定与安全存储。

浙江工业大学邓一凌等人(2019)指出,由于AFC数据公交车停靠站点时乘客上车刷卡产生的,我们可以根据AFC数据推断乘客的下车站点,即当个人一天有两次或以上的公交出行时,其公交出行具有连续特征:即前一次出行的下车站点临近后一次出行的上车站点,最后一次出行的下车站点临近第一次出行的上车站点[3]。也就是说,个人在两次公交出行之间很少夹杂步行外的出行方式。这种方法适合于两次乘车之间间隔时间较短的情况,在这种情况下,数据的准确性较大,可一旦两次乘车之间时间间隔较大,这种方法就会失效,数据也就不存在太大的参考价值。

二、地面公交下车站点估计

在宋晓晴(2016)、马晓磊(2015)等介绍的方法中,对于我们所获取的公交线路站点数据,通常与公交车载GPS数据所对应的基础地理定位坐标系不同,需要对公交车载 GPS 数据进行基础地理定位坐标系的修正[4,5]。对于公交线路站点数据坐标系已知的,将公交车载 GPS 数据的基础坐标系调整为公交线路站点数据所对应的基础坐标系;对于公交线路站点数据坐标系未知的,需要引入密度聚类算法,以公交线路站点数据中的站点数据作为簇核心,对公交车载 GPS 数据的经纬度进行密度聚类,并映射到与之对应的站点上。通常情况下,不同城市可能采用不同基础地理定位坐标系的公交线路站点数据,直接修正需要设计多种不同的映射算法,因此可以采用基于密度聚类算法的方法来获取公交车辆的到站时刻表。然后,当公交车辆到达站点时,相应的开启和关闭车门的行为是触发公交车载终端产生 GPS 数据的事件行为之一,所产生的公交到站GPS数据是进行公交到站时刻表获取的必要数据源,记录了公交的到站时刻与站点的经纬度信息。通过与公交线路站点数据的经纬度信息进行空间维度的融合,可以得到每个班次公交到达具体站点的时刻,以作为乘客上、下车站点识别的数据源输入。

三、对取得的数据进行预处理加工

东南大学刘少伟(2019)、石家庄铁道大学段钊宁(2019)指出,在选取IC卡记录的过程之前,需要对数据进行预处理工作[6,7]。最开始需要确定不同的研究时段,因为合理的公交排班制度和严格的运营体系保证了在绝大部分城市(除少数旅游城市等)中,常规公交出行具有明显的阶段性、周期性,其中,最具代表性的出行方式为通勤出行。公交需求分析通常以高峰小时、日、周和月作为基本研究时段。接着,我们需要选取关键字段进行分析,对于分析公交出行需求分析的研究而言,原始数据源中包含的部分字段,如消费金额、账户余额等对于公交出行需求的推导没有任何辅助作用,为降低数据存储空间,保证数据处理效率,在进行原始数据预处理时,这些字段信息对于研究并没有太大的帮助,需要剔除上述字段信息,以保证公交数据挖掘工作高效进行。本阶段保留的公交 IC 刷卡记录字段通常包含公交 IC 卡编号、刷卡类型、刷卡时间、线路编号和车辆编号。最后,我们需要清除掉数据当中的冗余数据,受到车载刷卡终端故障和通讯网络连接中断等偶然因素的影响,公交 IC 刷卡自动收费系统在数据采集、数据传输和数据存储的过程中不可避免地会造成公交 IC 刷卡记录的缺失,在部分情况下受到通讯网络波动的影响,还可能产生重复的无效数据,对于缺失公交 IC 卡编号、刷卡时间以及同时缺失线路编号和车辆编号的数据,尤其是缺失刷卡时间的数据直接进行剔除;同时对冗余数据进行去重操作,仅保留相同记录的一条;此外,存在少量数据刷卡时间在公交车辆运行时段之外,对于此类数据同样直接进行剔除,以保证待处理数据具有较高的质量。

总结

在已经搜集这些文章当中,最主要的方法就是胡继华(2014)、吴祥国(2011)、熊文华(2008)、陈茜(2004)、姚琳(2017)、郭戎格(2017)等专家通过公交IC卡的记录和GPS等现代化技术对乘客的下车站点进行评估或者对公交乘客的出行频率、时间等进行OD矩阵的估算,从而得到乘客换乘的数据与记录[8~13]

在第一种方法的计算当中,公交站点位置信息是必不可少的输入条件,然而在国内实际的项目实践中,往往存在公交站点位置信息缺失的情况。中小城市的公交企业和政府主管部门普遍没有现成的较高精度的公交站点位置数据。一些大城市尽管建立了包含公交系统在内的城市地理信息平台,但也存在部分公交线路缺失的问题,特别是城乡公交线路。另外,客流变化、极端天气、道路施工等造成的公交线路和站点的调整也无法在城市地理信息平台中得到及时的反馈。这对公交客流OD分析带来了很大的困难。针对公交站点位置信息缺失的情况,我们可以利用AFC和AVL数据自动识别公交站点位置进而估计公交客流OD的方法,并在城市公交系统中进行应用。最后利用城市公交客流OD数据,设计并开发了公交规划支持系统。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

免费ai写开题、写任务书: 免费Ai开题 | 免费Ai任务书 | 降AI率 | 降重复率 | 论文一键排版