新闻中心
奇妙的交通大数据:一位美国教授与840个公交扒手奇遇记
作者:睿至大数据
一个美国州立大学的终身教授,与北京公共交通系统上的840个扒手之间,存在着什么样的关系?难道说,这位倒霉的大学教授,在他短短几次光临北京的时候,不幸遭遇了这些扒手的集体“临幸”?又或者,他是这840名扒手背后的“神秘男子”?也许,还有什么不可告人的秘密?

很显然,我们今天讨论的既不是倒霉蛋的故事,也不是不着边际的阴谋论,这个故事的主角,是美国罗格斯-新泽西州立大学罗格斯商学院管理科学与信息系统系副系主任,他同时也是该大学信息安全中心的主任,他的名字叫熊辉。


2016年在旧金山举行的KDD2016学术会议上,熊辉向大家报告了他们的研究论文《Catch Me If You Can: Detecting Pickpocket Suspects from Large-Scale Transit Records》。这篇论文以2014年前9个月在北京公共交通系统上抓到的840名扒手(地铁350名,公交车490名)的数据以及北京市2014年4-6月三个月间600万乘客的约16亿智能公交一卡通数据记录为大数据集,统计出了正常出行者、旅游者、购物者和扒手四种“出行”模式。


熊辉的研究发现:扒手采用一种流浪的模式,没有清晰的目的地,他们频繁地换乘,随机的停留,经常进行短途的出行;他们还(一段时间内)频繁的访问多种功能区:交通枢纽(例如西直门)、购物区(例如王府井)、景点(例如鼓楼)——这一论文结论的得出,对北京公共交通系统的治安管理、安全运营提供了极具参考性的意见,显示出了在大数据的支撑下进行的数据分析所能产生的意想不到出众能力。


当然,治理公交车和地铁车厢里的扒手,还需要治安管理部门和交通运营管理部门的通力合作,大数据所起到的作用在当前来看还略微显得弱小了一些,毕竟在熙熙攘攘的人群中找到那个“并不贼眉鼠眼”的扒手,需要的更多还是有经验的反扒人员和更多数字化的监控手段。


不过,在公共交通系统的运营、规划、管理和乘坐体验等方面,大数据是可以发挥越来越重要的作用的。特别是近年来,各城市的公共交通运营管理机构(包括公交公司、地铁运营公司等运营管理机构,以下同)正在努力以城市全局公交交通统筹规划、优化线网建设、提升管控力、提升服务满意度为发展的核心目标,致力于更好地发展与管理城市公交,实现其社会效益最优化,并最大限度地提高公交企业管理水平、提高公共交通运行效率的大背景下,大数据能做的事情,或许会让你大吃一惊。


大数据:在公共交通系统大有可用之地

公共交通系统的大数据应当来自于政府管理部门、公交运营企业和公众出行参与者三方面多渠道多角度的信息,这其中包括了城市路网规划(比如路网条件、交通信号灯坐标等)、城市拥堵/交通情况、公交运营数据(包括公交车、地铁车辆运营信息)、公众出行参与者们的参与信息(上下车辆、进出站、客流迁徙等),是一个非常复杂的大数据系统。但需要注意的是,只有涵盖了“路、车、人”三者全部信息及其相互关系的大数据,才能够帮助公共交通系统的管理者们探索公共交通系统运营管理的切实举措和发展方向。


同样是在北京,我们看到为了更好地服务于乘客,拉近集中居住区和核心商务区之间的关系,北京公交集团开行了数十条商务班车,不仅提高了北京公交集团的收入,也为每天往返于居住地和工作地的公交族们提供了全新体验的“巴士专车”服务,不仅如此,北京公交集团还开行了快速直达专线、节假日撰写、休闲旅游专线和高铁快巴——这些创新的公共交通服务,依靠大数据将能够得到进一步的优化升级。

那么,具体到公共交通运营管理,大数据能够起到哪些重要的作用呢?

在过去几年,睿至大数据一直利用自身创新的大数据解决方案帮助全国各地的公共交通系统运营管理部门和城市管理部门优化城市公共交通系统,并就此得到了来自一线的经验如下:

线路、站点优化:随着社会经济的发展、城市化进程的加快,城市建设扩张、功能区重新规划、城市新兴聚集区等因素深刻影响着城市的公共交通系统,通过大数据可以统筹解析城市环境内公交线站网的规划,了解交通拥堵与公交站点、换乘站点等之间的关系,结合乘客流动,城市拥堵、线路覆盖度等综合因素,探索优化公交线路,包括线路和站点的调整、新开、取消;

调度优化:公交车辆和地铁列车的调度一直是公共交通运营管理机构最艰巨、最头疼的工作,道路拥堵、社会(突发)事件、车辆损坏(包括交通事故)等等因素,都会对车辆调度产生影响,并最终影响乘车人的体验(比如导致长时间的等待),大数据可以帮助公共交通运营管理机构更准确、更精细化的管理车辆调度,加大-缩短发车间隔、及时调度更换受损车辆、恶劣天气下的车辆调度、及时有效应对节假日或局部临时性活动的影响;

业务创新:大数据可以帮助公共交通运营管理机构在提升乘客体验、改变传统业务模式上提供新的可参考依据和新的想法,比如说设置智能公交站牌、智能公共交通APP等服务,让乘客第一时间了解“车在哪儿?下一趟车几点到?自己大约几点能到目的地?”等关键信息;

对睿至大数据来说,公共交通行业的业务创新是持续的,是以丰富的行业实践经验为基础的,这其中包含了三个重要的组成部分:业务执行、(大数据)分析、(决策)计算。以此为基础,在全国各地公共交通系统优化升级的背景下,睿至大数据正在塑造公共交通系统运营的新常态。

睿至大数据:塑造公共交通系统运营新常态

长期以来,睿至大数据在公共交通领域从探寻城市环境下公共交通运行全局活动出发,基于海量公共交通行业基础数据,从目前公共交通行业最为关心的问题入手,着力解决为公共交通系统线路优化、提升公共交通系统单车承载量、提高公共交通系统运行效率、为公共交通系统提升交通管理水平提供技术和决策支持,从而帮助公共交通运营管理机构构建运营新常态。

面对日益增长的交通大数据,睿至大数据交通大数据领域的行业业务创新基于实时计算池、大数据计算池、超级计算池三个组成部分,他们分别代表了公共交通系统运营管理时所面对的三类需求:业务执行、(大数据)分析、(决策)计算——在共用软件支撑平台的基础上,这三者满足了公共交通运营管理机构的三大需求:

业务执行:可以被称为运营决策系统,包括运营调度系统、多媒体实时监测系统、数据转发系统、企业实施通讯系统(IM)、办公自动化系统(OA)、企业资源管理(ERP)、车站管理、票务/公交卡系统、抢修救援调度系统、车载定位系统、地理信息系统、应急指挥系统、大屏幕/网络通信系统等多个系统,是公共交通运营管理机构的一线业务系统,只要是进行第一线的业务(决策/命令)执行的传递、第一线信息的及时投影以及相关运营管理资源的管理;

(大数据)分析:以大数据计算池为基础构建,提供了包括交通需求分析、配置策略分析、交通线网分析、票卡价格分析和企业能力分析等多方面的功能,主要帮助公共交通运营管理机构对大数据进行筛选、清理、集合、分析和关联性分析,从大数据中发现一些潜在的、不易察觉的数据特征;

(决策)计算:依托超级计算池,睿至大数据为公共交通构建了为公共交通运营管理机构提供实时优化、实际决策依据的“超级计算平台”,它支持了配置策略优化、车辆优化、交通线网优化、实时预案编制、实时预案优化、运能系统仿真等需要耗费大量计算资源,却能够在第一时间为运营管理者提供基于大数据和强大计算力的决策建议。

比如说,就北京公交集团的2万余辆公交车辆来说,就包括车辆进站中、出站中、运行中、停靠站、故障信号五种类别,并且应当通过采集公交车辆的GPS数据(以近乎实时的方式采集并回传),了解到车辆的实时位置信息。

详尽采集公共交通系统大数据并对其进行针对性的分析是有着非常重要的意义的: 通过刻画全局公交交通流特性,不仅能够从一定层面映射公交交通需求特性,从宏观层面展现公交交通线网时空热度,全局展现交通热区、热点(比如核心区域内交通活跃度、核心区线路覆盖重合度等),还能给出公交交通流与城市生产生活功能区域主干路网OD特性,展现公交运力热段、热点(比如客流迁徙的趋势等)。

依托超级计算池和大数据计算池的(决策)计算和(大数据)分析,是睿至大数据在公共交通运营管理平台及其业务优化上极为重要的创新,它改变了原有行业应用平台只能提供基本信息化功能(如IM、OA、ERP)或是实时数据显示的现状,能够为管理者呈现(经过分析的)数据内在的具有价值的信息以及不同数据之间的潜在关系。不仅如此,它还能够为管理者提供“行动指南”,即实时优化的建议和实际决策的参考——真正的将“看似毫无意义的数据”,变成具有实际意义的行动决策。

在某公交集团的大数据监测指挥平台项目上,睿至大数据帮助该公交集团构建了使用GIS形式展现的实时监控2万余辆公交车辆的平台,不仅实时计算该公交集团所属全市范围内路段的拥堵情况,(通过特征箱梁设计、模式识别)计算全市红绿灯地理坐标,而且通过客户OD大数据,定期监控了全市乘客OD迁移特征规律。

值得一提的是,在模型计算方面, 睿至大数据充分利用了大量高难度的算法,包括K-means聚类算法、平滑滤波算法、贝叶斯算法、概率密度算法等算法,保证了数据呈现的效果、数据分析结果以及优化决策建议的优化高效、切实可信。

在该公交集团的大数据监测指挥平台,不仅能够通过GIS可视化展现车辆运行情况,了解交通拥堵、热门站点、乘客OD迁移特征,并且进行定制化的分析模型构建与展示,更重要的,是能够直观的提供线路标准化运营状态分析、定位数据和调度车次的公里模型以及定位数据的线路及站点位置分析,为公共交通运营管理机构的信息获取、全景展现、实时优化和实际决策提供了有力的、创新的支撑。


睿至大数据:开展“院企合作” 实践“产学共赢”


除了自身在公共交通大数据领域的技术研发与创新,睿至大数据同时积极开展“院企合作”实践“产学共赢”,布局交通大数据的实践应用:2017年4月,睿至大数据与北京交通大学交通运输学院,正式签署战略合作协议,双方将通过睿至大数据在算法和工程上的经验结合专家们的行业经验,更进一步提升睿至大数据交通大数据平台的支持、服务和创新能力。

对于睿至大数据未来在交通大数据,特别是公共交通大数据领域的发展,睿至大数据CTO兰健认为:长期深耕行业、依托行业让睿至大数据在行业数据源和跨行业数据源整合方面具有先天优势,这在睿至大数据与北京公交、沈阳公交的合作上已经得到了体现。(在许多实际项目中)睿至大数据通过技术手段,对数据做对接和交互产生了非常好的效果。

未来,睿至大数据将进一步面向公共交通,特别是轨道交通行业(包括(高速)铁路、城市轨道交通(地铁、城铁)),开展结合行业需求、应用特点的面向社会服务的大数据应用研究和实践,帮助中国城市交通建立完善的大数据平台。