交通数据太庞大，不如交给可视化处理

交通大数据可视化

中国安防展览网 | 2018-01-11 11:53

【数据猿导读】伴随着大数据可视化的热潮，在交通数据中使用可视化可以帮助人们有效地理解移动车辆的行为、发现交通在时空上的模式，从而为交通优化等提供决策信息。当代交通系统每时每刻都会产生大量的数据

随着交通系统的快速发展，交通已经成为人类生活中一个重要的组成部分。据统计，城市中大约有40%的人口每天花费1小时在交通上。然而，现代城市中大量的人口以及交通工具产生了许多城市问题，比如交通拥堵、交通事故和空气污染等。

伴随着大数据可视化的热潮，在交通数据中使用可视化可以帮助人们有效地理解移动车辆的行为、发现交通在时空上的模式，从而为交通优化等提供决策信息。当代交通系统每时每刻都会产生大量的数据，比如，出租车上搭载的GPS传感器会记录出租车的行驶轨迹；街道监控摄像头会记录车辆的通过情况。而且，伴随着城市越来越大，汽车越来越多，监控越来越多，交通数据的规模有了爆炸性的增长。在这种情况下，直接对交通数据进行分析的传统方法已经变得越来越困难，而且效率越来越低，数据挖掘、机器学习和可视化等智能化技术的深入和广泛使用已经变得刻不容缓。特别地，可视化可以将用户和数据直接相关，支持用户以简单可视的方式与数据进行交互，进而实现用户智慧和机器智慧交融反馈，可以极大地提高分析和决策的效率与准度。

首次将交通可视化作为一个独立的研究与应用领域展开工作，认为这一技术是通向未来智慧城市的必由之路。狭义上来说交通可视化就是对交通系统中产生的数据进行编码，通过图片、图表的方式向用户展示交通数据，支持用户交互的分析交通数据，主要包括对象轨迹的可视化、监控数据的可视化以及路网路况的可视化。轨迹的可视化一般是将交通系统中的实体(比如出租车、公交车、行人等等)的轨迹在地图上用线条的方式进行展示；而监控数据的可视化则可以根据监控的类型分为基于监控事件的可视化和监控视频的可视化；至于路网路况的可视化，则一般是通过热力图等技术可视化实时通行状况和拥堵状况等。

广义的交通可视化则可以理解为在交通智能分析系统中可以利用的所有可视化技术的总和。一个智能分析系统一般可以大致的拆分成数据采集、数据预处理、数据查询和数据分析四个部分。除了数据采集外，其他三个部分都有可视化技术的施展空间。比如，在数据预处理过程中，采集到的原始交通数据可能存在包括重复、缺失在内的各种各样的问题，可视数据清洗可以帮助用户对原始交通数据进行去重、补全等操作，提高数据的可用性；在数据查询过程中，通过可视化的查询界面，帮助用户优化查询条件，分析查询结果等等；在数据分析过程中，可视化技术可以与其他数据分析方法相结合，支持用户干预数据分析流程。

1.交通可视化起源

随着交通系统的完善，人们对于出行的需求越来越迫切。为了提升交通系统对于人们的服务质量，交通数据的可视分析扮演了一个重要的角色。数据可视化虽然是刚兴起的学科，但是可视化方法在交通数据的分析过程中存在已久。

地铁出现至今已有百余年历史，目前最早的地铁工程可追溯至1863年的伦敦大都会铁路。为了向公众展示地铁在城市中的分布情况和站点地址，人们使用线条和圆点在城市地图上直观地表示地铁线路。图1是1907年英国伦敦The Evening News发布的“伦敦地铁地图(Tube Map)”，其中不同的地铁线路使用能够明显区分的颜色进行编码，站点位置均采用地图上的真实位置。

早期地铁线路图通常将视觉元素直接叠加在真实比例的城市地图上。然而在人们出行时，很多时候并不需要考虑准确的站点地理位置，只需要关注“我从某地出发，乘某条线，能到某个站点”这样的信息，就已足够满足出行需要。因此现代地铁图放弃完全贴合真实比例地图，转而使用比较规整的“示意性”布局方案。我们以目前最新的上海城市地铁示意图为例，其中所有用于表示线路的线条均由水平、垂直线和接近45度的斜线段组成，其站点位置的摆放仅大致表达了站点在城市中所处的方位。这种规整的布局设计能使人更加专注于提取“起始点——终点”信息，而无需费力地跟踪原本错综复杂的曲线线条。然而真实比例的地铁地图并不是完全被抛弃，地铁站经常会在非主要位置摆放真实比例图，提供给需要参考准确地理位置的乘客使用。

制作地铁示意图的工作最开始通常由设计师完成，其站点位置完全由人工安排。不过在站点和线路关系复杂的城市中，如何生成这种规整的地铁示意图着实是一门学问。随着优化算法的引入，很多专门的算法都可以用于生成这些地图，并支持加入各种约束条件(如保持整体形状、减少交叉数目、减少使用斜线等)，以生成不同需求下的示意图结果，供设计师和决策者参考。早在一个世纪前，étienne-Jules Marey为了分析火车交通系统的运行状态，设计了一个展示火车时刻的图表。如图3所示，多个时间轴平行分布，每一个时间轴对应一座车站，沿纵向根据车站间地理距离分布。每一条折线连接不同时间轴上的时间点，揭示每一列火车在每个站点停靠的时间。同时，线的斜率反映了火车的速度：越倾斜代表火车速度越快。现在我们称这样的图表为Marey's Graph。

2.可视化方法

交通数据主要指的是由移动设备的位置传感器和安装在道路上的监控器所生成并且收集的数据。例如，出租车GPS轨迹数据记录了车辆实时的精确经纬度位置，手机用户的基站数据记录了手机用户进出的基站序号，道路上的监控设备实时录制、拍摄和计数过往的车辆信息。轨迹数据是一种最常见的交通数据，每一个轨迹记录点不仅包含位置信息，同时还记录了当时的时间。事件日志提供了更多关于城市交通道路上的语义信息，可以增强我们对异常轨迹的理解和分析，比如堵车、车祸等事件。交通数据的可视化方法主要分为三类：统计、时空轨迹和多维编码。

2.1 统计热力图

作为最基本和常见的可视化形式之一，通常用于表达单一数值(如车流量、人数、繁忙程度等)在不同位置上的分布。图4是美国纽约2011年中某一周的出租车运营状况，其中，地图上每个像素点的颜色深浅代表该位置每小时的平均营运量；颜色越深，则代表该位置出租车上下客越频繁。因此在热力图的颜色分布中，我们可直观看到城市繁华地区的出租车客运更加繁忙。

2.2 时空轨迹

轨迹数据蕴含着丰富的时空信息，我们可以从时间和空间角度对轨迹数据进行可视化。轨迹的时间属性主要有线性时间和周期性时间两种。线性时间可以使用基于时间线的可视化方法编码，时间线的两端编码了数据的起始时间。图5中的视图采用时间线的方法可视化了地铁路径选择与时长的关系。从一个站点出发，用户可以根据地铁网络选择任意一个站点下车，水平轴上的长度代表了整一趟旅途所花费的时间。对于周期性的时间，比如周、天、小时，最常用的可视化方法是环形布局。

空间在轨迹分析中是非常重要的属性，人类的社会活动都和位置密切相关。轨迹的空间属性可以基于线进行绘制。Lundblad等人将轮船的航线用折线绘制于地图上，提供船只的监测服务。然而，如果直接绘制大规模的轨迹，屏幕上就会充斥着大量繁杂的轨迹，可视分析系统的使用者就无法进行理解分析。可视化研究者提出了边绑定算法对相似的轨迹进行聚合。图6所示的是美国境内的飞机轨迹。当我们采用边绑定的算法对形状类似的轨迹进行聚类，用户可以清楚地看到美国州与州之间的飞行情况。

2.3 多维编码

热力图和轨迹图等可视化形式一般只能编码较少的维度信息。当数据维度较多时，通用可视化形式开始变得难以驾驭如此复杂的信息，因此需要针对应用场景和分析任务针对性设计合适的视觉编码。例如，时空立方体(Space-Time Cube，STC)是一种表达时空轨迹的常用方法，其中物体的轨迹使用从地图平面逐渐向上方延伸的线条进行表达。为了展现轨迹不同位置上的多种属性(例如人群类型，车辆类型，发生事件的详细信息等)，轨迹线条上还可以在相应位置添加颜色、点、几何图形或是特殊设计的图符等。如图7所示，折线编码了车辆在空间和时间维度上的位置，其中颜色从红到绿编码了移动速度，一些遭遇交通拥堵的轨迹很容易被分辨出来。

在交通智能分析系统中所使用的可视分析技术按照应用类型可以分为查询、统计分析和查询推理三大类。

2.4 查询

城市交通路网分析对于交通管理有一定的指导意义。现有的路网分析方法一般需要布置特定的设备和专业人员现场采集数据，过程也多采取多次试错的方式调节各类模型参数，需要大量的人力和物力。城市交通轨迹数据保存了大量车辆长期行驶记录，数据覆盖城市大部分道路，有利于城市道路整体评估。陈为教授团队提出了一种基于道路的轨迹查询模型，对轨迹数据建立了双向链接哈希索引提升查询效率。他们设计的可视化系统中将道路作为空间查询约束，把道路上车流模式划分为四种拓扑模式：leave，cover，enter和cross。同时，系统提供了刷选工具，分析师可以任意选择道路，通过该道路的车流热力图，统计图等对道路进行评估和分析，见图8。通过实际案例分析，该系统可以发现潮汐车道以及“分水岭”等城市道路的车流模式特征。

对于交通轨迹数据的信息挖掘和知识提取越来越重要，现有的工作大多都围绕对特定地理位置区域和时间段的轨迹数据进行过滤。而对于特定的分析任务，查询难度就大大上升了。例如商场的管理者，希望知道在城市的什么地点放置摆渡车辆。赵烨教授团队研发了一种能够基于语义的大规模轨迹检索方法。系统将海量轨迹数据转换为两种不同的索引文本文件从而支持对出租车和针对行程的快速查询功能。领域专家或管理人员可以通过输入带有语义的查询句子对轨迹进行检索。例如用户可以查询经过特定的街道或地点的轨迹。统计视图、文本视图和环境地图从不同的分析角度展现查询结果。最后团队通过对商场轨迹的实际案例分析，发现了如“商场繁忙路段”、“最爱来商场购物人群”及“最热门商圈”等有价值的信息。

2.5 统计分析

手机位置数据可用于研究城市中的人群流动模式与特征。然而对于城市级别的海量位置数据，分析师首先希望从宏观角度查看和探索整个数据集，得到对数据分布和特征的大致印象。陈为教授团队将用户在手机基站间的流动量作为网络流进行建模，对城市范围内的手机用户的移动行为特征从四个方面进行可视化：①基于基站的流量分析，使用特殊设计的视觉编码展示每个基站上的流量和方向分布；②基站流量的时序特征分析，用于分析基站流量随时间的分布和周期性波动；③基站间流量的密度图可视化，使用密度图方法展示基站间的流动关系和人流密度；④结合社交关系的人群流动可视化，通过在同一社交圈中的手机用户在地域上的移动发掘人群社交关系与地理位置间的关联。

2.6 查询推理“智慧城市”一词萌芽于当今的数据爆炸时代。社交媒体，车辆人流，设施图像等各个领域汇集了海量数据信息。人们开始融合多领域数据，期望得到更加全面的分析结果。多源异构数据的查询与推理能够最直接的结合各个数据集的知识。“Step by step”的数据分析方法利用上一步分析结果，指导并影响下一步的分析，利用推理模式对多数据源的城市数据进行分析。针对查询推理的可视分析工具则能使人更加直观方便的输入查询条件，构建推理流程，得到分析结果。浙江大学陈为教授的团队研发了一种能够应用于城市规划，交通监管和场景再现的可视分析系统。系统通过建立高效的数据索引，提供对多源异构城市数据的查询、展示和推理，可以实现复杂的城市分析任务。系统中，繁琐的城市问题可以被拆分成多个简单的原子查询，从而建立推理流程，完成分析。例如图11案例，微博的博主希望寻回在出租车上丢失的手机。分析人员首先在建筑物信息数据中检索到行程起点和终点的位置。紧接着，通过对出租车轨迹数据的O-D查询，定位到两辆当晚经过起点和终点的出租车。系统通过对出租车轨迹的场景再现，结合出租车的载客状态与微博描述，从而锁定了乘客乘坐的出租车。

3.系统实例本文以多个交通数据可视分析系统的实例介绍交通模式发现和交通态势监控。

交通数据可视化的一个重要目标就是发现和分析交通系统中实体的移动模式。一种移动模式可以描述交通系统中一组实体的移动方式。通过将可视化技术与聚类等数据挖掘的方法相结合，便可以支持用户交互的探索交通数据中实体的移动模式。例如，在TripVista中，就利用了stream map，平行坐标图等可视化技术对一个十字路口中，行人、公交车、轿车、自行车等实体的移动模式进行了可视化的分析。

交通可视化的另一个重要目标就是对交通态势的可视化监控。可视化监控的目标就是从交通监控数据中发现在交通系统中出现的一些意外事件，比如车祸、汽车抛锚等等。一般情况下，交通监控系统产生的数据量是非常庞大的，因为这些系统每时每刻都在不断的产生数据。因此，直接从原始的监控数据中找到交通系统中发生的特殊事件是非常费时且困难的工作。如果利用可视化技术，就可以让用户根据可视化提供的一些视觉线索，从宏观到微观，自顶向下地寻找交通数据中存在的一些事件。比如，AIVis就首先从视频监控中抽取出交通事件，然后再通过可视化的方式展示在隧道中发生的事件；而T-Watcher则是一个监控和分析大城市中复杂交通状况的可视分析系统，通过多种视图来展示城市中不同尺度下的交通情况，引导用户从整个城市的宏观交通情况探索到一个较为微观的尺度中，监控一小部分车辆的行驶情况。

4.结语交通大数据给我们带来了无限的机遇，同时也存在着巨大的挑战。如何理解、分析和预测交通数据，是我们这个时代所面临的问题。可视化是解决分析大规模非结构化交通数据的一把重要的钥匙。通过对交通数据的交互式分析，可视化技术将用户智慧和机器智慧交融反馈，进而优化并且解决交通问题。相信在不久的将来，我们可以享受到更加高效的城市交通系统，生活在一个便捷的智慧城市中。

来源：中国安防展览网

收藏分享

声明：数据猿尊重媒体行业规范，相关内容都会注明来源与作者；转载我们原创内容时，也请务必注明“来源：数据猿”与作者名称，否则将会受到数据猿追责。