交通事故局部时空模式的张量分解可视分析方法

分类:论文范文 发表时间:2021-12-07 08:48

  摘要:交通事故数据中蕴含细粒度的局部时空模式,但它们往往被数据全集所掩盖而难以被发现.找到合适的数据子集是发现有意义的局部时空模式的重要前提,也是最为烦琐的过程.为此,提出基于张量分解方法自动获取数据子集的交通事故局部时空模式可视分析方法.首先,对交通事故数据集进行张量建模;并运用张量分解方法自动获取一组捕获了数据集各维度上的分布特征的向量,以表征数据集的多维模式;然后,利用这组向量指导数据集的聚类划分,从而将数据全集划分为若干有利于发现局部时空模式的数据子集,并设计了一套可视分析系统,以支持用户半自动化探索不同数据子集的局部时空模式和对得到的模式进行可视分析.最后,利用可视分析系统对合肥市交通事故接警数据进行局部时空模式的探索与分析,实验结果得到合肥交警部门相关专家的认同,表明该方法能够有效地辅助用户发掘数据集中所蕴含的局部时空模式.

  关键词:交通事故;可视分析;局部时空模式;张量分解

  随着信息化、智能交通等技术的普及,城市管理部门收集了各种包括时间、位置信息的时空数据[1].能反映城市中人类出行、车辆移动等活动的时空规律,为提高城市管理水平提供了重要依据.但这些数据通常具有海量、多维和动态等特点,给数据分析带来挑战.交通事故数据是重要的时空数据之一,长期积累的海量交通事故数据蕴含有交通事故的相关模式,揭示这些模式对预防和治理交通事故有重要价值.

交通事故局部时空模式的张量分解可视分析方法

  1相关工作

  因为本文面向交通事故数据,基于可视分析方法揭示其局部时空模式,所以将从交通事故数据的可视分析和局部时空模式分析2个方面介绍相关工作.

  1.1交通事故数据的可视分析

  随着相关部门收集交通事故数据越来越多,针对交通事故数据的统计分析方法越来越多.但由于交通事故数据具有复杂的时空等属性信息,传统的统计分析方法难以满足真实场景下的复杂分析要求.可视分析是一种人机结合的新兴数据分析方法[11],重点是通过交互式视觉界面进行分析推理,在解决模糊、复杂问题的分析上有突出优势.近年来,有不少国内外学者将可视分析应用于交通事故数据.Ramos等[12]采用可视分析方法动态检测道路事故聚集区域.Pack等[13]提出了基于Web的可视化分析工具ICE,它提供了对复杂交通事故数据集的用户友好的分析,该工具为用户提供了一套直观的功能,包括数据过滤、地理空间可视化、统计排序功能和多维数据探索功能.vanDaniker[14]描述了面向交通事故管理中心的分析实时和历史交通事故数据的交互系统(trafficincidentmanagementexplorer,TIME).Shafabakhsh等[15]提出基于地理信息系统(geographicinformationsystem,GIS)的事故空间可视化分析方法,并针对Mashhad市的交通事故数据进行案例分析.可视分析目前在交通事故数据方面的应用在国内外都还比较匮乏,研究如何在城市交通事故数据上构建可视分析应用以及进一步设计交互式方法探索交通事故数据中蕴含的模式具有重要学术价值.

  1.2局部时空模式分析

  时空模式反映了数据的时空分布规律,具有重要的应用价值.近年来,已有不少用于分析探索时空数据中的模式的可视分析方法.赵凡等[16]针对多维稀疏时空数据展开研究,最终实现对异常行为的识别.周志光等[17]面向空气质量监测数据的时空多维属性开发可视分析系统,帮助用户交互地探索大气污染的时空特征及潜在规律.这些方法多是基于数据全集进行时空模式分析,无法探索分析局部时空模式.大规模多维时空数据集中蕴含有丰富的局部时空模式,如何高效探索其中的局部时空模式成为一大挑战.对该类数据的时空模式分析多采用多视图聚合的技术以提供对整个数据集的时空分布概览[2,18],系统利用多个视图表达数据的多个维度,并通过筛选和连接等关联更新技术支持跨不同视图的视觉查询[19-20].用户往往需要手动交互迭代不同数据子集发现更细粒度的局部时空模式,由于数据子集组合数目过多,这种方式完全依赖于用户的人工选择,所以效率极其低下.近年来,基于张量的自动化方法被用于时空数据分析中,通过将多维时空数据集建模为张量结构,运用张量分解方法将其分解为一组向量,以表达数据集中的潜在模式[7,21].如对手机GPS数据的时空分析[22]和交通流量数据的时空分析方法[23-24].然而,这些方法不能针对得到的时空模式进行可视化解释和交互迭代的探索分析.将可视化方法与自动化方法相结合,能够有效地解决局部时空模式探索分析困难的问题.Doraiswamy等[25]采用拓扑分析方法自动识别数据集子集中的局部时空异常事件,并对其进行可视化分析.Andrienko等[26]基于自组织映射(self-organizingmap,SOM)方法对时间序列和空间位置进行聚类,以得到具有相似时间或空间分布的类簇.与上述工作不同,本文对交通事故数据中的局部时空模式进行探索分析,将城市交通事故数据建模为张量,并借助张量分解方法得到数据集的多维模式.进一步在聚类支持的交互系统中进行迭代式的局部时空模式探索,并进行可视化分析与解释,以帮助用户逐渐理解数据集、发现与确定有意义的局部时空模式.

  2交通事故数据

  本文所用数据为安徽省合肥市交通事故接警数据.所用数据已经通过去除人员信息、车辆信息等操作进行脱敏处理,主要用于交通事故方面的学术研究.交通事故接警数据记录车主的报案信息,如交通事故地点、时间、涉案车辆数及是否有人员伤亡等.本文选用2015—2018年的5464339条接警数据记录,通过去除无效数据等数据清洗工作后,保留2499581条有效记录.原始数据包含事故发生的时间、地理位置、报警人性别、报警内容和车牌号等字段.因为本文主要关注交通事故的时空属性,所以从原始数据中抽取时间、位置信息,并将其进行相应的转化形成如表1所示的数据结构.

  3基于张量分解的局部时空模式提取

  3.1张量建模

  张量也就是多维数组,天然具有表达多维时空数据的能力,已被广泛应用于建模图像、基因等多维数据[10].对数据集进行张量建模是应用张量分解自动提取模式的前提.

  交通事故数据集是典型的多维时空数据集,可以采用张量进行建模.如交通事故数据包含天(day,D),小时(hour,H)和位置(location,L)这3个常见的维度.采用3阶张量对其进行建模,得到的张量可表示为D??HLx??,如图1所示.

  3.2局部时空模式提取

  局部时空模式提取的关键在于将数据全集划分为若干有意义的数据子集.本文基于张量分解方法自动获取包含局部时空模式的数据子集.本节首先对张量分解方法进行简单概述,然后利用其自动提取模式的特性得到数据集上的多维时空模式,最后基于这组模式指导数据集的聚类划分,可得到蕴含不同局部时空模式的数据子集.

  4局部时空模式可视分析系统

  数据集中可能存在大量潜在局部时空模式,用户需要根据其分析需求进行自定义的探索性分析,以找出其感兴趣和有意义的局部时空模式.第3.2节自动化的局部时空模式提取算法无法满足用户分析的灵活性,且得到的结果不够直观.因此,本文设计了一套支持用户交互探索的局部时空模式可视分析系统,通过参数化设置等交互操作融入用户经验,引导其半自动地探索出有意义的局部时空模式,并可以选择其感兴趣的模式进一步进行可视化解释、对比分析等操作.

  4.1分析任务

  根据本文的目标,可视分析系统应该满足以下分析任务.(1)数据集的多维时空模式认知(T1).原始多维时空数据集中蕴含了沿时间、空间等多个维度的时空分布模式,提取和表达这些模式是理解数据集以及进一步探索局部时空模式的基础.系统应该能够支持数据集的多维时空模式提取,以及进行合适的可视化展示供用户观察.(2)局部时空模式认识(T2).数据全集上的时空分布模式可能会掩盖数据子集上的局部时空模式.因此,系统需要在多维时空模式认知的基础上,进一步支持用户探索不同数据子集上的局部时空模式;并能够帮助用户感知局部时空模式的好坏,提供信息辅助用户进一步优化局部时空模式.(3)不同局部时空模式的比较分析(T3).不同数据子集的局部时空模式存在一定的关联,通过对这些局部时空模式进行对比分析,进一步挖掘局部时空模式产生的原因,有利于对模式的解释.因此,系统需要提供合适的可视化方式展示多个数据子集的时空分布模式.

  4.2系统概述

  基于上述分析任务,本文设计了一个支持局部时空模式探索的可视分析系统.系统整体界面如图5所示,图5区域a所示为采用基于桑基图的设计方式展现数据集的逐步划分的过程;图5区域b所示为参数配置面板,提供自定义参数设置控制数据集划分过程;图5区域c~区域e分别是对选定的一组数据子集的多维时空模式的对比可视化.其中图5区域c通过一组并置的柱状图展示不同数据子集在week维度上的分布模式的对比情况;图5区域d通过一组叠加的折线图表达不同数据子集在hour上的趋势分布;图5区域e为包含行政区域的地图视图,地图上的气泡图表示数据集在相应region上的分布情况,气泡图的大小编码对应的事故数,颜色用于区分选择的不同子集.

  结语

  交通事故数据中蕴含有时空分布模式,但不同数据子集可能具有不同的时空分布,即存在局部时空模式.这些局部时空模式蕴含有细粒度的信息,但也更难分析发现.探索和分析这些局部时空模式,有助于更深入理解交通事故的规律,为相关部门的事故治理和预防提供更有价值和针对性的指导意见.因此,本文提出一种基于张量分解的局部时空模式可视分析方法,以引导用户高效探索和分析交通事故数据中存在的局部时空模式,主要贡献有:

  (1)提出了多维时空数据集的张量建模方法,能够将交通事故数据建模为多个维度的张量结构,以对数据集进行自动分析;(2)设计了一套交互式的可视分析系统,融合张量分解自动模式提取方法,引导用户半自动化探索和分析局部时空模式;(3)针对安徽省合肥市2015—2018年交通事故接警数据进行了案例分析,得到了早高峰模式、工作日模式等一些有意义的模式,验证了方法的有效性.本文分析方法也存在一些局限性:(1)对于交通事故的时空模式分析,只考虑了星期、时段、区域等常用的属性,未来将拓展到道路类型、车流量等更多属性的局部模式分析;

  (2)系统的多维时空模式可视化方式较为简单,只支持简单的对比分析,未来需研究针对多维时空模式的更精细化的可视化方式以及更多的交互分析方式.结合更多交通事故属性,并改进可视化设计,将会是本文方法今后主要的改进目标.

  参考文献(References):

  [1]ZhengY,CapraL,WolfsonO,etal.Urbancomputing:concepts,methodologies,andapplications[J].ACMTransactionsonIntelligentSystemsandTechnology,2014,5(3):ArticleNo.38

  [2]AndrienkoG,AndrienkoN.Spatio-temporalaggregationforvisualanalysisofmovements[C]//ProceedingsoftheIEEESymposiumonVisualAnalyticsScienceandTechnology.LosAlamitos:IEEEComputerSocietyPress,2008:51-58

  [3]AggarwalCC,WolfJL,YuPS,etal.Fastalgorithmsforprojectedclustering[J].ACMSpecialInterestGrouponManagementofDataRecord,1999,28(2):61-72

  [4]BohmC,RailingK,KriegelHP,etal.Densityconnectedclusteringwithlocalsubspacepreferences[C]//Proceedingsofthe4thIEEEInternationalConferenceonDataMining.LosAlamitos:IEEEComputerSocietyPress,2004:27-34

  罗月童,刘新月,郭正跃,刘晓平

上一篇:技术创新背景下的食品产业现状与发展趋势 下一篇:精确农业蔬菜变量施肥决策系统探讨