基于公交GPS浮动车的交通状态识别研究
2022-05-22
来源:小奈知识网
人工智能与识别技术信息与电脑China Computer&Communication2016年第3期基于公交GPS浮动车的交通状态识别研究肖思思 杨宏业(内蒙古工业大学信息工程学院,内蒙古 呼和浩特 010080)摘 要:城市交通问题日益严峻,发展智能交通系统是目前世界上公认的解决这一问题的最佳措施,其中短时交通状态识别可以说是智能交通系统能够发挥有效作用的基础和前提。笔者提出了直接通过提取车速样本特征进行预测交通状态的方法,避开了对交通流的预测。在综合考虑城市规模、城市公交车数量和交通设施等因素的基础上,以公交车车载GPS数据为基础,以公交车行驶车速为样本特征,采用支持向量机(SVM)完成对道路交通状态的分类。关键词:交通状态识别;支持向量机;数据采集中图分类号:U491 文献标识码:A 文章编号:1003-9767(2016)03-126-02作为智能交通系统的关键技术之一,短时交通状态识别到筛选计算出所需要数据的目的。比如浮动公交数据采集器技术能实时反映路网的服务水平。对短时交通状态进行合理出现临时故障或道路出现临时施工等,这种情况下采集的数识别,并将之作为诱导信息发布出来,不仅能为交通管理部据就不予考虑。实际使用的浮动车信息系统中,可能存在大门实施交通控制和交通诱导策略提供决策依据,还能帮助出量缺失数据。这些不完整数据从数据集中被抽取出后,会导行者选择最佳行驶路线,减少出行时间,从而达到均衡交通致建立不可靠甚至是错误的数据应用模型,以致偏离实际情流、优化交通管理方案、改进交通控制策略的目的,对于预况,给研究工作带来困难。因此,在建模之前对数据进行补防和缓解交通拥堵状况具有积极作用。本文选用公交车作为缺是很有必要的。车载工具,一方面公交车是常用交通工具,另一方面是公交1.3 抽取车速信号路线覆盖城市交通干线,定时循环发车,行驶路线相对于出通过预处理后得到的车辆位置、时间、状态、车速、行租车,其确定性更强。驶方向的GPS数据,从中再抽取车速,得到车速信号样本,利用公交车上安装的GPS全球定位系统,采集所研究本文初步将交通评判标准的服务等级设为畅通、拥挤、拥堵。路段内的公交车速度样本,并分为训练集和测试集,使用支持向量机识别算法对提取的特征向量进行分类,完成对道路2 SVM分类算法研究交通状态的识别,以求得到高精度的识别结果。本文接下来依据样本特征抽取结果,可以来识别一个样本所属的类的组织框架如下。第一部分介绍了采集车速信号样本的具体别是畅通、拥挤和拥堵中的哪一类。本文借助支持向量机对步骤,并在第二部分简要介绍了SVM分类算法,第三部分样本进行测试。详细介绍了实验过程及仿真结果。第四部分对本文进行了总支持向量机(support vector machine,SVM),最初是由结,并提出了改进措施。Vapnik博士提出的以统计学习理论为基础的一种新型机器1 采集车速信号样本学习方法,其可以从本质上提高学习机的泛化能力。支持向量机最初是为二值分类问题设计的,当处理多类问题时,就1.1 数据采集需要构造合适的多类分类器。本课题将交通状态分为三类,利用公交车上安装的GPS全球定位系统,获取所研究就需要组合多个二分类器来实现多分类器的构造,目前构造路段内公交车的平均车速。本课题拟选用内蒙古呼和浩特市SVM多类分类器的方法主要有两类:一类是直接法,即直接新华东街的兴安路口到展东路口作为研究路段,首先因为新在目标函数上进行修改,将多个分类面的参数求解合并到一华东街是该市的主干路,车辆较多,经过兴安路口到展东路个最优问题中,通过求解该最优化问题可以“一次性”实现口的公交车有16路、3路、23路、27路、31路、59路、66多类分类。这种方法看似简单,但其计算复杂度比较高,实路、75路、89路、95路、97路、102路、k1路、青城1号现起来比较困难。因此,本文采用另一类方法,即间接法,线以及青城2号线;其次,道路旁有交通诱导指示大屏(交通过组合多个二分类器来实现多分类器的构造。通指挥中心发布的道路交通状态),其也可以为数据的采集提供重要衡量标准。3 实验过程及仿真结果1.2 数据预处理本文在任意两类样本之间设计一个SVM,k个类别的样公交车上的GPS采集数据量相当大,很多不符合建模本就需要设计k(k-1)/2个SVM,所以本课题的3个类别的样所要求规范和标准,所以需要对原始数据进行预处理,以达本就需要设计3个SVM,通过在Matlab中安装LIBSVM工作者简介:肖思思(1992-),女,湖南衡阳人,在读研究生。研究方向:交通信息处理及其控制。杨宏业(1962-),男,辽宁丹东人,硕士,硕导,教授。研究方向:智能交通。 — 126 —信息与电脑2016年第3期China Computer&Communication人工智能与识别技术具箱来实现这种多分类器的构造。SVM进行训练,最后用得到的模型来预测测试集的分类标签。模型建立过程为:首先需要从原始数据中把训练集和算法流程如图1所示。测试集提取出来,然后进行一定的预处理,之后用训练集对选定训练集和SVM(训练测试集数据预处理选择最佳参数训练c&g集)分类准确率预测(测试集)图1 模型整体流程图采用SVM分类具体步骤如下:果在图3直观显示出来。第一,按照LIBSVM软件包所需要的格式准备数据集。通过对GPS采集到的数据进行预处理,提取出速度特征参数,创建一个速度样本。第二,选定训练集和测试集。在选定的6 653个样本中,选择其中70%的样本作为训练集,剩下30%的数据作为测试集。在选定的训练集中,将样本分为三类,速度30km/h以上的样本属于第一类(类别标签为1),定为畅通;速度在10km/h-30km/h之间的样本属于第二类(类别标签为2),定为拥挤;速度低于10km/h的样本属于第三类(类别标签为3),定为拥堵。通过训练集训练好分类模型,并对测试集进行分类。第三,进行数据预处理。对训练集和测试集进行归一化预处理,即把所有数据都转化为[0,1]之间的数,其目的是取图3 仿真结果图消各维数据间数量级差别,避免因为输入和输出数据数量级4 结 语差别较大而造成网络预测误差较大。本课题采用的数据归一化方法为最大最小法。函数形式如式(1)所示:采用理论分析和仿真分析相结合的方法,通过与实际道xk=(xk-xmin)/(xmax-xmin) (1)路交通状态的对比分析,不断优化参数、完善方案。对优化式(1)中,xmin为数据序列中的最小数;xmax为序列中前后的分类性能进行对比分析,在综合考虑各种可能影响分的最大数。类的因素的基础上,根据核函数仿真结果分析结果,研究、第四,选择最佳参数。SVM用于模式识别时,对于探索SVM分类算法,以探讨分类规律,总结归纳出具有普SVM方法及其参数、核函数及其参数的选择,目前国际上还遍指导意义的规律性,优化并确定最佳状态识别算法。没有形成一个统一的模式,也就是说最优SVM算法参数选择针对所得到的分类的准确率,还可以从以下方面提高:还只能凭借经验、实验对比、大范围搜寻或者利用软件包提供第一,尝试不同的参数寻优方法,以得到最佳的参数c的交互验证功能进行,以此来得到最佳的惩罚参数c和核函数和g。参数g。本课题拟采用网格寻优算法来选择最佳参数c和g。第二,在实验中,只采集了一天的数据,也在一定程度第五,训练和预测。用训练集对SVM分类器进行训练,上影响到样本的准确率。因此,在数据整理方面,应该采集用得到的模型对测试集进行标签预测,最后得到的分类准确多天的数据进行对比分类。率是99.649 5%。运行结果如图2所示:参考文献[1]龚珊.基于浮动车GPS数据的行车速度预测模型研究[D].北京:北京交通大学,2009.[2]吕宏义.基于支持向量回归机的路段平均速度短时预测方法研究[D].北京:北京交通大学,2008.[3]张心哲,关伟.基于多参数状态时间序列的交通状态预测方法[J].交通信息与安全,2009(6):1-5.[4]陆琳,张虹.城市短时交通流预测仿真研究[J].计算图2 运行结果图从图2可以看出,在测试的1 997个样本中,有1 990机仿真,2012(5):326-328.个正确,而此时的参数c=1.231 14,g=0.307 786。测试的结[5]董春娇,邵春福,诸葛承祥.混合状态下城市快速路交通流短时预测[J].物理学报,2012(1):44-52.— 127 —