1雾天高速公路交通安全分级标准 本研究用于风险分级的指标是车头时距和能见度,结合可能出现事故的概率和损失大小为分类依据。在同一能见度下,概率由统计车头时距在不同数据区间内的个数获取。Fisher最优分割方法是对有序数据进行分级的方法,其思想[8]是按照各类(总体)中的方差尽可能小、不同类的方差尽可能大的原则,即类间距离最大而类内离散性最小。其优点是对总体的分布类型没有要求。这表明,分2类时,概率在第1至j-1个数值间的车头时距为第1类,概率在第j到n个数值间的车头时距为第2类;分k类时,1至ik-1的车头时距为前k-1类,剩下的为第k类,即ik为下一类别的第1个样本。
本研究用于风险分级的指标是车头时距和能见度,结合可能出现事故的概率和损失大小为分类依据。在同一能见度下,概率由统计车头时距在不同数据区间内的个数获取。Fisher最优分割方法是对有序数据进行分级的方法,其思想[8]是按照各类(总体)中的方差尽可能小、不同类的方差尽可能大的原则,即类间距离最大而类内离散性最小。其优点是对总体的分布类型没有要求。这表明,分2类时,概率在第1至j-1个数值间的车头时距为第1类,概率在第j到n个数值间的车头时距为第2类;分k类时,1至ik-1的车头时距为前k-1类,剩下的为第k类,即ik为下一类别的第1个样本。
2基于K近邻的雾天交通风险评估方法
根据相似原理,相似条件产生相似结果。在以往研究中,K近邻非参数回归方法多用于在短时交通状态的预报[9-10],并且正确率很高。K近邻非线性预测[11-13]基本思想是在测试样本x的K个近邻中,以出现最多的样本类别作为x的类别,即先对车头时距x的K个近邻一一找出它们的类别,然后对车头时距x的类别进行判别,在K个近邻中出现最多的类别就是x的类别。实际上K近邻思想相当于一种投票机制,即选择前K个离样本最近的已知样本,用它们的类别投票来决定测试样本的类别。
3案例分析
采集数据为双向四车道、平直路段高速公路不同能见度下的车头时距数据,选择能见度和车头时距作为大雾天气条件下高速公路行车风险评估的指标。在数据筛选过程中,将车头时距大于5s的数据、仿真时间前30s以及最后30s的数据均剔除。在Matlab中编写Fisher分割程序,将每种能见度(50,75,…,475和500m)下的车头时距区间统计概率分别进行分类,可得到每种能见度下分类数k与最小误差函数mine(P(n,k))的关系图,例如:能见度为150,200m时的关系如图2所示。从图2中可以看出,在k=2,4时,出现比较明显的拐点,这说明样本分类数为2或4较适合。考虑到中国《突发气象灾害预警信号发布试行办法》和《国家气象灾害应急预案》中对预警信号的分类,预警信号分为4级(4,3,2,1级,它们的颜色依次为蓝色、黄色、橙色和红色),因此,本研究将样本分为4类。分区间统计不同车头时距出现的概率,车头时距越小,则发生事故后损失会越大。按照其特点,绘制不同能见度下车头时距概率的散点图。能见度为275m时,概率散点如图3所示。基于K近邻非参数预测的关键步骤之一是确定近邻个数K。在SPSS中,分析出预测结果相对误差与K的关系(如图4所示),得出最佳的K为7。历史数据库是通过驾驶模拟采集到的大量的数据,将历史样本分为4个类别w1,w2,w3和w4;搜索近邻就是在历史数据库中寻找与当前状态条件特征相似的能见度和车头时距数据,并把搜索到的有相似特征的历史记录标记为一个近邻,所有搜索到的近邻就组成了近邻子集。在SPSS中以70%的数据为训练集,剩余30%的数据为验证集,训练集用于模型训练,验证集用于验证模型的优劣,每条样本数据有能见度和车头时距2个分量。将K近邻模型分别对训练数据集和验证数据集进行检验,得到分类误差,见表2。训练和验证集的分类误差均为0.7%,由此可知该分类标准的模型用于预测效果较好。
4结论
利用驾驶模拟器采集不同能见度下车辆的车头时距数据,结合能见度,对车头时距分区间统计,运用Fisher最优分割思想编写Matlab程序确定将风险分为4级,考虑概率以及损失量大小确定风险分级标准;K近邻非参数回归对预测模型进行验证,训练集及验证集的分类误差均为0.7%,这说明该模型具有有效性。