Intelligent Prediction and Characteristic Recognition for Joint Delay of High Speed Railway Trains
-
摘要: 列车晚点预测及分析直接服务于高速铁路调度指挥, 是列车晚点研究的重点内容. 通过对列车晚点传播结构及传播规律的分析, 提出了一种高速铁路列车连带晚点的智能预测及特征识别方法. 首先利用列车晚点自身传播及相邻线列车晚点传播的关系, 构建基于小波神经网络的列车连带晚点递阶预测模型; 然后利用列车晚点波动的线性组合方程及其结构向量, 进行列车连带晚点影响值的量化; 最后综合连带晚点的实际值、预测值和影响值, 将晚点分为严重晚点、消散晚点、潜在晚点、一般晚点四种类型. 成渝高铁的实例数据表明, 小波神经网络的预测结果具有较高精度, 连带晚点的分类结果也比较符合实际, 能够为高速铁路列车连带晚点的运行调整提供数据支撑.Abstract: The prediction and analysis of train delays is the core content of train delay research, which directly serves the dispatching command of high-speed railway. Based on the propagation structure and law of train delay analyzing, an intelligent prediction and feature recognition method for the large area joint train delay is proposed. Firstly, considering the relationship between train delay propagation and adjacent train delays propagation, a hierarchical prediction model of train delay is constructed using wavelet neural network. Secondly, the linear combination equation of train delay fluctuation and its structural vector are used to quantify the impact value of train delays. Finally, combined with the prediction value and impact value of continuous delays, the joint delay are divided into heavy delay, dissipation delay, potential delay and general delay. The example using the data of Chengdu-Chongqing high-speed railway shows that the prediction results of wavelet neural network have high precision, and the classification results of joint delay are more realistic, which can provide data support for large-area train delayed operation adjustment.
-
高正点率是高速铁路的主要特征, 按图行车也是高速铁路行车组织的基本要求, 但是在实际的执行过程中, 偏离图定计划的高速列车晚点已成为难以避免的现象, 这其中既包括设备故障、天气变化、人员干扰等因素所导致的初始晚点, 又包括初始晚点纵向及横向传播所形成的、不同层次的连带晚点[1]. 与初始晚点(不包括连带影响所形成的初始晚点)相比, 连带晚点的占比更大、规律性更强, 也更易受控制, 因此常常作为行车组织的研究重点[2].
目前, 国内外关于晚点的研究主要集中在晚点致因分析、晚点传播及预测、晚点列车运行调整等三个领域. 关于连带晚点致因, 国内外研究基本上达成了共识, 主要是为了消除初始晚点所带来的列车冲突所致, 并且行车密度越大, 连带晚点的发生频率越高[3-5]. 关于晚点传播及预测, 胡思继等[6]通过对区段内两相邻列车间晚点传播过程及传播规律的分析, 提出了列车后效晚点时间的定义和计算公式; Meester等[7]通过对列车晚点传播规律及其影响程度的分析, 构建了基于铁路网络的列车晚点传播模型; Goverde[8]针对大面积的铁路网系统, 提出了一种计算周期性列车时刻表初始晚点传播的模型和算法; Yuan等[9]提出了一种车站列车晚点传播的随机分析模型, 用于估计线路冲突和晚点换乘连接所引起的连带晚点现象; 黄平等[10]以武广高速铁路的列车运行实际数据为例, 构建了基于随机森林回归的晚点恢复时间预测模型; Zhuang等[11]基于模糊时间知识推理, 提出了列车运行冲突的预测方法. 关于晚点运行调整, Burdett等[12]通过对列车连带晚点情况的仿真分析, 分别采用模拟退火算法和构造算法, 获得了列车运行时刻的最优表; 柏赟等[13]针对交叉线干扰情形下的列车晚点, 提出了一种最优接近速度控制方法; 季学胜等[14]针对高速铁路的晚点区段, 设计了一种基于整数规划的列车运行调整模型. 从上述研究可以看出, 晚点传播及预测不仅是列车晚点研究的核心, 也是晚点列车运行调整的基础, 其基本思路是通过列车晚点传播机理的分析, 构建列车晚点传播的系统网络和计算模型, 进而实现连带晚点预测, 因此, 晚点传播分析可以看作是晚点预测的工作内容.
在晚点数量少、晚点时间短的情况下, 调度人员利用工作经验可以粗略估计短期内的列车连带晚点, 另外, 调度指挥系统也可以提供较为精确的中短期连带晚点数据. 但是对于晚点数量多、行车密度大的列车连带晚点, 则需要采用类似随机森林[15]、灰色理论、神经网络[16]的智能预测方法. 针对高速铁路列车连带晚点较为密集的情况, 本文提出了一种基于小波神经网络的列车连带晚点预测方法, 并且根据连带晚点的预测值及影响值, 构建了连带晚点的特征识别及分类方法, 有别于传统列车晚点严重程度的简单化定义, 结果有助于合理选择列车晚点运行调整方法, 为高速铁路调度指挥策略提供数据支撑.
1. 列车连带晚点预测的问题描述
列车晚点是铁路运输组织中的一种正常现象, 据中国铁路总公司统计, 我国高速铁路 2015年正点率不足90 %[17]. 对于大多数列车晚点而言, 由于列车运行图设置有足够的缓冲时间, 能够避免发生晚点传播所带来的高层次连带晚点现象, 但是对于少数超过缓冲时间吸收能力的列车晚点情况, 大规模列车连带晚点的现象则不可避免.
虽然高层次连带晚点的发生根源是随机性很强的初始晚点, 但是本质上反映了连带晚点的多米诺效应, 不仅具有较为稳定的传播结构, 还具有很强的波动规律, 具体可以体现在列车自身的晚点传播、相邻列车的晚点传播等方面[18]. 以成渝高铁2018年的列车晚点数据为例, 笔者选择了图1所示的成都东至壁山的4个车次, 虽然这4个车次在成都东站出发的晚点时间各不相同, 但是各站的到达晚点时间总体上呈下降趋势, 表示晚点列车在纵向上存在明显的晚点恢复过程. 图2和图3分别为相邻车次在同一车站的到达晚点时间散点图和同一列车在相邻车站的到达晚点时间散点图, 其中图2所示的相邻列车在同一车站的到达晚点时间具有难以描述的复杂关系, 而图3所示的同一列车相邻车站的到达晚点时间则具有较为明显的线性关系, 当置信区间(Confidence interval, CI)取95 %时, 后车到达晚点时间在均值的
$\pm $ 4.7 min范围内波动.理论上, 只要掌握了列车晚点的传播结构及波动规律, 就能进行高层次列车连带晚点的预测. 但是列车晚点传播是一种综合时空属性的网络结构, 其传播程度(包括大小和方向)受铁路网拓扑结构、列车车底使用、列车运行规则、运行图缓冲时间等多种因素影响, 具有明显的非线性、波动性等特征, 使得传统的时间序列或者多元回归模型难以实现列车晚点传播关系的完整描述, 预测精度也不高. 因此, 本文考虑采用能够处理复杂多变量关系的智能型模型来进行列车连带晚点预测, 以提高预测的有效性.
2. 列车连带晚点的预测模型
人工神经网络的研究始于美国心理学家McCulloch和数学家Pitts在1943年提出的二值神经元模型, 该模型将神经元当作一个功能逻辑器件来对待, 后人也称之为MP模型[19]. 经过70多年的发展, 目前已有近40种, 其中最为常见的是反向传播(Back propagation, BP)神经网络模型. BP神经网络是一种多层结构的单向传播前馈型网络, 具有很强的自适应学习能力, 常常用于非线性复杂系统的预测, 但是BP神经网络本身具有收敛速度慢、容易陷入局部极小的问题[20-21].
小波变换(Wavelet transform, WT)兴起于20世纪80年代[22], 是基于傅里叶变换基础上的一种新的时频分析方法, 具有多尺度分析和快速算法能力, 适用于处理空间(时间)和频率的局部化问题[23-24]. 将小波变换与BP神经网络结合起来, 采用小波基函数(替代Sigmoid函数)作为神经网络的激励函数, 能够避免神经网络出现局部最小的非线性优化问题, 并且具有更快的收敛速度、更强的容错能力和逼近能力[25].
2.1 小波神经网络模型
为了预测目标列车在下一车站的连带晚点时间, 假设其影响因素有m个, 构造出图4所示的3层小波神经网络, 其中输入层i包含m个节点, 隐含层j包含n个节点, 输出层k仅有1个节点; ωij为输入层i与隐含层j的连接权值, ωjk为输入层i与隐含层k的连接权值.
选取P个列车连带晚点数据作为网络训练样本, 并且假设第p个样本的输入为
$x_i^p,i = 1,2, \cdots, $ $ m;p = 1,2, \cdots,P \, ,$ 第p个样本的输出为${y^p},p =1, $ $ 2, \cdots,P $ 时, 隐含层j和输出层k的输出分别为$\tag{1a}h_j^p = {\emptyset _j}\left( {\dfrac{{\displaystyle\sum\limits_{i = 1}^m {\omega _{ij}}x_i^p - {b_j}}}{{{a_j}}}} \right)$
(1a) $\tag{1b} {y^p} = \mathop \sum \limits_{j = 1}^n {\omega _{jk}}h_j^p \hspace{48pt}$
(1b) 其中,
$h_i^p$ 是隐含层第j个节点对应第p个样本的输出结果; yp是输出层k对应第p个样本的输出结果;${\emptyset _j}$ 为隐含层j的小波基函数; aj和bj分别为小波基函数${\emptyset _j}$ 的伸缩因子和平移因子. 式(1a)中,${\emptyset _j}$ 常常采用Morlet母小波基函数, 其计算式为${\emptyset _j}\left( x \right) = \frac{{{\rm{cos}}\left( {1.75x} \right)}}{{{ e^{\frac{x^2}{2}}}}}$
(2) 2.2 网络参数的确定
要实现式(1)所示的小波神经网络的计算, 首先需要确定参数ωij, ωjk, aj, bj, 这里可以采用梯度搜索的调整算法, 目标是使输出层的输出与实际值, 即期望输出相吻合.
将目标列车在下一车站的实际连带晚点时间作为期望输出, 并且假设第p个样本的期望输出为
${o^p},{p = 1,2, \cdots,P} $ , 样本p的二次型误差函数为${e^p}\left( t \right) = \frac{1}{2}{\left( {{o^p} - {y^p}} \right)^2}$
(3) 其中, t为迭代次数.
P个训练样本的总误差函数则为
$e\left( t \right) = \mathop \sum \limits_{p = 1}^P {e^p}\left( t \right)$
(4) 结合总误差e来实现网络参数的调整, 具体为
$\tag{5a}{{{\omega }}_{ij}}\left( {t + 1} \right) = {{{\omega }}_{ij}}\left( t \right) - \eta \frac{{\partial e}}{{\partial {{{\omega }}_{ij}}}} \hspace{5pt}$
(5a) $\tag{5b}{{{\omega }}_{jk}}\left( {t + 1} \right) = {{{\omega }}_{jk}}\left( t \right) - \eta \frac{{\partial e}}{{\partial {{{\omega }}_{jk}}}}$
(5b) $\tag{5c}{a_j}\left( {t + 1} \right) = {a_j}\left( t \right) - \eta \frac{{\partial e}}{{\partial {a_j}}} \hspace{18pt}$
(5c) $\tag{5d}{b_j}\left( {t + 1} \right) = {b_j}\left( t \right) - \eta \frac{{\partial e}}{{\partial {b_j}}} \hspace{20pt}$
(5d) 其中, η为网络学习速率,
$\eta \in \left[ {0,1} \right]$ , 具体通过样本训练加以确定, 其更新可以采用AdaGrad算法.小波神经网络参数调整的实现步骤如下:
步骤 1. 初始化. 置函数因子aj, bj和加权系数ωij, ωjk为最小的随机数, 并根据需要确定学习速率η, 预期误差e和最大迭代次数T.
步骤 2. 样本训练. 将包含输入参数和输出参数的样本数据分为训练样本和测试样本, 并将训练样本作为网络的训练数据, 完成网络训练.
步骤 3. 修正网络参数. 利用测试样本测试已经完成训练的网络精度, 并且根据误差e修正网络权值和小波函数的参数, 使网络预测值逼近期望值.
步骤 4. 判断是否结束网络训练. 若网络达到最大迭代次数T或预测结果达到精度要求, 则结束网络训练, 反之则返回步骤2, 继续进行样本训练.
2.3 网络节点数的选取
2.3.1 输入层节点数m的确定
列车连带晚点传播主要有两种形式: 1)列车自身的连带晚点传播; 2)两相邻列车的连带晚点传播[18]. 无论连带晚点传播属于何种形式, 均受到缓冲时间、列车接续、列车运行线等多种因素的影响.
通过对晚点传播因素的分析, 可以梳理出列车连带晚点的7个影响因素: 目标列车在前一车站的到达晚点时间
$\left({{X_1}} \right)$ ; 目标列车在前一车站的停站缓冲时间$\left({{X_2}} \right)$ ; 目标列车在前一车站与目标车站之间的区间缓冲时间$\left({{X_3}} \right)$ ; 前行列车在目标车站的到达晚点时间$\left({{X_4}} \right)$ ; 前行列车与目标列车的图定追踪间隔时间$\left({{X_5}} \right)$ ; 目标列车等级$\left({{X_6}} \right)$ ; 前行列车等级$\left({{X_7}} \right)$ .如果目标列车在下一车站的连带晚点时间用Y来表示, 其预测模型则可以表示为
$Y = f\left( {{X_1},{X_2},{X_3},{X_4},{X_5},{X_6},{X_7}} \right)$
(6) 其中, f是7个影响因素融合到Y的一个非线性映射; X1和X4可以从高速铁路的分散调度集中系统中获得; X1, X3和X5可以通过分析列车运行图获得; X6和X7的取值为1, 2, 3, 表示列车类型分别为高铁、动车和其他车. 很显然, 7也是小波神经网络输入层节点数m的取值.
2.3.2 隐含层节点数n的确定
隐含层节点数的取值与神经网络的训练效果息息相关. 节点数如果太少, 神经网络性能较差, 系统误差较大, 甚至可能达不到训练要求; 节点数如果太多, 网络结构复杂, 训练时间延长, 容易出现“过拟合”情况. 因此, 隐层节点数的确定应在综合考虑网络性能和系统误差大小的基础上进行.
到目前为止, 隐含层节点数的确定都没有找到一种普遍公认的科学合理方法, 多数情况下是综合以往经验和多次实验来获取[26]:
$n = \sqrt {m + k} + \alpha $
(7) 其中, n为隐含层节点数, m输入层节点数, k为输出层节点数. 本文中, m和k的取值分别是7和1, α的取值是1
$\sim $ 10的常数.2.4 连带晚点的递阶预测与误差检验
对于已经确定的列车运行图, 从式(6)可以看出, 目标列车连带晚点预测的可变量是目标列车和前车的历史连带晚点. 因此, 将列车连带晚点的预测值作为当前值, 结合式(1)和式(6), 可以实现连带晚点的递阶预测.
对于预测结果的误差检验, 本文选取了最大绝对误差(Maximum absolute error, MAE)、最大相对误差(Maximum relative error, MRE)、平均绝对误差(Average absolute error, AAE)和平均相对误差(Average relative error, ARE)四个指标. 假设测试样本有G个, 第s个样本的目标列车连带晚点预测值为Ys, 实际值为Rs, 误差的计算式为
$\tag{8a}MAE = \mathop {\max }\limits_{1 \le s \le G} \left| {{Y_s} - {R_s}} \right|$
(8a) $\tag{8b}MRE = \mathop {\max }\limits_{1 \le s \le G} \frac{{\left| {{Y_s} - {R_s}} \right|}}{{{R_s}}}$
(8b) $\tag{8c}AAE = \frac{1}{G}\mathop \sum \limits_{s = 1}^G \left| {{Y_s} - {R_s}} \right| \hspace{5pt}$
(8c) $\tag{8d}ARE = \frac{1}{G}\mathop \sum \limits_{s = 1}^G \frac{{\left| {{Y_s} - {R_s}} \right|}}{{{R_s}}} \hspace{5pt}$
(8d) 3. 列车连带晚点传播及其量化
在晚点列车的运行过程中, 为了避免列车冲突, 同时降低列车运行调整所带来的干扰, 需要将连带晚点非均匀地传播至相邻的站点或者车次, 并且晚点的传播量随着时空距离的增加而减小. 对列车运行图而言, 晚点传播的时间距离可以用运行线的间隔来替代, 晚点传播的空间距离可以用车站的间隔来替代, 据此可以简化列车晚点的传播路径. 假设列车的晚点传播仅能到达邻近的车站和线路, 并且将晚点传播视为关联列车运行线和关联列车停靠站的线性组合, 可以通过求解该线性组合方程, 得到列车晚点的传播结构, 从而量化列车晚点的影响值.
3.1 列车连带晚点的传播及建模
假设列车c在车站d的晚点时间为
${Y_{\left({c,d} \right)}}$ (已经发生用实际值, 否则用预测值), 根据同一列车相邻车站的晚点时间, 可以计算列车c在车站d的晚点时间波动$Y_{\left({c,d} \right)}^b$ , 具体为$Y_{\left( {c,d} \right)}^b = {Y_{\left( {c,d} \right)}} - {Y_{\left( {c,d - 1} \right)}}$
(9) 按照列车晚点传播的假设, 将列车晚点波动简化成时空传播上的线性组合, 即
$\left( {Y_{\left( {c,d + 1} \right)}^b,Y_{\left( {c + 1,d} \right)}^b} \right)T_{\left( {c,d} \right)}^b = Y_{\left( {c,d} \right)}^b$
(10) 式中, 两个系数
$Y_{\left({c,d + 1} \right)}^b,Y_{\left({c + 1,d} \right)}^b$ 分别代表了列车c在车站d的相邻车站晚点时间波动和相邻线路晚点时间波动.式(10)的解
$T_{\left({c,d} \right)}^b = \big({t_{\left({c,d} \right)}^D,t_{\left({c,d} \right)}^C} \big)$ 可以作为列车晚点波动的结构向量, 具体描述了列车晚点波动的空间影响和时间影响.3.2 列车连带晚点传播值的量化
传播结构是列车晚点传播对关联列车运行线和关联列车停靠站的晚点波动影响程度的标度, 因此, 可以将列车晚点波动的结构向量之和视为列车晚点的影响值
$T_{\left({c,d} \right)}^a$ , 具体为$T_{\left( {c,d} \right)}^a = t_{\left( {c,d} \right)}^D + t_{\left( {c,d} \right)}^C$
(11) 4. 列车连带晚点的特征识别
列车连带晚点的特征识别可以从两个方面加以考虑: 1)连带晚点的实际值(或预测值), 用以评价列车按图行车的能力; 2)连带晚点的影响值, 用于评价列车晚点的影响水平. 将连带晚点的实际值(或预测值)视为列车晚点的自身属性, 连带晚点的影响值视为列车晚点的传播属性, 借助空间统计的相关知识, 可以建立二维的Moran坐标系, 具体如图5所示, 其中Y轴为连带晚点的实际值(或预测值), T轴为连带晚点的影响值. 为了消除实际值(或预测值)和影响值的单位差异, 在绘制Moran散点图之前, 需要预先进行标准化处理[27].
坐标系中, Y > 0表示高实际值(或预测值), Y ≤ 0表示低实际值(或预测值); T > 0表示高影响值, T ≤ 0表示低影响值. 根据Y轴和T轴进行交叉划分, 可将连带晚点分为4类, 当T > 0, Y > 0时, 表示列车偏移图定时间长, 晚点波动影响大, 记为严重晚点; 当T > 0, Y ≤ 0时, 表示列车偏移图定时间长, 晚点波动影响小, 记为消散晚点; 当T ≤ 0, Y > 0时, 表示列车偏移图定时间短, 晚点波动影响大, 记为潜在晚点; 当T ≤ 0, Y ≤ 0时, 表示列车偏移图定时间短, 晚点波动影响小, 记为一般晚点.
5. 案例分析
5.1 案例数据描述
根据列车连带晚点要求, 笔者通过对成渝高铁2018年列车运行实际数据的筛选, 获得了171组有效的列车连带晚点数据, 具体如表1所示.
表 1 列车连带晚点的原始数据Table 1 Raw data on joint delayed train序号 X1 (min) X2 (min) X3 (min) X4 (min) X5 (min) X6 X7 Y (min) 1 25 1.23 0.56 22 4.3 1 1 22 2 7 2.37 0.09 7 5.7 1 1 6 3 8 1.66 0.79 9 4.8 1 2 5 4 8 1.85 0.49 7 5.5 1 1 7 5 8 2.16 0.68 10 3.8 1 1 8 6 11 2.24 0.48 11 6.2 2 1 9 $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ 为了避免样本数据大小及单位差异带来的影响, 需要将原始数据归一化至[−1, 1], 具体为
${X_i} = \frac{{2\left( {{x_i} - {x_{i,{\rm{min}}}}} \right)}}{{{x_{i,{\rm{max}}}} - {x_{i,{\rm{min}}}}}} - 1$
(12) 其中,
${x_{i,{\rm{max}}}}$ 和${x_{i,{\rm{min}}}}$ 分别为输入样本的最大值和最小值, Xi为归一化值.5.2 列车连带晚点预测
将表1中序号为1
$\sim $ 151的行数据作为学习样本, 152$\sim $ 171的行数据作为测试样本, 利用小波神经网络模型进行列车连带晚点的预测. 在模型训练过程中, 当学习率η = 0.05 (初始值为0.1), 预测误差e = 0.1的情况下, 模型迭代1 672次能够达到预期效果.为了判断小波神经网络预测模型的优劣, 笔者采用相同的样本数据, 分别构建了多元线性回归、随机森林模型、BP神经网络的预测模型, 其中随机森林模型和BP神经网络都通过了稳定性和误差检验, 以保证对应方法的所选参数达到最优预测效果.
上述四种方法的预测结果如图6和表2所示, 从中可以看出: 1)随着晚点时间的增加, 晚点预测的绝对误差增大, 但相对误差有所减小; 2)小波神经网络的最大相对误差为14.16 %, 平均相对误差为8.01 %, 预测效果好于多元线性回归、BP神经网络和随机森林模型, 后者的最大相对误差分别为51.71 %, 29.54 %和20.60 %, 平均相对误差分别为25.89 %, 14.50 %和11.82 %.
表 2 4种预测方法的误差比较Table 2 Error comparison of four prediction methods预测模型 MAE (min) MRE (%) AAE (min) ARE (%) 多元线性回归 11.38 51.71 4.29 25.89 随机森林 5.92 20.60 2.28 11.82 BP神经网络 6.11 29.54 2.42 14.50 小波神经网络 3.67 14.16 1.46 8.01 为了观测小波神经网络的收敛性, 笔者采用与上述相同的学习率和预设误差进行了随机森林、BP神经网络和小波神经网络的学习训练, 三种方法的收敛过程如图7所示, 从中可以看出, 当预测误差达到0.1时, 小波神经网络需要迭代1 672次, 随机森林和BP神经网络则分别需要迭代1 748次和2 093次, 表示小波神经的收敛速度优于BP神经网络和随机森林模型.
5.3 列车连带晚点特征识别
选取成渝高铁某日15:00
$\sim $ 19:00的列车下行数据为分析对象, 其中15:00$\sim $ 18:00的列车晚点数据为实际值, 18:00$\sim $ 19:00的列车晚点数据为小波神经网络模型的预测值. 通过对晚点传播影响值的计算, 参考图5所示的晚点分类, 得到图8所示的严重程度分级.15:00
$\sim $ 18:00, 成都东至壁山的下行区间出现了21处连带晚点(仅考虑晚点时间大于3 min的情况). 其中严重晚点7处, 集中出现在G8551的华兴村线路所至资阳北、G1831的华兴村线路所至简阳南、G2215的华兴村线路所等站点, 晚点时间均超过13 min, 主要是成都东的发车晚点所致. 晚点车次较为明显的是G8551, 成都东至壁山均出现了晚点现象, 其中严重晚点持续到内江北才开始消散, 到永川东才恢复为一般晚点.18:00
$\sim $ 19:00, 成都东至壁山的下行区间出现了11处连带晚点(仅考虑晚点时间大于3 min的情况), 与实际值进行对比发现, 最大绝对误差均小于3 min. 其中严重晚点3处, 集中出现在G1831的资阳北和资中北、G2215的简阳南等站点, 晚点时间均超过10 min, 主要是前行站点的严重晚点所致. 如G1831, 由于简阳南实际晚点16 min, 导致资阳北和资中北分别晚点13 min和11 min, 并且严重晚点持续到内江北才开始消散, 到荣昌北有明显减小, 最终在永川东恢复正常.对于部分晚点, 如G1837的简阳南和G2163的荣昌北等站点, 即使晚点时间分别达到了14 min和11 min, 但由于其影响值较小, 并且均属于一般晚点, 可以不采取特殊的列车调整措施.
6. 结论
高速铁路列车运行线具有较高弹性, 并不是所有列车的初始晚点或者连带晚点, 都有可能造成相邻列车或其自身的后效晚点. 因此, 有效的晚点预测不仅是对列车偏离图定时间范围的预测, 还需要估计列车晚点传播所带来的影响, 以采取有针对性的运行调整策略. 本文基于列车晚点传播结构及传播规律的分析, 提出了一种大规模列车连带晚点的智能预测及特征识别方法, 其主要结论如下:
1)与多元线性回归、BP神经网络和随机森林等预测模型相比, 基于小波神经网络的连带晚点预测模型可以大幅提高预测精度, 其中最大相对误差在15 %以内, 平均相对误差在9 %以内.
2)综合连带晚点的实际值、预测值和影响值, 将列车晚点分为严重、潜在、消散、一般四种类型, 提高了列车连带晚点的辨识度, 能够为高速铁路调度指挥提供数据支撑.
本文案例所采用的大规模列车晚点数据来源于成都铁路局集团有限公司高速铁路列车调度指挥系统, 虽然剔除了二次或多次干扰所导致的后续列车晚点急剧增加的样本数据, 但是并没有考虑运行调整方案所带来的晚点变化影响, 后续工作将在列车连带晚点样本充足的基础上, 结合列车运行调整方案进行深度研究.
-
表 1 列车连带晚点的原始数据
Table 1 Raw data on joint delayed train
序号 X1 (min) X2 (min) X3 (min) X4 (min) X5 (min) X6 X7 Y (min) 1 25 1.23 0.56 22 4.3 1 1 22 2 7 2.37 0.09 7 5.7 1 1 6 3 8 1.66 0.79 9 4.8 1 2 5 4 8 1.85 0.49 7 5.5 1 1 7 5 8 2.16 0.68 10 3.8 1 1 8 6 11 2.24 0.48 11 6.2 2 1 9 $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ 表 2 4种预测方法的误差比较
Table 2 Error comparison of four prediction methods
预测模型 MAE (min) MRE (%) AAE (min) ARE (%) 多元线性回归 11.38 51.71 4.29 25.89 随机森林 5.92 20.60 2.28 11.82 BP神经网络 6.11 29.54 2.42 14.50 小波神经网络 3.67 14.16 1.46 8.01 -
[1] 孟令云, Goverde R M P. 基于实际数据分析的列车晚点传播过程构建方法与实例. 北京交通大学学报, 2012, 36(6): 15−20 doi: 10.3969/j.issn.1673-0291.2012.06.0031 Meng Ling-Yun, Goverde R M P. A method for constructing train delay propagation process by mining train record data. Journal of Beijing Jiaotong University, 2012, 36(6): 15−20 doi: 10.3969/j.issn.1673-0291.2012.06.003 [2] 周方明, 程先东, 谢美全, 张增勇, 毛保华. 地铁列车初始布点的鲁棒性研究. 物流技术, 2010, 29(8): 47−512 Zhou Fang-Ming, Cheng Xian-Dong, Xie Mei-Quan, Zhang Zeng-Yong, Mao Bao-Hua. Research on the robustness of the initial distribution of metro trains. Logistics Technology, 2010, 29(8): 47−51 [3] 3 Ho T K, Norton J P, Goodman C J. Optimal traffic control at railway junctions. IEE Proceedings-Electric Power Applications, 1997, 144(2): 140−148 doi: 10.1049/ip-epa:19970941 [4] 4 Fay A. A fuzzy knowledge-based system for railway traffic control. Engineering Applications of Artificial Intelligence, 2000, 13(6): 719−729 doi: 10.1016/S0952-1976(00)00027-0 [5] 5 Mazzarello M, Ottaviani E. A traffic management system for real-time traffic optimisation in railways. Transportation Research. Part B, 2007, 41(2): 246−274 doi: 10.1016/j.trb.2006.02.005 [6] 胡思继, 孙全欣, 胡锦云, 杨肇夏. 区段内列车晚点传播理论的研究. 中国铁道科学, 1994, 15(2): 41−546 Hu Si-Ji, Sun Quan-Xin, Hu Jin-Yun, Yang Zhao-Xia. Research on theories of train delay propagation in a railway district. China Railway Science, 1994, 15(2): 41−54 [7] 7 Meester L E, Muns S. Stochastic delay propagation in railway networks and phase-type distributions. Transportation Research, Part B (Methodological), 2007, 41(2): 218−230 doi: 10.1016/j.trb.2006.02.007 [8] 8 Goverde R M P. A delay propagation algorithm for large-scale railway traffic networks. Transportation Research Part C Emerging Technologies, 2010, 18(3): 269−287 doi: 10.1016/j.trc.2010.01.002 [9] 9 Yuan J, Hansen I A. Optimizing capacity utilization of stations by estimating knock-on train delays. Transportation Research, Part B (Methodological), 2007, 41(2): 202−217 doi: 10.1016/j.trb.2006.02.004 [10] 黄平, 彭其渊, 文超, 杨宇翔. 武广高速铁路列车晚点恢复时间预测的随机森林模型. 铁道学报, 2018, 40(7): 1−910 Huang Ping, Peng Qi-Yuan, Wen Chao, Yang Yu-Xiang. Random forest prediction model for Wuhan-Guangzhou HSR primary train delays recovery. Journal of the China Railway Society, 2018, 40(7): 1−9 [11] 11 Zhuang H, Feng L P, Wen C, Peng Q Y, Tang Q Z. High-speed railway train timetable conflict prediction based on fuzzy temporal knowledge reasoning. Engineering, 2016, 2(3): 366−373 doi: 10.1016/J.ENG.2016.03.019 [12] 12 Burdett R L, Kozan E. A sequencing approach for creating new train timetables. OR Spectrum, 2010, 32(1): 163−193 [13] 柏赟, 何天健, 毛保华. 一种交叉线干扰情形下列车晚点恢复运行控制方法. 交通运输系统工程与信息, 2011, 11(5): 114−122 doi: 10.3969/j.issn.1009-6744.2011.05.01713 Bai Yun, Ho Tin-Kin, Mao Bao-Hua. Train control to reduce delays upon service disturbances at railway junctions. Journal of Transportation Systems Engineering and Information Technology, 2011, 11(5): 114−122 doi: 10.3969/j.issn.1009-6744.2011.05.017 [14] 季学胜, 孟令云. 列车到发时刻与进路同步优化的高速铁路列车运行调整模型. 中国铁道科学, 2014, 35(4): 117−123 doi: 10.3969/j.issn.1001-4632.2014.04.1714 Ji Xue-Sheng, Meng Ling-Yun. Train operation adjustment model for synchronously optimizing train arrival/departure time and route on high speed railway network. China Railway Science, 2014, 35(4): 117−123 doi: 10.3969/j.issn.1001-4632.2014.04.17 [15] 袁志明, 张琦, 黄康, 冯姗姗. 基于随机森林的列车到站时间预测方法. 铁道运输与经济, 2016, 38(5): 60−63, 7915 Yuan Zhi-Ming, Zhang Qi. Huang Kang. Feng Shan-Shan. Forecast method of train arrival time based on random forest algorithm. Railway Transport and Economy, 2016, 38(5): 60−63, 79 [16] 孙略添, 宋瑞, 何世伟, 殷玮川. 技术站列车晚点时间预测方法. 北京交通大学学报, 2018, 42(1): 94−98,126 doi: 10.3969/j.issn.1672-8106.2018.01.01316 Sun Lue-Tian. Song Rui. He Shi-Wei. Yin Wei-Chuan. Prediction method of train delay time in technology service station. Journal of Beijing Jiaotong University, 2018, 42(1): 94−98,126 doi: 10.3969/j.issn.1672-8106.2018.01.013 [17] 庄河, 文超, 李忠灿, 汤轶雄, 黄平. 基于高速列车运行实绩的致因 − 初始晚点时长分布模型. 铁道学报, 2017, 39(9): 25−31 doi: 10.3969/j.issn.1001-8360.2017.09.00417 Zhuang He, Wen Chao, Li Zhong-Can, Tang Yi-Xiong, Huang Ping. Cause based primary delay distribution models of high-speed trains on account of operation records. Journal of the China Railway Society, 2017, 39(9): 25−31 doi: 10.3969/j.issn.1001-8360.2017.09.004 [18] 刘宇, 黄凯. 基于极大代数的城际高速列车晚点传播研究. 综合运输, 2017, 39(9): 68−73, 10718 Liu Yu, Huang Kai. Analysis of delay propagation of network using max-plus theory. China Transportation Review, 2017, 39(9): 68−73, 107 [19] 19 McCulloch W S, Pitts W. A logical calculus of the ideas immanent in nervous activity. The Bulletin of Mathematical Biophysics, 1943, 5(4): 115−133 doi: 10.1007/BF02478259 [20] 诸静. 智能预测控制及其应用. 浙江大学出版社, 2002. 130−137Zhu Jing. Intelligent Predictive Control and Its Application. Zhejiang University Press, 2002. 130−137 [21] 朱大奇. 人工神经网络研究现状及其展望. 江南大学学报(自然科学版), 2004, 3(1): 103−110 doi: 10.3969/j.issn.1671-7147.2004.01.02721 Zhu Da-Qi. The research progress and prospects of artificial neural networks. Journal of Southern Yangtze University (Natural Science Edition, 2004, 3(1): 103−110 doi: 10.3969/j.issn.1671-7147.2004.01.027 [22] 22 Grossmann A, Kronland-Martinet R, Morlet J. Reading and understanding continuous wavelet transforms. Wavelets, 1990, 31(9): 2−20 [23] 吕柏权, 李天铎, 吕崇德, 刘兆辉. 一种用于函数学习的小波神经网络. 自动化学报, 1998, 24(4): 548−55123 Lv Bai-Quan, Li Tian-Duo, Lv Chong-De. Liu Zhao-Hui. Wavelet neural network for function learning. Acta Automatica Sinica, 1998, 24(4): 548−551 [24] 王群仙, 李少远, 李俊芳. 小波分析及其在控制中的应用. 控制与决策, 2000, 15(4): 385−389, 394 doi: 10.3321/j.issn:1001-0920.2000.04.00124 Wang Qun-Xian, Li Shao-Yuan, Li Jun-Fang. Wavelet analysis and its applications in control. Control and Decision, 2000, 15(4): 385−389, 394 doi: 10.3321/j.issn:1001-0920.2000.04.001 [25] 王正武, 黄中祥. 短时交通流预测模型的分析与评价. 系统工程, 2003, 21(6): 97−100 doi: 10.3969/j.issn.1001-4098.2003.06.02025 Wang Zheng-Wu, Huang Zhong-Xiang. An analysis and discussion on short-term traffic flow forecasting. Systems Engineering, 2003, 21(6): 97−100 doi: 10.3969/j.issn.1001-4098.2003.06.020 [26] 王嵘冰, 徐红艳, 李波, 冯勇. BP神经网络隐含层节点数确定方法研究. 计算机技术与发展, 2018, 28(4): 37−4126 Wang Rong-Bing, Xu Hong-Yan, Li Bo, Feng Yong. Research on method of determining hidden layer nodes in BP neural network. Computer Technology and Development, 2018, 28(4): 37−41 [27] 陈绍宽, 韦伟, 毛保华, 关伟. 基于改进时空Moran's I指数的道路交通状态特征分析. 物理学报, 2013, 62(14): 1−727 Chen Shao-Kuan, Wei Wei, Mao Bao-Hua, Guan Wei. Analysis on urban traffic status based on improved spatio-temporal Moran's I. Acta Physica Sinica, 2013, 62(14): 1−7 -