Pareto-based Multi-objective Optimization of Energy Management for Fuel Cell Tramway
-
摘要: 节能环保的出行方式得到政府的大力推广, 其中燃料电池混合动力有轨电车由于可无网运行且节能环保而备受关注.为了改善燃料电池/超级电容/动力电池大功率有轨电车的燃料经济性与系统耐久性, 提出一种有轨电车能量管理策略(Energy management strategy, EMS)的多目标优化方法. 首先以氢燃料消耗量和能量源性能衰减率作为评价指标, 建立多目标成本函数. 由于两个指标很难在同一个等式中评价, 设计了基于状态机与非支配排序的能量管理Pareto多目标优化方法, 获得了有轨电车能量管理策略Pareto非劣解集, 并分析了能量管理策略的目标功率参数对性能指标的影响规律, 进而遴选出兼顾燃料经济性与系统耐久性的综合最优解. 结果表明, 与功率跟随策略和基于遗传算法优化策略相比, 该能量管理优化方法的燃料经济性分别提高了29.4 %和2.4 %.Abstract: The environment-friendly transportation has been greatly promoted by governments. Because of non-polluting and being operated without nets, fuel cell hybrid tramway has attracted much attention. In order to improve the fuel economy and system durability of fuel cell/supercapacitor/power battery high-power hybrid electric vehicles, a multi-objective optimization method of energy management strategy for tramway is proposed. Firstly, the multi-objective cost function is established by using the hydrogen fuel consumption and the performance degradation rate of each energy source as performance indices. These two performance indeces are difficult to evaluate in one equation, so a Pareto multi-objective optimization method based on the state machine and non-dominated sorting is designed. The Pareto non-inferior solution set of the energy management strategy is obtained, and the influence law of the target power parameters of the energy management strategy on the performance index is revealed, and then the comprehensive optimal solution considering both fuel economy and system durability is selected. The results show that the fuel economy of the energy management optimization method is improved by 29.4 % and 2.4 % respectively, compared with the power following strategy and the genetic algorithm based optimization strategy.
-
Key words:
- Hybrid tram /
- fuel cell /
- energy management /
- Pareto /
- multi-objective optimization
-
1. 背景知识
本节将对宽度学习系统(Broad learning system, BLS)和孪生网络的有关背景知识进行简要的介绍. 我们将分别从方法介绍和应用研究两个角度展开描述, 对算法的有关设计思路以及实际应用进行介绍.
1.1 宽度学习系统
不同于深度学习方法, 宽度学习系统[1]提供了一种新的学习架构. 它不是通过增加网络深度的方式来进行学习, 而是以随机的方式将输入样本特征横向扩展到宽度空间. 宽度学习系统网络主要包括两类结点, 即特征节点和增强节点. 输入宽度学习系统网络的样本数据需要进行处理转化为特征结点和增强结点才可以进行进一步的学习. 其中, 特征节点由输入样本特征以随机的方式映射产生, 增强节点则是从特征节点以随机方式扩展得到. 随后系统将特征节点和增强节点拼接在一起, 通过联合求解得到最终的输出. 不同于以往的深度学习方法, 宽度学习系统需要学习的参数相对较少. 因为特征节点和增强节点的有关参数, 如结点权重和偏差只初始化一次, 在训练过程中只需学习由特征结点和增强结点连接到输出层的权值. 因此, 与深层网络方法相比, 宽度学习系统网络结构相对简单, 所需要学习的参数相对较少, 可以更加快速地对研究内容进行建模, 缩短了响应处理的时间. 图1给出了一种典型的宽度学习系统的网络结构.
1.1.1 方法介绍
宽度学习系统是在随机向量函数链接神经网络(Random vector functional-link neural network, RVFLNN)的基础上构建起来的. 传统的随机向量函数链接神经网络(RVFLNN)直接采用样本数据和生成的增强结点作为网络的输入信息. 而宽度学习系统则是先将输入样本特征映射为特征结点, 由特征结点生成增强结点, 再将特征结点和增强结点一起作为网络的输入信息. 宽度学习系统的构建可以大致分为三个步骤. 首先, 通过预先随机设定的映射矩阵将输入样本特征映射为特征结点. 随后, 生成的特征结点采用随机设定的权重和偏差进一步映射为增强结点. 值得注意的是, 生成特征结点和增强结点的权重和偏差值都是随机初始化的, 在后续的训练过程中不需要做进一步的学习调整. 同时特征结点和增强结点位于网络的同一层次, 这样就从宽度的层面拓展了网络的结构. 最后, 我们将特征结点和增强结点与输出结点连接起来, 并且采用求解伪逆的方法来求解连接的权重. 在这个过程中, 我们规定特征结点以及增强结点与输出结点之间的连接只设置权重, 没有偏差值. 由于不需要像深度学习方法一样通过逐轮的迭代来训练相关的参数, 并且所需要的学习训练的参数相对较少, 宽度学习系统的训练过程相对较快, 从而减少了时间开销.
以分类任务为例子, 宽度学习系统的步骤介绍如下. 我们首先假设输入的样本数据为
${\{} X, Y{\}} \in {\bf{R}}^{N\times(M+C) }$ . 其中X是样本特征数据, Y为样本标签, N代表样本的数量, M表示输入样本特征的维度, C表示类别的数量. 在将输入样本特征转化为特征结点之前, 我们还需要定义参数n和参数p. 其中n表示特征结点的组数, p表示每组特征结点有p个结点. 将输入样本特征转化为特征结点的过程如式(1)所示.$$ {Z_i} = {\varphi _i}(X{W_{zi}} + {\beta _{zi}}),\quad {\rm{ }}i{\rm{ }} = {\rm{ }}1, \cdots ,n $$ (1) 其中,
$X \in {\bf{R}}^{N\times M }$ ,$W_{zi} \in {\bf{R}}^{M\times p }$ ,$\beta_{zi} \in {\bf{R}}^{1\times p }$ . 并且$W_{zi}, \beta_{zi}$ 以随机的方式生成, 分别代表用于产生第i组特征结点的权重和偏差. Zi表示第i组生成的特征结点. 我们将所有的n组特征结点拼接在一起得到最终的特征结点集合$Z^n$ , 其中$Z^n=[{{Z}}_1,\cdots,{{Z}}_n]$ .类似地我们可以规定增强结点的组数为m, 每一组增强结点的个数为q. 则由特征结点生成增强结点的过程如式(2)所示.
$$ {H_j} = {\xi _j}({Z^n}{W_{hj}} + {\beta _{hj}}),\quad{\rm{ }}j{\rm{ }} = {\rm{ }}1, \cdots ,m $$ (2) 其中,
$Z_n \in {\bf{R}}^{N\times np }$ ,$W_{hj} \in {\bf{R}}^{np\times q }$ ,$\beta_{hj} \in {\bf{R}}^{1\times q }$ . 并且$W_{hj}, \beta_{hj}$ 以随机的方式生成, 分别代表用于产生第j组特征结点的权重和偏差. Hj表示第j组生成的特征结点. 我们将所有的m组特征结点拼接在一起得到最终的特征结点集合Hm, 其中$H_m=[{{H}}_1,\cdots, {{H}}_m]$ .在生成增强节点之后, 我们还需要将特征结点和增强结点拼接在一起作为输入层, 经过进一步计算得到输出的结果. 我们设连接输入层与输出层之间的权重为Wnm. 由输入层映射到输出层的过程如式(3)所示.
$$ Y = \left[ {{{{Z}}^{{n}}},{{{H}}^{{m}}}} \right]W_n^m $$ (3) $$ W_n^m = {\left[ {{{{Z}}^{{n}}},{{{H}}^{{m}}}} \right]^ + }Y $$ (4) 其中,
$W_n^m \in {\bf{R}}^{ (np+mq)\times C }$ . 我们可以根据式(4)来计算权重$W_n^m.\ [{{Z}}^n,{{H}}^m]$ 的伪逆$[{{Z}}^n,{{H}}^m]^+$ 可以通过岭回归算法计算得到.1.1.2 应用研究
自从宽度学习系统被提出来以后, 人们又进一步做了许多相关的研究. 宽度学习系统和深度学习方法相比需要训练的参数较少, 网络结构相对简单, 所需要的的时间开销也相对较小, 能够更好地适应实际应用的需求. 近年来在宽度学习系统的应用研究领域, 人们也取得了许多新的成果.
Peng等[2]提出将宽度学习网络应用于网络流量分析领域. 他们设计了一种基于雾计算的架构并在树莓派上进行了实验. 实验结果表明采用宽度学习能够在准确识别网络流量数据的情况下进一步提高训练速度. Zhang等[3]将宽度学习方法应用于人脸面部表情识别领域. 他们在拓展Cohn-Kanad (CK+)数据集上进行了实验, 证明了宽度学习方法在面部表情识别领域的有效性. Gao等[4]提出了一种基于事件的目标检测方法. 他们将宽度学习网络应用于提高事件摄像机的在线训练及推理能力, 并设计了一个梯度下降方法来训练相关的网络参数. Liu等[5]将宽度学习方法应用于半监督分类问题领域. 他们设计了一种流形正则化方法来探索潜在的数据分布, 从而协助提高分类准确度. 这种方法适合于样本数据随时间动态更新的应用领域. 与相关方法的对比实验结果表明Liu等提出的方法能够有效提高分类精度, 同时减少学习时间开销和存储空间消耗. Wang等[6]将宽度学习系统应用于脑电图情绪识别领域. 他们将宽度学习系统与图卷积神经网络结合起来, 提出了一种新的脑电信号处理系统, 即宽度动态图学习系统. 实验结果表明该方法能够有效提高情绪识别的准确度. Chu等[7]提出了一种加权宽度学习网络, 用于处理工业过程中的噪声和异常值. 他们对正常样本和异常样本分别赋予不同的权重来调整不同样本对建模的影响. 来自公共数据集和实际应用的实验结果表明这种方法具有较好的泛化性和鲁棒性.
1.2 孪生网络
孪生网络的概念由Bromley等[8]提出, 并被使用于签名验证领域, 用来验证两个签名笔迹是不是同一个人所书写的. 随着人们研究的深入, 孪生网络的应用范围也得到了进一步的拓广. 例如, 人们可以使用孪生网络来比较文本之间的语义相似度, 或者进行视觉跟踪任务. 虽然孪生网络的应用越来越多样化, 但是这些应用的基本思想是一致的. 那就是通过子网络将输入样本的特征信息映射为新的输出向量, 并且通过比较输出向量之间的相似程度来判断输入样本之间的近似程度. 在构建孪生网络的时候, 人们可以使用相同类型的子网络, 也可以根据实际应用的需求使用不同类型的子网络来构建孪生网络. 子网络之间可以共享权重, 也可以根据实际情况采用不同的权重. 这些子网络可以被视为是用于处理输入样本信息的映射模型, 负责将样本特征映射为指定维度的输出向量. 而训练的目标则是希望同类型样本的输出向量差异尽可能小, 不同类型样本的输出向量差异尽可能大. 近年来人们又对孪生网络的方法做了进一步的研究, 例如通过采用新的距离度量方法来比较输出向量之间的相似性, 或者将正负样本与基准样本同时输入来提高识别的效果. 为了更好地介绍孪生网络, 在方法介绍部分, 我们选择了其中一种典型的孪生网络结构来进行介绍.
1.2.1 方法介绍
我们选择了Nair等[9]提出的网络结构来进行介绍. 他们将孪生网络应用于人脸验证领域, 为后续人们将孪生网络应用于解决实际问题提供了更多的参考. 同时他们提出的孪生网络结构也具有一定的代表性, 能够反映孪生网络方法的基本思想. 在本节内容中, 我们将孪生网络分为特征提取, 相似度度量, 决策判别三个部分进行介绍.
在特征提取过程中, 人们需要将输入样本特征映射为指定的输出向量. 这个过程可以视为是一个降维过程, 将相对复杂的样本数据进行简化, 从而有利于后续对样本信息进行进一步处理. 特征提取过程的另一个作用在于抽取有效的样本信息, 通过训练使得输出向量能够更好地反映样本的类别信息, 从而提高最终识别的准确程度. 为了完成特征提取的任务, 人们可以采用卷积神经网络, 长短时记忆网络作为子网络来进行训练. 在原始版本的孪生网络结构中, 人们倾向于使用两个相同类型的网络作为子网络来进行训练. 子网络之间通常共享权重信息, 这样能够使得同一类别的样本生成的输出向量尽可能接近, 而不同类别样本生成的输出向量尽可能有所差异. 当然, 在实际应用中, 人们根据实际情况的需要也可以采用不同类型的网络作为子网络来进行训练. 同时人们也对共享权值的策略进行了研究, 在一些特殊情况下不共享权重, 而是为不同子网络赋予不同的权重, 可以进一步提高算法的性能[10].
相似度度量用于比较不同样本输出向量之间的相似程度, 从而为最终的决策判别提供依据. 由于输入样本特征已经被转化为指定维度的输出向量, 我们可以根据实际情况的需要采用不同的度量方法来进行衡量, 例如采用欧几里得距离或者余弦距离. 相似度度量的结果也将作为子网络进一步训练的依据, 用于进一步优化网络的结构.
决策判别则是根据相似度度量的结构生成最后的结论. 我们可以通过设置阈值的方式来对相似度度量的结果来进行划分, 也可以将相似度度量的结果转化为判别概率, 代表判别结果属于某一个类别的概率. 图2展示了一种典型的孪生网络结构, 其中的子网络采用相同的网络结构, 并且共享了权重信息.
1.2.2 应用研究
孪生网络在自然语言处理和图像视觉领域都有着广泛的应用, 一些典型的例子列举如下. Baraldi等[11]设计了一种应用于广播视频自动场景分割的深度孪生网络算法. 他们提出了一个新的性能度量方法来进一步提高场景分割的准确程度. 作者同时将视觉与文本数据进行了融合. 与该领域域相关算法的对比实验进一步证明了这种算法的有效性. Melekhov等[12]将孪生网络应用于图像匹配领域. 他们的成果可以被进一步应用于图像检索、三维重建等计算机视觉应用领域. Bertinetto等[13]提出了一种全卷积孪生网络算法用来进行视频目标追踪. 他们将全卷积神经网络用于构建孪生网络. 并且提出了一种新的离线学习策略. 实验结果表明新提出的方法能够有效地提高目标追踪的准确率. Zeghidour等[14]将孪生网络应用于比较说话人和语音之间的相似性. 他们设计了一种联合嵌入架构来提高将说话人身份信息从语音数据中提取出来的准确度. 实验结果表明这种方法在类似的弱监督方法的基础上有了进一步的提高. Neculoiu等[15]研究了如何比较文本内容相似性的问题. 他们采用长短时记忆神经网络来搭建孪生网络. 实验结果表明这种方法能够有效地识别可变长字符串之间的相似性. Rahul 等[16]将孪生网络应用于水下环境的目标追踪问题. 他们考虑了了水下环境光照变化、背景干扰对目标追踪的影响. 有关的实验结果表明作者提出的方法能够更好地克服周围环境的干扰, 进一步提高目标追踪的准确性.
2. 宽度孪生网络
在本节的内容中, 我们将对本文提出的宽度孪生网络算法进行介绍. 我们展示了算法的设计思路, 并将有关的内容将分为特征映射, 相似度度量和决策判别三个部分展开描述.
2.1 特征映射
传统的孪生网络算法在训练的时候需要构造成对的相似数据和不相似数据进行训练, 使得相似样本的输出向量尽可能接近, 不相似样本的输出向量差异尽可能明显. 当训练样本规模增大的时候, 所需要构造的相似对和非相似对数据规模也会显著增大. 如式(5)所示, 在完全图中(即任意两个样本之间都用一条边来描述它们之间的相似关系), 样本数量nSam和构造所有相似对信息的时间复杂度T(nSam)之间满足以下关系:
$$ T\left( {nSam} \right){\rm{ }} = {\rm{ }}nSam\left( {nSam - 1} \right)/2{\rm{ }} = {\rm{ O}}\left( {nSa{m^2}} \right) $$ (5) 其中, 样本数量nSam和构造所有相似对的时间复杂度T(nSam)之间近似满足平方关系. 由于实际应用中的样本数据通常没有直接标注相似对信息, 因此我们往往在训练之前需要人为先构造相似对信息用于训练. 当样本数量nSam较大的时候, 如果为任意两个样本数据构造相似对信息进行训练, 所需要的时间开销和计算资源开销将会明显增加. 这与边缘计算应用要求降低处理延迟, 并且满足终端设备资源受限情况的要求是不相匹配的. 虽然可以通过采样的方式, 只选取部分样本来构造相似对信息进行训练. 但这种方法在训练的时候会丢失部分样本信息, 从而影响最终训练的效果. 显然, 选择怎样的采样策略进行训练将会影响算法最终的性能表现. 人们需要在面对实际问题的时候额外考虑选取合适的采样策略来进行训练. 为了解决这一问题, 我们提出了一种特征映射策略来进行训练.
我们首先分析了传统孪生网络方法在训练的时候需要加入相似对信息进行训练的原因. 通常用孪生网络进行训练的时候, 子网络只是提取了样本数据的一些特征用于进一步的处理判断. 这些特征并不直接与类别信息相关. 以面部表情识别为例, 子网络所提取的特征可能只是面部某个器官的相关数据, 需要我们借助相似对信息来辅助调整子网络的有关参数, 使得同类别样本数据提取的特征差异尽可能小, 不同类别样本数据提取的特征差异尽可能明显.
为了减少对相似对信息的依赖, 使得在没有构造相似对信息的情况下也能够对孪生网络进行训练. 我们提出在映射特征的时候加入类别信息, 通过采用适当的特征映射策略, 使得同一类别样本映射得到的特征尽可能接近, 而不同类别样本映射得到的特征差异尽可能明显.
例如, 我们可以采用独热(One-hot)编码的方式来构造映射后的输出特征向量. 在独热编码中, 假设样本数据的类别数量为C, 则每一个样本在编码后将会得到一个长度为C的输出向量T, T中的每一位代表样本属于对应类别的概率. 在理想情况下, 我们在训练的时候希望向量T只有一位的数值为1, 代表样本属于对应类别的概率为1; 向量T中其他位置的数值为0, 代表样本属于其他类别的概率为0. 如图3(a)所示, 假设两个样本为T1和 T2, 它们之间的欧几里得距离为Eu, T1和 T2的长度为tn, 并且用T1(i)表示T1中的第i个元素
$i=1,2,\cdots,tn$ . 通过计算我们可以得到, 当两个样本属于同个类别的时候, Eu=0, 当两个样本不属于同个类别的时候, Eu=1, 满足孪生网络希望能类别样本的输出向量之间差异尽可能小, 不同样本输出向量之间差异尽可能大的要求. 如果在相似度度量阶段我们采用其他的度量指标, 例如曼哈顿距离, 我们依然能够得到相似的结论, 我们用Ma来表示两个样本T1和 T2之间的曼哈顿距离. 有关的说明过程如图3(b)所示.上述特征映射的过程虽然直观上来看是包含了样本的类别信息, 但其实这些类别信息也是在样本特征向量的基础上经过模型处理才得出的, 因此特征映射的结果也能够在一定程度上反映样本特征信息的特点. 如图4所示, 在图4中, 样本1和样本2的独热编码中数值最高位是不相同的, 但是它们在不同位置上的总体数值分布却有相似的地方, 这说明样本1和样本2的特征分布有相似的地方, 在一定程度上也反映出了样本的特征信息. 在进行相似度计算的时候, 我们不仅仅只比较数值最高位的情况, 还应该考虑其他位置上的数值. 在本文中, 为了简化相似度计算过程以及方便说明, 我们只考虑了映射结果取值最高两位的情况, 具体的相似度计算过程在下一节中将进行计算. 未来我们还可以对上述相似度计算方案做进一步的改进, 例如综合地考虑更多位置上的数值, 以进一步提高分类的准确度. 当然在特征映射的时候, 我们可以对映射的策略做进一步的改进. 例如在独热编码的基础上加入更多的特征信息, 包括与表情相关的人脸活动单元特征, 以进一步丰富输出向量所代表的内容. 一种可能的结合独热编码与额外样本特征信息的混合特征映射方案如图5所示.
在图4中, 我们可以为不同位的编码赋予不同的权重, 以进一步提高混合映射编码对样本信息的表达能力. 在本文的实验中, 为了方便进行说明展示, 我们采用了最简明的独热编码方案作为输出向量的映射策略. 我们将在后续的实验研究内容中, 进一步介绍有关的实验结果.
在对输出向量的映射策略进行介绍之后, 如图6所示, 我们展示了宽度孪生网络的特征映射过程. 我们采用宽度学习系统来构建孪生网络算法中的子网络, 并且采用了共享权重的策略来调整来调整子网络的权重信息. 采用共享权重的策略可以进一步降低训练时所需要的时间和存储空间开销, 从而进一步满足边缘计算应用的需求.
在图5中, X表示样本特征数据, Y为样本标签. 参数n表示特征结点的组数, p表示每组特征结点有p个结点, e表示增强节点的数量. 在生成特征结点的时候, 由输入样本特征根据随机设定的权重和偏差值进行映射, 得到n组特征结点
$Z_1,\cdots, Z_n .$ 将所有特征结点拼接在一起得到最终的特征结点$Z^n,Z^n=[{{Z}}_1,\cdots,{{Z}}_n]$ . 在生成增强结点的时候, 我们将Zn作为一个整体, 同样通过随机设定的权重和偏差值进行映射, 得到增强加点集合H. 我们将特征结点和增强结点拼接在一起作为输入层$[{{Z}}^n,{{H}}]$ . 随后我们定义连接输出向量Y和输入层$[{{Z}}^n,{{H}}]$ 之间的权重矩阵为Wmn, 其中Y采用独热编码方式进行编码. 值得注意的是, 连接输入样本与特征结点之间的系数矩阵是随机设定的. 而连接特征结点和增强结点之间的系数矩阵是正交规范化后生成的随机矩阵. 连接输入层和输出向量之间的只有权重矩阵Wmn, 不设置偏差值. 在训练的时候, 我们可以通过求伪逆的方法来求解Wmn. 已知$Y= [{{Z}}^n,{{H}}^m]W_{mn}$ , 可得$W_{mn}=[{{Z}}^n, {{H}}^m]^+{Y}$ . 其中,$[{{Z}}^n, {{H}}^m]^+$ 是输入层$[{{Z}}^n, {{H}}^m]$ 的伪逆, 可以通过岭回归的方法得到[9].2.2 相似度度量
在相似度量阶段, 我们需要对特征映射阶段得到的输出向量进行度量, 以进一步得到它们之间的相似程度. 我们首先对输出向量的结构进行分析, 以进一步确定适合的相似度度量方案. 如图7所示, 在独热编码中, 输出向量T中的每一位可以代表样本属于该类别的概率. 在通常情况下, 我们只用取值最高的一位来代表样本的类别信息. 然而如图1所描述, 编码中其他位置上的数值也在一定程度上包含了样本的信息. 在进行相似度计算的时候我们应该适当考虑其他位置上的数值, 以便得到更加准确的结果. 在常用的欧几里得距离公式中, 我们需要考虑每一位的数值对相似度度量结果的影响, 这在一定程度上影响了最终相似度的判定结果. 但这种做法容易受到极端值的影响. 考虑到编码中数值较高的几位往往与样本的关系更加密切, 我们设计了一种新的相似度度量方法. 在这种方法中, 我们只比较输出向量T中取值较高的几位数值来得到最终的相似度度量结果. 我们首先假设需要比较相似度的两个输出向量分别为输出向量T1
和 T2, 并且假设输出向量T1和 T2中取值最大的位置分别为第M1和M2位, 对应位置的取值分别为T1(M1), T2(M2). 如果M1 = M2, 我们规定最终的相似度度量结果 $$ D{\rm{ }} = \sqrt{\left( {{T_1}\left( {{M_1}} \right){\rm{ }} - {\rm{ }}{T_2}\left( {{M_2}} \right)} \right)^2} $$ (6) 如果M1 ≠ M2, 我们规定
$$ D{\rm{ }} \!=\! \sqrt{ {\rm{ }}{\left( {{T_1}\left( {{M_1}} \right){\rm{ }} \!-\! {\rm{ }}{T_2}\left( {{M_1}} \right)} \right)^2} \!+\! {\rm{ }}{\left( {{T_1}\left( {{M_2}} \right){\rm{ }} \!-\! {\rm{ }}{T_2}\left( {{M_2}} \right)} \right)^2}} $$ (7) 得到的D即是输出向量T1和 T2之间的相似度, 用于决策判别阶段得到最终的判别结果.
2.3 决策判别
在决策判别阶段, 我们采用设定阈值的方式来得到最终的判别结果. 对于输出向量T1和 T2之间的相似度D, 我们设定判别阈值为φ. 如果D > φ, 我们认为输出向T1和 T2对应的样本属于不同的类别. 如果D ≤ φ, 我们认为输出向量T1和 T2对应的样本属于相同的类别. 我们研究了阈值φ的设置对最终判别结果准确度的影响, 并绘制了相应的ROC曲线图像. 有关的实验结果将在实验研究部分进行进一步的说明.
3. 实验研究
在本节中, 我们将对有关实验研究的内容进行介绍. 我们将首先介绍实验的总体情况, 随后展示对比实验的结果. 与此同时, 我们也研究了相似性度量指标对宽度孪生网络算法识别准确度的影响. 最后, 我们对实验结果进行了总结分析.
3.1 实验介绍
在本次实验中, 我们采用了CK+、 MNIST等常见分类数据集来进行有关的实验. 有关数据集信息如表1所示. 其中, CK+、 JAFFE数据集是常见的人脸表情分类数据集. MNIST、 USPS是有关于手写体数字识别的数据集. 我们在不同的数据集中采用了不同的参数设置. 宽度孪生网络算法在不同数据集上的参数设置信息如表2所示. 为了证明我们提出的宽度孪生网络算法能够在保证分类准确度的同时降低训练时间, 减少内存等计算资源开销. 我们在对比实验中将宽度孪生网络算法与基于深度学习的孪生网络算法进行了比较, 比较的指标包括了分类准确度, 训练时间和内存开销. 与此同时, 我们也研究了相似度度量指标对宽度孪生网络算法性能的影响. 我们在一台配置了16 GB内存以及Intel i7 1.61 GHz中央处理器的笔记本电脑上进行了上述的实验内容. 最后, 我们对有关的实验内容进行了分析总结.
表 1 实验数据集信息表Table 1 Table of data set for experiments数据集 样本
规模类别
数量各类别样本数量 特征
维度CK+ 5876 7 (1022, 233, 868, 546, 1331, 547, 1329) 14400 MNIST 70000 10 每个类别近似 7000 样本 784 JAFFE 213 7 (30, 29, 32, 31, 30, 31, 30) 14 400 USPS 20000 10 每个类别 2 000 样本 784 表 2 宽度孪生网络参数设置信息Table 2 Table of parameters for broad Siamese network数据集 n p e CK+ 8 10 9000 MNIST 10 10 500 JAFFE 8 10 9000 USPS 10 10 1500 3.2 对比实验结果
我们在CK+、 JAFFE、 MNIST、 USPS等分类数据集上进行了对比实验, 比较的指标包括了分类准确度, 训练时间和内存开销. 考虑到在基于深度学习的孪生网络算法中, 随着网络结构复杂度的加深, 算法的训练时间和内存开销会明显增加. 为了更好地证明我们提出的宽度孪生网络算法能够有效地减少训练时间和内存开销, 我们使用结构相对简单的三层全连接神经网络来构建孪生网络, 并进行了有关的对比实验. 这个全连接网络每一层结点个数的设置如表3所示.
表 3 对比算法中全连接神经网络结点个数设置信息Table 3 Table of number about nodes in the fully connected network for comparison数据集 第一层结点数 第二层结点数 第三层结点数 CK+ 512 128 512 MNIST 16 16 16 JAFFE 1024 128 1024 USPS 128 128 128 在准确度方面, 我们比较了算法最终得到的准确率(如表4所示), 并绘制比较了算法准确度随阈值变化的曲线(图8)以及受试者工作特征(ROC)曲线(图9). 有关训练时间和内存开销的实验结果如表5和 表6所示.
表 4 准确率实验结果Table 4 Table of experiment results about accuracy数据集 宽度孪生网络 基于全连接神经网络的孪生网络 CK+ 0.9788738 0.9287094 MNIST 0.9798112 0.9777414 JAFFE 0.9217687 0.9206349 USPS 0.9536075 0.9505025 表 5 训练时间实验结果Table 5 Table of experiment results about training time数据集 宽度孪生网络 基于全连接神经网络的孪生网络 CK+ 94.140997 567.9896214 MNIST 5.6314652 60.0518959 JAFFE 58.4795067 1105.1385579 USPS 3.0834677 29.8392925 表 6 内存开销实验结果Table 6 Table of experiment results about memory overhead数据集 宽度孪生网络 基于全连接神经网络的孪生网络 CK+ 3.3491211 6.0307884 MNIST 2.4598732 2.0554810 JAFFE 0.2893066 5.6162262 USPS 1.2569504 0.8804893 为了进一步地探索相似性度量指标对宽度孪生网络算法性能的影响, 我们在接下来的内容中进一步设计了有关的研究实验, 并给出了相应的实验结果.
3.3 相似性度量指标分析
在相似性度量指标的有关研究实验中, 我们比较了欧几里得距离、曼哈顿距离等度量指标与本文提出的相似度度量方法对宽度孪生网络性能的影响. 我们按照实验结果绘制了准确率随阈值变化的曲线(如图10所示)以及受试者工作特征曲线(如图11所示).
通过观察图10和图11中的实验结果, 我们可以看到本文新提出的度量方法与传统的欧几里得距离、曼哈顿距离等度量方法相比, 能够有效地进一步提高宽度孪生网络的分类准确度, 具有进一步应用于解决实际问题的潜力.
3.4 结果分析
通过前面的实验内容, 我们可以看到宽度孪生网络算法相比于基于传统深度学习方法的孪生网络方法, 能够在保证分类准确度的前提下降低训练时间和内存资源开销, 具有进一步应用于边缘计算应用的潜力. 与此同时, 我们研究了相似性度量指标对宽度孪生网络算法分类准确度的影响, 并且证明了我们提出的相似性度量方法能够进一步提高宽度孪生网络算法的分类准确度, 未来可以再做进一步改进以提高算法的分类准确度. 由于大多数的边缘计算应用要求减少相应延迟, 降低计算资源开销, 我们提出未来可以进一步研究以将基于浅层网络的方法应用于提高边缘计算应用的性能.
4. 结论
在本文中, 我们提出了一种面向边缘计算应用的宽度孪生网络算法. 我们考虑了边缘计算应用要求降低处理延迟, 满足边缘设备资源受限的情况, 提出可以将宽度学习系统应用于边缘计算应用之中. 为了验证本文观点, 我们将宽度学习系统与孪生网络相结合, 提出了宽度孪生网络算法, 并应用于解决分类问题. 与传统基于深度学习的孪生网络方法相比, 宽度孪生网络算法能够在满足分类准确度要求的情况下, 进一步降低训练时间以及内存资源开销. 这说明借助宽度学习系统能够有效降低处理延迟, 减少计算资源消耗, 从而更好地满足边缘计算应用的要求. 在文章的最后, 我们对未来的研究方向进行了展望. 我们可以进一步改进宽度孪生网络方法, 用于解决更多的实际分类问题, 并应用到边缘计算应用之中. 例如, 自动驾驶车辆上的交通标识识别以及监控视频中的对象追踪应用. 本文算法可以做进一步的改进, 以适应这些应用要求低延迟、低资源开销的特点. 与此同时, 我们也可以进一步探索浅层网络方法如宽度学习系统在边缘计算领域的应用. 借助宽度学习系统等浅层网络方法进一步提高边缘计算应用的性能.
-
表 1 电车运行状态和对应策略
Table 1 Operating state and strategy of tramway
运行状态 策略 S1: FC 牵引 ${P_{\rm{d}}}= {P_{\rm{fc} }}$ S2: FC + SC 牵引 ${P_{\rm{d}}}= {P_{\rm{fc} }} + {P_{\rm{sc}}}$ S3: FC + SC + BT 牵引 ${P_{\rm{d}}} = {P_{\rm{fc} }} + {P_{\rm{sc}}} + {P_{\rm{bat}}}$ S4: 低功率 SC 充电 ${P_{\rm{d}}}= {P_{\rm{fc} }} - \left| {{P_{\rm{sc}}}} \right|$ S5: 低功率 BT 充电 ${P_{\rm{d}}}= {P_{\rm{fc} }} - \left| {{P_{\rm{bat}}}} \right|$ S6: 惰行/停车 SC 充电 ${P_{\rm{d}}}= {P_{\rm{fc} }} - \left| {{P_{\rm{sc}}}} \right|$ S7: 惰行/停车 BT 充电 ${P_{\rm{d}}} = {P_{\rm{fc} }} - \left| {{P_{\rm{bat}}}} \right|$ S8: 再生制动 + 机械制动 $\left| {{P_{\rm{d}} }} \right|{\rm{ + }}{P_{\rm{fc}}}= \left| {{P_{\rm{sc}}}} \right| + \left| {{P_{\rm{bat}}}} \right| + \left| {{P_{\rm{mb}}}} \right|$ S9: 高功率再生制动 $\left| {{P_{\rm{d}}}} \right| + {P_{\rm{fc}}}= \left| {{P_{\rm{sc}}}} \right| + \left| {{P_{\rm{bat}}}} \right|$ S10: 低功率再生制动 $\left| {{P_{\rm{d}}}} \right|{\rm{ + }}{P_{\rm{fc}}} = \left| {{P_{\rm{sc}}}} \right|$ 表 2 燃料电池电压衰减值
Table 2 Fuel cell voltage degradation rates
运行状态 符号 衰减值 启停 $V_1'$ 23.91 μV·周期−1 空转 $U_1'$ 10.17 μV·h−1 负载变化 $V_2'$ 0.0441 μV·ΔkW−1 高功率运行 $U_2'$ 11.74 μV·h−1 表 3 不同DOD范围下允许消耗的循环次数
Table 3 DOD ranges and lifespan cycles
DODi 范围 LCbati LCsci DOD1 (10 %) 70 000 106 DOD2 (20 %) 31 000 106 DOD3 (30 %) 18 100 106 DOD4 (40 %) 11 800 106 DOD5 (50 %) 8 100 106 DOD6 (60 %) 5 800 106 DOD7 (70 %) 4 300 106 DOD8 (80 %) 3 300 106 DOD9 (90 %) 2 500 106 表 4 列车主要仿真参数
Table 4 The main simulation parameters of tramway
参数 取值 参数 取值 列车质量 (t) 66 最高车速 (km·h−1) 50 机械传动比 6.28 最大加速度 (m·s−1) 1 惯性质量系数 0.09 最大减速度 (m·s−1) 1 基本阻力系数 A0 2.59 整车辅助功耗 (kWh) 30 基本阻力系数 B0 0.0917 DC/DC 效率 92 % 基本阻力系数 C0 0.000775 DC/AC 效率 90 % 表 5 PEMFC系统参数
Table 5 The PEMFC system parameters
参数 取值 额定电压 (V) 540 额定功率 (kW) 150 最大功率 (kW) 170 单电池数量 (个) 735 最大电流 (A) 320 表 6 辅助能量源单体参数
Table 6 The parameters of auxiliary power units
动力电池参数 取值 超级电容参数 取值 额定电压 (V) 3.2 额定电压 (V) 2.7 额定容量 (Ah) 40 额定容量 (F) 3 000 工作温度 (℃) −20$\sim $45 工作温度 (℃) −40$\sim $60 内阻 (mΩ) $ \le 2$ 内阻 (mΩ) 0.29 表 7 性能指标分析总结
Table 7 Analysis and summary of performance index
表 8 不同策略下的性能指标对比
Table 8 The performance index of different EMS
性能指标 功率跟随
策略基于 GA
优化基于Pareto
多目标优化燃料消耗量 (kg) 3.43 2.48 2.42 燃料电池性能衰减率 (%) 2.42 × 10−3 1.18 × 10−3 1.15 × 10−4 超级电容性能衰减率 (%) 3.2 × 10−3 3.3 × 10−3 2.9 × 10−3 动力电池性能衰减率 (%) 1.43 × 10−3 3.23 × 10−3 1.43 × 10−3 燃料电池系统效率 (%) 53.3 55.6 55.7 -
[1] 1 Kasimalla V K R, G N S, Velisala V. A review on energy allocation of fuel cell/battery/ultracapacitor for hybrid electric vehicles. International Journal of Energy Research, 2018, 42: 4263−4283 doi: 10.1002/er.4166 [2] 2 Scheepmaker G M, Goverde R M P, Kroon L G. Review of energy-efficient train control and timetabling. European Journal of Operational Research, 2017, 257(2): 355−376 doi: 10.1016/j.ejor.2016.09.044 [3] 吴铁洲, 王越洋, 许玉姗, 郭林鑫, 石肖, 何淑婷. 基于 PMP 算法的 HEV 能量优化控制策略. 自动化学报, 2018, 44(11): 2092−21023 Wu Tie-Zhou, Wang Yue-Yang, Xu Yu-Shan, Guo Lin-Xin, Shi Xiao, He Shu-Ting. Energy optimal control strategy of HEV with PMP algorithm. Acta Automatica Sinica, 2018, 44(11): 2092−2102 [4] 叶佩军, 吕宜生, 吉竟初. 基于社会网络视角的交通仿真和计算实验研究分析. 自动化学报, 2013, 39(9): 1402−14124 Ye Pei-Jun, Lv Yi-Sheng, Ji Jing-Chu. Literature analysis for traffic simulation and computational experiments based on social networks. Acta Automatica Sinica, 2013, 39(9): 1402−1412 [5] 5 Han Y, Li Q, Wang T H, Chen W R, Ma L. Multi-source coordination energy management strategy based on SOC consensus for a PEMFC–Battery–Supercapacitor hybrid tramway. IEEE Transactions on Vehicular Technology, 2018, 67(1): 296−305 doi: 10.1109/TVT.2017.2747135 [6] 6 Zhang W B, Li J Q, Xu L F, Ouyang M G. Optimization for a fuel cell/battery/capacity tram with equivalent consumption minimization strategy. Energy Conversion and Management, 2017, 134: 59−69 doi: 10.1016/j.enconman.2016.11.007 [7] 7 Dong H R, Zhu H N, Gao S G. An approach for energy-efficient and punctual train operation via driver advisory system. IEEE Intelligent Transportation Systems Magazine, 2018, 10(3): 57−67 doi: 10.1109/MITS.2018.2842030 [8] 8 Olatomiwa L, Mekhilef S, Ismail M S, Moghavvemi M. Energy management strategies in hybrid renewable energy systems: a review. Renewable and Sustainable Energy Reviews, 2016, 62: 821−835 doi: 10.1016/j.rser.2016.05.040 [9] 林泓涛, 姜久春, 贾志东, 程龙, 齐洪峰, 韦绍远. 权重系数自适应调整的混合储能系统多目标模型预测控制. 中国电机工程学报, 2018, 38(18): 5538−55479 Lin Hong-Tao, Jiang Jiu-Chun, Jia Zhi-Dong, Cheng Long, Qi Hong-Feng, Wei Shao-Yuan. Multi-objective model predictive control for hybrid energy storage system with adaptive adjustment of weight coefficients. Proceedings of the Chinese Society for Electrical Engineering, 2018, 38(18): 5538−5547 [10] 10 Zhang P, Yan F, Du C Q. A comprehensive analysis of energy management strategies for hybrid electric vehicles based on bibliometrics. Renewable and Sustainable Energy Reviews, 2015, 48: 88−104 doi: 10.1016/j.rser.2015.03.093 [11] 11 Zhang H, Yang J B, Zhang J Y, Song P Y, Xu X H. A firefly algorithm optimization-based equivalent consumption minimization strategy for fuel cell hybrid light rail vehicle. Energies, 2019, 12(14): 2665 doi: 10.3390/en12142665 [12] 12 Garcia P, Fernandez L M, Torreglosa J P, Jurado F. Comparative study of four control systems for a 400-kW fuel cell battery–powered tramway with two dc/dc converters. International Transactions on Electrical Energy System, 2013, 23: 1028−1048 doi: 10.1002/etep.1636 [13] 杨继斌, 宋鹏云, 张继业, 陈彦秋, 王国梁. 燃料电池混合动力列车建模与运行控制研究. 铁道学报, 2017, 39(9): 40−47 doi: 10.3969/j.issn.1001-8360.2017.09.00613 Yang Ji-Bin, Song Peng-Yun, Zhang Ji-Ye, Chen Yan-Qiu, Wang Guo-Liang. Research on modeling and operation Control of fuel cell hybrid power train. Journal of the China Railway Society, 2017, 39(9): 40−47 doi: 10.3969/j.issn.1001-8360.2017.09.006 [14] 王钦普, 游思雄, 李亮, 杨超. 插电式混合动力汽车能量管理策略研究综述. 机械工程学报, 2017, 53(16): 1−1914 Wang Qin-Pu, You Si-Xiong, Li Liang, Yang Chao. Survey on energy management strategy for plug-in hybrid electric vehicles. Journal of Mechanical Engineering, 2017, 53(16): 1−19 [15] Xu L F, Ouyang M G, Li J Q, Yang F Y. Dynamic programming algorithm for minimizing operating cost of a PEM fuel cell vehicle. In: Proceedings of the 21st IEEE International Symposium on Industrial Electronics. Hangzhou, China: IEEE, 2012. 28−31 [16] 杨继斌, 徐晓惠, 张继业, 宋鹏云. 燃料电池有轨电车能量管理策略多目标优化. 机械工程学报, 2018, 54(22): 153−15916 Yang Ji-Bin, Xu Xiao-Hui, Zhang Ji-Ye, Song Peng-Yun. Multi-objective optimization of energy management strategy for fuel cell tram. Journal of Mechanical Engineering, 2018, 54(22): 153−159 [17] 17 Li M G, Li M, Han G P, Liu N, Zhang Q M, Wang Y O. Optimization analysis of the energy management strategy of the new energy hybrid 100% low-floor tramcar using a genetic algorithm. Applied Sciences, 2018, 8(7): 1144 doi: 10.3390/app8071144 [18] 苏兆品, 张国富, 蒋建国, 岳峰, 张婷. 基于非支配排序差异演化的应急资源多目标分配算法. 自动化学报, 2017, 43(2): 195−21418 Su Zhao-Pin, Zhang Guo-Fu, Jiang Jian-Guo, Yue Feng, Zhang Ting. Multi-objective approach to emergency resource allocation using none-dominated sorting based differential evolution. Acta Automatica Sinica, 2017, 43(2): 195−214 [19] Jain M, Desai C, Kharma N, Williamson S S. Optimal powertrain component sizing of a fuel cell plug-in hybrid electric vehicle using multi-objective genetic algorithm. In: Proceedings of the 35th Annual Conference of IEEE. Porto, Portugal: IEEE, 2009. 3741–3746 [20] 李连升, 邓楼楼, 梅志武, 吕政欣, 刘继红. 聚焦型X 射线脉冲星望远镜Pareto多目标优化与多场耦合分析. 机械工程学报, 2018, 54(23): 174−18420 Li Lian-Sheng, Deng Lou-Lou, Mei Zhi-Wu, Lv Zheng-Xin, Liu Ji-Hong. Pareto-based multi-objective optimization of focusing X-ray pulsar telescope and multi-physics coupling analysis. Journal of Mechanical Engineering, 2018, 54(23): 174−184 [21] 21 Yang J B, Xu X H, Peng Y Q, Zhang J Y, Song P Y. Modeling and optimal energy management strategy for a catenary-battery-ultracapacitor based hybrid tramway. Energy, 2019, 183: 1123−1135 doi: 10.1016/j.energy.2019.07.010 [22] 杨继斌, 宋鹏云, 张继业, 王国梁, 张晗. 混合动力现代有轨电车仿真系统研究. 机械工程学报, 2017, 53(18): 161−16822 Yang Ji-Bin, Song Peng-Yun, Zhang Ji-Ye, Wang Guo-Liang, Zhang Han. Research on simulation system of hybrid modern tramway. Journal of Mechanical Engineering, 2017, 53(18): 161−168 [23] Spiegel C. PEM Fuel Cell Modeling and Simulation Using MATLAB. NewYork: Academic Press, 2008. 335−364 [24] 24 Tremblay O, Dessaint L A. Experimental validation of a battery dynamic model for EV applications. World Electric Vehicle Journal, 2009, 3(2): 289−298 doi: 10.3390/wevj3020289 [25] Ehsani M, Gao Y, Longo S, Ebrahimi K. Modern Electric, Hybrid Electric, and Fuel Cell Vehicles: Fundamentals, Theory, and Design (Second Edition). Boca Raton: CRC Press, 2018. 337−370 [26] 26 Herrera V I, Gaztanaga H, Milo A, Saez-de-Ibarra A, Etxeberria-Otadui I, Nieva Txomin. Optimal energy management and sizing of a battery-supercapacitor-based light rail vehicle with a multiobjective approach. IEEE Transactions on Industry Applications, 2016, 52(4): 3367−3377 doi: 10.1109/TIA.2016.2555790 [27] 27 Fang L C, Qin S Y, Xu G, Li T L, Zhu K M. Simultaneous optimization for hybrid electric vehicle parameters based on multi-objective genetic algorithms. Energies, 2011, 4(3): 532−544 doi: 10.3390/en4030532 [28] 28 Chen H C, Pei P C, Song M C. Lifetime prediction and the economic lifetime of proton exchange membrane fuel cells. Applied Energy, 2015, 142: 154−163 doi: 10.1016/j.apenergy.2014.12.062 [29] 29 Fletcher T, Thring R, Watkinson M. An energy management strategy to concurrently optimise fuel consumption & PEM fuel cell lifetime in a hybrid vehicle. International Journal of Hydrogen Energy, 2016, 41(46): 21503−21515 doi: 10.1016/j.ijhydene.2016.08.157 [30] 瞿凯平, 李昊飞, 余涛. 临近邻近均分轴线法及其在电 − 气互联系统帕累托优化运行中的应用. 中国电机工程学报, 2018, 38(7): 1990−200030 Qu Kai-Ping, Li Hao-Fei, Yu Tao. Adjoin uniform axes method and its application to the Pareto optimal operation of electric and natural gas combined systems. Proceedings of the Chinese Society for Electrical Engineering, 2018, 38(7): 1990−2000 [31] 31 Deb K. Multiobjective genetic algorithms: problem difficulties and construction of test functions. Evolutionary Computation, 1999, 7(3): 205−230 doi: 10.1162/evco.1999.7.3.205 期刊类型引用(14)
1. 付主木,朱龙龙,陶发展,李梦杨. 基于Stackelberg博弈的燃料电池混合动力汽车跟车能量管理. 河南科技大学学报(自然科学版). 2024(04): 1-9+115 . 百度学术
2. 高锋阳,刘嘉,韩国鹏,齐丰旭,刘庆寅. 考虑耐久性的PEM燃料电池有轨电车自适应优化控制策略. 汽车安全与节能学报. 2024(04): 569-578 . 百度学术
3. 张维海,彭称称,蒋秀珊. 多目标动态优化中Pareto随机合作博弈研究综述. 控制与决策. 2023(07): 1789-1801 . 百度学术
4. 陈鑫,杨继斌,徐晓惠,袁结. 基于提取PMP控制规则的FCHEV能量管理策略. 时代汽车. 2022(02): 10-11 . 百度学术
5. 董德宝,杨琨,樊海梅,熊金峰,陈涛,彭程. 基于NSGA-Ⅱ燃料电池城市客车能量管理策略优化. 客车技术与研究. 2022(02): 1-4 . 百度学术
6. 孙超利,李贞,金耀初. 模型辅助的计算费时进化高维多目标优化. 自动化学报. 2022(04): 1119-1128 . 本站查看
7. 刘静,孙闫,夏长高. 考虑部件使用寿命的FCEV能量管理策略. 电子测量技术. 2022(09): 1-7 . 百度学术
8. 郭晓凯,闫献国,陈峙,孟志宇. 氢燃料电池混合动力能量多参数控制方法仿真. 计算机仿真. 2022(06): 146-150 . 百度学术
9. 张晗,杨继斌,张继业,徐晓惠. 燃料电池有轨电车能量管理与速度曲线协同优化. 机械工程学报. 2022(10): 169-179 . 百度学术
10. 张爱军,方陆文,胡后征. 基于速度优化与粒子群优化算法的插电式燃料电池有轨电车能量管理策略. 城市轨道交通研究. 2022(10): 249-254 . 百度学术
11. 张晗,杨继斌,张继业,徐晓惠. 基于多种群萤火虫算法的车载燃料电池直流微电网能量管理优化. 中国电机工程学报. 2021(03): 833-846 . 百度学术
12. 吕沁阳,滕腾,张宝迪,张欣,薛奇成. 增程式燃料电池车经济性与耐久性优化控制策略. 哈尔滨工业大学学报. 2021(07): 126-133 . 百度学术
13. 阮永利,詹跃东. 燃料电池汽车分层能量管理策略优化研究. 电子测量技术. 2021(19): 1-7 . 百度学术
14. 卫超强,武志斐,蒋栋. 温度对质子交换膜燃料电池输出性能的影响. 可再生能源. 2021(12): 1588-1593 . 百度学术
其他类型引用(14)
-