-
摘要: 针对K2算法过度依赖节点序和节点序搜索算法评价节点序效率较低的问题, 提出一种基于节点块序列约束的局部贝叶斯网络结构搜索算法, 该算法首先通过评分定向构建定向支撑树结构, 在此基础上构建节点块序列, 然后利用节点块序列确定每个节点的潜在父节点集, 通过搜索每个节点的父节点集构建网络结构, 最后对该结构进行非法结构修正得到最优贝叶斯网络结构.利用标准网络将算法与几种不同类型的改进算法进行对比分析, 验证该算法的有效性.Abstract: The performance of the K2 algorithm depends on node ordering heavily. The Bayesian learning algorithm based on node order search needs to evaluate the quality of the node sequence by K2 algorithm, resulting in the problem of low efficiency in large and medium-sized networks. In this paper, a new Bayesian structure learning algorithm is proposed to solve the BN structure learning problem by searching local Bayesian network structure construction using node chunk sequence constraints. The algorithm firstly constructs a directional maximum weight spanning tree structure by using score orientation and generates the node chunk sequence by this structure. Then, the node chunk sequence is used to determine the potential parent node set of each node. The network structure is built by searching the parent node set of each node, and the structure is modified by illegal structure to get the optimal Bayesian network structure. Finally, some experiments are designed to evaluate the performance of the proposed algorithm, in which the standard network is used to compare the algorithm with several different improved algorithms to verify the effectiveness of the algorithm. The results indicate that the proposed algorithm is worthy of being studied in the field of BNs construction.
-
Key words:
- Bayesian network structure learning /
- directional maximum weight spanning tree /
- the node chunk sequence /
- K2 algorithm
-
随着交通拥堵问题的日益严重和道路安全问题的日益突出, 自动驾驶车辆已经成为汽车行业发展的趋势[1]. 自动驾驶车辆通过传感器实时感知并获取外界环境信息, 运用规划算法规划最优路径, 控制车辆安全到达期望目标[2], 主要包括环境感知、智能决策、路径规划和车辆运动控制等关键技术[3]. 自动驾驶车辆的路径跟踪控制在完成对目标路径跟踪的同时, 还要保证车辆的行驶安全性和稳定性, 属于车辆的底盘运动控制系统[4]. 但是, 由于实际的道路环境十分复杂, 车辆本身也存在着强非线性, 使得自动驾驶车辆的跟踪控制面临巨大的挑战[2].
国内外学者在自动驾驶车辆跟踪控制算法方面已经有了大量研究成果, 传统的控制方法主要有鲁棒控制、预瞄控制和滑模控制[5-7]等. 但上述方法通常只能利用当前的环境信息和车辆状态, 并且难以考虑环境和车辆的约束条件. 因此, 研究人员开始将模型预测控制(Model predictive control, MPC)应用到车辆控制领域. 由于MPC在处理多目标以及系统约束方面具有明显的优势, 而且其滚动优化策略能够弥补模型失配、畸变、扰动等引起的不确定性, 因此在车辆控制领域得到了广泛的应用[8-10]. 然而, 如果模型的误差过大, 仍会对系统的稳定性造成严重影响[11]. 轮胎力是影响车辆稳定性的重要因素[12], 高速极限工况下自动驾驶车辆路径跟踪控制器设计时需要建立高精度的非线性轮胎模型. 但是, 非线性模型的MPC优化求解会增加控制器的计算负担, 影响系统的实时性. 因此, 将非线性模型进行线性化, 采用线性时变MPC进行处理, 是一种广泛应用的能够兼顾系统非线性和实时性的方法[13-14].
国内在进行路径跟踪控制研究时, 通常假设车辆的轮胎侧偏角较小, 将轮胎模型简化成线性轮胎模型[9, 15-16], 因此并不适用于高速极限工况下的路径跟踪控制. 而在车辆稳定性控制领域, 国内外已有很多学者根据当前车辆状态对轮胎模型进行连续线性化处理, 设计基于线性时变MPC的车辆稳定性控制器并取得了很好的控制效果[17-18]. 但是, 这种线性化方法在预测时域内并没有考虑轮胎力的非线性变化, 当车辆处于动力学极限附近时, 这种线性化方式将变得不那么精确. 因此, 一些学者在对轮胎模型进行线性化时, 开始考虑预测时域内轮胎力变化对线性化效果的影响. Brown等[19]在研究基于MPC的路径规划与路径跟踪的集成控制时, 利用上一时刻求解的轮胎侧偏角序列对当前预测时域内的轮胎力进行连续线性化处理, 并在实车上实现了多种驾驶场景的实时跟踪控制. 但仅使用上一时刻优化的侧偏角序列会产生抖动的现象. Funke等[20] 在此基础上, 对轮胎侧偏角进行了正则化处理, 较好地解决了这一问题. 但是上述方法要求控制时域与预测时域长度一致, 较长的控制时域极大地加重了求解器的计算负担. 而且, 这些研究主要针对中低速工况, 尚未讨论高速低附着极限工况下的控制问题.
因此, 本文针对高速极限工况, 提出一种在预测时域内对非线性轮胎模型进行预测和线性化表达的新方法, 能够避免传统方法在紧急避撞时由于轮胎力表达不精确导致的路径跟踪失败问题, 并且不依赖控制时域长度, 有助于降低求解器的计算负担. 该方法利用期望路径信息对轮胎的状态刚度进行预测, 然后将预测的轮胎状态刚度用于预测时域内的非线性轮胎模型的线性化表达. 为了验证该方法的有效性, 本文还设计了在预测时域内轮胎力保持不变的传统线性时变MPC进行路径跟踪控制, 并利用MATLAB和CarSim联合仿真平台进行了对比实验. 为了加以区别, 在本文中将传统的线性时变MPC记为LTI-MPC (Linear time-invariant MPC in horizon), 将所提出方法记为LTV-MPC (Linear time-variation MPC in horizon).
1. 系统建模
1.1 车辆模型
本文采用的的车辆模型如图1所示.
$ XOY $ 坐标系为大地坐标系,$ \dot x $ 为车辆纵向速度,$ \dot y $ 为车辆侧向速度,$ {\gamma} $ 为车辆横摆角速度,$ {\delta _f} $ 为车辆前轮转角,$ F_{y,f} $ 和$ F_{y,r} $ 分别为前、后轮胎的侧向力,$ {\alpha _f} $ 与$ {\alpha _r} $ 分别为前、后轮胎侧偏角,$ {l_f} $ 与$ {l _r} $ 分别为质心到前轴和后轴的距离.车辆在大地坐标系中的横摆和侧向运动可以表示为
$$\begin{split} &{{I_z}\dot \gamma = {l_f}{F_{y,f}} - {l_r}{F_{y,r}}}\\ &{m\ddot y = - m\dot x\gamma + {F_{y,f}} + {F_{y,r}}}\\ &{\dot \varphi = \gamma }\\ &{\dot Y{\rm{ = }}\;\dot x\sin \varphi + \dot y\cos \varphi } \end{split}$$ (1) 其中,
$ {\varphi} $ 为车辆在大地坐标系中的横摆角,$ \dot{Y} $ 为车辆在大地坐标系中的横向速度,$ m $ 为整车质量,$ I_z $ 为横摆转动惯量.1.2 轮胎模型
轮胎力是产生车辆运动的主要外力来源, 直接影响车辆在极限工况下的稳定性. 因此, 在研究极限工况下的路径跟踪控制时有必要采用高精度的非线性的轮胎模型. 目前应用比较广泛的轮胎模型要有魔术公式、Fiala轮胎模型和UniTire模型. 其中UniTire模型是郭孔辉院士提出的适用于车辆动力学仿真和控制的非线性轮胎模型, 能够准确描述轮胎在复杂工况下的力学特性[21]. 因此本文的轮胎模型将采用UniTire模型, 具体表达式和参数见文献[22-23].
2. 控制器设计
控制器的整体结构如图2所示, 主要包括期望路径设计、轮胎模型线性化和MPC控制器设计等关键步骤.
2.1 期望路径设计
在主动避撞控制研究方面, 基于制动的纵向控制策略在中低车速具有很好的避撞表现, 但是随着车速升高车辆的安全制动距离迅速增加, 导致制动避撞效果不理想. 袁伟等[24]研究发现: 在附着系数为0.3的道路上当相对车速大于15.5 m/s时, 应优先进行转向避撞. 因此, 在高速极限工况下紧急避撞时规划一条合理的换道路径至关重要. 常见的换道路径规划方法有梯形加速度法、多项式法和Sigmoid函数法. 其中, Sigmoid函数法不仅构成简单, 而且包含了道路条件约束和车辆安全约束, 因此本文将采用Sigmoid函数法进行高速紧急换道路径的规划, 其表达式为
$$\begin{split} &{Y_{{\rm{ref}}}}\left( {X } \right) = \dfrac{B}{{1 + {{\rm{e}}^{ - a\left( {X + L - c} \right)}}}}\\ &{\varphi _{{\rm{ref}}}}\left( {X } \right) = \arctan \left(\frac{dY_{{\rm{ref}}}(X)}{d(X)} \right) \end{split}$$ (2) 式中,
$ X $ 为纵向位置,$ B $ 为侧向避撞距离,$ c $ 为纵向避撞距离的一半,$ a $ 为避撞路径的倾斜程度,$ L $ 为预瞄距离,$Y_{{\rm{ref}}}$ 为期望侧向位移,$\varphi _{{\rm{ref}}}$ 为期望横摆角. 参数的具体计算和推导过程参见文献[25], 基于Sigmoid函数的高速紧急避撞路径规划曲线示意如图3所示.2.2 LTI-MPC设计
为了评估和验证本文所提出方法的控制效果, 同时考虑到该方法是在LTI-MPC的基础上进行设计的, 因此本文先进行LTI-MPC的设计.
2.2.1 轮胎模型线性化
以往的研究中多采用泰勒一阶展开的方法对轮胎力进行线性化, 即根据当前时刻的轮胎侧偏角对轮胎力进行线性化[18-20], 但是这种方法会引入残余侧向力, 增加了模型的复杂度. 因此, 本文采用状态刚度法对轮胎力进行线性化. 状态刚度的概念由郭孔辉院士提出, 用于解决各向异性刚度条件下轮胎力学特性的表达, 其中侧偏状态刚度定义为每一侧向滑移率
$ S_{y} $ 下, 侧向力与该滑移率的比值, 即,$ K_{ys} = F_y /S_y $ . 本文根据控制系统设计的实际需求定义侧偏状态刚度为每一侧偏角$ \alpha $ 下, 侧向力与该侧偏角的比值, 如图4所示, 表达式为$$C = \frac{{{F_y}}}{\alpha }$$ (3) 由式(3)即可得到每个轮胎的侧偏状态刚度. 因此, LTI-MPC前、后轮胎的侧向力可以线性化表示为
$${F_{y,i}} = {C_i} {\alpha _i}$$ (4) 其中,
$ i = f,r $ 分别指前轮和后轮, 前轮和后轮的轮胎侧偏角定义为$$\begin{split} &{\alpha _f} = \dfrac{{\dot y + \gamma {l_f}}}{{\dot x}} - {\delta _f}\\ &{\alpha _r} = \dfrac{{\dot y - \gamma {l_r}}}{{\dot x}} \end{split}$$ 2.2.2 预测模型
将式(4)代入式(1), 并假设横摆角较小, 存在近似关系
$ \sin \varphi \approx \varphi $ 和$ \cos \varphi \approx 1 ,$ 可以得到LTI-MPC的预测模型为$$\begin{split} &{\dot \xi \;=\;{\boldsymbol{A}} \xi + {\boldsymbol{B}} u}\\ &{\zeta = {\boldsymbol{h}} \xi } \end{split}$$ (5) 式中, 控制输入
$ u $ 为转角$ \delta _f $ , 预测输出$\zeta $ 为$ \left[{\varphi ,Y} \right]^{\rm{T}} $ , 状态变量$\xi = {\left[ {\dot y,\gamma ,\varphi ,Y} \right]^{\rm{T}} }$ .$${\boldsymbol{A}} = \left[ {\begin{array}{*{20}{c}} {\frac{{{C_f} + {C_r}}}{{m\dot x}}}&{\frac{{{l_f}{C_f} - {l_r}{C_r}}}{{m\dot x}} - \dot x}&0&0\\ {\frac{{{l_f}{C_f} - {l_r}{C_r}}}{{{I_z}\dot x}}}&{\frac{{l_f^2{C_f} + l_r^2{C_r}}}{{{I_z}\dot x}}}&0&0\\ 0&1&0&0\\ 1&0&{\dot x}&0 \end{array}} \right]$$ $${\boldsymbol{B}} = {\left[ { - \frac{{{C_f}}}{m}, - \frac{{{l_f}{C_f}}}{{{I_z}}},0,0} \right]^{\rm{T}} },\;\;{\boldsymbol{h}} = \left[ {\begin{array}{*{20}{c}} 0&0&1&0\\ 0&0&0&1 \end{array}} \right]$$ 以步长
$ T_{s} $ 对式(5)进行离散化, 得到增量式的离散模型为$$\begin{split} &{\Delta \xi \left( {k + 1} \right){\rm{ = }}{{\boldsymbol{A}}_{{d}}} \Delta \xi \left( k \right) + {{\boldsymbol{B}}_{{d}}} \Delta u\left( k \right)}\\ &{\zeta \left( k \right) = {\boldsymbol{h}} \Delta \xi \left( k \right) + \zeta \left( {k - 1} \right)} \end{split}$$ (6) 其中,
${{\boldsymbol{A}}_{{d}}} = {{\rm{e}}^{{\boldsymbol{A}} {{T} _s}}}, {{\boldsymbol{B}}_{{d}}} = \int_0^{{{T} _s}} {{{\rm{e}}^{{\boldsymbol{A}} t}}{\rm{d}}t} {\boldsymbol{B}}$ .2.2.3 预测方程
基于式(6), 根据模型预测控制理论, 取预测时域为
$ P $ , 控制时域为$ M $ , 可以得到$ k $ 时刻的预测输出为$$\zeta (k + 1|k) = {{\boldsymbol{S}}_\xi } \Delta \xi (k) + {\boldsymbol{I}} \zeta (k) + {{\boldsymbol{S}}_{{u}}}\Delta {\boldsymbol{U}}(k)$$ (7) 其中,
$$ {\boldsymbol{I}} = \left[ {1,1, \cdots ,1} \right]_{1 \times P}^{\rm{T}} $$ $${{\boldsymbol{S}}_\xi } = \left[ {{\boldsymbol{h}}{{\boldsymbol{A}}_{{d}}},\sum\limits_{i = 1}^2 {{\boldsymbol{hA}}_{{d}}^i} , \cdots ,\sum\limits_{i = 1}^P {{\boldsymbol{hA}}_{{d}}^i} } \right]_{1 \times P}^{\rm{T}} $$ $${{\boldsymbol{S}}_{u}} = {\left[ {\begin{array}{*{20}{c}} {\begin{array}{*{20}{l}} {{\boldsymbol{h}}{{\boldsymbol{B}}_{d}}}\\ \vdots \end{array}}&{\begin{array}{*{20}{l}} 0\\ \ddots \end{array}}&{\begin{array}{*{20}{l}} 0\\ \vdots \end{array}}\\ {\sum\limits_{i = 1}^P {{\boldsymbol{hA}}_{d}^{i - 1}{{\boldsymbol{B}}_{d}}} }& \cdots &{\sum\limits_{i = 1}^{P + M - 1} {{\boldsymbol{hA}}_{d}^{i - 1}{{\boldsymbol{B}}_{d}}} } \end{array}} \right]_{P \times M}}$$ 预测输出序列
$\zeta \left( {k + 1\left| k \right.} \right)$ =$ \left[ {\zeta \left( {k + 1\left| k \right.} \right),\cdots ,} \right. $ $ {\left. { \zeta \left( {k + P\left| k \right.} \right)} \right]^{\rm{T}}} $ , 控制输入增量序列$\Delta {\boldsymbol{U}}\left( k \right)$ =$ \left[ {\Delta u\left( k \right),} \right. $ $ \cdots , $ $ {\left. {\Delta u\left( {k + M - 1} \right)} \right]^{\rm{T}}} $ .同时根据式(2)得到参考输出序列
${\boldsymbol{R}}\left( {k + 1} \right) =$ $\left[ {{{\boldsymbol{r}}_{{\rm{ref}}}}\left( {k + 1} \right),} \right. \cdots ,{\left. {{{\boldsymbol{r}}_{{\rm{ref}}}}\left( {k + P} \right)} \right]^{\rm{T}}}$ , 其中,${\boldsymbol{r}}_{{\rm{ref}}} = \left[ {Y_{{\rm{ref}}}},\right.$ $\left. {\varphi _{{\rm{ref}}}} \right]^{\rm{T}}$ .2.3 LTV-MPC设计
LTI-MPC在当前时刻对轮胎力进行线性化后, 在接下来的预测时域内轮胎的侧偏状态刚度将保持不变, 如图5中
$ C^k $ 所示. 当车辆处于极限工况时, LTI-MPC所采用的轮胎力线性化方法在预测时域内会产生较大的误差. 如图5所示, 随着预测时域向前滚动, LTI-MPC所表示的轮胎力误差越来越大, 如在侧偏角$ \alpha^{k+n} $ 处,$F_{y,{\rm{LTI}}}^{k+n}$ 已经严重偏离了实际值. 在跟踪路径过程中, LTI-MPC会认为只要不断增加前轮转角(前轮转角和轮胎侧偏角存在数学关系)就可以得到更大的侧向力(绝对值), 因此当需要增大侧向力以跟踪期望路径时, LTI-MPC就会不断增大前轮转角, 即使此时的实际轮胎力可能已经达到饱和甚至进入滑移区. 当轮胎力饱和后, 实际轮胎力会迅速减小, 这将导致车辆出现危险的侧滑行为, 失去路径跟踪能力.因此, 本文设计了在预测时域内轮胎状态刚度时变的LTV-MPC, 如图5所示, 该方法通过预测出预测时域内未来
$ P $ 步的状态刚度值$ C^k $ ~$C^{k+P} $ , 实现预测时域内非线性轮胎力的线性近似. 当需要较大的侧向力来跟踪期望路径时, LTV-MPC能够始终在侧向力峰值点附近得到最优控制输入, 避免输出过大的前轮转角致使侧向力超出物理极限.2.3.1 轮胎状态刚度预测
本文根据已知的期望侧向位移和横摆角对状态刚度进行预测, 具体方法如下.
将线性轮胎模型
${F_{y,i}} = {C_i} {\alpha _i}$ 代入到式(1), 得到车辆运动模型为$$\tag{8a} m\ddot y = - m\dot x\gamma + {C_f}\left( {\frac{{\dot y + \gamma {l_f}}}{{\dot x}} - {\delta _f}} \right) + {C_r}\left( {\frac{{\dot y - \gamma {l_r}}}{{\dot x}}} \right) $$ $$\tag{8b} {I_z}\dot \gamma = {l_f}{C_f}\left( {\frac{{\dot y + \gamma {l_f}}}{{\dot x}} - {\delta _f}} \right) - {l_r}{C_r}\left( {\frac{{\dot y - \gamma {l_r}}}{{\dot x}}} \right) \;$$ $$\tag{8c}\dot \varphi = \gamma $$ $$\tag{8d}\dot Y = \dot x\sin \varphi + \dot y\cos \varphi $$ 联立式(8a)和式(8b), 整理后, 可得
$$\begin{split} &{C_f} = \dfrac{{m\ddot y{l_r} + {I_z}\dot \gamma + m\dot x\gamma {l_r}}}{{{\alpha _f}\left( {{l_f} + {l_r}} \right)}}\\ &{C_r} = \dfrac{{m\ddot y{l_f} - {I_z}\dot \gamma + m\dot x\gamma {l_f}}}{{{\alpha _r}\left( {{l_f} + {l_r}} \right)}} \end{split}$$ (9) 式(9)中的横摆角速度
$ \dot \gamma $ 和侧向加速度$ \ddot y $ 由式(8c)和式(8d)整理后求导得到$$\begin{split} &\dot \gamma = \ddot \varphi \\ &\ddot y = \dfrac{{\ddot Y\cos \varphi - \dot Y\sin \varphi + \dot x}}{{{{\cos }^2}\varphi }} \end{split}$$ (10) 将式(2)得到的
${Y_{{\rm{ref}}}}$ 及其对时间的一阶和二阶导${\dot Y_{{\rm{ref}}}}$ ,${\ddot Y_{{\rm{ref}}}}$ 与${\varphi _{{\rm{ref}}}}$ 及其对时间的二阶导${\ddot \varphi _{{\rm{ref}}}}$ 代入式(10), 得到$$\begin{split} &{{\dot \gamma }_{{\rm{ref}}}} = {\kappa _{\mu ,\dot \gamma }}{{\ddot \varphi }_{{\rm{ref}}}}\\ &{{\ddot y}_{{\rm{ref}}}} = {\kappa _{\mu ,\ddot y}}\dfrac{{{{\ddot Y}_{{\rm{ref}}}}\cos {\varphi _{{\rm{ref}}}} - {{\dot Y}_{{\rm{ref}}}}\sin {\varphi _{{\rm{ref}}}} + \dot x}}{{{{\cos }^2}{\varphi _{{\rm{ref}}}}}} \end{split}$$ (11) 进而, 由式(9)可以得到预测的前、后轮胎的状态刚度为
$$\begin{split} &{C_{f,{\rm{pre}}}} = {\kappa _{\mu ,F}} \dfrac{{m{{\ddot y}_{{\rm{ref}}}}{l_r} + {I_z}{{\dot \gamma }_{{\rm{ref}}}} + m\dot x{\gamma _{{\rm{ref}}}}{l_r}}}{{{\alpha _f}\left( {{l_f} + {l_r}} \right){\rm{ +\; }}\varepsilon }}\\ &{C_{r,{\rm{pre}}}} = {\kappa _{\mu ,F}} \dfrac{{m{{\ddot y}_{{\rm{ref}}}}{l_f} - {I_z}{{\dot \gamma }_{{\rm{ref}}}} + m\dot x{\gamma _{{\rm{ref}}}}{l_f}}}{{{\alpha _r}\left( {{l_f} + {l_r}} \right){\rm{ +\; }}\varepsilon }} \end{split}$$ (12) 其中,
$C_{f,{\rm{pre}}}$ 与$C_{r,{\rm{pre}}}$ 分别表示预测的前、后轮胎的状态刚度,$ \kappa_{\mu ,\dot {\gamma }} $ ,$ \kappa _{\mu ,\ddot {y}} $ 和$ \kappa _{\mu ,F} $ 为补偿附着系数影响的调节因子,$ \varepsilon $ 是避免分母为零的极小数.由于状态刚度的预测值是由期望路径信息根据式(1)所示车辆运动模型逆向求解得到, 因此无法直接体现路面附着系数对侧向力的影响, 进而在式(9)中无法体现附着系数对状态刚度的影响, 因此式(11)和式(12)引入了路面附着系数调节因子, 以补偿附着系数对状态刚度预测值大小的影响, 这里
$ \kappa_{\mu ,\dot {\gamma }} $ 和$ \kappa _{\mu ,\ddot {y}} $ 的值取为当前道路的附着系数,$ \kappa _{\mu ,F} $ 的值通过实验调节得到, 取值范围为0.5 ~ 0.8.由于轮胎力附着极限的影响, 式(12)得到的状态刚度应满足约束
$$\left| {{C_{i,{\rm{pre}}}}} \right| \le \frac{{\mu {F_{z,i}}}}{{{\alpha _i}}}$$ (13) 其中,
$ F_z $ 为轮胎垂直载荷,$ \mu $ 为路面附着系数,$ i = f,r $ 分别指前轮和后轮.因此, 向前取
$ P $ 个期望路径数据即可得到未来预测时域内的轮胎状态刚度为$$C_{i,{\rm{pre}}}^{k + n} = f\left( {\ddot Y_{{\rm{ref}}}^{k + n},\dot Y_{{\rm{ref}}}^{k + n},\ddot \varphi _{{\rm{ref}}}^{k + n},\varphi _{{\rm{ref}}}^{k + n}} \right)$$ (14) 其中, 函数
$ f\left( \cdot\right) $ 表示式(11)和式(12)的函数关系,$ n = $ 0, 1, ···, P.预测的状态刚度变化量可以表示为
$$\Delta C_{i,{\rm{pre}}}^{k + n} = C_{i,{\rm{pre}}}^{k + n} - C_{i,{\rm{pre}}}^{k + n - 1}$$ (15) 最终可以得到预测时域内的状态刚度为
$$C_i^{k + n} = {C_i}^k + \sum\limits_{j = 1}^n {\Delta C_{i,{\rm{pre}}}^{k + n}} $$ (16) 其中,
$ C_i^k $ 表示当前时刻的状态刚度, 由式(3)得到.2.3.2 预测模型
将式(16)代入式(4)可得到预测时域内各时刻轮胎侧向力的线性化表达式为
$$F_{y,i}^{k + n} = C_i^{k + n} \alpha _i^{k + n}$$ (17) 将式(17)代入式(1), 并进行离散化处理后可以得到增量式的LTV-MPC的预测模型,
$ k $ 时刻预测模型可以表示为$$\begin{split} &\Delta \xi \left( {k + 1} \right)={\boldsymbol{A}}_{d}^k \Delta \xi \left( k \right) + {\boldsymbol{B}}_{d}^k \Delta u\left( k \right)\\ &\zeta \left( k \right) = {\boldsymbol{h}} \Delta \xi \left( k \right) + \zeta \left( {k - 1} \right) \end{split}$$ (18) 其中, 系数矩阵
${\boldsymbol{B}}_{d}^k$ 和${\boldsymbol{A}}_{d}^k$ 随$ C_i^k $ 时变, 表达式可参考式(5)得到.可以得到
$ k $ 时刻LTV-MPC的预测输出为$$\zeta (k + 1|k) = {\boldsymbol{S}}_\xi ^k \Delta \xi (k) + {\boldsymbol{I}} \zeta (k) + {\boldsymbol{S}}_{u}^k\Delta {\boldsymbol{U}}(k)$$ (19) 由于预测模型的系数矩阵在预测时域内为时变矩阵, 因此矩阵
${\boldsymbol{S}}_\xi ^k$ 和${\boldsymbol{S}}_{u}^k$ 的计算不同于 LTI-MPC, 表示为$${\boldsymbol{S}}_\xi ^k = {\left[ {\begin{array}{*{20}{c}} {{\boldsymbol{hA}}_{d}^k}\\ {{\boldsymbol{hA}}_{d}^k + {\boldsymbol{hA}}_{d}^k{\boldsymbol{A}}_{d}^{k + 1}}\\ \vdots \\ {{\boldsymbol{hA}}_{d}^k + \cdots + \left( {{\boldsymbol{hA}}_{d}^k{\boldsymbol{A}}_{d}^{k + 1} \cdots {\boldsymbol{hA}}_{d}^k{\boldsymbol{A}}_{d}^{k + P}} \right)} \end{array}} \right]_{P \times 1}}$$ $${\boldsymbol{S}}_{u}^k{\rm{ = }}\left[ {{{\boldsymbol{S}}_{{u}{\rm{1}}}}} \right.,{{\boldsymbol{S}}_{{u}{\rm{2}}}}, \cdots {\left. {,{{\boldsymbol{S}}_{{u}M}}} \right]_{P \times M}}\qquad\qquad\qquad\qquad\qquad$$ 其中,
$${{\boldsymbol{S}}_{{{u}}{\rm{1}}}}{\rm{ = }}{\left[ {\begin{array}{*{20}{c}} {{\boldsymbol{hB}}_{d}^k}\\ {{\boldsymbol{hB}}_{d}^k + {\boldsymbol{hA}}_{d}^k{\boldsymbol{B}}_{d}^k}\\ \vdots \\ {{\boldsymbol{hB}}_{d}^k + \cdots + \left( {{\boldsymbol{hA}}_{d}^k \cdots {\boldsymbol{A}}_{d}^{k + P - 1}{\boldsymbol{B}}_{d}^k} \right)} \end{array}} \right]_{P \times {\rm{1}}}}$$ $${{\boldsymbol{S}}_{{{{u}}}{\rm{2}}}}{\rm{ = }}{\left[ {\begin{array}{*{20}{c}} 0\\ {{\boldsymbol{hB}}_{d}^{k + 1}}\\ \vdots \\ {{\boldsymbol{hB}}_{d}^{k + 1} + \cdots + ( {{\boldsymbol{hA}}_{d}^{k + 1} \cdots {\boldsymbol{A}}_{d}^{k + P - 2}{\boldsymbol{B}}_{d}^{k + 1}} )} \end{array}} \right]_{P \times {\rm{1}}}}$$ $${{\boldsymbol{S}}_{{{u}}M}}{\rm{ = }}{\left[ {\begin{array}{*{20}{c}} 0\\ 0\\ \vdots \\ {{\boldsymbol{hB}}_{d}^{k + M} + \cdots + ( {{\boldsymbol{hA}}_{d}^{k + {\rm{1}}} \cdots {\boldsymbol{A}}_{d}^{k + P - M}{\boldsymbol{B}}_{d}^{k + M}} )} \end{array}} \right]_{P \times {\rm{1}}}}$$ 2.4 目标函数设计及求解
2.4.1 目标函数
本文的控制目标主要包括: 1)车辆尽可能跟踪上期望的侧向位移
$Y_{{\rm{ref}}}$ 和横摆角$\varphi _{{\rm{ref}}}$ ; 2)转向输入尽可能平滑. 因此, 控制目标$ J $ 可以表示为[13]$$\begin{split} &\mathop {\min }\limits_{\Delta {\boldsymbol{U}}(k)} \;\;\;\;J\left( {\zeta \left( {k + 1} \right),\Delta {\boldsymbol{U}}\left( k \right),P,M} \right)\\ &J = {{\left\| {{{{\boldsymbol{\varGamma}} }_\zeta }\left( {\zeta \left( {k + 1} \right) - {\boldsymbol{R}}\left( {k + 1} \right)} \right)} \right\|}^2} + {{\left\| {{{\boldsymbol{\varGamma }}_{u}}\Delta {\boldsymbol{U}}\left( k \right)} \right\|}^2}=\\ &\qquad\sum\limits_{n = 1}^P {\left[ {{{\left( {\varphi \left( {k + n|k} \right) - {\varphi _{{\rm{ref}}}}\left( {k + n} \right)} \right)}^2} {\tau _\varphi }} \right]} +\\ &\qquad\sum\limits_{n = 1}^P {\left[ {{{\left( {Y\left( {k + n|k} \right) - {Y_{{\rm{ref}}}}\left( {k + n} \right)} \right)}^2} {\tau _y}} \right]} +\\ &\qquad \sum\limits_{n = 1}^M {\left[ {\left( {\Delta {\delta _f}{{\left( {k + n - 1} \right)}^2}} \right) {\tau _u}} \right]} \\[-10pt] \end{split}$$ (20) 并满足约束
$$\begin{split} &{ - {\delta _f}_{\max } \le {\delta _f}\left( {k + {n_M}} \right) \le {\delta _f}_{\max }}\\ &{ - \Delta {\delta _f}_{\max } \le \Delta {\delta _f}\left( {k + {n_M}} \right) \le \Delta {\delta _f}_{\max }}\\ &{ - {\varphi _{\max }} \le \varphi \left( {k + 1 + {n_P}|k} \right) \le {\varphi _{\max }}}\\ &{ - {Y_{\max }} \le Y\left( {k + 1 + {n_P}|k} \right) \le {Y_{\max }}}\\ &{\;\;\;\;\;\;\;\quad{n_M} = 0,1, \cdots, M,\;{n_P} = 0,1, \cdots, P} \end{split}$$ (21) 其中,
${{\boldsymbol{\varGamma }}_\zeta }$ 和${{\boldsymbol{\varGamma }}_{u}}$ 为控制输出和输入的加权因子, 具体为${{\boldsymbol{\varGamma }}_\zeta } = {\rm{diag}}{\{ {{{\left[ {{\tau _\varphi },{\tau _y}} \right]}^{\rm{T}}}} \}_{2P \times 2P}}$ ,${{\boldsymbol{\varGamma }}_{u}} = {\rm{diag}}\{{\tau _u}\}_{M \times M}$ ,$ \tau _y $ ,$ \tau _\varphi $ 和$ \tau _u $ 分别是对侧向位移、横摆角跟踪性能以及控制输入变化量的加权因子.2.4.2 优化问题求解
将上述带约束的优化问题转化为二次规划(Quadratic programming, QP)的形式
$$\begin{split} &{\mathop {\min }\limits_{\boldsymbol{x}} {{\boldsymbol{x}}^{\rm{T}}}{\boldsymbol{H}}{\boldsymbol{x}} - {{\boldsymbol{g}}^{\rm{T}}}{\boldsymbol{x}}}\\ &{{\tilde{\boldsymbol C}}{\boldsymbol{x}} < {\tilde{\boldsymbol b}}} \end{split}$$ (22) 其中,
${\boldsymbol{x}} = \Delta {\boldsymbol{U}}(k)$ , H是黑塞矩阵, g是梯度向量,${\tilde{\boldsymbol C}}$ 和${\tilde{\boldsymbol b}}$ 是约束矩阵, 具体形式见文献[26].对于上述QP问题可以采用内点法[26]进行求解.
3. 仿真实验
仿真实验基于MATLAB和CarSim联合仿真平台进行, 选择CarSim中的B级掀背车作为实验车型. 表1给出了实验车辆的主要参数.
表 1 车辆参数Table 1 Vehicle parameters参数 符号 值 质心到前轴的距离 lf 1.04 m 质心到后轴的距离 lr 1.56 m 整车质量 m 1 240 kg 横摆转动惯量 Iz 2 031.4 kgm2 3.1 状态刚度预测方法验证
为证明所设计状态刚度预测方法的可行性和有效性, 以前轮为例, 分别给出了实验车辆以80 km/h和100 km/h的车速在附着系数为0.3的道路上换道避撞时状态刚度实际值及其预测值的对比结果, 如图6(a)和图6(b)所示.
从图6(a)中可以看出, 轮胎状态刚度的实际值在4.89 s附近达到最大值(绝对值)−90 036 N/rad, 预测值在5.03 s附近达到最大值−99 930 N/rad. 实际值和预测值存在约0.14 s的相位差和9 894 N/rad的峰值偏差, 在5.5 s后相位差基本消失, 峰值偏差也明显减小. 其中相位偏差主要是因为路径跟踪偏差引起的, 如图7 和 图8所示, 实际车辆轨迹相对于期望路径在5.5 s之前存在相位超前现象, 之后相位超前逐渐消失; 峰值偏差主要受式(12)中的路面附着系数补偿因子
$ \kappa_{\mu ,\dot {\gamma }} $ ,$ \kappa _{\mu ,\ddot {y}} $ 和$ \kappa _{\mu,F} $ 影响. 从图6(b)可以看出, 在100 km/h的车速下, 状态刚度的实际值和预测值在第1个峰值处出现约15 460 N/rad的峰值偏差和0.18 s的相位差. 在第2个峰值处偏差明显减小, 此后相位差也逐渐消失. 虽然状态刚度的预测值与实际值存在一定误差, 但由状态刚度最终计算式(16)可以看出, 预测的状态刚度仅占式(16)中的一项, 且只用到预测值的变化量, 因此预测时域内的最终状态刚度能够满足轮胎力的线性化需求. 图中状态刚度的预测值为式(14)计算出的预测序列的第1个值.3.2 路径跟踪控制仿真实验
为评估所提出的LTV-MPC跟踪控制系统的有效性和可行性, 结合我国公路车道宽标准, 本文设置侧向换道位移为3.5 m. 为了突出本文所提方法在高速极限工况下的路径跟踪性能, 分别设置了车速为80 km/h和100 km/h的两组实验工况, 其中路面附着系数为0.3, 目的是模拟雨雪天气的高速公路驾驶环境. 表2给出了LTV-MPC和LTI-MPC控制器主要参数.
表 2 控制器参数Table 2 MPC controller parameters参数 LTI-MPC LTV-MPC Ts 0.01 0.01 P 40 40 M 1 1 ${Y_{\max }}$(°) 5 5 ${\varphi _{\max }}$(°) 15 15 ${\delta _f}_{\max }$(°) 10 10 ${\Delta{\delta_f}_{\max }}$(°) 0.17 0.17 ${\tau _{\varphi ,80}}$ 550 550 ${\tau _{y ,80}}$ 260 260 ${\tau _{u ,80}}$ 1 900 1 900 ${\tau _{\varphi ,100}}$ 550 550 ${\tau _{y ,100}}$ 260 260 ${\tau _{u ,100}}$ 3 500 3 500 3.2.1 80 km/h下的实验
实验中, 车辆以80 km/h的速度在附着系数0.3的路面上进行避撞路径跟踪, 仿真结果如图7 ~ 12所示.
图7和图8为侧向位移和横摆角的跟踪结果对比曲线. 车辆从第4 s开始换道, 到第7 s换道完成. 结果显示LTV-MPC能够较好地跟踪期望路径, 整个换道过程侧向位移和横摆角变化平滑, 但是由于工况比较紧急, 在5 ~ 6 s之间横摆角的跟踪依然存在一定偏差. LTI-MPC的侧向位移跟踪效果与LTV-MPC基本一致, 但横摆角在第6.5 s时出现轻微波动. 这是由于LTI-MPC求解出的前轮转角波动较大引起的, 如图9所示, LTI-MPC控制车辆的前轮转角在第6 s时达到峰值−3.5°, 随即发生明显的振荡. 前轮转角过大和振荡是因为在预测时域内LTI-MPC的轮胎力与侧偏角为线性关系, 为了跟踪目标路径, LTI-MPC会不断地向侧向力大的方向寻找可行解, 这就致使求解的前轮转角过大, 进而导致实际的轮胎力超出附着极限而进入滑移区域. 从第7 s开始, 随着换道完成, 转角逐渐趋于0, 并保持稳定. 相对LTI-MPC, 整个换道过程中LTV-MPC的转角输入变化较为平滑, 且幅值较小.
图10为车辆侧偏角响应的仿真结果, 从图中可以看出LTI-MPC控制车辆的质心侧偏角在整个换道过程中都大于LTV-MPC. 且在第6.5 s时达到了0.5°, 约为LTV-MPC的2.5倍, 并有侧滑的趋势, 如图中实线强调区域. 由图10可以看出, LTV-MPC控制的车辆在换道过程中更稳定.
图11和图12分别给出了前后轮胎的侧向力变化曲线. 从图11可以看出, LTV-MPC和LTI-MPC控制车辆的前轮轮胎侧向力在4.8 s和6 s附近均达到了附着极限, 说明轮胎力此时已经进入非线性区域, 甚至达到饱和. 从图中放大区域可以清楚地看到, LTI-MPC控制车辆的前轮轮胎侧向力在峰值附近出现了明显的下降, 这说明前轮轮胎力已经进入滑移区并发生了侧滑, 这与图9和图10的结论一致. 从图12也可以看出, 后轮轮胎的侧向力在峰值处也达到了极限值, 说明此时车辆已处于极限操纵工况.
3.2.2 100 km/h下的实验
为了进一步验证所提出的LTV-MPC路径跟踪控制系统相对LTI-MPC路径跟踪控制系统的提升效果, 仿真实验车辆以100 km/h的速度进行避撞路径跟踪, 路面附着系数为0.3, 仿真结果如图13 ~ 18所示.
从图13和图14可以看出, 当车速提升至100 km/h时, LTI-MPC控制的车辆行驶到第7 s附近时已经无法完成路径的跟踪, 而LTV-MPC控制的车辆依然能够顺利地跟踪目标路径. 此外, 图13 和图14出现的相位超前现象是因为预瞄距离较长. 但是, 如果预瞄距离太短, 车辆则无法完成跟踪控制.
图15为实验车辆的前轮转角, 从图中可以看出在高速极限工况下LTI-MPC所采用的轮胎力线性化方法已经无法保证控制器输出准确的前轮转角. LTV-MPC由于在预测时域内考虑了轮胎力的非线性变化趋势, 因此在高速极限工况下依然能够保证车辆的跟踪性能. 从图中放大区域可以看出LTV-MPC的前轮转角在6 ~ 6.5 s之间出现了轻微的波动, 这表明LTV-MPC的控制性能也接近了极限. 从图16车辆的质心侧偏角响应中可以看出LTI-MPC控制的车辆行驶到第7 s附近时开始失稳. 图17和图18显示LTI-MPC控制车辆的前轮和后轮轮胎侧向力在峰值处均出现了严重的下降, 说明车辆已经发生了严重的侧滑. LTV-MPC控制车辆的前轮和后轮轮胎侧向力在峰值处也达到了极限值, 但能够保持在安全区域, 不发生侧滑.
综上, 说明所提出的LTV-MPC路径跟踪控制系统对提高高速极限工况的车辆路径跟踪性和稳定性有明显效果.
4. 结束语
本文基于期望路径信息设计了状态刚度预测方法, 在预测时域内实现对轮胎模型的预测和线性化表达, 提出一种新型线性时变模型预测路径跟踪控制系统. MATLAB和CarSim联合仿真实验表明本文所提出的路径跟踪控制系统有效提高了车辆在高速极限工况下的路径跟踪能力和稳定性.
本研究中发现仅通过转向来提高极限工况下车辆的路径跟踪能力依然是有限的, 因此在接下来的研究中将结合差动制动进一步提升高速极限工况下车辆的路径跟踪性能和行驶稳定性.
-
表 1 标准贝叶斯网络的参数
Table 1 Parameters of standard Bayesian networks
网络 节点数 边数 变量域 最大节点出入度 Alarm 37 46 2~4 6 Insurance 27 52 2~5 9 Hailfinder 56 66 2~11 17 表 2 标准贝叶斯网络结构平均BIC得分
Table 2 Average BIC score in standard Bayesian network structure
网络 1 000 2 000 3 000 5 000 Alarm -10 874.35 -20 382.51 -30 057.28 -48 056.66 Insurance -15 998.20 -30 103.21 -43 863.15 -73 069.35 Hailfinder -67 046.62 -126 837.31 -176 348.73 -279 766.12 表 3 NCSC算法与标准节点序的K2算法在Alarm网络中运行结果
Table 3 Results of NCSC algorithm and standard node sequence K2 algorithm in Alarm network
Alarm BIC Ext (s) 结构 C M R A W 1 000 NCSC -11 410.83 32.98±1.82 41.8 2.1 2.8 6.5 11.4 K2 -11 189.51 10.27±0.61 44.2 1.8 0 4.3 6.1 2 000 NCSC -20 791.86 42.14±1.88 41.7 1.9 2.2 6.2 10.3 K2 -20 605.99 11.53±0.47 44.5 1.5 0 2.7 4.2 3 000 NCSC -31 025.28 45.99±5.93 42.9 1.3 2.2 4.2 7.7 K2 -30 505.01 14.04±1.95 44.9 1.1 0 3.1 4.2 5 000 NCSC -49 812.61 56.25±2.13 43.2 1.2 1.1 4.7 7 K2 -49 235.77 16.51±0.74 45.1 1.0 0.0 3.1 4.1 表 4 NCSC算法与标准节点序的K2算法在Insurance网络中运行结果
Table 4 Results of NCSC algorithm and standard node sequence K2 algorithm in Insurance network
Insurance BIC Ext (s) 结构 C M R A W 1 000 NCSC -16 486.31 17.28±0.34 38.3 11.9 2.3 2.6 16.8 K2 -16 219.71 4.58±0.25 39.7 12.3 0 0.3 12.6 2 000 NCSC -30 756.3 19.61±1.13 39.1 10.7 2.4 3.2 16.3 K2 -30 544.86 5.11±0.31 42.2 9.8 0 0.5 10.3 3 000 NCSC -45 369.23 24.34±3.22 39.8 10.2 2.3 3.3 15.8 K2 -44 748.8 6.32±0.40 42.6 9.4 0 0.5 9.9 5 000 NCSC -73 566.77 29.92±2.91 40.6 9.4 2.3 3.2 14.9 K2 -73 148.28 7.68±0.45 43.8 8.2 0 0.6 8.8 表 5 NCSC算法与标准节点序的K2算法在Hailfinder网络中运行结果
Table 5 Results of NCSC algorithm and standard node sequence K2 algorithm in Hailfinder network
Insurance BIC Ext (s) 结构 C M R A W 1 000 NCSC -78 396.62 232.18±16.31 47.8 16.3 2.8 9.7 29.3 K2 -78 157.99 25.71±1.55 48.3 17.7 0 8.1 25.8 2 000 NCSC -131 604.2 250.58±7.94 50.2 13.9 1.6 10.1 25.6 K2 -130 945.5 30.22±1.51 51.6 14.4 0 9.1 23.5 3 000 NCSC -182 167.2 292.22±20.01 51.5 13.4 1.4 10.3 25.1 K2 -181 831.9 36.58±1.84 52.9 13.1 0 9.5 22.6 5 000 NCSC -283 288.4 356.14±16.77 51.8 12.8 1.8 10.1 24.7 K2 -282 937.2 43.37±1.83 53.5 12.5 0 9.9 22.4 表 6 五种算法在Alarm网络中运行时间(s)
Table 6 Running time of five algorithms in Alarm network (s)
Alarm 1 000 2 000 3 000 5 000 NCSC 32.98±1.82 42.14±1.88 45.99±2.04 56.25±2.13 K2+T 11.72±0.74 14.82±1.62 16.33±1.25 18.82±2.71 MAK 942.60±31.4 1 153.37±32.37 1 299.01±42.55 1 582.35±46.86 SHC 3 474.01±90.80 4 079.66±121.98 4 784.10±156.85 6 013.93±216.64 SAR 46.77±0.81 49.64±3.52 62.30±3.38 77.39±10.91 表 7 五种算法在Insurance网络中运行时间
Table 7 Running time of five algorithms in Insurance network (s)
Insurance 1 000 2 000 3 000 5 000 NCSC 17.28±0.34 19.61±1.13 24.34±3.22 29.92±2.91 K2+T 4.55±0.41 6.03±1.20 7.17±0.83 9.42±2.59 MAK 388.99±12.41 420.61±27.73 481.50±32.86 694.92±30.30 SHC 4 051.46±123.82 5 521.37±179.04 5 701.31±207.10 7 072.01±241.25 SAR 19.38±0.90 19.95±1.55 31.67±4.81 40.60±5.95 表 8 五种算法在Hailfinder网络中运行时间(s)
Table 8 Running time of five algorithms in Hailfinder network (s)
Hailflnder 1 000 2 000 3 000 5 000 NCSC 232.18±6.31 250.58±7.94 292.22±10.73 356.14±14.86 K2+T 28.54±0.92 32.82±0.93 39.21±1.16 49.38±1.76 MAK 2 203.76±61.58 2 611.30±66.94 3 100.82±96.87 3 854.99±120.45 SHC 18 273.69±468.55 23 500.71±318.11 29 255.29±380.52 35 785.38±420.00 SAR 229.07±7.82 264.35±15.53 307.52±12.35 362.27±20.55 -
[1] Tien I, Der Kiureghian A. Algorithms for Bayesian network modeling and reliability assessment of infrastructure systems. Reliability Engineering and System Safety, 2016, 156: 134-147 doi: 10.1016/j.ress.2016.07.022 [2] Gendelman R, Xing H M, Mirzoeva O K, Sarde P, Curtis C, Feiler H S, et al. Bayesian network inference modeling identifies TRIB1 as a novel regulator of cell-cycle progression and survival in cancer cells. Cancer Research, 2017, 77(7): 1575-1585 doi: 10.1158/0008-5472.CAN-16-0512 [3] Lee D, Pan R. A nonparametric Bayesian network approach to assessing system reliability at early design stages. Reliability Engineering and System Safety, 2018, 171: 57-66 doi: 10.1016/j.ress.2017.11.009 [4] Chaturvedi I, Ragusa E, Gastaldo P, Zunino R, Cambria E. Bayesian network based extreme learning machine for subjectivity detection. Journal of the Franklin Institute, 2018, 355(4): 1780-1797 doi: 10.1016/j.jfranklin.2017.06.007 [5] Khakzad N, Van Gelder P. Vulnerability of industrial plants to flood-induced natechs: a Bayesian network approach. Reliability Engineering and System Safety, 2018, 169: 403- 411 doi: 10.1016/j.ress.2017.09.016 [6] 刘建伟, 黎海恩, 罗雄麟.概率图模型学习技术研究进展.自动化学报, 2014, 40(6): 1025-1044 doi: 10.3724/SP.J.1004.2014.01025Liu Jian-Wei, Li Hai-En, Luo Xiong-Lin. Learning technique of probabilistic graphical models: a review. Acta Automatica Sinica, 2014, 40(6): 1025-1044 doi: 10.3724/SP.J.1004.2014.01025 [7] Contaldi C, Vafaee F, Nelson P C. Bayesian network hybrid learning using an elite-guided genetic algorithm. Artificial Intelligence Review, 2019, 52: 245-272 doi: 10.1007/s10462-018-9615-5 [8] Chow C, Liu C. Approximating discrete probability distributions with dependence trees. IEEE Transactions on Information Theory, 1968, 14(3): 462-467 doi: 10.1109/TIT.1968.1054142 [9] Koopman R, Wang S H. Mutual information based labelling and comparing clusters. Scientometrics, 2017, 111(2): 1157 -1167 doi: 10.1007/s11192-017-2305-2 [10] Pearl J. Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. San Francisco, CA: Morgan Kaufmann Publishers, 1988. [11] Jiang J K, Wang J Y, Yu H, Xu H J. Poison identification based on Bayesian network: a novel improvement on K2 algorithm via Markov blanket. In: Proceedings of the 2013 Advances in Swarm Intelligence. Lecture Notes in Computer Science. Berlin, Germany: Heidelberg: Springer, 2013. 173- 182 [12] Cooper G F, Herskovits E. A Bayesian method for the induction of probabilistic networks from data. Machine Learning, 1992, 9(4): 309-347 [13] Chen X W, Anantha G, Lin X T. Improving Bayesian network structure learning with mutual information-based node ordering in the K2 algorithm. IEEE Transactions on Knowledge and Data Engineering, 2008, 20(5): 628-640 doi: 10.1109/TKDE.2007.190732 [14] Ko S, Kim D W. An efficient node ordering method using the conditional frequency for the K2 algorithm. Pattern Recognition Letters, 2014, 40: 80-87 doi: 10.1016/j.patrec.2013.12.021 [15] Leray P, Francois O. BNT Structure Learning Package: Documentation and Experiments, Technical Report, Laboratoire PSI, 2006. [16] Faulkner E. K2GA: heuristically guided evolution of Bayesian network structures from data. In: Proceedings of the 2007 IEEE Symposium on Computational Intelligence and Data Mining. Honolulu, HI, USA: IEEE, 2007. 18-25 [17] Wu Y H, McCall J, Corne D. Two novel ant colony optimization approaches for Bayesian network structure learning. In: Proceedings of the 2010 IEEE Congress on Evolutionary Computation. Barcelona, Spain: IEEE, 2010. 1-7 [18] Aouay S, Jamoussi S, Ben Ayed Y. Particle swarm optimization based method for Bayesian network structure learning. In: Proceedings of the 5th International Conference on Modeling, Simulation, and Applied Optimization. Hammamet, Tunisia: IEEE, 2013. 1-6 [19] 刘浩然, 孙美婷, 李雷, 刘永记, 刘彬.基于蚁群节点寻优的贝叶斯网络结构算法研究.仪器仪表报, 2017, 38(1): 143-150 http://d.old.wanfangdata.com.cn/Periodical/yqyb201701019Liu Hao-Ran, Sun Mei-Ting, Li Lei, Liu Yong-Ji, Liu Bin. Study on Bayesian network structure learning algorithm based on ant colony node order optimization. Chinese Journal of Scientific Instrument, 2017, 38(1): 143-150 http://d.old.wanfangdata.com.cn/Periodical/yqyb201701019 [20] Malone B, Kangas K, Järvisalo M, Koivisto M, Myllymäki P. Empirical hardness of finding optimal Bayesian network structures: algorithm selection and runtime prediction. Machine Learning, 2018, 107(1): 247-283 doi: 10.1007/s10994-017-5680-2 [21] 王双成, 冷翠平, 李小琳.小数据集的贝叶斯网络结构学习.自动化学报, 2009, 35(8): 1063-1070 doi: 10.3724/SP.J.1004.2009.01063Wang Shuang-Cheng, Leng Cui-Ping, Li Xiao-Lin. Learning Bayesian network structure from small data set. Acta Automatica Sinica, 2009, 35(8): 1063-1070 doi: 10.3724/SP.J.1004.2009.01063 [22] Schwarz G. Estimating the dimension of a model. The Annals of Statistics, 1978, 6(2): 461-464 http://d.old.wanfangdata.com.cn/OAPaper/oai_doaj-articles_97aaabbf8da8b3a5ff9b5d690a7fdbc3 [23] Murphy K. The Bayes net toolbox for MATLAB. Computing Science and Statistics, 2001, 33: 1024-1034 http://www.researchgate.net/publication/2413249_The_Bayes_Net_Toolbox_for_Matlab [24] Wang J Y, Liu S Y. Novel binary encoding water cycle algorithm for solving Bayesian network structures learning problem. Knowledge-Based Systems, 2018, 150: 95-110 doi: 10.1016/j.knosys.2018.03.007 [25] 刘浩然, 吕晓贺, 李轩, 李世昭, 史永红.基于Bayesian改进算法的回转窑故障诊断模型研究.仪器仪表学报, 2015, 36(7): 1554- 1561 doi: 10.3969/j.issn.0254-3087.2015.07.014Liu Hao-Ran, Lv Xiao-He, Li Xuan, Li Shi-Zhao, Shi Yong-Hong. A study on the fault diagnosis model of rotary kiln based on an improved algorithm of Bayesian. Chinese Journal of Scientific Instrument, 2015, 36(7): 1554-1561 doi: 10.3969/j.issn.0254-3087.2015.07.014 [26] Liu H, Zhou S G, Lam W, Guan J H. A new hybrid method for learning Bayesian networks: separation and reunion. Knowledge-Based Systems, 2017, 121: 185-197 doi: 10.1016/j.knosys.2017.01.029 期刊类型引用(6)
1. 刘凯越,周鋆. 基于课程学习权重集成的贝叶斯结构学习算法研究. 应用科技. 2024(01): 1-9 . 百度学术
2. 王进花,汤国栋,曹洁,李亚洁. 基于AESL-GA的BN球磨机滚动轴承故障诊断方法. 北京航空航天大学学报. 2024(04): 1138-1146 . 百度学术
3. 高晓光,闫栩辰,王紫东,刘晓寒,冯奇. 基于评分缓存的节点序空间下BN结构学习. 系统工程与电子技术. 2024(12): 4091-4107 . 百度学术
4. 陈海洋,尚珊珊,任智芳,刘静,张静. 基于改进蚁狮优化的贝叶斯网络结构学习算法. 空军工程大学学报. 2023(02): 104-111 . 百度学术
5. 吕志刚,李叶,王洪喜,邸若海. 贝叶斯网络的结构学习综述. 西安工业大学学报. 2021(01): 1-17 . 百度学术
6. 陈海洋,张娜. 基于混合改进鸟群算法的贝叶斯网络结构学习. 空军工程大学学报(自然科学版). 2021(01): 85-91+98 . 百度学术
其他类型引用(11)
-