-
摘要: 针对一类严格反馈系统的安全控制问题, 提出一种基于滤波控制障碍函数(Filtered control barrier functions, FCBF)的优化控制方法. 首先引入一阶低通滤波器, 构建滤波控制障碍函数. 然后结合控制李雅普诺夫函数(Control Lyapunov functions, CLF)及离线优化技术, 提出一种新颖的安全反推控制算法. 与现有文献相比, 所提控制算法通过运用滤波控制障碍函数, 有效克服了安全反推过程中的“计算膨胀”问题. 仿真结果验证了所提控制算法的有效性与正确性.Abstract: In this paper, an optimal control approach with filtered control barrier functions (FCBF) is proposed for the safe control problem of class of strict-feedback systems. Initially, a sequence of first-order low-pass filters is first introduced to formulate the FCBF. Subsequently, by integrating control Lyapunov functions (CLF) with an off-line optimization approach, a novel safe backstepping control algorithm is devised. In contrast to existing literature, the proposed control algorithm effectively mitigates the issue of “explosion of complexity” inherent in safety backstepping procedures through the utilization of FCBF. Simulation outcomes corroborate the efficacy and validity of the proposed algorithm.
-
近年来, 随着大数据、人工智能等信息技术的迅速发展, 自主智能系统的技术迎来了快速增长阶段, 已在国防、航空航天、制造业、运输和医疗保健等多个领域得到广泛应用. 这些关键技术的进步不仅促进了行业的发展, 也显著提升了系统的自主智能水平. 然而, 随着自主智能系统的广泛应用, 其控制系统的安全性问题日益凸显, 成为无法忽视的重要挑战. 控制系统安全失效可能导致重大生命财产损失, 甚至对环境造成严重破坏. 因此, 确保系统在安全约束范围内运行成为控制领域亟待解决的关键问题. 目前, 常用的系统安全控制方法包括模型检测[1]、可达性分析[2−3]和控制障碍函数[4−6] (Control barrier functions, CBF) 等. 特别是CBF, 因其具有直接表征系统安全性要求的能力, 已逐步成为系统安全控制设计的核心工具之一.
受控制李雅普诺夫函数[7] (Control Lyapunov functions, CLF)和Sontag公式[8]的启发, 文献[9]首次提出CBF的概念. 在此基础上, Ames等在文献[10−12]中进一步定义倒数CBF (Reciprocal control barrier functions, RCBF)和零点CBF (Zeroing control barrier functions, ZCBF), 提出一套基于二次规划(Quadratic programming, QP)的安全控制理论框架. 借助于该框架, 文献[13]研究一类输入和状态受限的二阶非线性系统的预设时间安全控制问题, 提出一种基于CBF的安全控制策略, 确保闭环系统输出在预设时间内实现安全跟踪. 针对一类具有输入约束的二阶欧拉−拉格朗日系统, 文献[14]设计一种基于改进ZCBF的安全控制方法. 文献[15]将这一方法进一步扩展至具有多重约束限制的系统, 但所提安全控制方案仅适用于ZCBF之间不存在冲突的情形. 此外, 文献[16]通过结合高增益观测器和CBF, 解决了一类带有扰动的非线性系统的安全控制问题. 然而, 上述绝大多数安全控制结果仅适用于相对阶为1或2的非线性系统, 无法直接用于解决具有更高相对阶的非线性系统安全控制问题.
为突破这一限制, 文献[17]提出一种基于指数CBF的安全控制方法, 有效解决了具有任意相对阶的非线性系统的安全控制问题. 受文献[17]启发, 文献[18−20]通过在CBF序列的$ \kappa $类函数前引入调节参数或惩罚函数, 给出不同约束状态条件下高阶非线性系统的安全控制策略. 文献[21]探讨一类具有时变全状态约束的非线性系统安全控制问题, 提出一种高阶CBF方法. 这种高阶CBF能确保动态子安全集前向不变性, 并通过QP方法实时优化生成安全控制器. 然而, 为得到合适的指数CBF或高阶CBF, 文献[18−21]所提方法需要对CBF序列进行求导, 且以复杂的方式更改初始安全集.
严格反馈系统作为一类常见的高阶非线性模型, 在实际工程应用中具有广泛的适用性. 这类系统能够有效描述机械臂[22]、移动机器人[23]和无人船[24]等复杂系统的动态行为. 早期关于严格反馈系统的控制研究主要集中在闭环系统的稳定性和跟踪性能方面, 缺少对系统安全性的保证. 最近, 文献[25]提出一种控制共享障碍函数, 解决了具有多个时变输出约束的严格反馈系统的安全跟踪控制问题. 为避免指数CBF和高阶CBF引起的复杂性难题, 文献[26] 探讨一类高阶严格反馈系统的安全控制问题, 提出一种基于CBF的安全反推控制方案. 此外, 文献[27]提出一种基于反推设计的预设时间安全控制方案. 该方案能够确保闭环系统在预设时间内的安全性, 并在此基础上实现跟踪控制. 然而, 在安全反推设计过程中, 需要对虚拟控制函数反复求导, 从而造成“计算膨胀”问题, 增大了这类安全控制算法在实际应用中的实施难度.
基于上述讨论, 本文针对一类严格反馈系统的安全控制问题, 提出一种基于滤波控制障碍函数(Filtered control barrier functions, FCBF)的优化控制策略. 本文的主要贡献在于: 1) 通过引入一阶低通滤波器来构建FCBF, 有效解决了安全反推过程中固有的“计算膨胀”问题. 2) 结合CLF与离线优化技术, 设计一种新颖的安全反推控制算法. 最后, 通过仿真实验验证了所提控制算法的有效性和正确性.
本文的内容安排如下: 第1节和第2节分别描述相关预备知识与所研究的安全控制问题; 第3节引入FCBF并进行相应的安全性分析; 第4节提出一种确保闭环系统安全跟踪的状态反馈控制器; 第5节采用仿真算例对所设计的安全控制器进行验证; 第6节对全文进行总结与展望.
1. 预备知识
考虑如下一类仿射非线性系统
$$ \begin{aligned} \dot{\varepsilon}=\varphi(\varepsilon)+\psi(\varepsilon)u \end{aligned} $$ (1) 其中, $ \varepsilon\in{\bf{R}}^n $和$ u\in{\bf{R}}^m $分别为系统状态和控制输入, $ \varphi(\varepsilon) $和$ \psi(\varepsilon) $为局部利普希茨函数.
定义 1[28]. 对于给定函数$ \Upsilon:{\bf R}^n\rightarrow {\bf R}^m $, 开集$ \mathcal{D}\subseteq{\bf R}^n $, 若存在$ \mathcal{A}\in {\bf R_0}^+ $满足
$$ \begin{aligned} \|\Upsilon(x)-\Upsilon(y)\|\leq \mathcal{A}\|x-y\|,\; \forall x,\;y\in\mathcal{D} \end{aligned} $$ (2) 则称$ \Upsilon $在$ \mathcal{D}$上是利普希茨的.
定义 2[28]. 对于任意$ z\in{\bf R}^n $, 若存在$ \mathcal{B}>0 $, 函数$ \Upsilon $在集合$ \mathcal{A}_\mathcal{B}(z):=\{y\in{{\bf R}^n}:\|y-z\|<\mathcal{B}\} $上是利普希茨的, 则称$ \Upsilon $为局部利普希茨函数. 若$ \Upsilon $在空间$ {\bf R}^n $是利普希茨连续的, 则称$ \Upsilon $为全局利普希茨函数.
1.1 控制障碍函数
定义 3[12]. 给定连续可微函数$ H(\varepsilon):\mathcal{\bf{R}}^n\rightarrow {\bf R} $, 定义其零超水平集
$$ \begin{aligned} \mathcal{S}=\{\varepsilon\in{\bf{R}}^n\; |\; H(\varepsilon)\geq0\} \end{aligned} $$ (3) 定义 4[12]. 对于$ a,\;b > 0 $, 若连续函数$ \alpha: (-b,\;a) \rightarrow (-\infty,\;+\infty) $严格单调递增且$ \alpha(0)=0 $, 则称$ \alpha $为扩展$ \kappa $类函数.
定义 5[12]. 对于系统(1), 若存在扩展$ \kappa $类函数$ \alpha $, 使得$ \forall\varepsilon\in{\bf{R}}^n $, 连续可微函数$ H(\varepsilon) $满足
$$ \begin{split} \sup_{u\in{{\bf{R}}^m}}\dot{H}(\varepsilon,\;u)=\;&\sup_{u\in{{\bf{R}}^m}}L_\varphi H(\varepsilon)+L_\psi H(\varepsilon)u\geq\\ &-\alpha(H(\varepsilon)) \end{split} $$ (4) 则称$ H(\varepsilon) $为系统(1)的ZCBF. 其中, $ L_\varphi H(\varepsilon)= \nabla H(\varepsilon)\varphi(\varepsilon) $, $ L_\psi H(\varepsilon)=\nabla H(\varepsilon)\psi(\varepsilon) $.
给定函数$ H(\varepsilon) $, 定义集合$ \mathcal{U}_{CBF}(\varepsilon) $
$$ \begin{array}{*{20}{l}} \mathcal{U}_{CBF}(\varepsilon)=\Big{\{}u\in{{\bf{R}}^m}\; |\; \dot{H}(\varepsilon,\;u)\geq-\alpha(H(\varepsilon))\Big{\}} \end{array} $$ (5) 引理 1[29]. 若$ H(\varepsilon) $为系统(1)的ZCBF, 且$ \frac{\partial H}{\partial \varepsilon} $满足利普希茨连续, $ \forall\varepsilon\in{\bf{R}}^n $, 则总存在连续反馈控制器$ u\in\mathcal{U}_{CBF}(\varepsilon) $, 使得集合$ \mathcal{S} $相对于系统(1)是前向不变的, 即$ \varepsilon(0)\in\mathcal{S}\Rightarrow \varepsilon(t)\in\mathcal{S},\;\forall t\geq0 $.
定义 6[12]. 若集合$ \mathcal{S} $相对于系统(1)是前向不变的, 则系统(1)是安全的.
根据引理1, 系统(1)的最优安全控制器可由如下QP问题求解得到
$$ \begin{split} &u^*_{cbf}=\arg\mathop{\min}\limits_{u\in{{\bf{R}}}^m} \frac{1}{2}\Vert u\Vert_2^2\\ &\mathrm{s.t.}\; \dot{H}(\varepsilon,\;u)\geq-\alpha(H(\varepsilon)) \end{split} $$ (6) 1.2 控制李雅普诺夫函数
定义 7[7]. 对于系统(1), 若存在$ \kappa $类函数$ \gamma_{1},\; \gamma_{2} $和$ \gamma_{3} $, $ \forall\varepsilon\in{\bf{R}}^n $, 使得连续可微函数$ V(\varepsilon):{\bf{R}}^n\rightarrow $R满足
$$ \begin{array}{*{20}{l}} \gamma_{1}(\|\varepsilon\|_2)\leq V(\varepsilon)\leq\gamma_{2}(\|\varepsilon\|_2) \end{array} $$ (7) $$ \begin{split} \inf_{u\in{\bf{R}}^m}\dot{V}(\varepsilon,\;u)=\;&\inf_{u\in{\bf{R}}^m}L_\varphi V(\varepsilon)+L_\psi V(\varepsilon)u\leq\\ &-\gamma_{3}(V(\varepsilon)) \end{split} $$ (8) 则称$ V(\varepsilon) $为系统(1)的CLF. 其中, $ L_\varphi V(\varepsilon)= \nabla V(\varepsilon)\times \varphi(\varepsilon) $, $ L_\psi V(\varepsilon)=\nabla V(\varepsilon)\psi(\varepsilon) $.
给定$ V(\varepsilon) $, 定义集合$ \mathcal{U}_{CLF}(\varepsilon) $
$$ \begin{array}{*{20}{l}} \mathcal{U}_{{{CLF}}}(\varepsilon)=\Big{\{}u\in{{\bf{R}}^m}\; |\; \dot{V}(\varepsilon,\;u)\leq-\gamma_{3}(V(\varepsilon))\Big{\}} \end{array} $$ (9) 引理 2[7]. 若$ V(\varepsilon) $为系统(1)的CLF, 则总存在连续可微控制器$ u\in\mathcal{U}_{{{CLF}}} $, 使得系统渐近稳定.
根据引理2, 系统(1)的最优稳定控制器可由如下QP问题求解得到
$$ \begin{split} &u^*_{clf}=\arg\mathop{\min}\limits_{u\in{\bf{R}}^m} \frac{1}{2}\Vert u\Vert_2^2\\ &\mathrm{s.t.}\; \dot{V}(\varepsilon,\;u)\leq -\gamma_{3}(V(\varepsilon)) \end{split} $$ (10) 2. 问题描述
考虑如下严格反馈系统
$$ \begin{aligned}\left\{ \begin{aligned} &\dot{x}_i=f_i(\bar{\boldsymbol{x}}_i)+g_i(\bar{\boldsymbol{x}}_i)x_{i+1},\;i=1,\;\cdots,\;n-1 \\ &\dot{x}_n=f_n(\boldsymbol{x})+g_n(\boldsymbol{x})u \\ &y=x_1 \end{aligned} \right. \end{aligned} $$ (11) 其中, $ \boldsymbol{x}=[x_1,\;\cdots,\;x_n]^\mathrm{T}\in {\bf R}^n $为系统状态向量, $ \bar{\boldsymbol{x}}_i= [x_1,\;\cdots,\;x_i]^\mathrm{T} \in {\bf R}^i $, $ i=1,\;\cdots,\;n $, $ u\in{\bf R} $ 和$ y\in{\bf R} $ 分别为系统的控制输入和输出. $ f_i(\bar{\boldsymbol{x}}_i):{\bf R}^i\rightarrow {\bf R} $和$ g_i(\bar{\boldsymbol{x}}_i): {\bf R}^i\rightarrow {\bf R} $为连续可微非线性函数, $ i = 1,\;\cdots,\;n $.
给定表征系统输出安全约束的连续可微函数$ \Phi(x_1):{\bf{R}}\rightarrow {\bf{R}} $, 其零超水平集为
$$ \begin{array}{*{20}{l}} \mathcal{C}_1=\{x_1\in{\bf{R}}\; |\; \Phi(x_1)\geq0\} \end{array} $$ (12) 本文的控制目标是设计状态反馈控制器 $ u $, 确保系统输出始终处于设定的安全集$ \mathcal{C}_1 $内, 且当$ y_d\in \mathcal{C}_1 $, 系统输出 $ y $跟踪期望轨迹 $ y_d $.
假设 1. 存在正常数 $ g_0 $, 使得$ |g_i(\bar{\boldsymbol{x}}_i)|\geq g_0 $. 不失一般性, 假设$ g_i(\bar{\boldsymbol{x}}_i)\geq g_0,\; i=1,\;\cdots,\;n. $
假设 2. 期望轨迹 $ y_d $及其一阶导数 $ \dot{y}_d $连续有界.
注 1. 假设1为系统(11)充分可控的标准条件, 该假设广泛应用于严格反馈系统控制设计的相关文献中[30−31]. 假设2表明本文所提安全控制算法仅要求期望轨迹 $ y_d $及其一阶导数连续有界.
3. 滤波控制障碍函数
本节首先由安全约束函数$ \Phi(x_1) $引出FCBF的定义.
$ \Phi(x_1) $对时间求导可得
$$ \begin{array}{*{20}{l}} \dot{\Phi}(x_1)=\displaystyle\frac{\partial{\Phi}}{\partial{x_1}}(x_1)(f_1(x_1)+g_1(x_1)x_2) \end{array} $$ (13) 显见, 由于$ \Phi(x_1) $的导数不显含控制输入 $ u $, 无法使用CBF直接设计安全控制器. 受反推技术与CLF方法的启发, 文献[26]提出基于反推控制障碍函数的概念, 即存在连续可微的虚拟控制函数$ \vartheta_{1}(x_1) $和全局利普希茨连续的扩展$ \kappa $类函数$ \alpha_1 $, 满足
$$ \begin{split} \dot{\Phi}(x_1)=\;&\frac{\partial{\Phi}}{\partial{x_1}}(x_1)(f_1(x_1)+g_1(x_1)\vartheta_1(x_1))\geq\\ &-\alpha_1(\Phi(x_1)) \end{split} $$ (14) 即可确保系统状态$ x_1 $始终在安全集合$ \mathcal{C}_1 $内运行. 然而, 该方法用于设计严格反馈系统的安全控制器时需要对后续的虚拟控制函数$ \vartheta_i(\bar{\boldsymbol{x}}_i) $反复求导, 易引起“计算膨胀”问题. 为克服这一问题, 本文在每一步反推设计中引入如下一阶低通滤波器[32]
$$ \begin{array}{*{20}{l}} \tau_i\dot{s}_i+s_i=\vartheta_i(\bar{\boldsymbol{x}}_i) \end{array} $$ (15) 其中, $ s_i $为一阶滤波器的输出信号, $ \tau_i $为滤波时间常数, $ s_i(0)=\vartheta_i(0) $, $ \rho_i=s_i-\vartheta_i $为第 $ i $个边界层误差, $ i=1,\;\cdots,\;n-1 $.
定义函数$ h(\boldsymbol{x},\;\boldsymbol{s}) $
$$ h(\boldsymbol{x},\;\boldsymbol{s})=\Phi(x_1)-\displaystyle\sum\limits_{i=2}^{n}\frac{(x_i-s_{i-1})^2}{2}-\displaystyle\sum\limits_{i=1}^{n-1}\frac{\rho_i^2}{2} $$ (16) 及其零超水平集为
$$ \begin{array}{*{20}{l}} \mathcal{C} = \{\boldsymbol{x}\in {\bf{R}}^n|h(\boldsymbol{x},\;\boldsymbol{s})\geq0\} \end{array} $$ (17) 其中, $ \boldsymbol{s} = [s_1,\; \cdots,\;s_{n-1}] $, $ \mathcal{C} \subset \mathcal{C}_1 \times {\bf{R}}^{n - 1} $.
定义 8. 对于系统(11), 给定安全目标函数$ \Phi(x_1) $, $ \frac{\partial \Phi}{\partial x_1}\neq0 $且有式(14)成立. 若存在虚拟滤波信号$ \boldsymbol{s} $和扩展$ \kappa $类函数$ \alpha_1 $, $ \forall\boldsymbol{x}\in{\bf{R}}^n $, 使得
$$ \begin{split} \sup_{u\in{{\bf{R}}}}\dot{h}({\boldsymbol{x},\;\boldsymbol{s},\;u})\geq-\alpha_1(h({\boldsymbol{x},\;\boldsymbol{s}})) \end{split}$$ (18) 则称$ h({\boldsymbol{x},\;\boldsymbol{s}}) $为系统(11)的FCBF.
定理 1. 若$ h({\boldsymbol{x},\;\boldsymbol{s}}) $为系统(11)的FCBF, 对于任意初始值$ \boldsymbol{x}(0)\in\mathcal{C} $, 总存在连续反馈控制器$ u(\boldsymbol{x}) $, 使得集合$ \mathcal{C} $相对于系统(11)是前向不变的, 即$ {\boldsymbol{x}}(0)\in \mathcal{C}\Rightarrow {\boldsymbol{x}}(t)\in\mathcal{C}\Rightarrow x_1(t)\in\mathcal{C}_1 $, $ \forall t\geq0 $.
证明. $ h(\boldsymbol{x},\;\boldsymbol{s}) $对时间求导可得
$$ \begin{split} \dot{h}(\boldsymbol{x},\;&\boldsymbol{s},\;u)=\frac{\partial \Phi}{\partial x_1}(x_1)(f_1(x_1)+g_1(x_1)x_2)\;-\\ &\sum\limits_{i=2}^{n-1}(x_i-s_{i-1})\times(f_i(\bar{\boldsymbol{x}}_{i})+g_i(\bar{\boldsymbol{x}}_{i})x_{i+1}\;-\\ &\dot{s}_{i-1})-(x_n-s_{n-1})\;\times\\ &(f_n(\boldsymbol{x})+g_n(\boldsymbol{x})u-\dot{s}_{n-1})-\sum\limits_{i=1}^{n-1}\rho_i\dot{\rho}_i \end{split} $$ (19) 根据式(15), 设计虚拟控制函数$ \vartheta_i(\bar{\boldsymbol{x}}_i) $和控制器$ u $为
$$ \begin{split} \vartheta_1(x_1) \geq \;&\frac{1}{\frac{\partial{\Phi}}{\partial{x_1}}(x_1)g_1(x_1)}(-\alpha_1(\Phi(x_1))+\mathcal{F}\;-\\ &\frac{\partial{\Phi}}{\partial{x_1}}(x_1)f_1(x_1)) \end{split} $$ (20) $$ \begin{split} \vartheta_2(\bar{\boldsymbol{x}}_2) =\;& \frac{1}{g_2(\bar{\boldsymbol{x}}_2)}(-f_2(\bar{\boldsymbol{x}}_2)-\frac{\chi_2}{2}(x_2-s_1)\;+\\ &\frac{\partial \Phi}{\partial x_1}(x_1)g_1(x_1)+\dot{s}_1) \end{split} $$ (21) $$ \begin{split} \vartheta_i(\bar{\boldsymbol{x}}_i)=\;&\frac{1}{g_i(\bar{\boldsymbol{x}}_i)}(-f_i(\bar{\boldsymbol{x}}_i)-\frac{\chi_i}{2}(x_i-s_{i-1})\;-\\ &g_{i-1}(\bar{\boldsymbol{x}}_{i-1})(x_{i-1}-s_{i-2})\;+\\ &\dot{s}_{i-1}),\;\; \; \; \; \; \; i=3,\;\cdots,\;n-1 \end{split} $$ (22) $$ \begin{split}u(\boldsymbol{x}) =\;&\frac{1}{g_n(\boldsymbol{x})}(-f_n(\boldsymbol{x})-\frac{\chi_n}{2}(x_n-s_{n-1})\;-\\ &g_{n-1}(\bar{\boldsymbol{x}}_{n-1})(x_{n-1}-s_{n-2})+\dot{s}_{n-1}) \end{split} $$ (23) 其中, $ \mathcal{F}>0 $和$ \chi_i>0 $为设计常数, $ i=2,\;\cdots,\;n $.
结合式(15)和(20) ~ (23)代入式(19)中, 逐步计算可得
$$ \begin{split} \dot{h}(\boldsymbol{x},\;\boldsymbol{s},\;u) \geq \;& -\alpha_1(\Phi(x_1))-\sum\limits_{i=1}^{n-1}\rho_i\dot{\rho}_i\;+\\ &\sum\limits_{i=2}^n\frac{\chi_i}{2}(x_i-s_{i-1})^2+\mathcal{F} \end{split} $$ (24) 根据边界层误差定义, 可得
$$ \begin{split} \dot{\rho}_1=\;& \dot{s}_1-\dot{\vartheta}_1= \frac{\rho_1}{\tau_1}-\frac{\partial\vartheta_1}{\partial\Phi}(x_1)\dot{\Phi}(x_1)\;-\\ &\frac{\partial\vartheta_1}{\partial x_1}\dot{x}_1=-\frac{\rho_1}{\tau_1}+\mathcal{E}_1(\Phi,\;x_1) \end{split} $$ (25) $$ \begin{split} \dot{\rho}_2=\; \dot{s}_2-\dot{\vartheta}_2= -\frac{\rho_2}{\tau_2}+\mathcal{E}_2(\Phi,\;\bar{x}_2,\;s_1) \end{split} $$ (26) $$ \begin{split} \dot{\rho}_i =\;& \dot{s}_i-\dot{\vartheta}_i=-\frac{\rho_i}{\tau_i}+\mathcal{E}_i(\bar{x}_i,\;s_1,\;\cdots,\;s_i),\;\\ & i=3,\;\cdots,\;n-1 \end{split} $$ (27) 其中, $ \mathcal{E}_i(\cdot) $是连续函数, $ i=1,\;\cdots,\;n-1 $.
定义紧集$ \Omega={\{}x_1^2/2+\sum_{i=2}^{n}\;(x_i-s_{i\;-\;1})^2\;/2\;+ \sum_{i=1}^{n-1} \rho_i^2/ 2\leq m{\}}\in{\bf{R}}^{n+1} $, 其中, $ m $为任意给定的正常数, 则存在常数$ \mathcal{M}_i $, 使得$ |\mathcal{E}_i(\cdot)|\leq\mathcal{M}_i $成立, $ i= 1,\;\cdots,\; n-1 $. 结合式(25) ~ (27), 则式(24)中的$ \rho_i\dot{\rho}_i $可放缩成
$$ \begin{split} \rho_i\dot{\rho}_i=\;&\rho_i\left(-\frac{\rho_i}{\tau_i}+\mathcal{E}_i(\cdot)\right)=-\frac{\rho_i^2}{\tau_i}+\rho_i\mathcal{E}_i(\cdot)\leq\\ &-\frac{\rho_i^2}{\tau_i}+\mathcal{M}_i|\rho_i| \end{split} $$ (28) 利用Young不等式, 可得
$$ \begin{array}{*{20}{l}} \mathcal{M}_i|\rho_i|\leq\displaystyle\frac{\rho_i^2}{2\tau_i}+\displaystyle\frac{\tau_i\mathcal{M}_i^2}{2} \end{array} $$ (29) 将式(28)和(29)代入式(24), 可推得
$$ \begin{split} \dot{h}(\boldsymbol{x},\;\boldsymbol{s},\;u)\geq\;&-\alpha_1(\Phi(x_1))\;+\\ &\sum\limits_{i=2}^n\frac{\chi_i}{2}(x_i-s_{i-1})^2+\mathcal{F}\;+\\ &\sum\limits_{i=1}^{n-1}\frac{\rho_i^2}{2\tau_i}-\sum\limits_{i=1}^{n-1}\frac{\tau_i\mathcal{M}_i^2}{2} \end{split} $$ (30) 选取$ \mathcal{F}\geq\sum\nolimits_{i=1}^{n-1}\tau_i\mathcal{M}_i^2/2 $, 可进一步得到
$$ \begin{split} \dot{h}(\boldsymbol{x},\;\boldsymbol{s},\;u)\geq\;&-\alpha_1(\Phi(x_1))+\sum\limits_{i=1}^{n-1}\frac{\rho_i^2}{2\tau_i}\;+\\ &\sum\limits_{i=2}^n\frac{\chi_i}{2}(x_i-s_{i-1})^2 \end{split} $$ (31) 设$ L_1 $和$ L_2 $为扩展$ \kappa $类函数$ \alpha_1 $的利普希茨常数, 选取设计常数$ \chi_i\geq L_1,\; i=2,\;\cdots,\;n $和滤波时间常数$ \tau_i\leq 1/L_2,\; i=1,\;\cdots,\;n-1 $, 则有
$$ \begin{split} \dot{h}(\boldsymbol{x},\;\boldsymbol{s},\;u)\geq\;&-\alpha_1(\Phi(x_1))+\sum\limits_{i=1}^{n-1}\frac{L_2}{2}\rho_i^2\;+\\ &\sum\limits_{i=2}^n\frac{L_1}{2}(x_i-s_{i-1})^2 \end{split} $$ (32) 由于$ \alpha_1 $满足全局利普希茨连续条件, 则有
$$ \begin{split} &\Big{|}\alpha_1\Big{(}\Phi(x_1)-\sum\limits_{i=2}^n\frac{(x_i-s_{i-1})^2}{2}- \sum\limits_{i=1}^{n-1}\frac{\rho_i^2}{2}\Big{)}\; -\\ &\;\;\;\alpha_1(\Phi(x_1))\Big{|}\leq \sum\limits_{i=2}^n\frac{L_1}{2}(x_i-s_{i-1})^2+\sum\limits_{i=1}^{n-1}\frac{L_2}{2}\rho_i^2 \end{split} $$ (33) 结合式(16)和(33), 可得
$$ \begin{split} \alpha_1(h(\boldsymbol{x},\;\boldsymbol{s}))\geq\;&\alpha_1(\Phi(x_1))-\sum\limits_{i=1}^{n-1}\frac{L_2}{2}\rho_i^2\;-\\ &\sum\limits_{i=2}^n\frac{L_1}{2}(x_i-s_{i-1})^2 \end{split} $$ (34) 通过式(32)和(34), 可进一步得到
$$ \begin{array}{*{20}{l}} \dot{h}(\boldsymbol{x},\;\boldsymbol{s},\;u)\geq-\alpha_1(h(\boldsymbol{x},\;\boldsymbol{s})) \end{array} $$ (35) 依据定义8可知, $ h(\boldsymbol{x},\;\boldsymbol{s}) $为系统(11)的FCBF.
根据式(16)和比较引理[33], $ \forall\boldsymbol{x}(0)\in\mathcal{C} $, 有
$$ \begin{array}{*{20}{l}} h(\boldsymbol{x}(t),\;\boldsymbol{s})\geq0,\; \forall t\geq 0 \end{array} $$ (36) 由式(36)和定义6可得, 集合$ \mathcal{C} $相对系统(11)是前向不变的, 系统(11)是安全的, 即$ {\boldsymbol{x}}(0)\in \mathcal{C}\Rightarrow {\boldsymbol{x}}(t)\in\mathcal{C}\Rightarrow x_1(t)\in\mathcal{C}_1 $, $ \forall t\geq0 $.
□ 注 2. 与现有的严格反馈系统安全反推控制方案[26−27]相比, 本文通过引入一阶低通滤波器(15)来构建FCBF式(16), 在满足闭环系统安全约束的同时, 有效消除了反推过程中的“计算膨胀”问题.
注 3. 由式(30)可知, 滤波时间常数$ \tau_i $取值越小, 则$ \sum\nolimits_{i=1}^{n-1}\tau_i\mathcal{M}_i^2/2 $亦越小, 即边界层误差给系统(11) 安全性带来的影响越小. 因此, 在实际系统中, 应当根据采样周期、噪声水平和初始条件来尽可能减小滤波时间常数$ \tau_i $.
4. CLF-FCBF控制器设计
基于CBF/FCBF的控制器设计仅仅只能确保系统不违反安全性约束, 然而, 在实际的系统控制中还需要在不违反安全性约束的前提下实现目标控制. 通常系统的安全性约束由CBF确保, 控制目标则由CLF刻画. 由此, 本节结合CLF和FCBF设计连续反馈控制器.
给定跟踪目标函数$ V_1(x_1)=(x_1-y_d)^2/2 $和安全约束$ \Phi(x_1) $, 且满足式(7)、(8)和(14). 受文献[26]启发, 分别构造连续可微函数$ V(\boldsymbol{x},\;\boldsymbol{s}) $和$ h(\boldsymbol{x},\;\boldsymbol{s}) $
$$ V(\boldsymbol{x},\;\boldsymbol{s})=V_1(x_1)+\sum\limits_{i=1}^{n-1}\frac{\rho_{i}^2}{2}+\sum\limits_{i=2}^n\frac{(x_i-s_{i-1})^2}{2} $$ (37) $$ h(\boldsymbol{x},\;\boldsymbol{s})=\Phi(x_1)-\sum\limits_{i=1}^{n-1}\frac{\rho_{i}^2}{2}-\sum\limits_{i=2}^n\frac{(x_i-s_{i-1})^2}{2} $$ (38) 对$ V(\boldsymbol{x},\;\boldsymbol{s}) $和$ h(\boldsymbol{x},\;\boldsymbol{s}) $求导, 可得
$$ \begin{split} \dot{V}(\boldsymbol{x},\;&\boldsymbol{s},\;u)=\frac{\partial V_1}{\partial x_1}(x_1)(f_1(x_1)+g_1(x_1)x_2)\;+\\ &\sum\limits_{i=2}^{n-1}(x_i-s_{i-1})(f_i(\bar{\boldsymbol{x}}_{i})+g_i(\bar{\boldsymbol{x}}_{i})x_{i+1}-\dot{s}_{i-1})\;+\\ &(x_n-s_{n-1})(f_n(\boldsymbol{x})+g_n(\boldsymbol{x})u-\dot{s}_{n-1})\;+\\ &\sum\limits_{i=1}^{n-1}\rho_{i}\dot{\rho}_i= p_V(\boldsymbol{x})+q(\boldsymbol{x})u+\sum\limits_{i=1}^{n-1}\rho_{i}\dot{\rho}_i \\[-1pt]\end{split} $$ (39) $$ \begin{split} \dot{h}(\boldsymbol{x},\;&\boldsymbol{s},\;u)=\frac{\partial \Phi}{\partial x_1}(x_1)(f_1(x_1)+g_1(x_1)x_2)\;-\\ &\sum\limits_{i=2}^{n-1}(x_i-s_{i-1})\times(f_i(\bar{\boldsymbol{x}}_{i})+g_i(\bar{\boldsymbol{x}}_{i})x_{i+1}\;-\\ &\dot{s}_{i-1})-(x_n-s_{n-1})\times(f_n(\boldsymbol{x})\;+\\ &g_n(\boldsymbol{x})u-\dot{s}_{n-1})-\sum\limits_{i=1}^{n-1}\rho_{i}\dot{\rho}_i=\\ &p_h(\boldsymbol{x})- q(\boldsymbol{x})u-\sum\limits_{i=1}^{n-1}\rho_{i}\dot{\rho}_i \end{split} $$ (40) 其中,
$$ \begin{split} p_V(\boldsymbol{x})=\;&\frac{\partial V_1}{\partial x_1}(x_1)(f_1(x_1)+g_1(x_1)x_2)\;+\\ &\sum\limits_{i=2}^{n-1}(x_i-s_{i-1})\;\times\\ &(f_i(\bar{\boldsymbol{x}}_{i})+g_i(\bar{\boldsymbol{x}}_{i})x_{i+1}-\dot{s}_{i-1})\;+\\ &(x_n-s_{n-1})(f_n(\boldsymbol{x})-\dot{s}_{n-1}) \end{split} $$ $$ \begin{split} p_h(\boldsymbol{x})=\;&\frac{\partial \Phi}{\partial x_1}(x_1)(f_1(x_1)+g_1(x_1)x_2)\;-\\ &\sum\limits_{i=2}^{n-1}(x_i-s_{i-1})\;\times\\ &(f_i(\bar{\boldsymbol{x}}_{i})+g_i(\bar{\boldsymbol{x}}_{i})x_{i+1}-\dot{s}_{i-1})\;-\\ &(x_n-s_{n-1})(f_n(\boldsymbol{x})-\dot{s}_{n-1})\\ q(\boldsymbol{x})=\;&(x_n-s_{n-1})g_n(\boldsymbol{x}) \end{split} $$ 与传统的基于反推的控制算法思路相似, 通过递推设计虚拟控制器$ \vartheta_i $ ($ i=1,\;\cdots,\;n-1 $)和实际控制器$ u $, 使得
$$ \begin{split} \inf_{u\in\bf{R}} p_V(\boldsymbol{x})+q(\boldsymbol{x})u+\sum\limits_{i=1}^{n-1}\rho_{i}\dot{\rho}_i\leq -\beta_1(V_1(x_1))\;-\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; \sum\limits_{i=2}^n\frac{(x_i-s_{i-1})^2}{2}-\sum\limits_{i=1}^{n-1}\bar{\mathcal{F}}_i+\sum\limits_{i=1}^{n-1}\rho_{i}\dot{\rho}_i \end{split} $$ (41) $$ \begin{split} \inf_{u\in\bf{R}} -p_h(\boldsymbol{x})+q(\boldsymbol{x})u+\sum\limits_{i=1}^{n-1}\rho_{i}\dot{\rho}_i\leq \alpha_1(\Phi(x_1))\;-\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; \sum\limits_{i=2}^n\frac{(x_i-s_{i-1})^2}{2}-\sum\limits_{i=1}^{n-1}\bar{\mathcal{F}}_i+\sum\limits_{i=1}^{n-1}\rho_{i}\dot{\rho}_i \end{split} $$ (42) 其中, $ \alpha_1 $和$ \beta_1 $为满足全局利普希茨连续的扩展$ \kappa $类函数.
根据假设2, 定义集合$ \Omega_{0}={\{}y_d^2+ \dot{y}_d^2\le \mathcal{M}_0{\}}\in {\bf{R}}^2 $, 其中$ \mathcal{M}_0>0 $. 显见, $ \Omega_{0} $为紧集. 此外, 定义紧集$ \Omega_{d}={\{}x_1^2/2+\sum\nolimits_{i=2}^{n}(x_i-s_{i-1})^2/2+\sum\nolimits_{i=1}^{n-1}\rho_{i}^2/2\leq m_{1}{\}}\in {\bf{R}}^{2n-1} $, 其中, $ m_{1} $为任意给定的正常数. 可知$ \Omega_{0}\times \Omega_{d} $亦为紧集, 则存在常数$ \bar{\mathcal{M}}_i $, 使得$ |\dot{\vartheta}_i|=|\bar{\mathcal{E}}_i(\Phi,\;{\boldsymbol{x}},\; {s}_1,\;\cdots,\;{s}_i)|\leq\bar{\mathcal{M}}_i $成立, $ i=1,\;\cdots,\;n-1 $.
类似定理1, 利用Young不等式和误差边界定义, 可得
$$ \begin{split} \rho_{i}\dot{\rho}_{i}=\;&\rho_{i}(\dot{s}_i-\dot{\vartheta}_i)=\\ &\rho_{i}\left(-\frac{\rho_i}{\tau_i}+\bar{\mathcal{E}}_i(\Phi,\; \bar{\boldsymbol{x}}_i,\;{s}_1,\;\cdots,\;{s}_i)\right)\leq\\ &-\frac{\rho_i^2}{2\tau_i}+\frac{\tau_i\bar{\mathcal{M}}_i^2}{2} \end{split} $$ (43) 为消除边界层带来的影响, 选取设计常数$ \bar{\mathcal{F}}_i\geq \tau_i\bar{\mathcal{M}}_i^2/2,\; i=1,\;\cdots,\;n-1 $, 故而式(41)和(42) 可进一步写为
$$ \begin{split} \inf_{u\in\bf{R}} p_V(\boldsymbol{x})+q(\boldsymbol{x})u\leq -\beta_1(V_1(x_1))\;-\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; \sum\limits_{i=2}^n\frac{( x_i-s_{i-1})^2}{2}-\sum\limits_{i=1}^{n-1}\frac{\rho_{i}^2}{2\tau_i} \end{split} $$ (44) $$ \begin{split} \inf_{u\in\bf{R}} -p_h(\boldsymbol{x})+q(\boldsymbol{x})u\leq \alpha_1(\Phi(x_1))\;-\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; \sum\limits_{i=2}^n\frac{(x_i-s_{i-1})^2}{2}-\sum\limits_{i=1}^{n-1}\frac{\rho_{i}^2}{2\tau_i} \end{split} $$ (45) 根据引理1, 以式(44)和(45)为约束条件, 系统(11)的最优安全稳定控制器可由如下QP问题求解得到
$$ \begin{split} &u(\boldsymbol{x})=\arg\mathop{\min}\limits_{u\in\bf{R}} \frac{1}{2}\Vert u\Vert_2^2\\ &\mathrm{s.t.}\; q(\boldsymbol{x})u\leq \min\{c_V(\boldsymbol{x}),\;c_h(\boldsymbol{x})\} \end{split} $$ (46) 其中,
$$ \begin{split} c_V(\boldsymbol{x})=\;&-p_V(\boldsymbol{x})-\beta_1(V_1(x_1))\;-\\ &\sum\limits_{i=2}^n\frac{(x_i-s_{i-1})^2}{2}-\sum\limits_{i=1}^{n-1}\frac{\rho_{i}^2}{2\tau_i}\\ c_h(\boldsymbol{x})=\;&p_h(\boldsymbol{x})+\alpha_1(\Phi(x_1))\;-\\ &\sum\limits_{i=2}^n\frac{(x_i-s_{i-1})^2}{2}-\sum\limits_{i=1}^{n-1}\frac{\rho_{i}^2}{2\tau_i} \end{split} $$ 从上述讨论中可以看出, 在安全约束和跟踪控制约束不冲突的情况下, 通过恰当设计控制器$ u $, 能够确保系统(11)满足严格的安全约束并实现跟踪控制目标. 然而, 在实际应用中, CLF和FCBF并不总是相互兼容. 为优先确保系统的安全性, 本节引入松弛因子$ \delta_i,\; i=1,\;\cdots,\;n $, 放宽系统的CLF约束, 从而优先满足FCBF刻画的安全约束. 基于此, 本文提出以下定理.
定理 2. 针对严格反馈系统(11), 设计控制器$ u $, 对于任意初始值$ \boldsymbol{x}(0)\in\mathcal{C} $, 使得集合$ \mathcal{C} $相对于系统前向不变, 且当$ y_d\in\mathcal{C}_1 $, 系统输出$ y $跟踪期望轨迹$ y_d $.
证明. 本证明共分成2部分. 首先利用CLF和FCBF设计安全控制器$ u $, 然后分析系统的安全性. 为简化推导过程, 后文中将$ V_1(\cdot)、 V_i(\cdot) $、$ V(\cdot)、 \Phi(\cdot)$、$h_i(\cdot) $和$ h(\cdot) $分别用$ V_1、 V_i、V、 \Phi、 h_i $和$ h $来表示.
部分 1. 本部分通过离线优化方法和Karush-Kuhn-Tucker (KKT)条件, 递推构造安全控制器$ u $.
步骤 1. 对$ V_1 $和$ \Phi $求导, 可得
$$ \dot{V}_1=p_{V_1}+q_{V_1}\vartheta_1 $$ (47) $$ \dot{\Phi}=p_{\Phi}+q_{\Phi}\vartheta_1 $$ (48) 其中, $ p_{V_1} = \frac{\partial V_1}{\partial x_1}(x_1)f_1(x_1) $, $ p_{\Phi} = \frac{\partial \Phi}{\partial x_1}(x_1)f_1(x_1) $, $ q_{V_1}= \frac{\partial V_1}{\partial{x_1}}(x_1)g_1(x_1) $, $ q_{\Phi}=\frac{\partial \Phi}{\partial{x_1}}(x_1)g_1(x_1) $.
以式(47)和(48)为约束条件, 虚拟控制器$ \vartheta_1^* $可由如下QP问题求解得到
$$ \begin{split} &(\vartheta_1^*,\, \omega_{11}^*,\, \omega_{12}^*)=\arg\mathop{\min}\limits_{\vartheta_1,\,\omega_{11},\,\omega_{12}\in{\bf{R}}}+\; \frac{1}{2}\Vert\vartheta_1\Vert_2^2\;+ \\ &\qquad\frac{p_{\omega_{11}}}{2}(\omega_{11}- 1)^2+\frac{p_{\omega_{12}}}{2}(\omega_{12}-1)^2+\frac{p_{s1}}{2}\delta_1^2\\ &\mathrm{s.t.}\; p_{V_1}+q_{V_1}\vartheta_1\leq -\omega_{11}\beta_1(V_1)+\delta_1\\ &\;\;\;\;\;\;p_{\Phi}+q_{\Phi}\vartheta_1\geq -\omega_{12}\alpha_1(\Phi) \\[-1pt]\end{split} $$ (49) 其中, $ \omega_{11} $和$ \omega_{12} $为调节参数, $ p_{\omega_{11}},\; p_{\omega_{12}} $和$ p_{s1} $为正的设计常数, $ \delta_1 $为松弛因子, $ \alpha_1 $和$ \beta_1 $为满足全局利普希茨连续的扩展$ \kappa $类函数.
式(49)的拉格朗日方程为
$$ \begin{split} L(\vartheta_1,\;\omega_{11},\;&\omega_{12},\;\lambda_1,\;\mu_1)=\frac{1}{2}\Vert \vartheta_1\Vert_2^2+\frac{p_{s1}}{2}\delta_1^2\;+\\ &\frac{p_{\omega_{11}}}{2}(\omega_{11}-1)^2+\frac{p_{\omega_{12}}}{2}(\omega_{12}-1)^2\;+\\ &\lambda_1(p_{V_1}+q_{V_1}\vartheta_1+\omega_{11}\beta_1(V_1)-\delta_1)\;-\\ &\mu_1(p_{\Phi}+q_{\Phi}\vartheta_1+\omega_{12}\alpha_1(\Phi)) \\[-1pt]\end{split} $$ (50) 其中, $ \lambda_1 $和$ \mu_1\in{\bf{R}}_{\geq0} $是拉格朗日乘子.
通过KKT条件, 可得
$$ \begin{array}{*{20}{l}} \vartheta_1^*+\lambda_1q_{V_1}-\mu_1q_{\Phi}=0 \end{array} $$ (51) $$ \begin{array}{*{20}{l}} p_{\omega_{11}}(\omega_{11}^*-1)+\lambda_1\beta_1(V_1)=0 \end{array} $$ (52) $$ \begin{array}{*{20}{l}} p_{\omega_{12}}(\omega_{12}^*-1)-\mu_1\alpha_1(\Phi)=0 \end{array} $$ (53) $$ \begin{array}{*{20}{l}} p_{s1}\delta_1-\lambda_1=0 \end{array} $$ (54) $$ \begin{array}{*{20}{l}} \lambda_1(p_{V_1}+q_{V_1}\vartheta_1^*+\omega_{11}^*\beta_1(V_1)-\delta_1)=0 \end{array} $$ (55) $$ \begin{array}{*{20}{l}} \mu_1(p_{\Phi}+q_{\Phi}\vartheta_1^*+\omega_{12}^*\alpha_1(\Phi))=0 \end{array} $$ (56) $$ \begin{split}& \lambda_1\geq0,\; \\ &\quad p_{V_1}+q_{V_1}\vartheta_1^*+\omega_{11}^*\beta_1(V_1)-\delta_1\leq0 \end{split} $$ (57) $$\begin{split}& \mu_1 \geq0,\; \\ &\quad p_{\Phi}+q_{\Phi}\vartheta_1^*+\omega_{12}^*\alpha_1(\Phi)\leq0 \end{split} \qquad\quad$$ (58) 根据约束是否满足, 考虑以下三种情形来分析QP问题(49)的解.
情形 1. 若$ p_{\Phi}+q_{\Phi}\vartheta_1+\omega_{12}\alpha_1(\Phi)\geq0 $. 此时, 令$ \mu_1=0 $, 联立式(51)、(52)、(54)和(55), 可解得$ \vartheta_1^* $、$ \omega_{11}^* $、$ \delta_1 $和$ \lambda_1 $为
$$ \begin{split} \vartheta_1^*=-\lambda_1q_{V_1} \end{split} $$ (59) $$ \begin{split} \omega_{11}^*=1-\frac{\lambda_1\beta_1(V_1)}{p_{\omega_{11}}} \end{split} $$ (60) $$ \begin{split} \delta_1=\frac{\lambda_1}{p_{s1}} \end{split} $$ (61) $$ \begin{split} \lambda_1=\frac{p_{\omega_{11}}p_{s1}(p_{V_1}+\beta_1(V_1))}{p_{\omega_{11}}p_{s1}q_{V_1}^2+p_{s1}\beta_1^2(V_1)+p_{\omega_{11}}} \end{split} $$ (62) 情形 2. 若$ p_{\Phi}+q_{\Phi}\vartheta_1+\omega_{12}\alpha_1(\Phi)<0 $且 $ p_{V_1}+ q_{V_1}\vartheta_1+\omega_{11}\beta_1(V_1)-\delta_1\leq0 $. 此时, 令$ \lambda_1=0 $, 联立式(51)、(53)和(56), 可解得$ \vartheta_1^* $、$ \omega_{12}^* $和$ \mu_1 $为
$$ \begin{split} \vartheta_1^*=\mu_1q_{\Phi} \end{split} $$ (63) $$ \begin{split} \omega_{12}^*=1+\frac{\mu_1\alpha_1(\Phi)}{p_{\omega_{12}}} \end{split} $$ (64) $$ \begin{split} \mu_1=-\frac{p_{\omega_{12}}(p_{\Phi}+\alpha_1(\Phi))}{p_{\omega_{12}}q_{\Phi}^2+\alpha_1^2(\Phi)} \end{split} $$ (65) 情形 3. 若$ p_{\Phi}+q_{\Phi}\vartheta_1+\omega_{12}\alpha_1(\Phi)<0 $且$ p_{V_1}+ q_{V_1}\vartheta_1+\omega_{11}\beta_1(V_1)-\delta_1>0 $. 此时, 联立式(51) ~ (56), 可解得$ \vartheta_1^* $、$ \omega_{11}^* $、$ \omega_{12}^* $、$ \delta_1 $、$ \lambda_1 $和$ \mu_1 $为
$$ \begin{split} \vartheta_1^*=\mu_1q_{\Phi}-\lambda_1q_{V_1} \end{split} $$ (66) $$ \begin{split} \omega_{11}^*=1-\frac{\lambda_1\beta_1(V_1)}{p_{\omega_{11}}} \end{split} $$ (67) $$ \begin{split} \omega_{12}^*=1+\frac{\mu_1\alpha_1(\Phi)}{p_{\omega_{12}}} \end{split} $$ (68) $$ \begin{split} \delta_1=\frac{\lambda_1}{p_{s1}} \end{split} $$ (69) $$ \begin{split} \mu_1=\;&-(p_{\omega_{12}}(p_{\Phi}+\alpha_1(\Phi)-\lambda_1q_{V_1}q_{\Phi}))\;\times\\ &\frac{1}{p_{\omega_{12}}q_{\Phi}^2+\alpha_1^2(\Phi)} \end{split} $$ (70) $$ \begin{split} \lambda_1=\frac{Q_1-W_1}{P_1} \end{split} $$ (71) 其中,
$$ \begin{split} Q_1=\;&p_{\omega_{11}}p_{s1}(p_{\omega_{12}}q_{\Phi}^2+\alpha_1^2(\Phi))\times(p_{V_1}+\beta_1(V_1)) \\ W_1=\;&p_{\omega_{11}}p_{s1}p_{\omega_{12}}q_{\Phi}q_{V_1}(p_{\Phi}+\alpha_1(\Phi))\\ P_1=\;&p_{\omega_{11}}p_{s1}\alpha_1^2(\Phi)q_{V_1}^2+(p_{\omega_{12}}q_{\Phi}^2+\alpha_1^2(\Phi))\;\times\\ &(p_{s1}\beta_1^2(V_1)+p_{\omega_{11}}) \end{split} $$ 根据文献[34]的定理2可知, $ \vartheta_1^* $满足局部利普希茨连续. 由式(15)可得
$$ \begin{split} s_1=\vartheta_1^*-\tau_1\dot{s}_1 \end{split} $$ (72) 步骤 $ i $ ($ i=2,\;\cdots,\;n-1 $). 构造如下连续函数
$$ \begin{split} V_i(\bar{\boldsymbol{x}}_i,\;\boldsymbol{s}_{i-1})=\;&V_1+\sum\limits_{j=2}^{i}\frac{(x_j-s_{j-1})^2}{2} \end{split} $$ (73) $$ \begin{split} h_i(\bar{\boldsymbol{x}}_i,\;\boldsymbol{s}_{i-1})=\;&\Phi-\sum\limits_{j=2}^i\frac{(x_j-s_{j-1})^2}{2} \end{split} $$ (74) 其中, $ \boldsymbol{s}_{i-1}=[s_1,\;\cdots,\;s_{i-1}] $.
对$ V_i(\bar{\boldsymbol{x}}_i,\;\boldsymbol{s}_{i-1}) $和$ h_i(\bar{\boldsymbol{x}}_i,\;\boldsymbol{s}_{i-1}) $求导, 可得
$$ \begin{split} \dot{V}_i(\bar{\boldsymbol{x}}_i,\;\boldsymbol{s}_{i-1})=\;&p_{V_i}+q_{V_i}\vartheta_i \end{split} $$ (75) $$ \begin{split} \dot{h}_i(\bar{\boldsymbol{x}}_i,\;\boldsymbol{s}_{i-1})=\;&p_{h_i}-q_{h_i}\vartheta_i \end{split} $$ (76) 其中,
$$ \begin{split} p_{V_i}=\;&\frac{\partial V_1}{\partial x_1}(x_1)(f_1(x_1)+g_1(x_1)x_2)\;+\\ &\sum\limits_{j=2}^{i-1}(x_{j}-s_{j-1})\;\times\\ &(f_j(\bar{\boldsymbol{x}}_j)+g_j(\bar{\boldsymbol{x}}_j)x_{j+1}-\dot{s}_{j-1})\;+\\ &(x_i-s_{i-1})(f_i(\bar{\boldsymbol{x}}_i)-\dot{s}_{i-1})\\ \end{split} $$ $$ \begin{split} p_{h_i}=\;&\frac{\partial \Phi}{\partial x_1}(x_1)(f_1(x_1)+g_1(x_1)x_2)\;-\\ &\sum\limits_{j=2}^{i-1}(x_{j}-s_{j-1})\;\times\\ &(f_j(\bar{\boldsymbol{x}}_j)+g_j(\bar{\boldsymbol{x}}_j)x_{j+1}-\dot{s}_{j-1})\;-\\ &(x_i-s_{i-1})(f_i(\bar{\boldsymbol{x}}_i)-\dot{s}_{i-1})\\ q_{V_i}=\;&q_{h_i}=(x_i-s_{i-1})g_i(\bar{\boldsymbol{x}}_i) \end{split} $$ 与步骤1类似, 以式(75)和(76)为约束条件, 虚拟控制器$ \vartheta_i^* $可由如下QP问题求解得到
$$ \begin{split} &(\vartheta_i^*,\; \omega_{i1}^*,\; \omega_{i2}^*)=\arg\mathop{\min}\limits_{\vartheta_i,\;\omega_{i1},\;\omega_{i2}\in{\bf{R}}}\frac{1}{2}\Vert \vartheta_i\Vert_2^2\;+\\ &\qquad\frac{p_{\omega_{i1}}}{2}(\omega_{i1}-1)^2+\frac{p_{\omega_{i2}}}{2}(\omega_{i2}-1)^2+ \frac{p_{si}}{2}\delta_i^2\\ & \mathrm{s.t.}\; p_{V_i}+q_{V_i}\vartheta_i\leq -\omega_{i1}\beta_i(V_i)+\delta_i\\ & \;\;\;\;\;\;p_{h_i}-q_{h_i}\vartheta_i\geq -\omega_{i2}\alpha_i(h_i) \\[-1pt]\end{split} $$ (77) 其中, $ \omega_{i1} $和$ \omega_{i2} $为调节参数, $ p_{\omega_{i1}} $、$ p_{\omega_{i2}} $和$ p_{si} $为正的设计常数, $ \delta_i $为松弛因子, $ \alpha_i $和$ \beta_i $为满足全局利普希茨连续的扩展$ \kappa $类函数.
式(77)的拉格朗日方程为
$$ \begin{split} L(\vartheta_i,\; \omega_{i1},\; & \omega_{i2},\; \lambda_i,\; \mu_i)=\frac{1}{2}\Vert \vartheta_i(\bar{\boldsymbol{x}}_{i})\Vert_2^2+\frac{p_{si}}{2}\delta_i^2\;+\\ &\frac{p_{\omega_{i1}}}{2}(\omega_{i1}-1)^2+\frac{p_{\omega_{i2}}}{2}(\omega_{i2}-1)^2\;+\\ &\lambda_i(p_{V_i}+q_{V_i}\vartheta_i+\omega_{i1}\beta_i(V_i)-\delta_i)\;-\\ &\mu_i(p_{h_i}-q_{h_i}\vartheta_i+\omega_{i2}\alpha_i(h_i)) \\[-1pt]\end{split} $$ (78) 其中, $ \lambda_i $和$ \mu_i\in{\bf{R}}_{\geq0} $是拉格朗日乘子.
利用KKT条件, 可得
$$ \begin{split} \vartheta_i^*+\lambda_iq_{V_i}+\mu_iq_{h_i}=0 \end{split} $$ (79) $$ \begin{split} p_{\omega_{i1}}(\omega_{i1}^*-1)+\lambda_i\beta_i(V_i)=0 \end{split} $$ (80) $$ \begin{split} p_{\omega_{i2}}(\omega_{i2}^*-1)-\mu_i\alpha_i(h_i)=0 \end{split} $$ (81) $$ \begin{split} p_{si}\delta_i-\lambda_i=0 \end{split} $$ (82) $$ \begin{split} \lambda_i(p_{V_i}+q_{V_i}\vartheta_i^*+\omega_{i1}^*\beta_i(V_i)-\delta_i)=0 \end{split} $$ (83) $$ \begin{split} \mu_i(p_{h_i}-q_{h_i}\vartheta_i^*+\omega_{i2}^*\alpha_i(h_i))=0 \end{split} $$ (84) $$ \begin{split} & \lambda_i\geq0,\;\\ &\quad p_{V_i}+q_{V_i}\vartheta_i^*+\omega_{i1}^*\beta_i(V_i)-\delta_i\leq0 \end{split} $$ (85) $$ \begin{split}& \mu_i\geq0,\;\\ &\quad p_{h_i}-q_{h_i}\vartheta_i^*+\omega_{i2}^*\alpha_i(h_i)\leq0 \end{split}\quad\quad $$ (86) 同步骤1, 根据约束是否满足, 考虑以下三种情形来分析QP问题(77)的解.
情形 1. 若$ p_{h_i}-q_{h_i}\vartheta_i^*+\omega_{i2}\alpha_i(h_i)\geq0 $. 此时, 令$ \mu_i=0 $, 联立式(79)、(80)、(82)和(83), 可解得$ \vartheta_i^* $、$ \omega_{i1}^* $、$ \delta_i $和$ \lambda_i $为
$$ \begin{split} \vartheta_i^*=-\lambda_iq_{V_i} \end{split} $$ (87) $$ \begin{split} \omega_{i1}^*=1-\frac{\lambda_i\beta_i(V_i)}{p_{\omega_{i1}}} \end{split} $$ (88) $$ \begin{split} \delta_i=\frac{\lambda_i}{p_{si}}\; \end{split} $$ (89) $$ \begin{split} \lambda_i=\frac{p_{\omega_{i1}}p_{si}(p_{V_i}+\beta_i(V_i))}{p_{\omega_{i1}}p_{si}q_{V_i}^2+p_{si}\beta_i^2(V_i)+p_{\omega_{i1}}} \end{split} $$ (90) 情形 2. 若$ p_{h_i}-q_{h_i}\vartheta_i+\omega_{i2}\alpha_i(h_i)<0 $且 $ p_{V_i}\;+ q_{V_i}\vartheta_i+\omega_{i1}\beta_i(V_i)-\delta_i\leq0 $. 此时, 令$ \lambda_i=0 $, 联立式(79)、(81)和(84), 可解得$ \vartheta_i^* $、$ \omega_{i2}^* $和$ \mu_i $为
$$ \begin{split} \vartheta_i^*=-\mu_iq_{h_i} \end{split} $$ (91) $$ \begin{split} \omega_{i2}^*=1+\frac{\mu_i\alpha_i(h_i)}{p_{\omega_{i2}}} \end{split} $$ (92) $$ \begin{split} \mu_i=-\frac{p_{\omega_{i2}}(p_{h_i}+\alpha_i(h_i))}{p_{\omega_{i2}}q_{h_i}^2+\alpha_i^2(h_i)} \end{split} $$ (93) 情形 3. 若$ p_{h_i}-q_{h_i}\vartheta_i+\omega_{i2}\alpha_i(h_i)<0 $且 $ p_{V_i}+ q_{V_i}\vartheta_i+\omega_{i1}\beta_i(V_i)-\delta_i>0 $. 此时, 联立式(79) ~ (84), 可解得$ \vartheta_i^* $、$ \omega_{i1}^* $、$ \omega_{i2}^* $、$ \delta_i、\mu_i $和$ \lambda_i $为
$$ \begin{split} \vartheta_i^*=-\mu_iq_{h_i}-\lambda_iq_{V_i} \end{split} $$ (94) $$ \begin{split} \omega_{i1}^*=1-\frac{\lambda_i\beta_i(V_i)}{p_{\omega_{i1}}} \end{split} $$ (95) $$ \begin{split} \omega_{i2}^*=1+\frac{\mu_i\alpha_i(h_i)}{p_{\omega_{i2}}} \end{split} $$ (96) $$ \begin{split} \delta_i=\frac{\lambda_i}{p_{si}}\; \end{split} $$ (97) $$ \begin{split} \mu_i=\;&-(p_{h_i}+\alpha_i(h_i)+\lambda_iq_{V_i}q_{h_i})\;\times\\ &\frac{p_{\omega_{i2}}}{p_{\omega_{i2}}q_{h_i}^2+\alpha_i^2(h_i)} \end{split} $$ (98) $$ \begin{split} \lambda_i=\frac{Q_i+W_i}{P_i} \end{split} $$ (99) 其中,
$$ \begin{split} Q_i=\;&p_{\omega_{i1}}p_{si}(p_{\omega_{i2}}q_{h_i}^2+\alpha_i^2(h_i))\;\times \\ &(\beta_i(V_i)+p_{V_i}) \end{split} $$ $$ \begin{split} W_i=\;&p_{\omega_{i1}}p_{si}q_{V_i}q_{h_i}p_{\omega_{i2}}(p_{h_i}+\alpha_i(h_i)) \\ P_i=\;&p_{\omega_{i1}}p_{si}q_{V_i}^2\alpha_i^2(h_i)+(p_{si}\beta_i^2(V_i)+p_{\omega_{i1}})\;\times\\ &(p_{\omega_{i2}}q_{h_i}^2+\alpha_i^2(h_i)) \end{split} $$ 相同的, 根据文献[34]的定理2可知, $ \vartheta_i^*(\bar{\boldsymbol{x}}_{i}) $满足局部利普希茨连续. 由式(15)可得
$$ \begin{split} s_i=\vartheta_i^*(\bar{\boldsymbol{x}}_{i})-\tau_i\dot{s}_i \end{split} $$ (100) 步骤 $ n $. 构造如下连续函数
$$ \begin{split} V_n(\boldsymbol{x},\;\boldsymbol{s})=\;&V_1(x_1)+\sum\limits_{i=2}^{n}\frac{(x_i-s_{i-1})^2}{2} \end{split} $$ (101) $$ \begin{split} h_n(\boldsymbol{x},\;\boldsymbol{s})=\;&\Phi(x_1)-\sum\limits_{i=2}^{n}\frac{(x_i-s_{i-1})^2}{2} \end{split} $$ (102) 对式(101)和(102)求导可得
$$ \begin{split} \dot{V}_n(\boldsymbol{x},\;\boldsymbol{s},\;u)=\;&p_{V}+q_{V}u \end{split} $$ (103) $$ \begin{split} \dot{h}_n(\boldsymbol{x},\;\boldsymbol{s},\;u)=\;&p_{h}-q_{h}u \end{split} $$ (104) 其中,
$$ \begin{split} p_{V}=\;&\frac{\partial V_1}{\partial x_1}(x_1)(f_1(x_1)+g_1(x_1)x_2)\;+\\ &\sum\limits_{i=2}^{n-1}(x_i-s_{i-1})\;\times\\ &(f_i(\bar{\boldsymbol{x}}_{i})+g_i(\bar{\boldsymbol{x}}_{i})x_{i+1}-\dot{s}_{i-1})\;+\\ &(x_n-s_{n-1})(f_n(\boldsymbol{x})-\dot{s}_{n-1})\\ p_{h}=\;&\frac{\partial \Phi}{\partial x_1}(x_1)(f_1(x_1)+g_1(x_1)x_2)\;-\\ &\sum\limits_{i=2}^{n-1}(x_i-s_{i-1})\;\times\\ &(f_i(\bar{\boldsymbol{x}}_{i})+g_i(\bar{\boldsymbol{x}}_{i})x_{i+1}-\dot{s}_{i-1})\;-\\ &(x_n-s_{n-1})(f_n(\boldsymbol{x})-\dot{s}_{n-1})\\ q_{V}=\;&q_{h}=(x_n-s_{n-1})g_n(\boldsymbol{x}) \end{split} $$ 根据式(103)和(104), 控制器$ u^* $可由如下QP问题求解得到
$$ \begin{split}& (u^*,\;\omega_{n1}^*,\;\omega_{n2}^*)=\arg\mathop{\min}\limits_{u,\;\omega_{n1},\;\omega_{n2}\in\bf{R}} \frac{1}{2}\Vert u\Vert_2^2\;+\\ &\qquad\frac{p_{\omega_{n1}}}{2}(\omega_{n1}-1)^2+\frac{p_{\omega_{n2}}}{2}(\omega_{n2}-1)^2+ \frac{p_{sn}}{2}\delta_n^2\\&\mathrm{s.t.}\; p_{V}+q_{V}u\leq -\omega_{n1}\beta_n(V_n)+\delta_n-\bar{\mathcal{F}}\\ &\;\;\;\;\;\;p_{h}-q_{h}u\geq -\omega_{n2}\alpha_n(h_n)+\bar{\mathcal{F}}\\[-1pt] \end{split} $$ (105) 其中, $ \omega_{n1} $和$ \omega_{n2} $为调节参数, $ p_{\omega_{n1}} $、$ p_{\omega_{n2}} $、$ p_{sn} $和$ \bar{\mathcal{F}} $为正的设计常数, $ \delta_n $为松弛因子, $ \alpha_n $和$ \beta_n $为全局利普希茨连续的扩展$ \kappa $类函数.
式(105)的拉格朗日方程为
$$ \begin{split} L(u,\;&\omega_{n1},\;\omega_{n2},\;\lambda_n,\;\mu_n)=\frac{1}{2}\Vert u\Vert_2^2+\frac{p_{sn}}{2}\delta_n^2\;+\\ &\frac{p_{\omega_{n1}}}{2}(\omega_{n1}-1)^2+\frac{p_{\omega_{n2}}}{2}(\omega_{n2}-1)^2\;+\\ &\lambda_n(p_{V}+q_{V}u+\omega_{n1}\beta_n(V_n)-\delta_n+\bar{\mathcal{F}})\;-\\ &\mu_n(p_{h}-q_{h}u+\omega_{n2}\alpha_n(h_n)-\bar{\mathcal{F}}) \end{split} $$ (106) 其中, $ \lambda_n,\; \mu_n\in{\bf{R}}_{\geq0} $是拉格朗日乘子.
利用KKT条件, 可得
$$ \begin{split} u^*+\lambda_nq_{V}+\mu_nq_{h}=0 \end{split} $$ (107) $$ \begin{split} p_{\omega_{n1}}(\omega_{n1}^*-1)+\lambda_n\beta_n(V_n)=0 \end{split} $$ (108) $$ \begin{split} p_{\omega_{n2}}(\omega_{n2}^*-1)-\mu_n\alpha_n(h_n)=0 \end{split} $$ (109) $$ \begin{split} p_{sn}\delta_n-\lambda_n=0 \end{split} $$ (110) $$ \begin{split} \lambda_n(p_{V}+q_{V}u^*+\omega_{n1}^*\beta_n(V_n)- \delta_n+\bar{\mathcal{F}})=0 \end{split} $$ (111) $$ \begin{split} \mu_n(p_{h}-q_{h}u^*+\omega_{n2}^*\alpha_n(h_n)-\bar{\mathcal{F}})=0 \end{split} $$ (112) $$ \lambda_n \geq 0,\;\; p_{V} + q_{V}u^* + \omega_{n1}^*\beta_n(V_n) - \delta_n +\bar{\mathcal{F}}\leq0 $$ (113) $$ \begin{split} \mu_n \geq0,\;\; p_{h}-q_{h}u^*+\omega_{n2}^*\alpha_n(h_n)-\bar{\mathcal{F}}\leq0 \end{split} $$ (114) 同理, 根据约束是否满足, 考虑以下三种情形来分析QP问题(105)的解.
情形 1. 若$ p_{h}-q_{h}u+\omega_{n2}\alpha_n(h_n)-\bar{\mathcal{F}}\geq0 $. 此时, 令$ \mu_n=0 $, 联立式(107)、(108)、(110) 和(111), 可解得$ u^* $、$ \omega_{n1}^* $、$ \delta_n $和$ \lambda_n $为
$$ \begin{split} u^*=-\lambda_nq_{V} \end{split} $$ (115) $$ \begin{split} \omega_{n1}^*=1-\frac{\lambda_n\beta_n(V_n)}{p_{\omega_{n1}}} \end{split} $$ (116) $$ \begin{split} \delta_n=\frac{\lambda_n}{p_{sn}} \end{split} $$ (117) $$ \begin{split} \lambda_n=p_{\omega_{n1}}p_{sn}(p_{V}+\bar{\mathcal{F}}+\beta_n(V_n))\;\times\\ \; \; \; \; \; \; \; \; \; \; \frac{1}{p_{sn}(p_{\omega_{n1}}q_{V}^2+\beta_n^2(V_n))+p_{\omega_{n1}}} \end{split} $$ (118) 情形 2. 若$ p_{h}\;-\;q_{h}u\;+\;\omega_{n2}\alpha_n(h_n)\;-\;\bar{\mathcal{F}}\;<\;0 $且$ p_{V} + q_{V}u + \omega_{n1}\beta_n(V_n) - \delta_n + \bar{\mathcal{F}}\leq0 $. 此时, 令$ \lambda_n=0 $, 联立式(107)、(109)和(112), 可解得$ u^* $、$ \omega_{n2}^* $和$ \mu_n $为
$$ \begin{split} u^*=-\mu_nq_{h} \end{split} $$ (119) $$ \begin{split} \omega_{n2}^*=1+\frac{\mu_n\alpha_n(h_n)}{p_{\omega_{n2}}} \end{split} $$ (120) $$ \begin{split} \mu_n=\;&-(p_{h}-\bar{\mathcal{F}}+\alpha_n(h_n)+\lambda_nq_{V}q_{h})\;\times\\ &\frac{p_{\omega_{n2}}}{p_{\omega_{n2}}q_{h}^2+\alpha_n^2(h_n)} \end{split} $$ (121) 情形 3. 若$ p_{h}\;-\;q_{h}u\;+\;\omega_{n2}\alpha_n(h_n)\;-\;\bar{\mathcal{F}}<0 $且$ p_{V}+q_{V}u+\omega_{n1}\beta_n(V_n)-\delta_n+\bar{\mathcal{F}}>0 $. 此时, 联立式(107) ~ (112), 可解得$ u^* $、$ \omega_{n1}^* $、$ \omega_{n2}^* $、$ \delta_n $、$ \lambda_n $和$ \mu_n $为
$$ \begin{split} u^*=-\mu_nq_{h}-\lambda_nq_{V} \end{split} $$ (122) $$ \begin{split} \omega_{n1}^*=1-\frac{\lambda_n\beta_n(V_n)}{p_{\omega_{n1}}} \end{split} $$ (123) $$ \begin{split} \omega_{n2}^*=1+\frac{\mu_n\alpha_n(h_n)}{p_{\omega_{n2}}} \end{split} $$ (124) $$ \begin{split} \delta_n=\frac{\lambda_n}{p_{sn}} \end{split} $$ (125) $$ \begin{split} \mu_n=\;&-(p_{h}-\bar{\mathcal{F}}+\alpha_n(h_n)+\lambda_nq_{V}q_{h})\;\times\\ & \frac{p_{\omega_{n2}}}{p_{\omega_{n2}}q_{h}^2+\alpha_n^2(h_n)} \end{split} $$ (126) $$ \begin{split} \lambda_n=\frac{Q_n+W_n}{P_n} \end{split} $$ (127) 其中,
$$ \begin{split} Q_n=\;&p_{\omega_{n1}}p_{sn}(p_{\omega_{n2}}q_{h}^2+\alpha_n^2(h_n))\;\times\\ &(\beta_n(V_n)+\bar{\mathcal{F}}+p_{V})\\ W_n=\;&p_{\omega_{n1}}p_{sn}q_{h}q_{V}p_{\omega_{n2}}(p_{h}-\bar{\mathcal{F}}+\alpha_n(h_n))\\ P_n=\;&p_{\omega_{n1}}p_{sn}q_{V}^2\alpha_n^2(h_n)+(p_{sn}\beta_n^2(V_n)+p_{\omega_{n1}})\;\times\\ &(p_{\omega_{n2}}q_{h}^2+\alpha_n^2(h_n)) \end{split} $$ 根据文献[34]的定理2可知, $ u^* $满足局部利普希茨连续.
部分 2. 本部分将进行系统的安全分析.
若系统安全约束条件不满足时, 即$ y_d\notin\mathcal{C}_1 $时. 类似定理1, 结合式(40)、(43)和部分 1的步骤1 ~ 步骤$ n $中的情形2和情形3, 同时选取设计常数$ \bar{\mathcal{F}}\geq \sum\nolimits_{i=1}^{n-1}\tau_i\bar{\mathcal{M}}_i^2/2 $, 则有
$$ \begin{split} \dot{h}(\boldsymbol{x},\;\boldsymbol{s},\;u^*)\geq\;&-\omega_{n2}^*\alpha_n(h(\boldsymbol{x},\;\boldsymbol{s})) \end{split} $$ (128) 根据定义6和定义8可知, 集合$ \mathcal{C} $相对于系统(1)是安全的, 即$ {\boldsymbol{x}}(0)\in\mathcal{C}\Rightarrow {\boldsymbol{x}}(t)\in\mathcal{C}\Rightarrow x_1(t)\in\mathcal{C}_1,\; \forall t\geq0 $.
若系统安全约束条件满足时, 即$ y_d\in\mathcal{C}_1 $时. 结合式(39)、(43)和部分1的步骤1 ~ 步骤$ n $中的情形1, 在该条件下系统增加跟踪约束, 且选取设计常数$ \bar{\mathcal{F}}\geq\sum\nolimits_{i=1}^{n-1}\tau_i\bar{\mathcal{M}}_i^2/2 $, 可使得式(128)成立, 且满足
$$ \begin{split} \dot{V}(\boldsymbol{x},\;\boldsymbol{s},\;u)\leq-\omega_{n1}^*\beta_n(V(\boldsymbol{x},\;\boldsymbol{s})) \end{split} $$ (129) 即系统输出可实现跟踪控制.
□ 注 4. 根据文献[10], 引入松弛因子$ \delta_i $可确保CLF和FCBF不等式约束线性无关, 因此总存在满足不等式约束的解, 从而确保了所提安全反推控制算法的可行性.
5. 仿真算例
为验证本文所提安全控制方法的有效性, 本节利用两个算例进行仿真实验.
例1. 考虑如下二阶严格反馈系统
$$ \begin{split} \left\{ \begin{aligned} &\dot{x}_1=f_1(x_1)+g_1(x_1)x_2\\ &\dot{x}_2=f_2(\boldsymbol{x})+g_2(\boldsymbol{x})u\\ &y=x_1 \end{aligned} \right. \end{split} $$ (130) 其中, $ f_1(x_1)=x_1^2,\; f_2(\boldsymbol{x})=x_1x_2,\; g_1(x_1)=1, \; g_2(\boldsymbol{x}) = 1+x_1x_2 $. 系统初始状态为$ x_1(0)=0.35,\; x_2(0)= 0 $. 给定期望轨迹$ y_d=\sin(t) $.
定义系统的跟踪目标函数$ V_1=(x_1-y_d)^2/2 $和安全约束函数$ \Phi=0.81-x_1^2 $, 分别构造CLF和FCBF为
$$ \begin{split} V(\boldsymbol{x},\;\boldsymbol{s}) = V_1+\frac{(x_2-s_{1})^2}{2} \end{split} $$ (131) $$ \begin{split} h(\boldsymbol{x},\;\boldsymbol{s}) = \Phi-\frac{(x_2-s_{1})^2}{2} \end{split} $$ (132) 仿真结果如图1所示, 刻画不同滤波时间常数对系统安全性能的影响. 当滤波时间常数 $ \tau $取值较小($ \tau=0.002,\; \tau=0.01 $) 时, 所设计的控制器能够确保系统输出 $ y $始终在安全区域内运行, 并保持较好的跟踪性能. 然而, 当滤波时间常数增大至$ \tau= 0.05 $时, 则会破坏系统的安全性.
为更好地阐明本文所提安全控制算法的优越性, 在保持系统初始值和控制器参数不变的前提下, 将本文所提基于FCBF的安全控制算法($ \tau=0.01 $)与文献[26]中的安全反推控制方法进行对比. 仿真结果如图2和图3所示. 图2表明两种控制算法均能确保系统输出 $ y $的安全性与跟踪性能. 图3显示, 相较于文献[26]中的安全反推控制方法, 本文所提基于FCBF的安全控制方法能够以较小的控制成本实现安全跟踪控制.
例2. 考虑如下双积分系统
$$ \left\{\begin{aligned} &\dot{\boldsymbol{x}}=f_1(\boldsymbol{x})+g_1(\boldsymbol{x})\boldsymbol{\xi}\\ & \dot{\boldsymbol{\xi}}=f_2(\boldsymbol{x},\;\boldsymbol{\xi})+g_2(\boldsymbol{x},\;\boldsymbol{\xi})\boldsymbol{u} \end{aligned} \right.$$ (133) 其中, $ f_1(\boldsymbol{x})=f_2(\boldsymbol{x},\;\boldsymbol{\xi})=[0,\; 0]^\mathrm{T} $, $ g_1(\boldsymbol{x})=g_2(\boldsymbol{x},\;\boldsymbol{\xi})= [1,\; 1]^\mathrm{T} $, $ \boldsymbol{x}=[x_1,\; x_2]^\mathrm{T} $, $ \boldsymbol{\xi}=[\xi_1,\; \xi_2]^\mathrm{T} $和$ \boldsymbol{u}=[u_1,\; u_2]^\mathrm{T} $.
给定目标点$ \boldsymbol{x}_g=(4,\;-2) $, 障碍物的圆心为$ \boldsymbol{x}_o = (2,\;-1) $, 半径$ R_o=1 $. 系统的初始状态设为$ \boldsymbol{x}(0) = [0,\; 0]^\mathrm{T},\;\boldsymbol{\xi}(0)=[0,\; 0]^\mathrm{T} $.
系统的跟踪目标函数为$ V_1=\Vert \boldsymbol{x}-\boldsymbol{x}_g \Vert^2_2 $, 无碰撞行为安全约束为$ \Phi=\Vert \boldsymbol{x}-\boldsymbol{x}_o\Vert_2^2-R_o^2 $, 分别构造CLF和FCBF如式(131)和(132)所示.
仿真结果如图4和图5所示. 图4描述不同滤波时间常数条件下系统位置轨迹随时间的变化情况. 图5为控制输入$ u_1 $和$ u_2 $的变化曲线. 从上述仿真结果中可以观察到, 当滤波时间常数较小时, 系统能够有效实现无碰撞的安全运动.
类似于例1, 为验证本文所提算法的优越性, 在系统初始值与控制器参数保持不变的条件下, 将本文所提基于FCBF的安全控制算法($ \tau=0.005 $)与文献[26]中的安全反推控制方法进行仿真对比. 仿真结果如图6和图7所示. 图6为系统位置轨迹的变化曲线, 显示两种方法皆可确保系统的安全性. 图7为控制输入 $ u_1 $和 $ u_2 $, 表明本文所提控制方法能够以较小的控制成本实现安全跟踪.
6. 结束语
本文提出一种基于FCBF的优化控制方法, 解决了一类严格反馈系统的安全控制问题. 具体地, 通过引入一阶低通滤波器来构建FCBF. 接着将FCBF、CLF及离线优化技术相结合, 设计了一种安全反推控制算法. 与现有的安全反推控制方法相比较, 本文所提方法在保证闭环系统安全运行的同时, 有效避免了安全反推过程中出现的“计算膨胀”问题.
值得指出的是, 本文所提安全控制方法依赖于系统模型的精确信息. 今后的研究方向包括将该方法扩展至具有不确定或未知动态的严格反馈系统. 此外, 将所提安全控制方法用于解决无人机安全飞行[35]、轮式机器人[36−37]安全运动控制等应用问题亦是未来研究的目标.
-
-
[1] Clarke E M, Grumberg O, Peleg D. Model Checking. Cambridge: MIT Press, 1999. [2] Tomlin C, Pappas G J, Sastry S. Conflict resolution for airtraffic management: A study in multiagent hybrid systems. IEEE Transactions on Automatic Control, 1998, 43(4): 509−521 doi: 10.1109/9.664154 [3] Gao Y, Johansson K H, Xie L. Computing probabilistic controlled invariant sets. IEEE Transactions on Automatic Control, 2021, 66(7): 3138−3151 doi: 10.1109/TAC.2020.3018438 [4] Sun J, Yang J, Zeng Z. Safety-critical control with control barrier function based on disturbance observer. IEEE Transactions on Automatic Control, 2024, 69(7): 4750−4756 doi: 10.1109/TAC.2024.3352707 [5] Cohen M H, Belta C. Safe exploration in model-based reinforcement learning using control barrier functions. Automatica, 2023, 147: Article No. 110684 doi: 10.1016/j.automatica.2022.110684 [6] 陈杰, 吕梓亮, 黄鑫源, 洪奕光. 非线性系统的安全分析与控制: 障碍函数方法. 自动化学报, 2023, 49(3): 567−579Chen Jie, Lyu Zi-Liang, Huang Xin-Yuan, Hong Yi-Guang. Safety analysis and safety-critical control of nonlinear systems: Barrier function approach. Acta Automatica Sinica, 2023, 49(3): 567−579 [7] Artstein Z. Stabilization with relaxed controls. Nonlinear Analysis: Theory, Methods and Applications, 1983, 7(11): 1163−1173 [8] Sontag E D. A ‘universal’ construction of Artstein's theorem on nonlinear stabilization. Systems and Control Letters, 1989, 13(2): 117−123 doi: 10.1016/0167-6911(89)90028-5 [9] Wieland P, Allgöwer F. Constructive safety using control barrier functions. IFAC Proceedings Volumes, 2007, 40(12): 462−467 doi: 10.3182/20070822-3-ZA-2920.00076 [10] Ames A D, Grizzle J W, Tabuada P. Control barrier function based quadratic programs with application to adaptive cruise control. In: Proceedings of the 53rd IEEE Conference on Decision and Control (CDC). Los Angeles, USA: IEEE, 2014. 6271−6278 [11] Xu X, Tabuada P, Grizzle J W, Ames A D. Robustness of control barrier functions for safety-critical control. IFAC-PapersOnLine, 2015, 48(27): 54−61 doi: 10.1016/j.ifacol.2015.11.152 [12] Ames A D, Xu X, Grizzle J W, Tabuada P. Control barrier function based quadratic programs for safety critical systems. IEEE Transactions on Automatic Control, 2017, 62(8): 3861−3876 doi: 10.1109/TAC.2016.2638961 [13] Xu Y, Sun Y, Chen Y Y, Tao H F. Safety predefined time tracking control of second-order nonlinear systems. In: Proceedings of the 12th Data Driven Control and Learning Systems Conference (DDCLS). Xiangtan, China: IEEE, 2023. 1320−1324 [14] Cortez W S, Dimarogonas D V. Correct-by-design control barrier functions for Euler-Lagrange systems with input constraints. In: Proceedings of the American Control Conference (ACC). Denver, USA: IEEE, 2020. 950−955 [15] Cortez W S, Dimarogonas D V. Safe-by-design conrtrol for Euler-Lagrange systems. Automatica, 2022, 146: Article No. 110620 doi: 10.1016/j.automatica.2022.110620 [16] Das E, Murray R M. Robust safe control synthesis with disturbance observer-based control barrier functions. In: Proceedings of the 61st Conference on Decision and Control (CDC). Cancun, Mexico: IEEE, 2022. 5566−5573 [17] Nguyen Q, Sreenath K. Exponential control barrier function for enforcing high relative-degree safety-critical constraints. In: Proceedings of the American Control Conference (ACC). Boston, USA: IEEE, 2016. 322−328 [18] Xiao W, Belta C. Control barrier functions for systems with high relative degree. In: Proceedings of the 58th IEEE Conference on Decision and Control (CDC). Nice, France: IEEE, 2019. 474−479 [19] Xiao W, Belta C. High-order control barrier functions. IEEE Transactions on Automatic Control, 2022, 67(7): 3655−3662 doi: 10.1109/TAC.2021.3105491 [20] Tan X, Cortez W S, Dimarogonas D V. High-order barrier functions: Robustness, safety, and performance-critical control. IEEE Transactions on Automatic Control, 2021, 67(6): 3021−3028 [21] Wang H, Peng J, Xu J, Zhang F, Wang Y. High-order control barrier functions based optimization control for time-varying nonlinear systems with full-state constraints: A dynamic sub-safe set approach. International Journal of Robust and Nonlinear Control, 2023, 33(8): 4490−4503 doi: 10.1002/rnc.6624 [22] Zhang D H, Van M, Mcllvanna S, Sun Y, McLoone S. Adaptive safety critical control with uncertainty estimation for human-robot collaboration. IEEE Transactions on Automation Science and Engineering, DOI: 10.1109/TASE.2023.3320873 [23] Molnar T G, Cosner R K, Singletary A W, Ubellacker W, Ames A D. Model-free safety critical control for robotic systems. IEEE Robotics and Automation Letters, 2022, 7(2): 944−951 doi: 10.1109/LRA.2021.3135569 [24] Xu J X, Gu N, Wang D, Li T S, Han B, Peng Z H. Safety critical parallel trajectory tracking control of maritime autonomous surface ships based on integral control barrier functions. IEEE Transactions on Intelligent Vehicles, 9 (5): 4979−4988, 2024 doi: 10.1109/TIV.2024.3361477 [25] Xu X. Constrained control of input-output linearizable systems using control sharing barrier funcions. Automatica, 2018, 87: 195−201 doi: 10.1016/j.automatica.2017.10.005 [26] Taylor A J, Ong P, Molnar T G, Ames A D. Safe backstepping with control barrier functions. In: Proceedings of the 61st IEEE Conference on Decision and Control (CDC). Cancun, Mexico: IEEE, 2022. 5775−5782 [27] Abel I, Steeves D, KritićM, JankovićM. Prescribed time safety design for strict-feedback nonlinear systems. IEEE Transactions on Automatic Control, 2024, 69(3): 1464−1479 doi: 10.1109/TAC.2023.3326393 [28] 马知恩, 周义仓, 李承治. 常微分方程定性与稳定性方法. 第2版. 北京: 科学出版社, 2015.Ma Zhi-En, Zhou Yi-Cang, Li Cheng-Zhi. Qualitative and Stability Theory of Ordinary Differential Equations (2nd edition). Beijing: Science Press, 2015. [29] Ames A D, Coogan S, Egerstedt M, Notomista G, Sreenath K, Tabuada P. Control barrier functions: Theory and applications. In: Proceedings of the 18th European Control Conference (ECC). Naples, Italy: IEEE, 2019. 3420−3431 [30] Li L H, Zhao K, Zhang Z Z, Song Y D. Dual-channel event-triggered robust adaptive control of strict-feedback system with flexible prescribed performance. IEEE Transactions on Automatic Control, 2024, 69(3): 1752−1759 doi: 10.1109/TAC.2023.3328167 [31] Cheng H, Huang X C, Cao H W. Asymptotic tracking control for uncertain nonlinear strict-feedback systems with unknown time-varying delays. IEEE Transactions on Neural Networks and Learning Systems, 2023, 34(12): 9821−9831 doi: 10.1109/TNNLS.2022.3160803 [32] Yip P P, Hedrick J K. Adaptive dynamic surface control: A simplified algorithm for adaptive backstepping control of nonlinear systems. International Journal of Control, 1998, 71(5): 959−979 doi: 10.1080/002071798221650 [33] Khalil H K. Nonlinear Systems. Upper Saddle River: Prentice Hall, 2002. [34] Wang H, Margellos K, Papachristodoulou A. Explicit solutions for safety problems using control barrier functions. In: Proceedings of the 61st IEEE Conference on Decision and Control (CDC). Cancun, Mexico: IEEE, 2022. 5680−5685 [35] Saviolo A, Loianno G. Learning quadrotor dynamics for precise, safe, and agile flight control. Annual Reviews in Control, 2023, 55: 45−60 doi: 10.1016/j.arcontrol.2023.03.009 [36] Yuan W, Liu Y H, Su C Y, Zhao F. Whole-body control of an autonomous mobile manipulator using model predictive control and adaptive fuzzy technique. IEEE Transactions on Fuzzy Systems, 2024, 31(3): 799−809 [37] Yuan W, Liu Y, Liu Y H, Su C Y. Differential flatness-based adaptive robust tracking control for wheeled mobile robots with slippage disturbances. ISA Transactions, 2024, 144: 482−489 doi: 10.1016/j.isatra.2023.11.008 -