2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

永磁同步电动机速度伺服系统最优输出反馈控制器设计

王忠阳 梁丽 王友清

王忠阳, 梁丽, 王友清. 永磁同步电动机速度伺服系统最优输出反馈控制器设计. 自动化学报, 2024, 50(9): 1794−1803 doi: 10.16383/j.aas.c240018
引用本文: 王忠阳, 梁丽, 王友清. 永磁同步电动机速度伺服系统最优输出反馈控制器设计. 自动化学报, 2024, 50(9): 1794−1803 doi: 10.16383/j.aas.c240018
Wang Zhong-Yang, Liang Li, Wang You-Qing. Optimal output feedback controller design of permanent magnet synchronous motor speed servo system. Acta Automatica Sinica, 2024, 50(9): 1794−1803 doi: 10.16383/j.aas.c240018
Citation: Wang Zhong-Yang, Liang Li, Wang You-Qing. Optimal output feedback controller design of permanent magnet synchronous motor speed servo system. Acta Automatica Sinica, 2024, 50(9): 1794−1803 doi: 10.16383/j.aas.c240018

永磁同步电动机速度伺服系统最优输出反馈控制器设计

doi: 10.16383/j.aas.c240018 cstr: 32138.14.j.aas.c240018
基金项目: 国家杰出青年科学基金(62225303), 中央高校基本科研业务费(buctrc202201, buctrc202228)资助
详细信息
    作者简介:

    王忠阳:北京化工大学信息科学与技术学院博士研究生. 2017年和2020年分别获得东华理工大学学士学位和南昌大学硕士学位. 主要研究方向为自适应动态规划, 强化学习和电力电子控制. E-mail: wangzhongyang@buct.edu.cn

    梁丽:北京化工大学信息科学与技术学院副教授. 2020年获得北京理工大学博士学位. 主要研究方向为微分对策, 多智能体系统和多目标优化与决策. E-mail: 2022500051@buct.edu.cn

    王友清:北京化工大学信息科学与技术学院教授. 2003年和2008年分别获得山东大学学士学位和清华大学博士学位. 主要研究方向为故障诊断, 容错控制, 状态监测及其在化工系统的应用. 本文通信作者. E-mail:wang.youqing@ieee.org

Optimal Output Feedback Controller Design of Permanent Magnet Synchronous Motor Speed Servo System

Funds: Supported by National Science Fund for Distinguished Young Scholars (62225303) and Fundamental Research Funds for the Central Universities (buctrc202201, buctrc202228)
More Information
    Author Bio:

    WANG Zhong-Yang Ph.D. candidate at the College of Information Science and Technology, Beijing University of Chemical Technology. He received his bachelor degree from East China University of Technology and master degree from Nanchang University in 2017 and 2020, respectively. His research interest covers adaptive dynamic programming, reinforcement learning, and power electronic control

    LIANG Li Associate professor at the College of Information Science and Technology, Beijing University of Chemical Technology. She received her Ph.D. degree from Beijing Institute of Technology in 2020. Her research interest covers differential games, multi-agent system, and multi-objective optimization and decision

    WANG You-Qing Professor at the College of Information Science and Technology, Beijing University of Chemical Technology. He received his bachelor degree from Shandong University and Ph.D. degree from Tsinghua University in 2003 and 2008, respectively. His research interest covers fault diagnosis, fault-tolerant control, state monitoring, and their applications in chemical systems. Corresponding author of this paper

  • 摘要: 针对永磁同步电动机(Permanent magnet synchronous motor, PMSM)模型参数未知以及电枢电流和负载转矩无法直接测量的问题, 设计一种基于自适应动态规划(Adaptive dynamic programming, ADP)的输出反馈控制方案, 实现PMSM最优速度跟踪控制. 首先, 根据PMSM内部特性确定其数学模型的结构, 构建与原始系统相对应的辅助系统, 引入新的线性二次指标来实现速度最优跟踪调节. 其次, 设计一种嵌入式观测器, 该观测器能够在系统模型未知情况下用可测量数据重构系统全部状态. 此外, 提出一种离线策略的ADP方法逼近最优控制增益的解. 最后, 仿真结果验证所提控制方案在模型参数未知以及电枢电流和负载转矩不可测量的情况下, 实现了精确的速度跟踪性能和良好的瞬态响应, 同时降低了电压的冲击.
  • 永磁同步电动机(Permanent magnet synchronous motor, PMSM)因体积小和效率高等优点被广泛应用于工业系统中, 特别是伺服系统, 如机器人、电动汽车以及发电系统等[13]. 在实际应用中, 良好的控制策略是使得PMSM的转子速度能够快速地跟踪参考转速的关键. 由于电气元件的响应速度远快于机械元件, 级联比例积分(Proportional integral, PI)控制是PMSM有效控制方案之一. 在这个方案中, 文献[4]和文献[5]分别设计一个快内环来控制电枢电流和一个慢外环来调节机械转子速度. 然而, 外部环境的变化导致PMSM的模型参数会发生变化, 因此, 传统的级联PI控制器存在参数整定困难、速度跟踪性能达不到预期效果等缺陷.

    针对PMSM模型不确定的情况, 大量研发人员已经开发了一系列有效的先进控制方案[6], 包括自适应控制、自抗扰控制和模型预测控制等. 针对PMSM模型参数变化, 文献[7] 使用自适应调速器来控制PMSM速度伺服系统, 该方法能使速度跟踪误差快速收敛. Wu等[8]提出一种新的伺服系统自适应控制方法, 对于每个缓慢变化的参数和未知参数设计参数自适应律, 并引入鲁棒项来提高所提出的参数自适应律的收敛速度. 为提升PMSM在参数摄动、负载变化以及其他不确定因素干扰下的抗扰动性能, 谢浩然等[9]提出基于级联线性–非线性自抗扰控制器的PMSM控制方案, 有效提升了系统的抗扰动能力. 文献[10]提出一种基于高阶滑模观测器的PMSM无差拍预测电流控制方法, 提高了PMSM响应速度和电流跟踪精度等控制性能. 针对传统无差拍预测控制存在的预测误差、转矩与磁链耦合等缺陷, 卢宏平等[11]提出一种新型的无差拍预测电流控制方法, 能够适用于PMSM高低载波比运行, 消除了误差和耦合带来的缺陷.

    自适应动态规划(Adaptive dynamic programming, ADP)是一种基于无模型的最优控制方案[1215], 旨在利用在线数据学习近似最优控制策略. 在实际应用中, ADP已经取得了一系列成果[1620]. 文献[21]利用ADP和输出调节理论解决PMSM伺服系统最优调节问题. 文献[22] 采用神经网络思想设计不确定动态下的最优转矩控制器, 实现了快速的电流响应和较小的超调. 针对具有部分未知动态、饱和电压以及速度和电流动态扰动的PMSM系统, 文献[23]提出一种基于$ H_{\infty} $的控制策略, 并在PMSM样机上证明了该方法的有效性. 文献[24]开发ADP和PI组合的最优控制方案, 通过引入线性二次型调节器来实现速度渐近跟踪和控制闭环系统的瞬态响应.

    然而, 上述方法需要测量系统的全部状态. 在许多实际的跟踪和控制问题中, 不是全部状态都可以直接测量的. 相比之下, 输出反馈技术所使用的传感器更少, 是一种被认为更实用、更经济的方案[25]. 文献[26]对线性离散系统的输出反馈进行深入研究, 研究结果表明, 输出反馈和状态反馈有一致的控制效果. 为研究轨迹跟踪控制问题, 文献[27]提出一种测量反馈方案, 利用可测量输入输出数据在线求解最优控制策略. 另一种解决输出调节的方案是内模原理[28-29], 在反馈回路中包含外部扰动的模型能够实现无误差跟踪.

    为解决PMSM模型参数未知以及电枢电流和负载转矩无法直接测量的问题, 本文提出一种基于ADP方法的PMSM速度伺服输出反馈控制方案. 与之前的研究相比, 本文主要贡献如下:

    1) 通过建立辅助系统来引入新的线性二次指标, 既能保证输出误差收敛到零, 又能降低电压变化带来的冲击, 保护生产过程中的设备;

    2) 所开发的控制策略仅使用输入和输出数据, 解决负载转矩和转子电流无法直接测量的问题;

    3) 所开发的控制策略避免求解调节器方程, 在参考输入或外部干扰发生变化时, 这种方法不需要调整控制器, 具有良好的抗干扰性能.

    本文内容安排如下: 第1节介绍PMSM速度伺服系统的数学模型; 第2节介绍状态反馈控制策略的设计; 第3节介绍状态重构方法; 第4节介绍基于ADP的输出反馈策略设计; 仿真结果和结束语分别在第5节和第6节给出.

    矩阵向量化表示方法. 给定一个任意对称矩阵 $ P\in \mathbf{R}^{n\times n} $ 和向量 $ x\in\mathbf{R}^n $, 定义符号 $ \text{vecs}(\cdot) $ 和$ \text{vecv}(\cdot) $, 有

    $$ \begin{split} \text{vecs}(P)=\;&[p_{11},\;2p_{12},\;\cdots ,\;p_{22},\;\cdots ,\;p_{nn}]^\text{T}\in\mathbf{R}^{\frac{n(n+1)}{2}}\\ \text{vecv}(x)=\;&[x_1^2,\;x_1x_2,\;\cdots ,\;x_2^2,\;\cdots ,\;x_n^2]^\text{T}\in\mathbf{R}^{\frac{n(n+1)}{2}} \end{split} $$

    为便于控制器设计和稳定性分析, 对PMSM速度伺服系统作如下标准假设: 1)磁路是饱和的; 2) 磁场在空间中呈正弦分布; 3) 忽略磁滞和涡流损耗.

    在$ dq $坐标系下, PMSM速度伺服系统的数学模型由如下非线性方程描述[30]

    $$ \left\{ \begin{aligned} &J\frac{\text{d}\omega}{\text{d}t}=-B_s\omega+1.5n_p\varphi i_q-T_L\\& L_d\frac{\text{d}i_d}{\text{d}t}=-R_si_d+n_pL_d\omega i_q+u_d\\& L_q\frac{\text{d}i_q}{\text{d}t}=-n_p\varphi\omega-n_pL_q\omega i_d-R_si_q+u_q \end{aligned} \right. $$ (1)

    式中, $ \omega $表示转子转速, $ J $是转动惯量, $ B_s $是粘性摩擦系数, $ T_L $是负载转矩, $ n_p $是电机的磁极对数, $ \varphi $是磁链; $ i_d $和$ i_q $是定子的$ d $ 轴和$ q $ 轴电流, $ u_d $和$ u_q $是定子的$ d $轴和$ q $轴电压, $ R_s $是定子电阻, $ L_d $和$ L_q $是定子的$ d $轴和$ q $轴电感, 一般来说有$ L_d=L_q= L_s $, $ L_s $表示定子电感.

    从系统(1)中看到, 电机的转速是由电流$ i_q $唯一生成的, 因此本文的控制方案可以认为是磁场定向控制. 另一方面, 文献[31]中指出, $ i_d^*=0 $被设置为最大化转矩电流比. 为了控制器设计方便, 假设直流回路中PI控制器工作良好, 即$ i_d^*=i_d=0 $. 那么, 系统(1)的简化形式为

    $$ \left\{ \begin{aligned} &J\frac{\text{d}\omega}{\text{d}t}=-B_s\omega+1.5n_p\varphi i_q-T_L\\ &L_s\frac{\text{d}i_q}{\text{d}t}=-n_p\varphi\omega-R_si_q+u_q \end{aligned} \right. $$ (2)

    值得注意的是, 简化后的模型(2)被广泛应用于PMSM速度伺服控制系统中[24, 31].

    本文的主要目的是开发一种最优输出反馈控制策略, 该策略能够在系统模型参数未知、状态不可测量情况下将PMSM速度伺服系统的转子速度渐近调节到其设定值, 本文所提控制方案框图如图 1所示, 包含一个ADP最优调节器和一个工作良好的直流电流环组成, PWM 表示脉冲宽度调制.

    图 1  所提出的控制方案框图
    Fig. 1  Block diagram of the proposed control scheme

    定义状态$ x=[\omega,\;i_q]^\text{T} $, 控制输入$ u=u_q $和系统输出$ y=\omega $, 简化后的系统(2)状态空间表达式如下式所示

    $$ \left\{ \begin{aligned} \dot{x}&=A_cx+B_cu+D_c\\ y&=Cx\\ e&=y-y_r \end{aligned} \right. $$ (3)

    式中, $ y $, $ y_r $和$ e $分别是输出转子速度、参考速度和误差, 以及

    $$ \begin{split} A_c&=\left[ \begin{array}{cccccc} -\dfrac{B_s}{J}& \dfrac{1.5n_p\varphi}{J}\\ -\dfrac{n_p\varphi}{L_s}&-\dfrac{R_s}{L_s} \end{array} \right],\;B_c=\left[ \begin{array}{cccccc} 0\\ \dfrac{1}{L_s} \end{array} \right]\\ D_c&=\left[ \begin{array}{cccccc} -\dfrac{T_L}{J}\\0 \end{array} \right],\;C=\left[ \begin{array}{cccccc} 1&0 \end{array} \right] \end{split} $$

    假设采样时间为$ T_s $, 将系统(3)进行离散化, 得到

    $$ \left\{ \begin{aligned} &x_{k+1}=A_dx_k+B_du_k+D_d\\ &y_k=Cx_k\\& e_k=y_k-y_{rk} \end{aligned} \right. $$ (4)

    式中, $ x_k $, $ u_k $, $ y_k $, $ y_{rk} $和$ e_k $分别是$ x $, $ u $, $ y $, $ y_{r} $和$ e $的离散形式. $ A_d $, $ B_d $和$ D_d $是常数矩阵, 如下

    $$ \begin{split} A_d&=\text{exp}(A_cT_s)\\ B_d&=\text{exp}(A_cT_s)\int_{0}^{T_s}\text{exp}(-A_ct)B_c\text{d}t \\ D_d&=\text{exp}(A_cT_s)\int_{0}^{T_s}\text{exp}(-A_ct)D_c\text{d} t \end{split} $$

    为便于设计控制器, 定义新的辅助向量

    $$ \eta_k=[x_k^\text{T}-x_{k-1}^\text{T},\;e_{k-1}]^\text{T},\;\; \bar{u}_k=u_{k}-u_{k-1} $$ (5)

    其中

    $$ \begin{split} e_{k}=\;&Cx_{k}-y_{rk}=\\ &C(x_{k}-x_{k-1})+Cx_{k-1}-y_{rk}=\\ &C(x_{k}-x_{k-1})+e_{k-1} \end{split} $$ (6)

    根据系统(4)和新的辅助向量(5), 构造新的辅助系统

    $$ \left\{ \begin{aligned} \eta_{k+1}&=\left[ \begin{array}{cccccc} A_d&0\\C&1 \end{array} \right]\eta_k+\left[ \begin{array}{cccccc} B_d\\0 \end{array} \right]\bar{u}_k:=A\eta_k+B\bar{u}_k\;\\ e_{k-1}&=\left[ \begin{array}{cccccc} 0&0&1 \end{array} \right]\eta_k:=\bar{C}\eta_k \end{aligned} \right. $$ (7)

    引理 1[32]. $ \{A,\;B\} $是可控的, 即存在反馈控制增益$ K $, 使得$ A-BK $是稳定矩阵.

    本文控制目标是寻找一个最优控制策略$ \bar{u}_k $, 最小化如下性能指标函数

    $$ \begin{split} &V(e_{k-1},\;\bar{u}_k)=\sum\limits_{k=1}^{\infty}(e_{k-1}^\text{T} Q e_{k-1}+\bar{u}_k^\text{T} R\bar{u}_k)= \\ &\qquad \sum\limits_{k=1}^{\infty}(\eta_{k}^\text{T} \bar{C}^\text{T} Q \bar{C} \eta_{k}+\bar{u}_k^\text{T} R\bar{u}_k) \\ &\text{s.t.}\quad (7) \end{split} $$ (8)

    式中, $ Q\geq 0 $和$ R > 0 $是误差和输入的权重且$ \{A, \sqrt{\bar{C}^\text{T} Q \bar{C} }\} $是可观测的.

    注 1. 性能指标函数(8)表示的是跟踪误差与控制输入电压变化率之间的加权和. 第一项表示的是系统输出到参考值之间的过渡性能, 确保系统输出能够快速准确地跟踪参考值; 第二项表示的是输入电压变化率, 确保输入电压在动态响应中不产生过大的超调, 这个性能指标在许多应用中都非常关键, 特别是在电力电子电路中, 较大的电压变化会导致电力电子设备受到较大的电压冲击, 使得电力电子设备发生损坏. 因此, 本文所选取的性能指标函数既保证了系统输出能够快速准确地跟踪参考值, 同时也保证了输入电压能够平稳过渡到稳态值.

    注2. 在本文中, $ Q\geq 0 $和$ R > 0 $是正数. 一般来说, $ Q $值越大, 要使得性能指标$ V(e_{k-1},\;\bar{u}_k) $越小, 那么就需要更小的$ e_{k-1} $, 也就是意味着闭环系统的矩阵$ A-BK $的特征值更接近0, 这样$ e_{k-1} $就以更快的速度收敛到0. 另外, 大的$ R $表示更加关注输入变量$ \bar{u}_k $, $ \bar{u}_k $的减小意味着状态衰减将变慢, 因此闭环系统的矩阵$ A-BK $的特征值更接近单位圆的边界.

    根据线性系统控制理论, 最小化性能指标函数(8)的控制输入为

    $$ \bar{u}_k=-K_x(x_k-x_{k-1})-K_ee_{k-1} $$ (9)

    式中

    $$ [K_x,\;K_e]=(R+B^\text{T} P B)^{-1}B^\text{T} PA:=K $$ (10)

    并且$ P $是如下代数黎卡提方程的唯一解

    $$ A^\text{T} PA-P+\bar{C}^\text{T} Q\bar{C}-K^\text{T} RK={\bf{0}} $$ (11)

    可以看到, 式(11)是一个非线性方程, 很难直接求解. 策略迭代和值迭代被认为是两种有效的求解方法, 其中策略迭代对系统稳定性要求较高, 需要稳定的初始控制增益, 一般来说, 这个初始增益很难清楚得到. 相对来说, 值迭代则放宽了这一要求, 值迭代可以从任意半正定的对称矩阵$ P $开始. 因此, 本文考虑值迭代方法, 值迭代过程如下.

    引理2[28]. 选择初始值矩阵$ P_0\geq {\bf{0}} $和给定一个较小的正数$ \tau > 0 $.

    值更新: 利用下式求解$ P_{j+1} $和$ K_{j+1} $

    $$ \left\{ \begin{aligned} P_{j+1}&=A^\text{T} P_jA+\bar{C}^\text{T} Q\bar{C} -K_j^\text{T} RK_j\\ K_{j+1}&=(R+B^\text{T} P_{j+1} B)^{-1}B^\text{T} P_{j+1}A \end{aligned} \right. $$ (12)

    重复上述过程$ j\gets j+1 $直到$ ||P_j-P_{j-1}|| < \tau $, $ j\geq 1 $.

    因此有$ P^*\geq P_{j+1} \geq P_j $以及$ \lim_{j\to\infty}K_j=K^* $和$ \lim_{j\to\infty}P_j=P^* $, $ K^* $和$ P^* $分别是最优控制增益和值矩阵.

    根据算法所得到的最优控制增益为$ K $, 最优控制输入(9) 等价于

    $$ u_k=-K_xx_k-K_ez_k $$ (13)

    式中, $ z_k $由$ z_{k+1}=z_k+e_k $生成.

    然而, 以这种方式设计的最优控制策略本质上是基于模型的, 它依赖于系统模型的完美知识. 由于参数变化, 通常很难知道物理系统的确切模型. 在本文的后续研究中, 将在缺乏动态模型精确知识的情况下设计数据驱动的控制方法, 可以使用在线输入和输出数据来学习最优控制器.

    传统的状态反馈利用系统可测量的全部状态信息来设计控制器, 能够提高系统的鲁棒性. 然而, 有些系统的状态并非是全部可测量的, 此时如何利用输出数据来设计控制器是至关重要的. 传统的状态观测器需要系统矩阵$ A_d $和$ B_d $已知. 为解决矩阵未知的问题, 本文设计一种嵌入式观测器, 它不依赖于系统的模型信息, 利用测量的输入输出信息来重新表述状态信息.

    定理 1. 考虑如下方程

    $$ \hat{x}_k=M_1\xi_k+M_2\mu_k+F $$ (14)

    式中, $ M_{i},\; i=1,\;2 $是未知的参数化矩阵并且包含观测器传递函数和系统矩阵的信息, $ F $是未知的常数向量, $ \hat{x}_k $是估计状态, $ \xi_k $和$ \mu_k $是通过可测量轨迹$ e_k $和$ u_k $所得到的轨迹. 那么实际状态$ x_k $是指数收敛于估计状态$ \hat{x}_k $的, 即$ \lim_{k\to\infty}||x_k-\hat{x}_k||={{0}} $. 在这里, $ \xi_k $和$ \mu_k $的表述形式为

    $$ \left\{ \begin{aligned} \xi_{k+1}&=H\xi_k+be_k,\;\xi_0={\bf{0}}\\ \mu_{k+1}&=H\mu_k+bu_k,\;\mu_0={\bf{0}} \end{aligned} \right. $$ (15)

    式中, $ H $是人为定义的稳定矩阵, $ b=[0,\;\cdots , \;0,\;1]^\text{T} $.

    证明. 因为本文所描述的PMSM速度伺服系统参数都是正常的常数, 因此$ \{A_d,\;C\} $是可观测的. 选择一个稳定的矩阵$ L $, 使得$ A_d-LC $是一个稳定矩阵, 那么系统(4)的观测系统为

    $$ \begin{split} \hat{x}_{k+1}=\;&A_d\hat{x}_k+B_du_k+D_d+L(y_k-C\hat{x}_k)=\\& (A_d-LC)\hat{x}_k+B_du_k+Le_k+\bar{D}_d \end{split} $$ (16)

    式中, $ \bar{D}_d=Ly_{rk}+D_d $, 初始状态为$ \hat{x}_0 $, 一般选择$ \hat{x}_0={\bf{0}} $.

    根据线性系统理论可知, 系统(16)可以分解为$ \hat{x}_k=\varkappa_k+\chi_k $, 具体表述为

    $$ \left\{ \begin{aligned} \varkappa_{k+1}&=(A_d-LC)\varkappa_k+B_du_k+Le_k\\ \chi_{k+1}&=(A_d-LC)\chi_k+\bar{D}_d \end{aligned} \right. $$ (17)

    一方面, $ \chi_k $的解为

    $$ \begin{split} \chi_k=\;&(A_d-LC)\chi_{k-1}+\bar{D}_d=\\ &\sum\limits_{i=0}^{k-1}(A_d-LC)^{k-i-1}\bar{D}_d+(A_d-LC)^k\chi_0:=\\ &F+(A_d-LC)^k\chi_0 \\[-1pt]\end{split} $$ (18)

    另一方面, 式(17)第一个公式两边同时进行$ z $的反变换, 得到

    $$ \begin{split} \Omega(z)=\;&(z{\bf{1}}-(A_d-LC))^{-1}B_dU(z)\;+\\ &(z{\bf{1}}-(A_d-LC))^{-1}LE(z)\;+\\ &(z{\bf{1}}-(A_d-LC))^{-1}z\varkappa_0 \end{split} $$ (19)

    式中, $ \Omega(z) $, $ U(z) $和$ E(z) $分别是$ \varkappa_k $, $ u_k $和$ e_k $的$ z $变换形式.

    不妨假设$ z{\bf{1}}-(A_d-LC) $的特征多项式为

    $$ \text{det}(z{\bf{1}}-(A_d-LC))=z^2+a_1z+a_0 $$ (20)

    式中, $ \text{det}(\cdot) $表示特征多项式, $ a_1 $和$ a_0 $是已知的常数. 那么, 式(19)可写成

    $$ \begin{split} \Omega(z)=\;&\left[ \begin{array}{cccccc} \dfrac{a_{11}^1z+a_{10}^1}{z^2+a_1z+a_0}\\ \dfrac{a_{11}^2z+a_{10}^2}{z^2+a_1z+a_0} \end{array} \right]U(z)\;+\\ &\left[ \begin{array}{cccccc} \dfrac{a_{21}^1z+a_{20}^1}{z^2+a_1z+a_0}\\ \dfrac{a_{21}^2z+a_{20}^2}{z^2+a_1z+a_0} \end{array} \right]E(z)\;+\\ &(z{\bf{1}}-(A_d-LC))^{-1}z\varkappa_0:=\\ &M_1\Xi(z)+M_2\Theta(z)\;+\\ &(z{\bf{1}}-(A_d-LC))^{-1}z\varkappa_0 \end{split} $$ (21)

    式中, $ a_{1i}^j $和$ a_{2i}^j $, $ i=0,\;1,\;j=1,\;2 $是未知常数

    $$ \begin{split} M_1&=\left[ \begin{array}{cccccc} a_{10}^1& a_{11}^1\\ a_{10}^2& a_{11}^2 \end{array} \right],\;\Xi(z)=\left[ \begin{array}{cccccc} \dfrac{U(z)}{z^2+a_1z+a_0}\\ \dfrac{zU(z)}{z^2+a_1z+a_0} \end{array} \right]\\ M_2&=\left[ \begin{array}{cccccc} a_{20}^1& a_{21}^1\\ a_{20}^2& a_{21}^2 \end{array} \right],\;\Theta(z)=\left[ \begin{array}{cccccc} \dfrac{E(z)}{z^2+a_1z+a_0}\\ \dfrac{zE(z)}{z^2+a_1z+a_0} \end{array} \right] \end{split} $$

    对式(21)进行$ z $反变换得

    $$ \varkappa_k=M_1\xi_k+M_2\mu_k+(A_d-LC)^k\varkappa_0 $$ (22)

    式中, $ \xi_k $和$ \mu_k $通过如下动态获得

    $$ \left\{ \begin{aligned} \xi_{k+1}&=H\xi_k+be_k,\;\xi_0={\boldsymbol{0}}\\ \mu_{k+1}&=H\mu_k+bu_k,\;\mu_0={\boldsymbol{0}} \end{aligned} \right. $$ (23)

    其中

    $$ H=\left[ \begin{array}{cccccc} 0&1\\-a_0&-a_1 \end{array} \right],\;b=\left[ \begin{array}{cccccc} 0\\1 \end{array} \right] $$

    在本文中, $ A_d-LC $和$ H $有着相同的特征多项式, 即

    $$ \begin{split} \text{det}(z{\bf{1}}-H)=\;&\text{det}(z{\bf{1}}-(A_d-LC))=\\& z^2+a_1z+a_0 \end{split} $$ (24)

    因此, 选择合适的$ a_0 $和$ a_1 $使得式(24)的根在单位圆内, 即能保证观测器矩阵的稳定性.

    通过上述分析, $ \hat{x}_k $的表达式为

    $$ \begin{split} \hat{x}_k=\;&\varkappa_k+\chi_k=\\ &M_1\xi_k+M_2\mu_k+F+(A_d-LC)^k\hat{x}_0 \end{split} $$ (25)

    原系统(4)与观测系统(16)之间的误差为

    $$ \begin{split} x_k-\hat{x}_k=\;&(A_d-LC)(x_{k-1}-\hat{x}_{k-1})=\\ &(A_d-LC)^k(x_{0}-\hat{x}_{0}) \end{split} $$ (26)

    式中, $ x_0 $是系统(4)的初始状态.

    那么, 原系统的状态可以表述为

    $$ \begin{split} x_k=\;&\hat{x}_k+(A_d-LC)^k(x_{0}-\hat{x}_{0})=\\ &M_1\xi_k+M_2\mu_k+F+(A_d-LC)^kx_0 \end{split} $$ (27)

    由于$ A_d-LC $是稳定矩阵, 因此$ x_k $是指数收敛于$ \hat{x}_k $的.

    在本文中, 为矩阵$ A_d-LC $配置合适的特征值, 使得$ (A_d-LC)^kx_0 $快速收敛到$ {\bf{0}} $, 那么, 状态$ x_k $可以表示为

    $$ x_k:=M\sigma_k+F $$ (28)

    式中, $ M=[M_1,\;M_2] $和$ \sigma_k=[\xi_k^\text{T},\;\mu_k^\text{T}]^\text{T}\in\mathbf{R}^{4} $.

    从重构结果(28)看到, $ x_k $包含两个部分, 分别是$ M\sigma_k $和$ F $. 其中$ \sigma_k $是可测量向量, 而$ F $是未知向量. 因此, 在后续的控制策略设计中不包含$ F $的信息.

    定理 2. 在稳定的控制增益$ K=[K_x,\;K_e] $下, 考虑如下控制输入

    $$ u_k=-K_xM\sigma_k-K_ez_k $$ (29)

    能够保证系统稳定并使得跟踪误差渐近到$ {{0}} $.

    证明. 控制输入(29)等价于

    $$ u_k=-K_x(x_k-F)-K_ez_k $$ (30)

    那么, $ \bar{u}_k $的形式为

    $$ \bar{u}_k=-K_x(x_k-x_{k-1})-K_e(z_{k}-z_{k-1}) =-K\eta_k $$ (31)

    因此, 系统(7)的闭环形式为

    $$ \left\{ \begin{aligned} \eta_{k+1}&=(A-BK)\eta_k\\ e_{k-1}&=\bar{C}\eta_k \end{aligned} \right. $$ (32)

    由于$ A-BK $是稳定矩阵, 得到如下结果: $ \lim_{k\to\infty}\eta_k={\bf{0}} $以及$ \lim_{k\to\infty}e_{k-1}=0 $.

    那么, 辅助系统(7)的状态重构结果为

    $$ \begin{split} \eta_k=\;&[x_k^\text{T}-x_{k-1}^\text{T},\;e_{k-1}]^\text{T}=\\ &[M(\sigma_{k}^\text{T}-\sigma_{k-1}^\text{T}),\;e_{k-1}]^\text{T}= \mathcal{M}\varepsilon_k \end{split} $$ (33)

    式中

    $$ \mathcal{M}=\left[ \begin{array}{cccccc} M&{\bf{0}}\\{\bf{0}} &1 \end{array} \right],\;\;\; \varepsilon_k=[\sigma_{k}^\text{T}-\sigma_{k-1}^\text{T},\;e_{k-1}]^\text{T} $$

    因此, 控制输入(29)的等价形式为

    $$ u_k=-K_xM\sigma_k-K_ez_k:=-\mathcal{K}\gamma_k $$ (34)

    式中

    $$ \gamma_k=[\sigma_k^\text{T},\;z_k]^\text{T},\; \mathcal{K}=\left[ K_xM,\;\;K_e \right]:=K\mathcal{M} $$

    首先, 为获得足够多的采样数据, 本文使用一个合适的初始控制策略$ u_k=u_k^0 $, 即

    $$ \eta_{k+1}=A\eta_k+B\bar{u}_k $$ (35)

    然后, 给定一个对称矩阵$ P_j\geq {\bf{0}} $, 作如下变换

    $$ \begin{split} \eta^\text{T}_{k+1}& P_j \eta_{k+1}+e^\text{T}_{k-1} Q e_{k-1}+\bar{u}^\text{T}_k R\bar{u}_k=\\ &(A\eta_k+B\bar{u}_k)^\text{T} P_j (A\eta_k+B\bar{u}_k)\;+\\& e^\text{T}_{k-1} Q e_{k-1}+u^\text{T}_k Ru_k=\\ &\eta_k^\text{T}(A^\text{T} P A+\bar{C}^\text{T} Q \bar{C})\eta_k+\bar{u}_k^\text{T} (R+B^\text{T} P_j B)\bar{u}_k\;+\\& 2\bar{u}_k^\text{T} B^\text{T} P_j A\eta_k \\[-1pt]\end{split} $$ (36)

    其次, 将重构结果$ \eta_k=\mathcal{M}\varepsilon_k $代入式(36) 中, 得到

    $$ \begin{split}& \left[ \begin{array}{cccccc} \varepsilon_k\\ \bar{u}_k \end{array} \right]^\text{T}\left[ \begin{array}{cccccc} \mathcal{Q}_j^{11}&\mathcal{Q}_j^{12}\\ \mathcal{Q}_j^{21}&\mathcal{Q}_j^{22} \end{array} \right]\left[ \begin{array}{cccccc} \varepsilon_k\\ \bar{u}_k \end{array} \right]=\\ &\qquad\varepsilon_{k+1}^\text{T}\mathcal{P}_j\varepsilon_{k+1}+e^\text{T}_{k-1} Q e_{k-1}+\bar{u}^\text{T}_k R\bar{u}_k:=\varsigma_k \end{split} $$ (37)

    式中, $ \mathcal{P}_j=\mathcal{M}^\text{T} P_j\mathcal{M} $

    $$ \left\{ \begin{aligned} &\mathcal{Q}_j=\left[ \begin{array}{cccccc} \mathcal{Q}_j^{11}&\mathcal{Q}_j^{12}\\ \mathcal{Q}_j^{21}&\mathcal{Q}_j^{22} \end{array} \right]\nonumber\\ &\mathcal{Q}_j^{11}=\mathcal{M}^\text{T} (A^\text{T} P_j A+\bar{C}^\text{T} Q \bar{C})\mathcal{M}\nonumber\\ &\mathcal{Q}_j^{12}=\mathcal{M}^\text{T} A^\text{T} P_j B\nonumber\\ &\mathcal{Q}_j^{21}=B^\text{T} P_j A \mathcal{M}\nonumber\\ &\mathcal{Q}_j^{22}=B^\text{T} P_j B+R\nonumber \end{aligned} \right. $$

    在采样时间$ [k_l,\;k_{l+s+1}] $范围内, 将式(37)表示为如下紧凑形式

    $$ \mathcal{H}_j\text{vecs}(\mathcal{Q}_j) =\mathcal{N}_j $$ (38)

    式中, $ \mathcal{N}_j $和$ \mathcal{H}_j $分别为

    $$ \begin{split} \mathcal{N}_j&=\left[ \begin{array}{cccccc} \varsigma_{k_{l+1}}^\text{T},\; \varsigma_{k_{l+2}}^\text{T},\;\cdots ,\;\varsigma_{k_{l+s}}^\text{T} \end{array} \right]^\text{T}\\ \mathcal{H}_j&=\left[ \left ( \text{vecv}\left(\left[ \begin{array}{cccccc} \varepsilon_{k_{l}}\\ \bar{u}_{k_{l}} \end{array} \right]\right)\right)^\text{T},\;\cdots ,\;\right.\\ &\qquad\left.\left(\text{vecv}\left(\left[ \begin{array}{cccccc} \varepsilon_{k_{l+s}}\\ \bar{u}_{k_{l+s}} \end{array} \right]\right)\right)^\text{T} \right]^\text{T} \end{split} $$

    注3. 与状态反馈相比, 式(38) 使用输入–输出数据而不是输入–状态数据来解决最小二乘问题. 与状态反馈问题类似, 为解决最小二乘问题(38), 需要给系统添加初始持续激励信号. 由于数据矩阵$ \mathcal{H}_j $具有与系统反馈测量以及控制信号$ \bar{u}_k $相关的列, 因此, 初始持续激励的选择要独立于这些反馈测量. 一般地, 各种高频的信号叠加被认为是有效的持续激励信号. 在持续激励信号的驱动下, 对所有$ j $, $ \mathcal{H}_j $是列满秩的, 即

    $$ {\rm{rank}}(\mathcal{H}_j)=\frac{5\times(5+1)}{2}+5\times1+1\times1=21 $$ (39)

    在秩条件(39)下, 式(38)的最小二乘解为

    $$ \text{vecs}(\mathcal{Q}_j)=(\mathcal{H}_j^\text{T} \mathcal{H}_j)^{-1}\mathcal{H}_j^\text{T}\mathcal{N}_j $$ (40)

    无模型值迭代算法如算法1所示.

    算法1. 无模型值迭代算法

    1) 初始化: 选择初始值矩阵$ \mathcal{P}_0=\mathcal{P}_0^\text{T}\geq {\bf{0}} $, $ j\gets 0 $和给定一个较小的正数$ \tau > 0 $;

    2) 值更新: 在秩条件(39)下, 利用式(40)求解$ \mathcal{Q}_j $, 使用下式更新值矩阵$ \mathcal{P}_{j+1} $

    $$ \mathcal{P}_{j+1}=\mathcal{Q}_j^{11}-\mathcal{Q}_j^{12}(\mathcal{Q}_j^{22})^{-1}\mathcal{Q}_j^{21} $$

    3) 重复上述过程$ j\gets j+1 $直到$ ||\mathcal{P}_j - \mathcal{P}_{j-1}|| < \tau $, $ j\geq 1 $;

    4) 反馈控制增益更新: 通过下式更新反馈增益

    $$ \mathcal{K}^*=(\mathcal{Q}_j^{22})^{-1}\mathcal{Q}_j^{21} $$

    定理 3. 通过求解算法1得到的序列$ \{\mathcal{P}_j\} $和$ \{\mathcal{K}_j\} $收敛于最优值矩阵$ \mathcal{P}^* $和控制增益$ \mathcal{K}^* $.

    证明. 首先给定任意正定对称矩阵$ P_j=P_j^\text{T}\geq {\bf{0}} $, $ P_{j+1} $和$ K_{j+1} $可以被式(12)唯一确定. 那么一旦矩阵$ \mathcal{H}_j $满秩, 则式(38)具有唯一解, 因此, $ \mathcal{Q}_j $和$ \mathcal{K}_j $可以被唯一确定. 另一方面, $ \mathcal{P}_{j+1}=\mathcal{M}^\text{T} P_{j+1}\mathcal{M}= \mathcal{Q}_j^{11}-\mathcal{Q}_j^{12}(\mathcal{Q}_j^{22})^{-1}\mathcal{Q}_j^{21} $以及$ \mathcal{K}_j=K_j\mathcal{M}= (\mathcal{Q}_j^{22})^{-1}\times \mathcal{Q}_j^{21} $. 式中$ P_{j+1} $和$ K_j $与引理2中的结果等价, 因此, 有$ \lim_{j\to\infty}\mathcal{P}_j=\lim_{j\to\infty}\mathcal{M}^\text{T} P^*\mathcal{M}=\mathcal{P}^* $, $ \lim_{j\to\infty}\mathcal{K}_j = \lim_{j\to\infty}K^*\mathcal{M}=\mathcal{K}^* $.

    本文所提控制方案的算法流程如图 2所示. 首先给定一个初始控制策略$ u_k $作为持续激励信号, 然后根据系统的输出误差$ e_k $和控制输入$ u_k $设计输入/输出观测器进行状态重构, 最后采集系统的可测量数据, 使用基于离线策略ADP的方法逼近最优解.

    图 2  所提控制方案算法流程图
    Fig. 2  The algorithm flowchart of the proposed control scheme

    为验证所提无模型控制方案的速度跟踪性能, 将测试结果与传统的级联PI[24]、线性自抗扰控制[33] (Linear active disturbance rejection control, LADRC)方法以及文献[24]中所提的速度控制方法进行比较. 本文在具有Core i7-12700H和CPU @ 2.30 GHz的Windows PC中的64位MATLAB R2023a上进行仿真测试. PMSM系统参数设置如表 1所示.

    表 1  PMSM系统参数设置
    Table 1  PMSM system parameters setting
    参数 大小 单位
    转动惯量$J$ $2.10\times 10^{-3}$ ${{\rm{kg}}{\cdot}{\rm{m}}}^2$
    粘性摩擦系数$B_s$ $5.71\times 10^{-3}$ ${{\rm{N}}{\cdot}{\rm{s/rad}}}$
    极对数$n_p$ $4$
    永磁通链$\varphi$ $8.10\times 10^{-2}$ Wb
    定子电感$L_s$ $9.80\times 10^{-3}$ H
    定子电阻$R_s$ $1.06$ $\Omega$
    下载: 导出CSV 
    | 显示表格

    性能指标函数选择为

    $$ V(e_{k-1},\;\bar{u}_k)=\sum\limits_{k=1}^{\infty}\left(10^{-4}e_{k-1}^\text{T}e_{k-1}+100\bar{u}_k^\text{T} \bar{u}_k\right) $$

    嵌入式观测器矩阵为

    $$ H=\left[ \begin{array}{cccccc} 0&1\\-0.01&-0.20 \end{array} \right],\;b=\left[ \begin{array}{cccccc} 0\\ 1 \end{array} \right] $$ (41)

    系统采样时间为$T_s=10^{-4}\;\text{s}$. 当系统参数模型完全已知时, 参数化矩阵$ M_i $和最优控制增益$ \mathcal{K}^* $分别为

    $$ \left\{ \begin{aligned} M_1&=\left[ \begin{array}{*{20}{r}} -0.979\,0 & 2.188\,9\\ -51.536\,0 & 51.544\,8 \end{array} \right]\\ M_2&=\left[ \begin{array}{*{20}{r}} 0.000\,1 & 0.000\,1\\ 0.006\,0 & 0.010\,1 \end{array} \right]\\ \mathcal{K}^*&=\left[ \begin{array}{*{20}{c}} -13.855\,5 & 14.027\,8 & \end{array} \right.\nonumber\\ &\quad \left. \begin{array}{*{20}{c}} 0.001\,6 & 0.002\,7 & 0.001\,0 \end{array} \right] \end{aligned} \right. $$

    学习过程中反馈增益的迭代误差如图 3所示, 可以看到, 在迭代到23次时, 反馈增益收敛到最优反馈增益, 迭代值为

    $$ \begin{split} \mathcal{K}_{23}=\;&\left[ \begin{array}{cccccc} -13.881\,4 & 14.060\,7 & \end{array} \right.\\ & \left. \begin{array}{cccccc} 0.005\,1 & 0.002\,7 & 0.001\,0 \end{array} \right] \end{split} $$ (42)
    图 3  学习过程中反馈增益的迭代误差
    Fig. 3  Iterative error of feedback gain during learning process

    PMSM转子参考速度为

    $$ \omega_{\text{ref}}=\left\{ \begin{aligned} &600\;\text{r/min},&& 0 \;{\rm{s}}< t \leq 1\;\text{s} \\ &1\,200\;\text{r/min},&& 1\;\text{s} < t \leq 2\;\text{s} \\& 300\;\text{r/min},&& 2\;\text{s} < t \leq 3\;\text{s} \end{aligned} \right. $$ (43)

    仿真结果如图 4所示, 方法1为级联PI控制方法(PI控制形式和参数可以在文献[24]中找到), 方法2为文献[24]提出的控制方法, 方法3为LADRC控制方法(LADRC控制形式和参数可以在文献[33]中找到, 在这里设置观测器带宽为$ \omega_o= 1\,000 $和控制器带宽为$ \omega_c=500 $), 方法4是本文所提方法.

    图 4  不同控制方法下转子速度的跟踪效果
    Fig. 4  Tracking effect of rotor speed under different control methods

    可以看到, 方法1和方法2存在一定的超调, 尽管方法3能够快速达到稳态值, 但是本文根据实验结果发现, 它存在一定的稳态误差(稳态误差为5 r/min), 不能实现无误差跟踪. 相比之下, 本文所提方法(方法4)能够无超调跟踪参考速度.

    图 5图 6分别为方法1和方法3下$ q $轴电压响应, 可以看到, 两种方法在启动和参考速度发生变化时, 均存在较大的电压冲击. 图 7为方法2和方法4下$ q $轴电压响应, 图 8图 7的局部放大, 可以看到, 相对于方法2, 本文所提方法有着更快的电压响应以及更好的稳态过程.

    图 5  方法1下的$ q $轴电压响应
    Fig. 5  q-axis voltage response under method 1
    图 6  方法3下的$ q $轴电压响应
    Fig. 6  q-axis voltage response under method 3
    图 7  方法2和方法4下的$ q $轴电压响应
    Fig. 7  q-axis voltage response under method 2 and method 4
    图 8  方法2和方法4下的$ q $轴电压响应局部放大
    Fig. 8  Partial amplification of q-axis voltage response under method 2 and method 4

    为验证不同参数对系统性能的影响, 本文做了一组仿真. 在1 s时, 参考速度从600 r/min突变到1200 r/min; 在2 s时, 负载从1 N·m突变到4 N·m. 不同权重$ Q $下的速度跟踪效果和 $ q $轴电压响应如图 9图 10所示, 不同权重$ R $下的转子速度跟踪效果和$ q $轴电压响应如图 11图 12所示. 可以看到, 权重$ Q $越大, 系统响应越快, 负载变化后依然能快速响应到参考速度; 另一方面, 权重$ R $ 越大, 系统响应越慢.

    图 9  不同权重$ Q $下的转子速度跟踪效果
    Fig. 9  Tracking effect of rotor speed under different weights $ Q $
    图 10  不同权重$ Q $下的$ q $轴电压响应
    Fig. 10  q-axis voltage response under different weights $ Q $
    图 11  不同权重$ R $下的转子速度跟踪效果
    Fig. 11  Tracking effect of rotor speed under different weights $ R $
    图 12  不同权重$ R $下的$ q $轴电压响应
    Fig. 12  q-axis voltage response under different weights $ R $

    本文介绍了一种参数未知的ADP最优输出反馈控制方案, 用于解决PMSM速度伺服系统的转子速度跟踪问题. 该控制方案是在输出反馈和自适应动态规划框架下共同完成的, 不需要额外测量系统的转矩、定子$ q $轴电枢电流和事先了解PMSM模型精确参数. 仿真结果表明, 在PMSM模型参数未知的情况下, 仅利用部分测量数据就能找到最佳调节器, 其速度跟踪和瞬态响应性能优于传统的级联PI、LADRC和文献[24]提出的方案. 在未来的工作中, 我们将主要研究PMSM速度伺服系统的非线性自适应最优控制方案.

  • 图  1  所提出的控制方案框图

    Fig.  1  Block diagram of the proposed control scheme

    图  2  所提控制方案算法流程图

    Fig.  2  The algorithm flowchart of the proposed control scheme

    图  3  学习过程中反馈增益的迭代误差

    Fig.  3  Iterative error of feedback gain during learning process

    图  4  不同控制方法下转子速度的跟踪效果

    Fig.  4  Tracking effect of rotor speed under different control methods

    图  5  方法1下的$ q $轴电压响应

    Fig.  5  q-axis voltage response under method 1

    图  6  方法3下的$ q $轴电压响应

    Fig.  6  q-axis voltage response under method 3

    图  7  方法2和方法4下的$ q $轴电压响应

    Fig.  7  q-axis voltage response under method 2 and method 4

    图  8  方法2和方法4下的$ q $轴电压响应局部放大

    Fig.  8  Partial amplification of q-axis voltage response under method 2 and method 4

    图  9  不同权重$ Q $下的转子速度跟踪效果

    Fig.  9  Tracking effect of rotor speed under different weights $ Q $

    图  10  不同权重$ Q $下的$ q $轴电压响应

    Fig.  10  q-axis voltage response under different weights $ Q $

    图  11  不同权重$ R $下的转子速度跟踪效果

    Fig.  11  Tracking effect of rotor speed under different weights $ R $

    图  12  不同权重$ R $下的$ q $轴电压响应

    Fig.  12  q-axis voltage response under different weights $ R $

    表  1  PMSM系统参数设置

    Table  1  PMSM system parameters setting

    参数 大小 单位
    转动惯量$J$ $2.10\times 10^{-3}$ ${{\rm{kg}}{\cdot}{\rm{m}}}^2$
    粘性摩擦系数$B_s$ $5.71\times 10^{-3}$ ${{\rm{N}}{\cdot}{\rm{s/rad}}}$
    极对数$n_p$ $4$
    永磁通链$\varphi$ $8.10\times 10^{-2}$ Wb
    定子电感$L_s$ $9.80\times 10^{-3}$ H
    定子电阻$R_s$ $1.06$ $\Omega$
    下载: 导出CSV
  • [1] Yang J, Chen W H, Li S H, Guo L, Yan Y D. Disturbance/uncertainty estimation and attenuation techniques in PMSM drives——A survey. IEEE Transactions on Industrial Electronics, 2017, 64(4): 3273−3285 doi: 10.1109/TIE.2016.2583412
    [2] Deniz E. ANN-based MPPT algorithm for solar PMSM drive system fed by direct-connected PV array. Neural Computing and Applications, 2017, 28(10): 3061−3072 doi: 10.1007/s00521-016-2326-4
    [3] Li P, Xu X S, Yang S R, Jiang X F. Open circuit fault diagnosis strategy of PMSM drive system based on grey prediction theory for industrial robot. Energy Reports, 2023, 9: 313−320 doi: 10.1016/j.egyr.2022.10.433
    [4] Wang M L, Ren X M, Chen Q. Cascade optimal control for tracking and synchronization of a multimotor driving system. IEEE Transactions on Control Systems Technology, 2019, 27(3): 1376−1384 doi: 10.1109/TCST.2018.2810273
    [5] Errouissi R, AL-Durra A, Muyeen S M. Experimental validation of a novel PI speed controller for AC motor drives with improved transient performances. IEEE Transactions on Control Systems Technology, 2018, 26(4): 1414−1421 doi: 10.1109/TCST.2017.2707404
    [6] Ruderman M, Iwasaki M, Chen W H. Motion-control techniques of today and tomorrow: A review and discussion of the challenges of controlled motion. IEEE Industrial Electronics Magazine, 2020, 14(1): 41−55 doi: 10.1109/MIE.2019.2956683
    [7] Kim S K. Robust adaptive speed regulator with self-tuning law for surfaced-mounted permanent magnet synchronous motor. Control Engineering Practice, 2017, 61: 55−71 doi: 10.1016/j.conengprac.2017.01.014
    [8] Wu J, Zhang J D, Nie B C, Liu Y H, He X K. Adaptive control of PMSM servo system for steering-by-wire system with disturbances observation. IEEE Transactions on Transportation Electrification, 2022, 8(2): 2015−2028 doi: 10.1109/TTE.2021.3128429
    [9] 谢浩然, 胡纯福, 卢萌, 刘晓, 黄守道. 基于级联线性−非线性自抗扰控制器的永磁直线同步电机速度控制策略研究. 中国电机工程学报, 2024, 44(15): 6158−6168

    Xie Hao-Ran, Hu Chun-Fu, Lu Meng, Liu Xiao, Huang Shou-Dao. Research on speed control strategy for permanent magnet linear synchronous motor based on cascaded linear-nonlinear active disturbance rejection controller. Proceedings of the CSEE, 2024, 44(15): 6158−6168
    [10] 徐睿琦, 张昆鹏, 林欣魄, 孔德山, 刘壮, 刘健行. 基于高阶滑模观测器的永磁同步电机无差拍预测电流控制. 控制理论与应用, 2023, 40(11): 1990−1998 doi: 10.7641/CTA.2023.20476

    Xu Rui-Qi, Zhang Kun-Peng, Lin Xin-Po, Kong De-Shan, Liu Zhuang, Liu Jian-Xing. Deadbeat predictive current control of permanent magnet synchronous motor based on higher order sliding mode observer. Control Theory & Applications, 2023, 40(11): 1990−1998 doi: 10.7641/CTA.2023.20476
    [11] 卢宏平, 赵文祥, 陶涛, 王化南, 钱渊方, 王政. 永磁同步电机低载波比精确无差拍预测电流控制. 中国电机工程学报, DOI: 10.13334/j.0258-8013.pcsee.231871

    Lu Hong-Ping, Zhao Wen-Xiang, Tao Tao, Wang Hua-Nan, Qian Yuan-Fang, Wang Zheng. Precise deadbeat predictive current control of PMSM with low carrier ratio. Proceedings of the CSEE, DOI: 10.13334/j.0258-8013.pcsee.231871
    [12] 张化光, 张欣, 罗艳红, 杨珺. 自适应动态规划综述. 自动化学报, 2013, 39(4): 303−311 doi: 10.1016/S1874-1029(13)60031-2

    Zhang Hua-Guang, Zhang Xin, Luo Yan-Hong, Yang Jun. An overview of research on adaptive dynamic programming. Acta Automatica Sinica, 2013, 39(4): 303−311 doi: 10.1016/S1874-1029(13)60031-2
    [13] Gao W N, Jiang Z P. Adaptive dynamic programming and adaptive optimal output regulation of linear systems. IEEE Transactions on Automatic Control, 2016, 61(12): 4164−4169 doi: 10.1109/TAC.2016.2548662
    [14] Wei Q L, Liu D R, Lin H Q. Value iteration adaptive dynamic programming for optimal control of discrete-time nonlinear systems. IEEE Transactions on Cybernetics, 2016, 46(3): 840−853 doi: 10.1109/TCYB.2015.2492242
    [15] Lu J W, Wei Q L, Wang F Y. Parallel control for optimal tracking via adaptive dynamic programming. IEEE/CAA Journal of Automatica Sinica, 2020, 7(6): 1662−1674 doi: 10.1109/JAS.2020.1003426
    [16] 王睿, 孙秋野, 张化光. 微电网的电流均衡/电压恢复自适应动态规划策略研究. 自动化学报, 2022, 48(2): 479−491

    Wang Rui, Sun Qiu-Ye, Zhang Hua-Guang. Research on current sharing/voltage recovery based adaptive dynamic programming control strategy of microgrids. Acta Automatica Sinica, 2022, 48(2): 479−491
    [17] 罗彪, 欧阳志华, 易昕宁, 刘德荣. 基于自适应动态规划的移动机器人视觉伺服跟踪控制. 自动化学报, 2023, 49(11): 2286−2296

    Luo Biao, Ouyang Zhi-Hua, Yi Xin-Ning, Liu De-Rong. Adaptive dynamic programming based visual servoing tracking control for mobile robots. Acta Automatica Sinica, 2023, 49(11): 2286−2296
    [18] Wang Z Y, Wang Y Q, Davari M, Blaabjerg F. An effective PQ-decoupling control scheme using adaptive dynamic programming approach to reducing oscillations of virtual synchronous generators for grid connection with different impedance types. IEEE Transactions on Industrial Electronics, 2024, 71(4): 3763−3775 doi: 10.1109/TIE.2023.3279564
    [19] Wang Z Y, Yu Y J, Gao W N, Davari M, Deng C. Adaptive, optimal, virtual synchronous generator control of three-phase grid-connected inverters under different grid conditions——An adaptive dynamic programming approach. IEEE Transactions on Industrial Informatics, 2022, 18(11): 7388−7399 doi: 10.1109/TII.2021.3138893
    [20] Qasem O, Davari M, Gao W N, Kirk D R, Chai T Y. Hybrid iteration ADP algorithm to solve cooperative, optimal output regulation problem for continuous-time, linear, multiagent systems: Theory and application in islanded modern microgrids with IBRs. IEEE Transactions on Industrial Electronics, 2024, 71(1): 834−845 doi: 10.1109/TIE.2023.3247734
    [21] Ping Z W, Jia Y J, Xiong B G, Zhang H W, Lu J G. Optimal output regulation for PMSM speed servo system using approximate dynamic programming. Science China Information Sciences, 2023, 66(7): Article No. 170206
    [22] Khiabani A G, Heydari A. Optimal torque control of permanent magnet synchronous motors using adaptive dynamic programming. IET Power Electronics, 2020, 13(12): 2442−2449 doi: 10.1049/iet-pel.2019.1339
    [23] Tan L N, Pham T C. Optimal tracking control for PMSM with partially unknown dynamics, saturation voltages, torque, and voltage disturbances. IEEE Transactions on Industrial Electronics, 2022, 69(4): 3481−3491 doi: 10.1109/TIE.2021.3075892
    [24] Zhao J G, Yang C Y, Gao W N, Zhou L N. Reinforcement learning and optimal control of PMSM speed servo system. IEEE Transactions on Industrial Electronics, 2023, 70(8): 8305−8313 doi: 10.1109/TIE.2022.3220886
    [25] Rizvi S A A, Lin Z L. Reinforcement learning-based linear quadratn of continuous-time systems using dynamic output feedback. IEEE Transactions on Cybernetics, 2020, 50(11): 4670−4679 doi: 10.1109/TCYB.2018.2886735
    [26] 庞文砚, 范家璐, 姜艺, Lewis Frank Leroy. 基于强化学习的部分线性离散时间系统的最优输出调节. 自动化学报, 2022, 48(9): 2242−2253

    Pang Wen-Yan, Fan Jia-Lu, Jiang Yi, Lewis Frank Leroy. Optimal output regulation of partially linear discrete-time systems using reinforcement learning. Acta Automatica Sinica, 2022, 48(9): 2242−2253
    [27] Gao W N, Jiang Z P. Adaptive optimal output regulation of time-delay systems via measurement feedback. IEEE Transactions on Neural Networks and Learning Systems, 2019, 30(3): 938−945 doi: 10.1109/TNNLS.2018.2850520
    [28] Wang Z Y, Wang Y Q, Kowalczuk Z. Adaptive optimal discrete-time output-feedback using an internal model principle and adaptive dynamic programming. IEEE/CAA Journal of Automatica Sinica, 2024, 11(1): 131−140 doi: 10.1109/JAS.2023.123759
    [29] Gao W N, Liu Y Y, Odekunle A, Yu Y J, Lu P L. Adaptive dynamic programming and cooperative output regulation of discrete-time multi-agent systems. International Journal of Control, Automation and Systems, 2018, 16: 2273−2281 doi: 10.1007/s12555-017-0635-8
    [30] Du H B, Wen G H, Cheng Y J, Lu J H. Design and implementation of bounded finite-time control algorithm for speed regulation of permanent magnet synchronous motor. IEEE Transactions on Industrial Electronics, 2021, 68(3): 2417−2426 doi: 10.1109/TIE.2020.2973904
    [31] Krishnan R. Electric Motor Drives: Modeling, Analysis, and Control. Upper Saddle River: Prentice Hall, 2001.
    [32] Huang J. Nonlinear Output Regulation: Theory and Applications. Philadelphia: SIAM, 2004.
    [33] Wang Z Y, Yu Y J. Adaptive optimal control of CVCF inverters with uncertain load: An adaptive dynamic programming approach. IEEE Access, 2021, 9: 89276−89286 doi: 10.1109/ACCESS.2021.3090815
  • 加载中
图(12) / 表(1)
计量
  • 文章访问数:  431
  • HTML全文浏览量:  189
  • PDF下载量:  175
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-01-09
  • 录用日期:  2024-03-29
  • 网络出版日期:  2024-08-18
  • 刊出日期:  2024-09-19

目录

/

返回文章
返回