-
摘要: 无偏(静差)模型预测控制(Model predictive control, MPC)的设计目标是使被控变量渐近地跟踪设定值, 这类控制方法直接关系到闭环系统的跟踪性能和抗扰性能.由于可以有效处理不可测扰动、模型失配等, 无偏MPC具有很强的工程应用价值, 但是在理论方面并没有得到充分重视.近30年来, 围绕无偏MPC的原理、分析和设计展开了一系列的研究工作, 并取得了系统性的研究成果.当前的一些研究结果大多分散在不同的参考文献中, 缺少全面的梳理和呈现.本文的主要工作包括回顾常见无偏控制方法, 综述当前无偏MPC的研究进展, 并探讨一些潜在的研究方向.Abstract: The goal of offset-free MPC (Model predictive control) is to drive the controlled variables to the desired setpoints asymptotically. Due to the ability to cope with unmeasured disturbances and/or model mismatch, offset-free control strategies are directly related to the tracking performance and disturbance rejection performance. Offset-free MPC is fundamental for practical implementation, however, is often overlooked in academic researches. Great achievements have been made in the area of offset-free MPC over the last three decades. The existing results scatter in many academic papers and books, and there are few systemic discussions. This paper aims to shed some light on the theory and design of offset-free MPC, including common offset-free control strategies, current research activities, and some possible directions in the future.
-
Key words:
- Model predictive control /
- offset-free control /
- tracking control /
- disturbance modeling /
- disturbance observer
-
在当今社会, 签名笔迹鉴别作为重要的法证手段之一, 广泛应用于法律、保险、文化等多个领域. 由于签名笔迹具有独特性、稳定性及可靠性等特点, 它成为鉴别文件真伪、确认当事人身份等方面的重要依据. 然而, 随着科技的不断发展, 签名笔迹检验也面临着许多挑战. 签名笔迹的产生可以追溯到古代, 当时人们使用各种符号、图形来签名. 随着纸张和墨水的发展, 人们开始使用手写签名, 早在公元439年, 罗马帝国就用签名来验证文件的真伪. 然而, 直到20世纪初, 签名笔迹才开始引起人们的研究. 这一时期, 心理学和统计学等学科开始应用于签名笔迹的研究, 为签名笔迹检验提供了理论基础. 签名笔迹在多个领域中具有重要作用. 在法律领域, 签名笔迹是确认文件真伪的重要依据, 也是法庭上证据的一部分. 在保险领域, 签名笔迹用于鉴别保单真伪, 预防保险欺诈. 在文化领域, 签名笔迹则体现了艺术家的风格和个性, 对于笔迹学的深入研究有着重要价值. 随着科技的进步, 签名笔迹检验面临着许多挑战. 签名笔迹易受书写习惯、情绪、环境等因素影响, 使得笔迹检验的准确性变得复杂. 此外, 签名笔迹造假技术的发展也给检验工作带来了一定的难度. 考虑到如今的文件的真实性大部分还是靠手写签名进行验证, 而利用人力进行判断的成本过高, 因此急需开发一个准确且高效的签名验证技术.
签名验证技术根据输入的方式不同分为联机签名验证技术和脱机签名验证技术两种. 对于联机签名验证, 研究人员可以获取到签名过程的动态信息, 如笔划轨迹、倾斜度和笔划压力等[1–4]. 而在脱机签名验证技术当中, 研究人员只能获取到通过扫描仪或相机拍摄到的签名图像, 是一种静态的信息[5–7]. 因为静态的信息相比于动态的信息, 获取的信息量更少, 因此脱机签名验证比联机签名验证更具有挑战性. 在如今纸质文档广泛使用的环境下, 脱机签名验证有着更普及的使用空间. 签名验证技术也根据与写入者是否相关, 分为依赖于写者和独立于写者. 在依赖于写者方法当中, 研究人员的测试样本依赖于训练样本, 也就是说测试集的每个签名主体都有一定量的签名样本在训练集当中[8–10]. 在实际应用当中, 为每个用户收集并训练大量的样本是不切实际的. 而独立于写者方法当中, 训练集的用户和测试集的用户是相互独立的[11–12], 因此, 在实际应用中更具有价值.
签名伪造方法根据伪造的熟练程度, 分为随机伪造、简单伪造和熟练伪造三种类型[13]. 随机伪造的签名没有任何关于被模仿者的信息, 因此与真实样本差异性大. 简单伪造是不遵循被模仿者的书写风格而进行的伪造样本, 与真实样本有一定的相似性. 熟练伪造是专业人员通过分析被模仿者的签名特征, 进行伪造的签名, 与真实样本高度相似. 对于熟练伪造样本, 非专业人员一般分辨不出来, 因此如果有犯罪集团通过获取被模仿者的相关信息, 精心伪造签名进行犯罪行为, 这将对原签名的持有者本人造成不良影响. 此外, 对于书写者本人, 在不同的环境下书写的签名也有很大的区别, 因此, 如何找到真实样本与伪造样本的差异点, 这将是一项艰巨的任务. 为了方便研究人员对脱机签名验证方法的研究, 学术界目前公开了许多脱机签名验证数据集, 例如英语的CEDAR数据集[14]、GPDS数据集[15], 包含孟加拉语和印地语的BHSig260数据集[16], 中文的MSDS数据集[17]、ChiSig数据集[18].
在深度学习兴盛之前, 研究人员通常采用特征匹配等传统的图像处理方法进行签名验证. 例如, 文献[19]以及文献[20]开发了第一个离线和在线签名验证系统; 文献[21]利用字符的笔划方向性先进行方向分解, 然后对每个方向的子图像进行频带分解, 用分解后的采样信号值作为笔迹特征, 并采用特征匹配方法进行书写人识别; 文献[22]通过多通道二维Gabor滤波等方法进行身份判别. 如今, 研究者们不断探索新的签名笔迹检验方法, 并且随着深度学习及其相关技术的崛起, 文献[23]采用孪生网络分别提取输入的两张样本图像的特征, 然后利用度量学习的方法判断两张签名之间的相似距离, 并选择一个阈值来判断是否是同一个人书写. 该度量学习的方法具有很大的局限性, 一方面是, 度量学习的度量方法大多使用欧氏距离进行计算, 而欧氏距离仅考虑两个点之间的绝对距离, 容易忽视点的方向、缩放的信息, 不会考虑数据之间的相关性, 因此忽略了特征向量内部各值之间的关系; 另一方面是, 其度量阈值是通过遍历过程求解, 虽然能获取到当前数据集的最优解, 但是泛化性不高, 同一个阈值对不同的数据集的效果将完全不一样. 因此, 文献[24]针对该缺陷提出了DeepHSV, 利用双通道判别的方法进行脱机笔迹鉴别, 通过图像融合, 将需要对比的两张图片融合成一张图片用于模型的输入, 可以有效解决度量学习的局限性. 然而它们是直接在模型输入前将图片进行通道融合, 此时两张对比图片的特征还不是很明显, 导致不同图片之间的精细特征被融合覆盖掉, 因此无法区分精心伪造的签名. 文献[25]提出了逆鉴别八重注意力机制, 将逆鉴别图片作为注意力附加在原始图片上, 使得模型更加关注笔划特征, 并且在多个数据集上取得了不错的结果. 该方法的局限性在于过多关注原始图片的特征, 且只把逆鉴别的特征作为辅助判断的信息, 本文认为笔迹的特征不仅仅可以从原图中获取, 反灰度图片同样蕴含大量的图片特征.
脱机笔迹签名验证技术虽然可以看成一个二分类任务, 但是和传统的图片分类有很大的不同. 它们的区别在于: 1) 笔迹验证系统输入的两张图片的相似度远远高于其他领域的, 两张图片的差异细节过于稀疏; 2) 图片为灰度单通道图片; 3) 笔迹验证系统判别的本质是风格对比, 设计不当容易造成过拟合. 针对这些问题, 不同的学者给出了不同解决方案, 例如IDN[25], TransOSV[26], LGR[27]等. 以上方法采用CNN或自注意力[28-29]的技术, 通常来说, 这两种技术被归于不同的类型. 但是文献[30]提出的ACMix证明两种方法有很强的潜在关系. 本文将其作为模型的判别模块, 将使得模型更加地专注于融合后图片的稀疏信息特征, 以达到更高的判别精度.
本文针对双通道判别方法的局限性, 设计了一种多重通道特征融合网络(Multi-channel feature fusion network, MCFFN)框架, 采用双重逆鉴别注意力进行原始图片和反灰度图片的特征提取与增强, 将提取后的多维向量进行通道整合, 采用ACMix进行图像相似度判断. 该网络模型在CEDAR、BHSig-B、BHSig-H、ChiSig四个数据集上均取得了不错的效果, 证明了该方法的有效性及广泛性.
本文主要贡献如下: 1)提出了MCFFN框架, 通过融合多重孪生网络提取输入图片的多维详细特征来增强真实与伪造图片的差异性; 2)改进了逆鉴别注意力模块, 通过双重逆鉴别注意力机制, 强化了签名特征提取的能力; 3)在CEADR、BHSig-B、BHSig-H和ChiSig数据集上分别进行实验, 取得了很好的效果, 优于基线论文及大多数现有方法.
1. 相关工作
脱机签名验证可以算为一种二分类的问题. 近年来, 基于深度学习的方法优于传统特征设计的方法, 这得益于深度神经网络强大的特征提取能力及其相关技术的发展. 目前学术上对于笔迹识别的相关工作主要分为深度度量学习和双通道判别网络两个方向.
1.1 孪生网络
基于深度度量学习的方法, 其主要做法是两个样本先通过相同的网络生成样本向量, 之后计算两个样本之间的距离来判断是否为同一类样本. 该网络便是孪生网络. 孪生网络又称为连体网络, 是一种特殊的神经网络结构, 该网络可以输入两张图片进行特征提取, 两个模型之间通过共享权重来实现. 1993年, 孪生网络首次被提出用于处理美国支票上的签名识别[31].
孪生网络因其结构简单、易于编码实现等特点, 被广泛应用于图像相似度度量领域. 两个样本经过相同的特征提取器之后, 提取到的特征具有很强的图片代表性. 一般情况下, 该网络常被用于处理两个输入差异不是很大的验证问题等. 该网络输入的是一对样本, 通过训练网络使得标签相同的样本在特征空间当中越靠近, 标签不同的样本在特征空间中越远离. 因此, 该网络促进了脱机签名验证领域的发展. 例如: 文献[23]提出的SigNet, 文献[32]提出的MSDN, 文献[26]提出的TransOSV等. 孪生网络的基本的网络框架如图1所示: 其中, $ A $和$ B $为输入的两个样本, 网络1和网络2为特征提取网络, 两个网络之间参数共享. 输入图片后, 经过特征提取网络生成特征向量$ a $和$ b $, 通过度量函数计算$ a $和$ b $两个样本的度量距离, 最后通过对比损失函数或其他损失函数来优化网络参数.
通过孪生网络生成两个特征向量, 按照同一个类别的图片之间越靠近, 不同的图片之间越远离的原则可以在最小距离与最大距离之间采用遍历的方法寻找最优阈值. 但是遍历寻找最优阈值的方法有一个很大的局限性, 即当前的阈值是遍历当前的训练测试集得到的, 其算法可扩展性很低, 且采用欧氏距离判断不同图片的相似性, 而欧氏距离仅考虑两个点之间的绝对距离, 容易忽视点的方向、缩放的信息, 不会考虑数据之间的相关性, 忽略了特征向量之间的关系. 因此, 需要一个新的方法来解决这个问题.
1.2 双通道判别网络
另一种主流的脱机签名验证方法是双通道判别方法, 将两张图片进行特征融合后, 模型直接输出0/1来判断是否为同一类. 该方法与孪生网络最大的区别在于孪生网络是两个样本通过相同的网络结构生成向量, 之后再进行判断, 而双通道判别网络则是在输入网络之前就把两张图片融合成一张双通道图片, 之后输入单体网络, 获得是否为同一类的结果. 双通道判别网络当中, 网络不会明确提取输入的特征, 而是在第一步就测量它们的距离. 这样的设计大大减少了搜索的参数空间, 使得双通道网络特别适合签名验证. 基于双通道的图像相似度计算方法由文献[33]提出, 自提出以来, 在脱机签名验证领域也取得了不少的成果. 例如, 文献[24]采用双通道融合, 双logit的输出作为监督条件进行训练的方法进行脱机签名验证. 文献[26]提出了一种基于双通道和双重Transformer的离线签名框架等. 双通道判别网络的基本网络框图如图2所示: 其中, $ A $和$ B $为输入的两个样本, 网络模型为特征提取网络. 输入两张图片后, 进入单体网络前先通过图像预处理将两张图片进行通道融合成一张新的图片$ C $, 之后将$ C $输入单体网络, 网络的输出结果直接输出是否为同一个人书写的情况, 也就是0和1.
双通道判别方法本质上是将图像的相似度判断看成是一种二分类的方法. 通过双通道判别网络, 将相似距离的测算放在网络的第一步, 网络直接输出是否是同一个人书写的结果. 该方法相比于孪生网络方法, 一方面大大减少了搜索的参数空间, 有效地加快网络的训练速度; 另一方面, 网络直接输出结果的方法, 避免了孪生网络的阈值的局限性, 在更换训练数据集或增加数据后, 准确率不会受到过多的影响. 当前网络对于双通道判别的方法都是直接在原始图片上或图片裁剪之后进行融合, 即在最初的两张图片上进行距离测算, 此时的图片特征还不明显, 将其简单地融合会导致损失大量的精细的特征, 最终导致模型的性能不佳.
1.3 灰度处理
在脱机签名验证当中, 本文输入的是两张单通道图片, 而文献[34]也尝试采用三通道彩色图片进行训练, 但是效果不如灰度图片. 在灰度图片当中, 不同灰度分布将对模型的结果起着重要的影响, 例如黑底白字和白底黑字, 不同的输入对同一个模型的训练会造成很大的影响. 这是因为在签名验证图片当中, 数据模型仅仅需要笔迹笔划的特征信息, 大部分背景信息是无效甚至是有害处的. 如果背景信息是像素值为0的像素点, 卷积之后的结果没有变化, 这对特征提取甚至是模型的输出有不小的影响. 但是这并不意味着白底黑字的图片都是无效信息, 其中也包含着详细且重要的信息. 文献[25]针对该问题提出了一种逆判别网络, 网络的输入为黑底白字的图片, 该网络通过灰度处理和多路径注意力模块强化了签名验证的有效信息. 该方法的注意力模块是从反灰度图片当中提取特征制作成注意力模块加载在原始灰度图片上, 使得模型更加关注图片的笔划信息. 该方法创新性地将黑底白字及其反灰度图片进行特征提取, 但是该方法的特征提取重心在原始灰度图片上, 而忽视了其反灰度图片并不是只能作为附加注意力的工具, 其信息也包含着大量的笔迹笔划信息.
1.4 ACMix
卷积核和自注意力是表示学习的两种强大技术, 二者之间存在很强的潜在关系, 因为这两种范式的大部分计算实际上是通过相同的操作完成的. 具体来说, 核大小为$ k \times k $的卷积可以分为$ k^{2} $个单独的$ 1 \times 1 $卷积, 然后进行移位和求和操作. 而ACMix当中首先用$ 1 \times 1 $的卷积核将输入特征投影为查询、键和值, 然后计算注意力权重和值矩阵的聚合, 即局部特征的聚集. 因此, ACMix能够将这两种看似不同的范式进行优雅的整合, 既享有自注意力和卷积的好处, 同时又与纯卷积或自注意力相比具有更小的开销[30].
本文根据双通道判别网络的特征缺失问题提出了一个名为MCFFN的网络结构, 采用四重孪生网络和双重逆鉴别注意力机制进行特征提取, 将提取之后的多重细微特征进行通道融合, 最后基于自注意力和卷积网络判断是否是真实样本对.
2. 方法
MCFFN的网络结构如图3所示, 作为一个端到端的签名验证系统, 由特征提取、通道融合、ACMix模块组成. 一对签名图像先进行反灰度的获取, 总共生成四张图片, 之后输入到四重孪生网络当中. 然后, 对同一张图片的灰度与反灰度图片通过双重逆鉴别注意力计算加权后的特征, 提取大量的细节特征. 最后, 将所提取到的不同图片表示进行通道融合, 采用卷积神经网络与自注意力结合的方式进行判别处理, 以实现高相似度的图像判别.
2.1 双重逆鉴别注意力模块
该网络的特征提取器采用四重孪生网络结构, 该网络由两个卷积块组成, 每个卷积块包含两个由ReLU函数激活的卷积层, 每个卷积层为$ 3 \times 3 $, 步长为1, 填充为1. 每个卷积块的维度为64、128. 参考图片及其反灰度图片、测试图片及其反灰度图片分别输入到特征提取网络, 网络之间共享权重. 在灰度图及对应的反灰度图的卷积模块之间由四个双重笔划注意力模块连接, 每个注意力模块连接判别流中的卷积模块和逆流中的卷积模块, 如图4所示.
同一张图片的灰度图片卷积块与反灰度图片卷积块同时输入到双重逆鉴别注意力模块当中, 其中根据灰度图片卷积块与反灰度图片卷积块的不同时刻的输出分为两条数据流进入共享注意力当中. 注意力模块内部流程图如图4右图所示, 并以左图的黄色数据流为例: 经过灰度图片卷积块输出的特征向量输入到上采样结构中, 该结构使用最近邻算法进行上采样, 并使用 Sigmoid 激活进行卷积运算后, 输出为$ g $. 而反灰度图片卷积块在ReLU后输出为$ h $, 将$ h $乘以$ g $元素, 然后添加$ h $产生中间注意力测量$ h\cdot g + h $, 其中“·”表示点乘. 接下来的全局平均池化(Global average pooling, GAP)层和具有 Sigmoid 激活的全连接层(Full connection, FC)接收中间注意力测量并输出权重向量$ f $. 将每个通道乘以$ f $的每个元素的中间注意力测量分别生成最终的注意力$ (h\cdot g+h) \times f $, 之后输出到反灰度图片卷积块的第二层进行卷积处理. 该方法根据输入输出的不同, 分为红色与黄色两条数据流, 期间共享注意力模块参数, 两个卷积块当中的虚线框也共享权重, 两个卷积块之间也共享权重. 假设灰度图片的ReLU输出为$ x_1 $, 灰度图片卷积块的输出为$ y_1 $; 反灰度图片的ReLU输出为$ x_2 $, 反灰度图片卷积块输出为$ y_2 $; 虚线部分的共享卷积块统称为$ w $, 因此, 不同数据流有不同的公式, 具体如式(1) ~ (4)所示:
$$ \begin{align*} & out_1 = h(x_1)\;g[w(x_2)]+h(x_1) \end{align*} $$ (1) $$ \begin{align*} & y_1=w[out_1\times f(out_1)] \end{align*} $$ (2) $$ \begin{align*} & out_2 = h(x_2)\cdot g[w(x_1)]+h(x_2) \end{align*} $$ (3) $$ \begin{align*} & y_2=w[out_2 \times f(out_2)] \end{align*} $$ (4) 其中, 式(1)、(2)为红色数据流, 式(3)、(4)为黄色数据流.
在注意力模块当中, 本文将灰度图片与反灰度图片分别进行注意力处理, 形成双重逆鉴别注意力. MCFFN与IDN的注意力特征图如图5所示, 通过与IDN的注意力进行对比发现, IDN虽然有四重注意力, 但是随着卷积操作的深入, 注意力模块的关注点更加的抽象. 而MCFFN的注意力模块, 一方面双重特征的引入, 使得注意力之间存在制约, 实现在第二层注意力特征图当中也能准确关注到笔画边缘信息; 另一个方面, 通过减少层数, 使得在通道融合时, 提取到足够详细的特征. 通过多路径注意力机制, 增强了签名验证的重要特征.
由于本文的注意力模块连接了原灰度图和反灰度图, 最终的注意力掩模将引导网络学习用于签名验证的判别特征并抑制误导信息. 整个MCFFN框架有4路注意力模块连接不同的卷积模块, 将注意力机制应用于不同的尺度和分辨率.
2.2 多重通道融合
双通道判别的方法将两张输入的单通道图片融合成一张双通道图片, 并且直接输出是否相似来快速地得到结果. 但是, 双通道判别网络因在图片的原始状态就进行通道融合, 此时的图片特征还不明显, 将其简单地融合会损失大量精细的特征, 最终导致模型的性能不佳. 因此, 在MCFFN当中, 融合了四张分别经过特征提取处理后的128维特征信息的图片, 总共融合了512维特征信息. 相比于传统的双通道判别网络, MCFFN不仅仅包含了需要判别的两张图片的卷积特征, 还包含了两张图片的反灰度图片的卷积特征. 这种方式在融合过程当中考虑了更多的通道信息, 使得网络能够捕捉更多的信息, 提高了融合特征的多样性. 因此, 在融合后的判别阶段, 该网络能够达到更高的精度.
MCFFN将提取后的参考图片、参考图片反灰度图片、测试图片、测试图片反灰度图片特征进行连接, 每张图片各有128维, 之后经过判别模块最终输出0/1来判别是否为同一个人. 与双通道判别方法相比, 经过多通道融合而成的多通道图像, 融合的图像特征更多, 计算图片之间的距离有正负样本各一张, 总共两张图片转变为正负样本各256维来计算差异性, 由于图片特征更多, 计算出来的距离更加精确.
2.3 判别模块
在判别模块当中, 本文主体采用了ACMix模块[30], 辅助两个小卷积块作为判别. 在特征融合之后, 得到具有512个维度的特征向量, 特征之间的差别多且大, 为了准确提取到特征, 采用卷积与自注意力结合的ACMix模块进行特征提取.
经过通道融合后的 512 维特征表示并非直接输入全连接层进行分类, 而是先经过一个基于单体网络模型的判别模块. 在模块中进行整体的特征学习与基于自注意力与卷积网络的判断, 最终输出为0/1二分类的结果. 判别模块的结构由两个小型的卷积模块、一个ACMix模块组成, 其中第一个小型卷积模块的输入为整合通道融合之后的具有区分性的512维特征, 之后采用ACMix的卷积和自注意力机制进行特征提取, 最后采用小型的卷积模块进行特征归纳, 并进入多重感知器进行分类. 此时进入多重感知器的特征为经过判别网络提取的512维图像的特征, 该特征包含参考图片、参考图片反灰度图片、测试图片、测试图片反灰度图片这四张图片整体之间的差异特征信息.
在多重感知器当中引入了全局平均池化来减少网络冗余, 为避免过拟合, 本文采用了0.5的Dropout. 最后, 整个网络将输出一个经过Sigmoid的特征值, 即生成 $ 0 \sim 1 $ 的评判概率. 在准确率判断过程当中, 本文设定该评判概率小于等于0.5的概率为伪造签名, 大于0.5的概率即为真实签名. 损失函数采用二分类交叉熵损失, 其公式为:
$$ \begin{align*} L = -\frac{1}{n}\sum_{i}^{n}[y_i\mathrm{lg}(p_i)+(1-y_i)\mathrm{lg}(1-p_i)] \end{align*} $$ (5) 其中, $ y_i $表示样本i的真实标签, 正类为1, 负类为0. $ p_i $表示样本i预测为正类的概率, 同理$1- p_i $则为样本预测为负类的概率.
3. 实验
本文基于PyTorch(1.13.0)框架, 使用NVIDIA-3090训练模型. 采用Adam优化器, 初始学习率设置为$ 10^{-6} $, 权重衰减为$ 10^{-5} $. batchsize大小设置为 32, ACMix模块的kernel_att为3, head为2. 另外, 本文也进行了跨语言实验, 即在一种语言的数据集上进行训练并在不同语言的另一个数据集上进行测试.
3.1 数据集
数据集的数量与质量对模型的影响很大, 目前随着国内外学者对脱机笔迹鉴别方向的深入研究, 提出了不少公开的脱机数据集, 本文将使用英语的CEDAR数据集, 包含孟加拉语和印地语的BHSig260数据集, 中文的ChiSig数据集进行模型的测试评估. 各种数据集的统计信息如表1所示.
表 1 脱机签名验证数据集Table 1 Offline signature verification dataset数据集名称 语言 签名种类 图片数量 真实伪造样本比 CEDAR 英语 55 2624 24/24 BHSig-B 孟加拉语 100 5400 24/30 BHSig-H 印地语 160 8640 24/30 ChiSig 中文 102 10242 −/− CEDAR数据集为英语语种的签名样本数据集. 它由55名签名者样本组成, 每名签名者有24张真实签名样本和24张伪造签名样本. 根据前人的工作, 本文选取50个人的样本进行训练, 其余5名签名者的样本进行测试. 对于每名签名者, 该数据集有276个参考−真实样本对, 576个参考−伪造样本对, 为保证正负样本平衡, 本文将根据参考−真实样本对的数量随机抽取参考−伪造样本对, 所以对于每名签名者, 本文将有276个参考−真实样本对, 276个参考−伪造样本对进行训练和测试.
BHSig260数据集包含孟加拉语和印地语数据集, 本文将其看作两个不同的数据集. BHSig-B数据集包含100名签名者的孟加拉语签名图像. 每名签名者有24个真实签名和30个伪造签名. 本文根据前人的经验, 随机选择50名签名者的签名进行训练, 其余签名者的签名图像进行测试. BHSig-H数据集包含160名签名者的印地语签名图像. 每名签名者有24个真实签名和30个伪造签名. 同样地, 本文将随机选择100名签名者的签名作为训练集来训练模型, 其余60名签名者的签名作为测试数据. 对于以上两个数据集的每名签名者, 本文同样随机抽取276个参考−真实样本对, 276个参考−伪造样本对进行训练和测试.
文献[18]构建了一个新颖的中文文档离线签名伪造检测基准数据集ChiSig, 包括签名检测、恢复和验证等所有任务. 数据集由干净的手写签名、合成的干扰手写签名和具有手写签名的合成文档组成. 作者通过随机生成500个名字, 然后让志愿者按照一定的规则签名, 得到干净的签名数据, 可用于签名验证任务. 因其志愿者的数量大于名字数量, 因此存在同名但是不同书写者的现象, 这对于签名验证是一个很大的挑战. 之后, 作者通过XFUND数据集、中国国家标准和专利等公共资源获得可用于合成背景的扫描文档. 对于该数据集, 本文随机抽取250个签名作为训练集, 250个签名作为测试集. 对于每个名字, 同个志愿者书写之间的签名作为真实样本对, 不同志愿者之间的签名作为伪造样本对. 对于专门的伪造数据, 仅作为伪造样本对, 伪造数据之间不作为真实样本对. 为保证真实与伪造样本对之间的数据均衡, 本文去除了多余的样本对.
3.2 评估指标
对于CEDAR和BHSig260数据集, 本文将沿照文献[25]的设置, 使用错误拒绝率(False rejection rate, FRR)、错误接受率(False acceptance rate, FAR)和准确率(Accuracy, ACC)来综合评估MCFFN, 并将其与其他现有方法进行比较. FRR定义为错误拒绝数量除以真实样本数量的比率, FAR定义为错误接受数量除以伪造样本数量的比率, ACC定义为判断正确的样本除以总样本量的比率.
而对于ChiSig数据集, 本文采用数据集作者提出的判断指标准确率、等错误率(Equal error rate, EER)和真实接受率(True acceptance rate, TAR)来进行比较. 其中EER来评估FRR等于FAR的平衡点, EER越低, 模型性能越好. TAR的计算方法如式(6) ~ (8)所示, 且当错误接受率(FAR)等于$ 10^{-3} $时, TAR才进行计算:
$$ FAR = \frac{错误接受数}{伪造数量} $$ (6) $$FRR = \frac{错误拒绝数}{真实数量} $$ (7) $$TAR = 1 - FRR $$ (8) 3.3 对比实验
为验证模型的效果, 根据当前笔迹鉴别任务的发展, 本文选取了最新的深度学习模型进行比较, 分别是 SigNet (2017arXiv)[23]、IDN (2019CVPR)[25]、DeepHSV (2019ICDAR)[24]、SDINet (2021AAAI)[35]、SURDS (2022ICPR)[36]、2C2S (2023EAAI)[37]、TransOSV (2022ICME)[26], 这些模型既有孪生网络与度量学习相结合的方法, 也有采用双通道判别的方法, 比较结果足以说明本文所提MCFFN模型的优势. 为方便观察, 对于最优解, 本文采用加粗处理, 次优解则采用下划线处理, 次次优解则为波浪线. CEDAR、BHSig-B、BHSig-H分别在表2、表3、表4中展示, 对于ChiSig数据集的结果, 本文将在第3.4节进行介绍.
表 2 基于CEDAR数据集的对比实验 (%)Table 2 Comparison on CEDAR dataset (%)模型名称 FRR FAR ACC SigNet (2017arXiv) 0 0 100.00 DeepHSV (2019ICDAR) — — 100.00 IDN (2019CVPR) 2.17 5.87 96.38 SDINet (2021AAAI) 3.42 0.73 98.25 2C2S (2023EAAI) 0 0 100.00 OURS 0 0 100.00 表 3 基于BHSig-B数据集的对比实验 (%)Table 3 Comparison on BHSig-B dataset (%)模型名称 FRR FAR ACC SigNet (2017arXiv) 13.89 13.89 86.11 DeepHSV (2019ICDAR) — — 88.08 IDN (2019CVPR) 5.24 4.12 95.32 SDINet (2021AAAI) 7.86 3.30 94.42 SURDS (2022ICPR) 5.42 19.89 87.34 2C2S (2023EAAI) 8.11 5.37 93.25 TransOSV (2022ICME) 9.95 9.95 90.05 OURS 3.86 3.84 95.61 表 4 基于BHSig-H数据集的对比实验 (%)Table 4 Comparison on BHSig-H dataset (%)模型名称 FRR FAR ACC SigNet (2017arXiv) 15.36 15.36 84.64 DeepHSV (2019ICDAR) — — 86.66 IDN (2019CVPR) 4.93 8.99 93.04 SDINet (2021AAAI) 3.77 6.24 95.00 SURDS (2022ICPR) 8.98 12.01 89.50 2C2S (2023EAAI) 9.98 8.66 90.68 TransOSV (2022ICME) 3.39 3.39 96.61 OURS 4.89 4.89 95.70 在CEDAR数据集的实验结果中, MCFFN模型达到100%的准确率. 其主要原因在于该数据集样本较少、结构简单且差异性较大, 因此很多方法在此数据集上取得了良好的成绩. 综合分析, MCFFN的ACC分别比IDN、SDI提高了3.62%, 1.75%, 并与SigNet、DeepHSV、2C2S一样, 达到了100%.
在BHSig-B数据集当中, 实验结果表明MCFFN比当前主流的脱机笔迹鉴别算法都更具有优势, 准确率达到了95.61%, 并且在FRR与FAR的比较当中, 也证明了这一点, 达到了最优或次优. MCFFN与IDN相比, ACC提高了0.29%, 与目前最新的算法2C2S、TransOSV相比, 分别提高了2.36%、5.56%. 这足以证明本文提出的MCFFN模型的优越性.
与CEDAR、BHSig-B相同, MCFFN在BHSig-H数据集上也取得了不错的结果. 与目前最新的算法相比, MCFFN在BHSig-H数据集上取得了95.7%的准确率, 虽然不是最优的结果, FRR为次次优, 其余为次优. 并且与最优的相比, MCFFN的准确率仅仅差了0.89%, 而在BHSig-B当中, 与BHSig-H的最优模型TransOSV相比, MCFFN在准确率上取得了5.56%的领先. 足以说明, MCFFN的泛化性优于TransOSV.
3.4 消融实验
此外, 本文在ChiSig数据集上进行了消融实验, 其中InceptionResnet是数据集论文提供的基线模型[18], 本文通过复现SigNet、IDN代码进行对比实验.
如表5所示, 基准IDN与将其通道融合的方法相对比, 通道融合的方法比原本的方法准确率提高了0.9%; 双重逆鉴别注意力扩充了反灰度图片的信息, 使得通道融合的时候有更加详细的信息, 这个方法使得准确率提升到了88.96%, 相比于通道融合, 提高了3.24%. 而ACMix的判别结构, 使模型具有更高的准确率, 达到了95.23%.
表 5 基于ChiSig数据集的消融实验 (%)Table 5 Ablation experiment on ChiSig dataset (%)模型名称 EER TAR ACC InceptionResnet 6.60 28.10 93.60 SigNet — — 82.28 IDN (基线) 17.91 10.50 84.82 IDN (通道融合) 14.81 9.61 85.72 IDN (通道融合 + 注意力) 11.38 7.82 88.96 OURS (无反灰度图片, 无注意力) 11.78 32.49 88.09 OURS (无反灰度图片, 单注意力) 10.83 — 89.20 OURS (反灰度图片, 无注意力) 7.84 — 92.14 OURS 5.19 28.96 95.23 为了证明反灰度图片及相应的注意力对结果的影响, 本文也针对灰度图片和注意力进行了删减实验, 其中无反灰度图片表示模型仅仅输入参考图片与测试图片, 单注意力表示在双重注意力模块当中, 点乘及上采样的输入由本身提供, 其余均和MCFFN的最终模型一致. 对于无反灰度图片, 引入单注意力后, 准确率提高了1.11%, 而引入反灰度图片, 准确率则提高4.05%. 实验结果表明注意力与反灰度图片的添加具有一定的可行性, 反灰度图片的添加比注意力的添加提升效果更大.
该消融实验, 证明了本文所提出的方法具有合理性. 另外, 为了方便未来的研究人员采用FRR和FAR指标进行对比, 本文也计算了MCFFN在ChiSig数据集上的FRR和FAR指标, 如表6所示.
表 6 基于ChiSig数据集的主流参数 (%)Table 6 Main parameters on ChiSig dataset (%)模型名称 FRR FAR ACC IDN 10.46 17.91 84.82 IDN (通道融合) 9.61 18.97 85.72 IDN (通道融合 + 注意力) 7.82 14.27 88.96 OURS (无反灰度图片, 无注意力) 21.91 17.26 88.09 OURS (无反灰度图片, 单注意力) 15.59 16.30 89.20 OURS (反灰度图片, 无注意力) 6.90 17.18 92.14 OURS 5.34 5.34 95.23 3.5 跨语言实验
此外, 本文也进行了跨语种测试. 在这项工作当中, 本文采用CEDAR、BHSig-B、BHSig-H、ChiSig四种不同语言进行测试. 本文采用一种语言的训练集进行训练, 剩下语言的训练集进行测试. 例如, 本文在BHSig-B的训练数据集上训练模型, 并在 BHSig-H 的测试数据集上测试模型. 训练和测试数据的划分与每个独立数据集上的实验相同. 表7显示了跨语言测试的准确率, 其中行对应于训练语言, 列对应于测试语言.
表 7 跨语言实验 (%)Table 7 Cross-language test (%)训练集 测试集 CEDAR BHSig-B BHSig-H ChiSig CEDAR 100.00 48.76 49.89 57.48 BHSig-B 64.86 95.61 82.79 63.71 BHSig-H 50.11 86.27 95.70 20.00 ChiSig 54.60 70.02 55.37 95.23 表7显示跨语言的签名验证性能快速下降. 本文认为脱机签名验证系统的本质是风格特征匹配, 每个人的签名与每个人的书写风格习惯密切相关, 不同语言风格的书写习惯不一样, 导致当前数据集学习的风格无法适用于其他数据集. BHSig-B数据集与BHSig-H数据集的准确率相比于其他数据集更高, 可能是由于印地语和孟加拉语的书写方式更加接近.
4. 结束语
本文提出了一种新颖的脱机笔迹验证模型MCFFN, 用于独立于作者的场景的手写签名验证, 该模型先通过两层卷积网络和双重注意力模块进行特征提取, 然后采用通道融合的方式进行特征融合, 最后采用ACMix判别模块进行多张图片的相似性判断. 采用逆监督机制和双重注意力机制来解决传统通道融合方法中的特征信息不够详细问题. 在测试中, 输入参考签名图像和测试签名图像, 模型直接输出测试签名是真实的还是伪造的. 实验证明了所提出方法的优势和潜力. 未来的工作将集中于跨语言签名验证和识别的研究.
-
-
[1] 席裕庚, 李德伟, 林姝.模型预测控制—现状与挑战.自动化学报, 2013, 39(3): 222-236 doi: 10.3724/SP.J.1004.2013.00222Xi Yu-Geng, Li De-Wei, Lin Shu. Model predictive control—status and challenges. Acta Automatica Sinica, 2013, 39(3): 222-236 doi: 10.3724/SP.J.1004.2013.00222 [2] Shinskey F G. Feedback Controllers for the Process Industries. New York: McGraw-Hill Professional, 1994. 117-119 [3] Lundström P, Lee J H, Morari M, Skogestad S. Limitations of dynamic matrix control. Computers & Chemical Engineering, 1995, 19(4): 409-421 http://cn.bing.com/academic/profile?id=f784b1919df2f28bf79ef45d9c4c572f&encoded=0&v=paper_preview&mkt=zh-cn [4] Muske K R, Badgwell T A. Disturbance modeling for offset-free linear model predictive control. Journal of Process Control, 2002, 12(5): 617-632 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=a53bce47218139e3782ace29d6d5a1bf [5] Aström K J, Hägglund T. PID Controllers: Theory, Design and Tuning (Second edition). USA: Instrument Society of America, 1995. 80-92 [6] Garcia C E, Morari M. Internal model control. A unifying review and some new results. Industrial & Engineering Chemistry Process Design & Development, 1982, 21(2): 308-323 doi: 10.1021-i200017a016/ [7] Morari M, Zafiriou E. Robust Process Control. Englewood Cliffs, NJ: Prentice-Hall, 1989. [8] 席裕庚.预测控制.第2版.北京:国防工业出版社, 2013Xi Yu-Geng. Predictive Control (Second edition). Beijing: National Defense Industry Press, 2013. [9] Maeder U, Morari M. Offset-free reference tracking with model predictive control. Automatica, 2010, 46(9): 1469-1476 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=82a599115d96619621990f520aa8e59a [10] Young P C, Willems J C. An approach to the linear multivariable servomechanism problem. International Journal of Control, 1972, 15(5): 961-979 doi: 10.1080/00207177208932211 [11] Franklin G F, Powell J D, Workman M L. Digital Control of Dynamic Systems (Third edition). Menlo Park, CA: Addison Wesley Longman Publishing Co., Inc., 1998. 322-336 [12] Johnson C D. Accomodation of external disturbances in linear regulator and servomechanism problems. IEEE Transactions on Automatic Control, 1971, 16(6): 635-644 doi: 10.1109/TAC.1971.1099830 [13] Davison E J, Smith H W. Pole assignment in linear time-invariant multivariable systems with constant disturbances. Automatica, 1971, 7(4): 489-498 doi: 10.1016/0005-1098(71)90099-9 [14] Kwakernaak H, Sivan R. Linear Optimal Control Systems. New York: John Wiley & Sons, Inc., 1972. 278-279 [15] Richalet J, Rault A, Testud J L, Papon J. Model predictive heuristic control: applications to industrial processes. Automatica, 1978, 14(5): 413-428 doi: 10.1016-0005-1098(78)90001-8/ [16] Cutler C R, Ramaker B L. Dynamic matrix control: a computer control algorithm. In: Proceedings of the 1980 Joint Automatic Control Conference. San Francisco, USA, 1980. [17] Garcia C E, Morshedi A M. Quadratic programming solution of dynamic matrix control (QDMC). Chemical Engineering Communications, 1986, 46(1-3): 73-87 doi: 10.1080/00986448608911397 [18] Clarke D W, Mohtadi C. Properties of generalized predictive control. Automatica, 1989, 25(6): 859-875 doi: 10.1016/0005-1098(89)90053-8 [19] Marquis P, Broustail J. SMOC, a bridge between state space and model predictive controllers: application to the automation of a hydrotreating unit. IFAC Proceedings Volumes, 1988, 21(4): 37-45 doi: 10.1016/B978-0-08-035735-5.50010-3 [20] Rawlings J B. Tutorial overview of model predictive control. IEEE Control Systems, 2000, 20(3): 38-52 http://cn.bing.com/academic/profile?id=80dc0712a8ee58d18b9749b8224d9743&encoded=0&v=paper_preview&mkt=zh-cn [21] Li S F, Lim K Y, Fisher D G. A state space formulation for model predictive control. AIChE Journal, 1989, 35(2): 241-249 doi: 10.1002/aic.690350208 [22] Ricker N L. Model predictive control with state estimation. Industrial & Engineering Chemistry Research, 1990, 29(3): 374-382 http://d.old.wanfangdata.com.cn/OAPaper/oai_doaj-articles_af2ad960e2e7be4856a2fd53c7dba86d [23] Kwon W H, Byun D G. Receding horizon tracking control as a predictive control and its stability properties. International Journal of Control, 1989, 50(5): 1807-1824 doi: 10.1080/00207178908953467 [24] Rawlings J B, Muske K R. The stability of constrained receding horizon control. IEEE Transactions on Automatic Control, 1993, 38(10): 1512-1516 doi: 10.1109/9.241565 [25] Muske K R, Rawlings J B. Model predictive control with linear models. AIChE Journal, 1993, 39(2): 262-287 doi: 10.1002/aic.690390208 [26] Lee J H, Morari M, Garcia C E. State-space interpretation of model predictive control. Automatica, 1994, 30(4): 707-717 doi: 10.1016/0005-1098(94)90159-7 [27] Wang L P. A tutorial on model predictive control: using a linear velocity-form model. Developments in Chemical Engineering & Mineral Processing, 2004, 12(5-6): 573-614 http://cn.bing.com/academic/profile?id=57d01df231d6ee94633e98e901047a90&encoded=0&v=paper_preview&mkt=zh-cn [28] Froisy J B. Model predictive control—building a bridge between theory and practice. Computers & Chemical Engineering, 2006, 30(10-12): 1426-1435 https://academic.oup.com/her/article/15/2/125/550414 [29] Morari M, Maeder U. Nonlinear offset-free model predictive control. Automatica, 2012, 48(9): 2059-2067 doi: 10.1016/j.automatica.2012.06.038 [30] Akesson J, Hagander P. Integral action — a disturbance observer approach. In: Proceedings of the 2003 European Control Conference (ECC). Cambridge, UK: IEEE, 2015. 2577-2582 [31] Rao C V, Wright S J, Rawlings J B. Application of interior-point methods to model predictive control. Journal of Optimization Theory & Applications, 1998, 99(3): 723-757 http://cn.bing.com/academic/profile?id=37dc2572a182e4eb56569ba6ef573176&encoded=0&v=paper_preview&mkt=zh-cn [32] Prett D M, García C E. Fundamental Process Control. Stoneham, MA: Butterworths, 1988 [33] Betti G, Farina M, Scattolini R. A robust MPC algorithm for offset-free tracking of constant reference signals. IEEE Transactions on Automatic Control, 2013, 58(9): 2394-2400 doi: 10.1109/TAC.2013.2254011 [34] Maciejowski J M. Predictive Control with Constraints. Englewood Cliffs: Prentice-Hall, 2002 [35] González A H, Adam E J, Marchetti J L. Conditions for offset elimination in state space receding horizon controllers: a tutorial analysis. Chemical Engineering & Processing: Process Intensification, 2008, 47(12): 2184-2194 http://cn.bing.com/academic/profile?id=b39d1d783d51ed52a7998aacb43bc963&encoded=0&v=paper_preview&mkt=zh-cn [36] Betti G, Farina M, Scattolini R. An MPC algorithm for offset-free tracking of constant reference signals. In: Proceedings of the 51st IEEE Conference on Decision and Control. Maui, HI, USA: IEEE, 2012. 5182-5187 [37] Tatjewski P. Advanced Control of Industrial Processes. London: Springer Verlag, 2007. 176-197 [38] Tatjewski P. Disturbance modeling and state estimation for offset-free predictive control with state-space process models. International Journal of Applied Mathematics & Computer Science, 2014, 24(2): 313-323 http://cn.bing.com/academic/profile?id=6e8857562a4802d30d390cba6f9aed9c&encoded=0&v=paper_preview&mkt=zh-cn [39] Zou T. Offset-free strategy by double-layered linear model predictive control. Journal of Applied Mathematics, 2012, 2012: Article ID 808327 [40] 吴明光, 钱积新.基于多目标分层的预测控制定态优化技术.化工学报, 2005, 56(1): 105-109 doi: 10.3321/j.issn:0438-1157.2005.01.019Wu Ming-Guang, Qian Ji-Xin. Multi-objective and layered steady-state optimization method of model predictive control. Journal of Chemical Industry and Engineering, 2005, 56(1): 105-109 doi: 10.3321/j.issn:0438-1157.2005.01.019 [41] 邹涛, 丁宝苍, 张瑞.模型预测控制工程应用导论.北京:化学工业出版社, 2010.Zou Tao, Ding Bao-Cang, Zhang Rui. MPC: an Introduction to Industrial Applications. Beijing: Chemical Industry Press, 2010. [42] Rawlings J B, Amrit R. Optimizing process economic performance using model predictive control. In: Proceedings of the 2009 Nonlinear Model Predictive Control. Lecture Notes in Control & Information Sciences. Berlin, Heidelberg: Springer, 2009, 384: 119-138 [43] Rao C V, Rawlings J B. Steady states and constraints in model predictive control. AIChE Journal, 1999, 45(6): 1266-1278 doi: 10.1002/aic.690450612 [44] 丁宝苍.工业预测控制.北京:机械工业出版社, 2016.Ding Bao-Cang. Industrial Predictive Control. Beijing: China Machine Press, 2016. [45] Rajamani M R, Rawlings J B, Qin S J. Achieving state estimation equivalence for misassigned disturbances in offset-free model predictive control. AIChE Journal, 2009, 55(2): 396-407 doi: 10.1002/aic.11673 [46] Badgwell T A, Muske K R. Disturbance model design for linear model predictive control. In: Proceedings of the 2002 American Control Conference. Anchorage, USA: IEEE, 2002. 1621-1625 [47] Pannocchia G, Rawlings J B. Disturbance models for offset-free model predictive control. AIChE Journal, 2003, 49(2): 426-437 doi: 10.1002/aic.690490213 [48] Maeder U, Borrelli F, Morari M. Linear offset-free model predictive control. Automatica, 2009, 45(10): 2214-2222 doi: 10.1016/j.automatica.2009.06.005 [49] Pannocchia G. Offset-free tracking MPC: a tutorial review and comparison of different formulations. In: Proceedings of the 2015 European Control Conference. Linz, Austria: IEEE, 2015. 527-532 [50] Wang H K, Xu Z H, Zhao J, Jiang A P. An optimal filter based MPC for systems with arbitrary disturbances. Chinese Journal of Chemical Engineering, 2017, 25(5): 632-640 doi: 10.1016/j.cjche.2016.09.011 [51] Wang H K, Zhao J, Xu Z H, Shao Z J. Input and state estimation for linear systems with a rank-deficient direct feedthrough matrix. ISA Transactions, 2015, 57: 57-62 doi: 10.1016/j.isatra.2015.02.005 [52] Aström K J. Introduction to Stochastic Control Theory. London: Academic Press, 1970. [53] Davison E J. The output control of linear time-invariant multivariable systems with unmeasurable arbitrary disturbances. IEEE Transactions on Automatic Control, 1972, 17(5): 621-630 doi: 10.1109/TAC.1972.1100084 [54] Davison E J, Smith H W. A note on the design of industrial regulators: integral feedback and feedforward controllers. Automatica, 1974, 10(3): 329-332 doi: 10.1016/0005-1098(74)90044-2 [55] Francis B A, Wonham W M. The internal model principle of control theory. Automatica, 1976, 12(5): 457-465 doi: 10.1016/0005-1098(76)90006-6 [56] Rawlings J B, Mayne D Q. Model Predictive Control: Theory and Design. Boston, MA, USA: Addison-Wesley Longman Publishing Co., Inc., 2006. [57] Geromel J C, Bernussou J, Garcia G. $H_2$ and $H{_\infty}$ robust filtering for discrete-time linear systems. SIAM Journal on Control & Optimization, 2000, 38(5): 1353-1368 [58] Speyer J L, Chung W H. Stochastic Processes, Estimation, and Control. Philadelphia: Society for Industrial and Applied Mathematics, 2008 [59] Box G P, Jenkins G M. Time Series Analysis: Forecasting and Control. San Francisco, CA, USA: Holden-Day, 1970 [60] Brockwell P J, Davis R A. Time Series: Theory and Methods. New York, USA: Springer-Verlag, 1987 [61] Odelson B J, Rajamani M R, Rawlings J B. A new autocovariance least-squares method for estimating noise covariances. Automatica, 2006, 42(2): 303-308 doi: 10.1016/j.automatica.2005.09.006 [62] Lima F V, Rajamani M R, Soderstrom T A, et al. Covariance and state estimation of weakly observable systems: application to polymerization processes. IEEE Transactions on Control Systems Technology, 2013, 42(4): 1249-1257. http://cn.bing.com/academic/profile?id=53a79c0373636eafc52382190236fc75&encoded=0&v=paper_preview&mkt=zh-cn [63] Rajamani M R, Rawlings J B. Estimation of the disturbance structure from data using semidefinite programming and optimal weighting. Automatica, 2009, 45(1): 142-148 doi: 10.1016/j.automatica.2008.05.032 [64] Wang H K, Zhao J, Xu Z H, Shao Z J. Linear offset-free model predictive control: a minimum-variance unbiased filter based approach. In: Proceedings of the 52nd IEEE Conference on Decision and Control. Florence, Italy: IEEE, 2013. 782-786 [65] Shead L R E, Muske K R, Rossiter J A. Conditions for which linear MPC converges to the correct target. Journal of Process Control, 2010, 20(10): 1243-1251 doi: 10.1016/j.jprocont.2010.09.001 [66] Davison E J. The robust control of a servomechanism problem for linear time-invariant multivariable systems. IEEE Transactions on Automatic Control, 1976, 21(1): 25-34 doi: 10.1109/TAC.1976.1101137 [67] Johnson C. Further study of the linear regulator with disturbances—the case of vector disturbances satisfying a linear differential equation. IEEE Transactions on Automatic Control, 1970, 15(2): 222-228 doi: 10.1109/TAC.1970.1099406 [68] Wonham W M. Tracking and regulation in linear multivariable systems. SIAM Journal on Control, 1973, 11(3): 424-437 doi: 10.1137/0311035 [69] Wonham W M, Pearson J B. Regulation and internal stabilization in linear multivariable systems. SIAM Journal on Control, 1974, 12(1): 5-18 doi: 10.1137/0312002 [70] Pearson J, Shields R, Staats P. Robust solutions to linear multivariable control problems. IEEE Transactions on Automatic Control, 1974, 19(5): 508-517 doi: 10.1109/TAC.1974.1100679 [71] Francis B, Sebakhy O A, Wonham W M. Synthesis of multivariable regulators: the internal model principle. Applied Mathematics and Optimization, 1974, 1(1): 64-86 http://cn.bing.com/academic/profile?id=58970e1b229940be8283923ba7e068cf&encoded=0&v=paper_preview&mkt=zh-cn [72] Qin S J, Badgwell T A. A survey of industrial model predictive control technology. Control Engineering Practice, 2003, 11(7): 733-764 doi: 10.1016/S0967-0661(02)00186-7 [73] Pannocchia G, Bemporad A. Combined design of disturbance model and observer for offset-free model predictive control. IEEE Transactions on Automatic Control, 2007, 52(6): 1048-1053 doi: 10.1109/TAC.2007.899096 [74] 王浩坤.无偏模型预测控制的若干理论和方法研究[博士学位论文], 浙江大学, 中国, 2015 http://cdmd.cnki.com.cn/Article/CDMD-10335-1015305300.htmWang Hao-Kun. Theories and Methods for Offset-Free Model Predictive Control [Ph. D. dissertation], Zhejiang University, China, 2015 http://cdmd.cnki.com.cn/Article/CDMD-10335-1015305300.htm [75] 钱积新, 赵均, 徐祖华.预测控制.北京:化学工业出版社, 2007.Qian Ji-Xin, Zhao Jun, Xu Zu-Hua. Predictive Control. Beijing: Chemical Industry Press, 2007. [76] Sun Z J, Zhao Y, Qin S J. Improving industrial MPC performance with data-driven disturbance modeling. In: Proceedings of the 50th IEEE Conference on Decision and Control and European Control Conference. Orlando, USA: IEEE, 2011. 1922-1927 [77] Pannocchia G. Robust model predictive control with guaranteed setpoint tracking. Journal of Process Control, 2004, 14(8): 927-937 doi: 10.1016/j.jprocont.2004.03.001 [78] Äström K J, Wittenmark B. Computer-Controlled Systems: Theory and Design, (Third edition). Englewood Cliffs, N.J.: Prentice Hall, 1996. [79] 钱积新.控制理论研究中的几个挑战性的问题.控制工程, 2005, 12(3): 193-195 doi: 10.3969/j.issn.1671-7848.2005.03.001Qian Ji-Xin. Some challenging problems in research on control theory. Control Engineering of China, 2005, 12(3): 193-195 doi: 10.3969/j.issn.1671-7848.2005.03.001 [80] Hovd M. Improved target calculation for model predictive control. Modeling, Identification and Control, 2007, 28(3): 81-86 doi: 10.4173/mic.2007.3.3 [81] Rawlings J B, Bonne D, Jorgensen J B, Venkat A N, Jorgensen S B. Unreachable setpoints in model predictive control. IEEE Transactions on Automatic Control, 2008, 53(9): 2209-2215 doi: 10.1109/TAC.2008.928125 [82] Limon D, Alvarado I, Alamo T, Camacho E F. MPC for tracking piecewise constant references for constrained linear systems. Automatica, 2008, 44(9): 2382-2387 doi: 10.1016/j.automatica.2008.01.023 [83] Gilbert E G, Kolmanovsky I, Tan K T. Discrete-time reference governors and the nonlinear control of systems with state and control constraints. International Journal of Robust and Nonlinear Control, 1995, 5(5): 487-504 doi: 10.1002/rnc.4590050508 [84] Rossiter J A, Kouvaritakis B, Gossner J R. Feasibility and stability results for constrained stable generalized predictive control. Automatica, 1995, 31(6): 863-877 doi: 10.1016/0005-1098(94)00166-G [85] Bemporad A, Casavola A, Mosca E. Nonlinear control of constrained linear systems via predictive reference management. IEEE Transactions on Automatic Control, 1997, 42(3): 340-349 doi: 10.1109/9.557577 [86] Wang H K, Zhao J, Xu Z H, Shao Z J. Model predictive control for Hammerstein systems with unknown input nonlinearities. Industrial & Engineering Chemistry Research, 2014, 53(18): 7714-7722 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=f7559988503aab59e5d0d19aabf9e767 [87] Wang H K, Jiang A P. An active fault-tolerant MPC for systems with partial actuator failures. In: Proceedings of the 11th Asian Control Conference. Gold Coast, Australia: IEEE, 2017. 1614-1619 [88] Lima F V, Rawlings J B. Nonlinear stochastic modeling to improve state estimation in process monitoring and control. AIChE Journal, 2011, 57(4): 996-1007 doi: 10.1002/aic.12308 [89] Zagrobelny M A, Rawlings J B. Practical improvements to autocovariance least-squares. AIChE Journal, 2015, 61(6): 1840-1855 doi: 10.1002/aic.14771 [90] Mehra R. Approaches to adaptive filtering. IEEE Transactions on Automatic Control, 1972, 17(5): 693-698 doi: 10.1109/TAC.1972.1100100 [91] Mehra R. On the identification of variances and adaptive Kalman filtering. IEEE Transactions on Automatic Control, 1970, 15(2): 175-184 doi: 10.1109/TAC.1970.1099422 [92] Myers K, Tapley B. Adaptive sequential estimation with unknown noise statistics. IEEE Transactions on Automatic Control, 1976, 21(4): 520-523 doi: 10.1109/TAC.1976.1101260 [93] Bodizs L, Srinivasan B, Bonvin D. On the design of integral observers for unbiased output estimation in the presence of uncertainty. Journal of Process Control, 2011, 21(3): 379-390 doi: 10.1016/j.jprocont.2010.11.015 [94] 陈虹.模型预测控制.北京:科学出版社, 2013.Chen Hong. Model Predictive Control. Beijing: Science Press, 2013. [95] Mohammadkhani M, Bayat F, Jalali A A. Two-stage observer based offset-free MPC. ISA Transactions, 2015, 57: 136-143 doi: 10.1016/j.isatra.2015.02.015 [96] Mayne D Q. Model predictive control: recent developments and future promise. Automatica, 2014, 50(12): 2967-2986 doi: 10.1016/j.automatica.2014.10.128 [97] Pannocchia G, Kerrigan E C. Offset-free receding horizon control of constrained linear systems. AIChE Journal, 2005, 51(12): 3134-3146 doi: 10.1002/aic.10626 [98] Ding B C, Zou T, Pan H G. A discussion on stability of offset-free linear model predictive control. In: Proceedings of the 24th Chinese Control and Decision Conference. Taiyuan, China: IEEE, 2012. 80-85 [99] Kassmann D E, Badgwell T A, Hawkins R B. Robust steady-state target calculation for model predictive control. AIChE Journal, 2000, 46(5): 1007-1024 doi: 10.1002/aic.690460513 [100] Seborg D E, Edgar T F, Mellichamp D A. Process Dynamics and Control (Second edition). New York: John Wiley & Sons, Inc., 2004. [101] Tatjewski P. Advanced control and on-line process optimization in multilayer structures. Annual Reviews in Control, 2008, 32(1): 71-85 doi: 10.1016/j.arcontrol.2008.03.003 [102] Darby M L, Nikolaou M, Jones J, Nicholson D. RTO: an overview and assessment of current practice. Journal of Process Control, 2011, 21(6): 874-884 doi: 10.1016/j.jprocont.2011.03.009 [103] Würth L, Hannemann R, Marquardt W. A two-layer architecture for economically optimal process control and operation. Journal of Process Control, 2011, 21(3): 311-321 doi: 10.1016/j.jprocont.2010.12.008 [104] Zanin A C, Tvrzská de Gouvêa M, Odloak D. Integrating real-time optimization into the model predictive controller of the FCC system. Control Engineering Practice, 2002, 10(8): 819-831 doi: 10.1016/S0967-0661(02)00033-3 [105] Adetola V, Guay M. Integration of real-time optimization and model predictive control. Journal of Process Control, 2010, 20(2): 125-133 doi: 10.1016/j.jprocont.2009.09.001 [106] Alvarez L A, Odloak D. Robust integration of real time optimization with linear model predictive control. Computers & Chemical Engineering, 2010, 34(12): 1937-1944 doi: 10.1016-j.compchemeng.2010.06.017/ [107] Helbig A, Abel O, Marquardt W. Structural concepts for optimization based control of transient processes. In: Nonlinear Model Predictive Control. Progress in Systems and Control Theory. Basel: Birkhäuser Verlag, 2000. 295-311 [108] Morari M, Arkun Y, Stephanopoulos G. Studies in the synthesis of control structures for chemical processes: Part Ⅰ: Formulation of the problem. Process decomposition and the classification of the control tasks. Analysis of the optimizing control structures. AIChE Journal, 1980, 26(2): 220-232 doi: 10.1002/aic.690260205 [109] Pannocchia G, Gabiccini M, Artoni A. Offset-free MPC explained: novelties, subtleties, and applications. IFAC-PapersOnLine, 2015, 48(23): 342-351 doi: 10.1016/j.ifacol.2015.11.304 期刊类型引用(7)
1. 褚菲,王佩,朱安强,张海军. 面向过程控制的煤泥浮选机理建模与仿真研究. 控制工程. 2024(12): 2129-2139+2166 . 百度学术
2. 赵建国,杨春雨. 复杂工业过程非串级双速率组合分散运行优化控制. 自动化学报. 2023(01): 172-184 . 本站查看
3. 姜艺,范家璐,柴天佑. 数据驱动的保证收敛速率最优输出调节. 自动化学报. 2022(04): 980-991 . 本站查看
4. 庞文砚,范家璐,姜艺,LEWIS Frank Leroy. 基于强化学习的部分线性离散时间系统的最优输出调节. 自动化学报. 2022(09): 2242-2253 . 本站查看
5. 牛桂强. 絮凝剂制备系统在某金矿尾矿浓缩的应用. 铜业工程. 2022(04): 37-40 . 百度学术
6. 李臻,范家璐,姜艺,柴天佑. 一种基于Off-Policy的无模型输出数据反馈H_∞控制方法. 自动化学报. 2021(09): 2182-2193 . 本站查看
7. 盘城. 基于数据驱动的智能个性化排版系统设计. 自动化与仪器仪表. 2020(12): 66-69+74 . 百度学术
其他类型引用(11)
-