-
摘要: 一直以来, 各种推荐系统关注于如何挖掘用户与物品特征间的潜在关联, 特征信息的充分利用有利于用户到物品的精准匹配. 基于矩阵分解和分解机的推荐算法是该领域的主流, 前者学习用户历史行为而后者分析对象特征关系, 但都难以兼顾用户行为与个体特征. 而近年来, 深度神经网络凭借其强大的特征学习能力和灵活可变的结构被应用到了推荐系统领域. 鉴于此, 本文提出了一种基于注意力机制的协同卷积动态推荐网络(Attentionbased collaborative convolutional dynamic network, ACCDN), 它通过注意力机制实现用户历史行为、用户画像与物品属性的多重交互, 再通过卷积网络逐层捕捉更高阶的特征交互. 网络同时接受不同组块输出的低阶至高阶信息, 最后给出用户对指定物品青睐评分概率的预估. 而且本文还提出了一种基于无参时间衰减的用户兴趣标签来量化用户关注的变化. 通过比较若干先进模型在两个现实数据集的表现, 本文设计的动态推荐模型不但能够缓解推荐时滞性, 还能明显提高推荐质量, 为用户带来更好的个性化服务体验.Abstract: A variety of recommender systems focus on connecting users′ and item′s features, and the full use of the potential information presented by features contributes to the accurate user-item matching. Recommendation algorithms based on matrix factorization and factorization machine have risen to the backbone in this field, with the former learning the users′ behavior in history and the latter analyzing the individual features, but neither of them are taken into account by algorithms. Recently, deep neural networks are widely applied to recommendation because of their powerful representation learning and flexible structures. Thus, this paper proposes a novel attention-based collaborative convolutional dynamic network (ACCDN) for recommendation, which realizes the multiple interactions of the user behavior, user profiles and item attributes through attention mechanism and models higher-order interactions by convolution layers. And it absorbs all the low-to-high-order interaction features to predict the user preferable rating probability given an item. In addition, this paper puts forward the unique user interest label based on non-parametric time decay, as an auxiliary tool, to quantify the change of user focus. We conduct extensive experiments on two real-world datasets, which justifies that our proposed ACCDN not only alleviates the recommendation lag, but also improves the quality of recommendation significantly, bringing a better personalized service experience.
-
大惯量伺服系统广泛应用于机器人、风力发电以及深空探测等领域. 这类系统的特点是由电机通过联结轴和齿轮箱连接负载, 通常可以简化为双惯量伺服系统[1-4]. 在这类系统中, 往往存在外部扰动等因素, 降低了双惯量伺服系统的控制精度. 为提高其控制精度, 文献[5]采用传统的比例−积分−微分(Proportional-integral-differential, PID) 方法抑制双惯量伺服系统存在的外部扰动, 但由于存在非线性动态, PID控制方法不能满足对高精度控制的要求. 随着控制理论与技术的发展, 各种先进的控制策略也应用于控制双惯量伺服系统. 例如, 自适应控制[6-7]、Backstepping控制[8-9] 以及滑模控制[10]等. 另外, 随着智能控制的发展, 函数逼近器 (神经网络[11-13] 或模糊逻辑[14-15])也应用于估计系统中的未知非线性动态, 并将其估计值融入到控制器设计中对其补偿, 从而提高系统的控制精度. 虽然上述方法能够提高控制精度, 但未考虑系统的瞬态响应 (如超调量、收敛速度等).
众所周知, 瞬态响应是双惯量伺服控制系统一个重要的性能指标, 对控制系统的安全性和可靠性至关重要. 传统的非线性控制方法很难对瞬态响应进行预先设计. 为克服该问题, 文献[16]提出了一种新型的预设性能控制器设计方法, 其主要特点是通过引入误差转换函数将原始系统的跟踪误差转换为一个等价的误差变量, 并据此设计控制器, 从而保证原始系统的跟踪误差保持在预先设定的边界之内. 受该思想的启发, 基于预设性能的控制方法在多种控制系统中得到应用[17-20]. 另一方面, BLF (Barrier Lyapunov function)[21] 作为一种约束控制技术同样用于提高系统的跟踪控制性能. 该方法的主要特点是利用BLF保证系统的输出信号在给定的约束之内, 故其在一些实际系统得到成功应用, 如: 起重机系统[22]、多输入输出系统[23]以及切换系统[24] 等. 虽然预设性能控制在伺服系统得到一些应用[25-26], 但已有的研究成果主要是利用扰动观测器或者函数逼近器对系统的扰动或不确定性进行估计和补偿, 从而增加了控制器的计算复杂度, 不利于在实际中应用. 因此, 研究不依赖于函数逼近器的双惯量伺服系统的控制器设计并确保预设瞬态响应性能是本文的主要动机.
本文研究含外部扰动的双惯量伺服系统预设性能状态反馈控制. 首先提出一种改进的带有最大超调量、收敛速率和稳态收敛误差边界的预设性能函数(Prescribed performance functions, PPF), 进一步提升传统预设性能函数的收敛速度. 其次将该预设性能函数用于控制器设计中, 设计了一种类比例控制结构的状态反馈控制器. 与传统的Backstepping方法相比较, 该方法结构简单、避免了虚拟控制的高阶导数计算, 从而消除了复杂性爆炸的问题. 此外, 在反馈控制器设计中避免使用函数逼近方法, 从而降低了控制系统计算复杂度. 实验结果也验证了本文提出控制算法的有效性.
本文主要创新点总结为:
1) 设计了一种改进的带有快速收敛率的预设性能函数, 并将该函数用于控制器设计以提高双惯量伺服控制系统的瞬态性响应和稳态性能;
2) 基于预设性能函数设计了一种类比例的伺服控制器, 避免了传统反演控制中对函数估计器的适应及复杂性爆炸问题, 降低了控制系统实现的复杂度.
本文结构安排如下: 第1节给出相关的引理; 第2节描述了双惯量伺服系统的模型和改进预设性能函数设计; 第3节给出了控制器设计步骤和收敛性证明; 第4节通过实验验证了所提出方法的有效性; 最后对全文进行了总结和展望.
1. 预备知识
考虑以下初始值问题[27]
$$ \dot{\mu}(t) = \psi(t,\mu),\; \; \mu(0) = \mu^{0}\in\Omega_{\mu} $$ (1) 其中,
$\psi: {\bf{R}}_{+} \times \Omega_{\mu} \rightarrow {\bf{R}}^{n}$ 为连续函数,$\Omega_{\mu}\subset {\bf{R}}^{n}$ 表示非空集合.引理 1[27]. 对系统(1), 若函数
$ \psi(t,\mu) $ 满足以下条件: 1) 对于时间$ t>0 $ ,$ \psi(t,\mu) $ 对$ \mu $ 是局部Lipschitz; 2) 对每一固定的$ \mu(t)\in\Omega_{\mu} $ ,$ \psi(t,\mu) $ 在时间$ t $ 上是分段连续的; 3) 对每一固定$ \mu(t)\in\Omega_{\mu} $ ,$ \psi(t,\mu) $ 在时间$ t $ 上是局部可积的, 则在区间$[0,\rho_{\max})$ ($\rho_{\max} > 0$ ) 存在解$ \mu(t) $ , 使得$ \mu(t)\in\Omega_{\mu} $ 成立.命题 1[27]. 对任意紧集
$\bar{\Omega}_{\mu} \subset \Omega_{\mu}$ , 在区间$[0,\rho_{\max})$ $(\rho_{\max} < \infty)$ 存在一个最大解$ \mu(t) $ , 则存在一个时间$t_{1}\in[0,\rho_{\max})$ , 使得$ \mu(t_1)\notin \bar{\Omega}_{\mu} $ .2. 系统建模及预设性能函数设计
2.1 双惯量伺服系统模型
本文考虑的典型伺服传动系统(如图1所示) 主要由一个驱动电机通过传动轴和柔性的负载机连接而成. 该系统可以简化为双惯性系统, 其中, 第1个惯量表示电机, 第2个惯量代表负载. 此外, 阻尼系数
$ c_{f} $ 通常忽略, 且摩擦、齿隙等本文暂时不予考虑.根据以上所述, 该双惯量伺服系统数学模型可表示为
$$ {\left\{ {\begin{aligned} &{{{\dot \theta }_m} = {\omega _m}}\\ &{{J_m}{{\dot \omega }_m} = {T_m} - {T_s} + {d_m}}\\ &{{{\dot \theta }_l} = {\omega _l}}\\ &{{J_l}{{\dot \omega }_l} = {T_s} - {T_l} + {d_l}}\\ &{{T_s} = {k_f}({\theta _m} - {\theta _l})} \end{aligned}} \right.} $$ (2) 其中,
$ \theta_{m} $ 和$ \theta_{l} $ 分别表示电机和负载的角位置,$ \omega_{m} $ 和$ \omega_{l} $ 分别表示角速度,$ T_{m} $ 表示电机力矩,$ T_{s} $ 表示轴(扭转)扭矩,$ T_{l} $ 表示负载扰动力矩,$ k_{f} $ 表示联轴器的弹性系数,$ J_{m} $ 和$ J_{l} $ 分别表示电机惯量和负载惯量,$ d_{m} $ 和$ d_l $ 表示电机端和负载端的量测噪声及未建模动态.为了方便控制器设计, 选择状态变量
$ x_1 = \theta_l $ ,$ x_2 = \dot{\theta}_l $ ,$ x_3 = \theta_m $ , 和$ x_4 = \dot{\theta}_m $ . 因此, 系统状态方程可写为$$ \begin{array}{*{20}{c}} {\left\{ {\begin{aligned} &{{{\dot x}_1} = {x_2}}\\ &{{{\dot x}_2} = \frac{{{k_f}}}{{{J_l}}}({x_3} - {x_1} - {T_l}) + {d_1}}\\ &{{{\dot x}_3} = {x_4}}\\ &{{{\dot x}_4} = \frac{1}{{{J_m}}}u - \frac{{{k_f}}}{{{J_m}}}({x_3} - {x_1}) + {d_2}} \end{aligned}} \right.} \end{array}$$ (3) 其中,
$ u = T_m $ 为控制变量,$ d_1 = d_{l}/J_{l} $ 及$d_2 = d_{m}/ J_{m}$ 为集总干扰.假设 1[28]. 系统负载端扰动
$ T_{l} $ 是有界的.假设 2[28]. 集总干扰满足
$ |d_{i}|< \bar{d}_{i},\; i = 1,2 $ , 其中,$ \bar{d}_{i}>0 $ 为常数.在实际双惯量伺服系统实际运行中, 上述假设条件(外部扰动及未建模动态有界)一般可得到满足, 因此其已广泛用于伺服控制器设计中. 此外, 针对上述伺服系统控制设计, 一般需采用函数逼近器(神经网络或模糊逻辑)估计未知动态和未知干扰. 但函数逼近器会增加控制系统计算复杂度, 且控制系统的瞬态性能难以定量分析. 因此, 本文将研究不依赖于函数逼近器的预设性能控制器设计, 确保双惯量伺服系统的控制性能.
2.2 预设性能函数
为定量研究伺服控制系统的瞬态响应, 定义预设性能函数[16]为
$$ \varphi(t) = (\varphi_{0}-\varphi_{\infty}){\rm{e}}^{-a t}+\varphi_{\infty} $$ (4) 其满足
$$ 0< \varphi_{\infty}<\varphi_0,\; \; a >0 $$ (5) 其中,
$ \varphi_{0} $ ,$ \varphi_{\infty} $ 和$ a $ 是大于零的常数.根据文献[16], 为定量研究控制系统瞬态性能, 需让跟踪误差
$ e(t) = x_1-x_d $ $ (x_d $ 表示参考轨迹) 满足以下条件:$$ -\underline{\delta}\varphi(t)<e(t)<\bar{\delta}\varphi(t) $$ (6) 其中,
$ \underline{\delta} $ 和$ \bar{\delta} $ 是设计参数.为确保式(3)的误差约束边界, 引入一个误差转换函数
$ \Lambda(z) $ , 该函数具有以下性质:1)
$\lim \nolimits_{z\rightarrow -\infty} \Lambda (z) = -\underline{\delta}$ ,$ \lim \nolimits_{z\rightarrow \infty} \Lambda (z) = \bar{\delta} $ ;2)
$ -\underline{\delta}< \Lambda(z)< \bar{\delta},\; \; \; \forall z \in L_{\infty} $ .根据以上函数性质, 式(6)可以写为
$$ e(t) = \varphi(t)\Lambda(z) $$ (7) 进而可得函数
$ \Lambda(z) $ 的反函数$$ z(t) = \Lambda^{-1}\bigg[\frac{e(t)}{\varphi(t)}\bigg] $$ (8) 本文中, 函数
$ \Lambda(z) $ 可选为$$ \Lambda(z) = \frac{\delta {\rm{e}}^{z(t)}-\delta {\rm{e}}^{-z(t)}}{{\rm{e}}^{z(t)}+{\rm{e}}^{-z(t)}} $$ (9) 根据式(9), 可得到转换误差为
$$ z(t) = \frac{1}{2} \ln \frac{\mu(t)+\underline{\delta}}{\bar{\delta}-\mu(t)} $$ (10) 其中,
$ \mu(t) = e(t)/\varphi(t) $ 为中间误差变量.由式(10)可知, 对于有界误差初始值
$ e(0) $ , 可选择合适的参数$ a $ ,$ \varphi_0 $ ,$ \varphi_\infty $ , 使其满足不等式$ -\underline{\delta}\varphi(0)<e(0)<\bar{\delta}\varphi(0) $ . 故若能设计控制器使得$ z(t) $ 有界, 则不等式$ -\underline{\delta}< \Lambda(z)< \bar{\delta} $ 成立, 进而使得预设控制系统性能(6)得到满足. 上述预设性能函数(4)中误差收敛方式为指数方式, 虽然可通过增大收敛参数$ a $ 获得更好的收敛性能, 但较大的参数$ a $ 会引起转换误差$ z $ 过大, 可能造成基于变量$ z $ 的控制器输出幅值过大, 故本文将给出改进的预设瞬态性能函数, 实现更快的收敛速度.2.3 改进预设性能函数
通过以上分析可知, 跟踪误差
$ e(t) $ 下的边界和收敛速度主要受到预设性能函数$ \varphi(t) $ 的影响且满足$$ |e(t)|< \delta \varphi(t) $$ (11) 其中,
$ \delta = \max\{\underline{\delta},\bar{\delta}\} $ .为进一步提高收敛速度, 本文提出一种改进的预设性能函数, 定义为
$$ \varphi(t) = \varphi_{0}{\rm{e}}^{-a t}+\frac{t}{a(t+1)}\varphi_{\infty} $$ (12) 从式(12)可知, 改进的预设性能函数同样满足性质1和性质2, 但可获得更快的收敛速度. 图2给出了与传统的预设性能函数[16]的仿真比较, 从图2中可以看出, 对于相同的参数
$ \underline{\delta} $ ,$ \bar{\delta} $ 和$ a $ , 改进的预设性能函数(12)具有更快的收敛速度.3. 控制器设计与稳定性分析
针对含外部扰动的双惯量伺服系统, 本文提出不依赖于函数逼近器的反馈控制器设计方法, 其闭环控制结构如图3所示.
3.1 状态反馈控制器设计
针对双惯量伺服系统(3), 借助于递归设计方法构造类比例状态反馈控制器设计, 具体的设计步骤如下:
步骤 1. 定义跟踪误差
$ e_1 = x_1-x_d $ , 根据式(9), 得转换误差为$$ z_1(t) = \Lambda^{-1}(\mu_{1}(t)) $$ (13) 其中,
$ \mu_{1}(t) = e_{1}(t)/\varphi_{1}(t) $ , 性能函数$ \varphi_{1}(t) $ 为$$ \varphi_{1}(t) = \varphi_{10}{\rm{e}}^{-a_{1} t}+\frac{t}{a_{1}(t+1)}\varphi_{1\infty} $$ (14) 其中,
$ \varphi_{10} $ ,$ \varphi_{1\infty} $ 和$ a_{1} $ 为正常数, 且$ e_{1}(0) $ 满足$ |e_{1}(0)|< \min\{\underline{\delta},\bar{\delta}\}\varphi_{10} $ . 定义第1个虚拟控制为$$ \vartheta_{1} = -k_1z_1 = -\frac{k_1}{2}\ln\bigg(\frac{\underline{\delta}+\mu_{1}}{\bar{\delta}-\mu_1}\bigg) $$ (15) 其中,
$ k_1>0 $ 是控制增益常数.步骤 2. 定义中间控制误差为
$$ e_{2} = x_2-\vartheta_1 $$ (16) 转换误差为
$$ z_{2}(t) = \Lambda^{-1}(\mu_{2}(t)) $$ (17) 其中,
$ \mu_{2}(t) = e_{2}(t)/\varphi_{2}(t) $ . 定义$ \varphi_{2}(t) $ 为$$ \varphi_{2}(t) = \varphi_{20}{\rm{e}}^{-a_{2} t}+\frac{t}{a_{2}(t+1)}\varphi_{2\infty} $$ (18) 其中,
$ \varphi_{20} $ ,$ \varphi_{2\infty} $ 以及$ a_{2} $ 是大于零的常数, 并且跟踪误差$ e_{2}(0) $ 满足$ |e_{2}(0)|< \min\{\underline{\delta},\bar{\delta}\}\varphi_{20} $ . 因此, 第2个虚拟控制量为$$ \vartheta_{2} = -k_{2}z_2 = -\frac{k_2}{2}\ln\bigg(\frac{\underline{\delta}+\mu_{2}}{\bar{\delta}-\mu_{2}}\bigg) $$ (19) 其中,
$ k_2>0 $ 为控制增益常数.步骤 3. 定义第3个误差变量为
$$ e_3 = x_3-\vartheta_{2} $$ (20) 根据式(9), 转换误差为
$$ z_{3} = \Lambda^{-1}(\mu_{3}(t)) $$ (21) 其中,
$ \mu_{3}(t) = e_{3}(t)/\varphi_{3}(t) $ . 定义变量$ \varphi_{3}(t) $ 为$$ \varphi_{3}(t) = \varphi_{30}{\rm{e}}^{-a_{3} t}+\frac{t}{a_{3}(t+1)}\varphi_{3\infty} $$ (22) 其中,
$ \varphi_{30} $ ,$ \varphi_{3\infty} $ 以及$ a_{3} $ 是大于零的常数且误差$ e_{3}(0) $ 满足$ |e_{3}(0)|< \min\{\underline{\delta},\bar{\delta}\}\varphi_{30} $ . 第3个虚拟控制量为$$ \vartheta_{3} = -k_3z_{3} = -\frac{k_3}{2}\ln\bigg(\frac{\underline{\delta}+\mu_{3}}{\bar{\delta}-\mu_{3}}\bigg) $$ (23) 其中,
$ k_3>0 $ 是控制增益常数.步骤 4. 计算实际控制器
$ u $ . 定义误差为$$ e_4 = x_4-\vartheta_{3} $$ (24) 转换误差为
$$ z_4 = \Lambda^{-1}(\mu_{4}(t)) $$ (25) 其中,
$ \mu_{4}(t) = e_4(t)/\varphi_{4}(t) $ , 且$ \varphi_{4}(t) $ 定义为$$ \varphi_{4}(t) = \varphi_{40}{\rm{e}}^{-a_{4} t}+\frac{t}{a_{4}(t+1)}\varphi_{4\infty} $$ (26) 其中,
$ \varphi_{40} $ ,$ \varphi_{4\infty} $ 和$ a_{4} $ 为大于零的常数, 且误差$ e_{4}(0) $ 满足$ |e_{4}(0)|< \min\{\underline{\delta},\bar{\delta}\}\varphi_{40} $ . 因此, 实际控制器$ u $ 为$$ u = -k_4z_4 = -\frac{k_4}{2}\ln\bigg(\frac{\underline{\delta}+\mu_{4}}{\bar{\delta}-\mu_{4}}\bigg) $$ (27) 其中,
$ k_4>0 $ 是控制增益常数.与传统的Backstepping方法相比较, 本文提出的反馈控制方法不需要双惯量伺服系统中未知动态的先验知识, 同时无需及时虚拟控制量的导数, 故消除了复杂性爆炸问题. 除此之外, 在控制器设计中避免了函数近似, 便于在实际系统中的应用.
3.2 稳定性分析
本节利用李雅普诺夫方法分析闭环系统的稳定性和控制误差收敛性. 首先给出引理2.
引理 2. 考虑跟踪误差
$ e_1 $ 以及中间控制误差$ e_{i}, i = 2,3,4 $ , 若转换误差$ z_{i} $ 有界$(|z_{i}|\leq e_{Mi},\;\;e_{Mi}>0) $ , 则可得$-\underline{\delta}\varphi_{i}(t) < e_{i}(t)<\bar{\delta}\varphi_{i}(t),\forall t > 0$ .证明. 根据误差转换函数(8), 可得
$$ {\rm{e}}^{2z_{i}} = \frac{\underline{\delta}+\mu_{i}}{\bar{\delta}-\mu_{i}} $$ (28) 则下列不等式成立
$$ -\underline{\delta}<\frac{{\rm{e}}^{-2e_{Mi}}\bar{\delta}-\underline{\delta}}{{\rm{e}}^{-2e_{Mi}}+1}\leq z_{i}(t)\leq\frac{{\rm{e}}^{2e_{Mi}}\bar{\delta}-\underline{\delta}}{{\rm{e}}^{2e_{Mi}}+1}<\bar{\delta} $$ (29) 根据
$ \mu_{i} = e_{i}(t)/\varphi_{i}(t) $ 的定义, 则$$ -\underline{\delta}\varphi_{i}(t)<e_{i}(t)<\bar{\delta}\varphi_{i}(t) $$ (30) 成立.
□ 定理 1. 考虑双惯量伺服系统(2), 设计带有预设性能函数的中间控制量(15), (19), (23) 以及实际控制器(24). 如果控制误差
$ e_{i} $ 满足初始条件$ |e_{i}(0)|<\min\{\underline{\delta},\bar{\delta}\}\varphi_{i0} $ , 则控制系统所有的信号有界, 且跟踪误差$ e_{1} $ 能够保持在预先设定的边界(4)之内.证明. 由规范化误差
$ \mu_{i}(t) = e_{i}(t)/\varphi_{i}(t) $ 定义可知:$$ \left\{\begin{aligned} &x_1 = \varphi_1\mu_1+x_d,\; \; x_2 = \varphi_2\mu_2+\vartheta_1\\ &x_3 = \varphi_3\mu_3+\vartheta_2,\; \; x_4 = \varphi_4\mu_4+\vartheta_3 \end{aligned} \right. $$ (31) 对
$\mu_{i},i = 1,\cdots,4$ 求导, 可得:$$ \begin{split} \dot{\mu}_1 =\;& \frac{1}{\varphi_1}\big[(\dot{x}_1-\dot{x}_d)-\mu_{1}\dot{\varphi}_1\big] = \frac{1}{\varphi_1}\big[\varphi_2\mu_2+\\ &\vartheta_1-\dot{x}_d-\mu_{1}\dot{\varphi}_1\big] = \psi_{1}(t,\mu_1,\mu_2) \end{split} $$ (32) $$ \begin{split} \dot{\mu}_2 =\;& \frac{1}{\varphi_2}\big[(\dot{x}_2-\dot{\vartheta}_1)-\mu_{2}\dot{\varphi}_2\big]=\\ & \frac{1}{\varphi_2}\bigg[\frac{k_f}{J_l}(\varphi_3\mu_3+\vartheta_2-x_1-T_{l}+d_1)-\dot{\vartheta}_1-\\ &\mu_{2}\dot{\varphi}_2\bigg]= \psi_{2}(t,\mu_2,\mu_3) \end{split} $$ (33) $$ \begin{split} \dot{\mu}_3 =\;&\frac{1}{\varphi_3}\big[\dot{x}_3-\dot{\vartheta}_2-\mu_{3}\dot{\varphi}_2\big] = \frac{1}{\varphi_3}\big[\varphi_4\mu_4+\\ &\vartheta_3-\dot{\vartheta}_2-\mu_{3}\dot{\varphi}_3\big] = \psi_3(t,\mu_3,\mu_4) \end{split} $$ (34) $$ \begin{split} \dot{\mu}_4 =\;& \frac{1}{\varphi_4}\big[\dot{x}_4-\dot{\vartheta}_3-\mu_{4}\dot{\varphi}_3\big]=\\ &\frac{1}{\varphi_4}\bigg[\frac{1}{J_m}u-\frac{k_f}{J_m}(x_3-x_1)+d_2\;-\\ &\dot{\vartheta}_3-\mu_{4}\dot{\varphi}_3\bigg] = \psi_4(t,\mu_3,\mu_4) \end{split} $$ (35) 定义向量
$\mu = [\psi_1,\psi_2,\psi_3,\psi_4]^{{\rm{T}}}$ , 则上述方程可写为$$ \dot{\mu} = \psi(t,\mu) = \left[ \begin{array}{c} \psi_{1}(t,\mu_1,\mu_2) \\ \psi_{2}(t,\mu_2,\mu_3) \\ \psi_{3}(t,\mu_3,\mu_4) \\ \psi_{4}(t,\mu_3,\mu_4) \\ \end{array} \right] $$ (36) 定理1的证明主要分为两步: 首先, 证明在集合
$ \Omega_{\mu} $ 存在唯一的最大解; 其次, 证明闭环系统所有的信号在时间$t\in [0,\rho_{\max})$ 是有界的, 并且该结果对$\rho_{\max} = +\infty$ 成立.步骤 1. 选择预设性能函数
$\varphi_{i},\; i = 1,\cdots,4$ , 使其满足$ \varphi_{i}(0)>\min\{\underline{\delta},\bar{\delta}\}|e_{i}(0)| $ , 故函数$ \mu(t) $ 的初始值满足$ |\mu_{i}(0)|<\min\{\underline{\delta},\bar{\delta}\} $ 使得$ \mu_{i}(0)\in\Omega_{\mu} $ . 此外, 函数$ \psi_{i}(t) $ 在时间$ t $ 上有界且分段连续. 由于参考信号$ x_d $ , 性能函数$ \varphi_{i} $ 有界且连续可微, 以及实际控制器$ u $ 和中间控制器$ \vartheta_{i} $ 在集合$ \Omega_{\mu} $ 光滑, 所以函数$ \mu $ 在集合$ \Omega_{\mu} $ 是局部Lipschitz. 因此, 定理1的条件成立, 故在区间$ [0,\rho_{\max}) $ 存在着式(34)一个最大解$ \mu: [0, \rho_{\max})\rightarrow \Omega_{\mu} $ .步骤 2. 为证明闭环系统在时间
$ t\in [0,\rho_{\max}) $ 有界, 对$ z_{1} $ 求导并应用方程$ x_{1} = \varphi_2\mu_2+\vartheta_1 $ 可得$$ \begin{split} \dot{z}_1 =\;& \frac{\partial \Lambda^{-1}}{\partial\mu_1}\dot{\mu}_1 = \rho_1(\dot{x}_1-\dot{x}_d-\mu_1\dot{\varphi}_1)=\\ \;& \rho_1(\varphi_2\mu_2+\vartheta_1-\dot{x}_d-\mu_1\dot{\varphi}_1) \end{split} $$ (37) 其中,
$ \rho_1 = 1/(2\varphi_1)[1/(\mu_1+\underline{\delta})-1/(\mu_1-\bar{\delta})] $ 是大于零的变量, 并且满足$ 0<\rho_1 \leq \rho_{M1} $ .类似于式(37), 可以得到
$$ \begin{split} \dot{z}_2 =\;& \frac{\partial \Lambda^{-1}}{\partial\mu_2}\dot{\mu}_2 = \rho_2\big[\dot{x}_2-\dot{\vartheta}_1-\mu_{2}\dot{\varphi}_2\big]=\\ \;& \rho_2\bigg[\frac{k_f}{J_l}(\varphi_3\mu_3+\vartheta_2-x_1-T_{l}+d_1)-\dot{\vartheta}_1-\mu_{2}\dot{\varphi}_2\bigg] \end{split} $$ (38) $$ \begin{split} \dot{z}_3 =\;& \frac{\partial \Lambda^{-1}}{\partial\mu_3}\dot{\mu}_3 = \rho_3\big[\dot{x}_3-\dot{\vartheta}_2-\mu_{3}\dot{\varphi}_2\big]=\\ \;& \rho_3\big[\varphi_4\mu_4+\vartheta_3-\dot{\vartheta}_2-\mu_{3}\dot{\varphi}_3\big] \end{split} $$ (39) $$ \begin{split} \dot{z}_4 =\;&\frac{\partial \Lambda^{-1}}{\partial\mu_3}\dot{\mu}_3 = \rho_4\big[\dot{x}_4-\dot{\vartheta}_3-\mu_{4}\dot{\varphi}_3\big]=\\ \;&\rho_4\bigg[\frac{1}{J_m}u-\frac{k_f}{J_m}(x_3-x_1)+d_2-\dot{\vartheta}_3-\mu_{4}\dot{\varphi}_3\bigg]\\[-15pt] \end{split} $$ (40) 其中,
$ \rho_i = 1/(2\varphi_i)[1/(\mu_i+\underline{\delta})-1/(\mu_i-\bar{\delta})] $ 是大于零的变量, 且满足$ 0<\rho_{i}\leq \rho_{Mi},i = 2,3,4 $ .1) 选择李雅普诺夫函数
$$ V_1 = 0.5z_{1}^{2} $$ (41) 对其求导, 得
$$ \dot{V}_1 = z_1\dot{z}_1 = z_1\rho_1(\mu_2\varphi_2-\dot{x}_d-\mu_1\dot{\varphi}_1-k_1z_1) $$ (42) 由于
$ \dot{\varphi}_1 $ 和$ \varphi_2 $ 是有界的并且$ \mu_{i}(t) $ 满足$|\mu_{i}(t)| < \min\{\underline{\delta},\bar{\delta}\}$ . 根据极值定理, 可知对于$ t_{1}\in[0,\rho_{\max}) $ , 使得$$ |\mu_2\varphi_2-\dot{x}_d-\mu_1\dot{\varphi}_1| \leq \varpi_{1} $$ (43) 其中,
$ \varpi_1 $ 是大于零的常数. 故有$$ \dot{V}_1\leq |z_1|\rho_{M1}(\varpi_1-\kappa_{1}|z_1|) $$ (44) 从式(42)可以看出, 对于任意
$ |z_1|>\varpi_1/\kappa_1 $ , 李雅普诺夫函数$ \dot{V}_1 $ 是非正的. 根据李雅普诺夫稳定性理论可知,$ z_1 $ 收敛到一个紧集$\Psi_1 = \{z_{1}||z_1|\leq z_{M1}\}$ 内,$ \forall t \in [0,\rho_{\max}) $ , 其中$z_{M1} = \max\{|z_1(0)|, \varpi_{1}/\kappa_{1}\}$ . 因此, 控制信号$ \vartheta_1 $ 和$ {z}_1 $ 是有界的. 由引理2可知, 跟踪误差$ e_1 $ 在预设的边界(6)之内.2) 选择李雅普诺夫函数
$$ V_2 = 0.5z_{2}^{2} $$ (45) 对其进行求导, 得
$$ \begin{split} \dot{V}_2 =\;& z_2\rho_2\bigg[\frac{k_f}{J_l}(\varphi_3\mu_3-x_1-T_{l}+d_1)-\\ &\frac{k_f k_2}{J_l}z_{2}-\dot{\vartheta}_1-\mu_{2}\dot{\varphi}_2\bigg]\leq\\ &|z_2|\rho_{M2}\bigg[\varpi_2-\frac{k_2k_{f}}{J_{l}}|z_2|+\frac{k_{f}}{J_l}\bar{d}_{1}\bigg]\\[-15pt] \end{split} $$ (46) 其中, 在
$ t \in [0,\rho_{\max}) $ 中由极值定理可知, 存在大于零的常数$ \varpi_{2} $ , 使得$|k_{f}(\varphi_3\mu_3-x_1-T_{l})/J_{l}- \dot{\vartheta}_1- \mu_{2}\dot{\varphi}_2|\leq \varpi_{2}$ 成立. 由于$ |z_{2}(t)|<\min\{\underline{\delta},\bar{\delta}\} $ , 以及$ \mu_2 $ ,$ \dot{\mu}_2 $ ,$ \mu_1 $ ,$ \dot{\vartheta}_1 $ 是有界的. 因此,$ z_2 $ 收敛到紧集$\Psi_2 = \{z_2||z_2|\leq \;z_{M2}\}$ 内, 其中,$z_{M2}\; =\; \max\{|z_{2}\;(0)|,\;(\varpi_2\;+\; k_f \bar d_{1})/ (k_2k_f)\}$ . 所以, 虚拟控制器$ \vartheta_2 $ 及其微分$ \dot{\vartheta}_2 $ 有界, 因而$ e_2 $ 保持在预设的边界(6)之内.3) 类似于以上步骤, 选择李雅普诺夫函数
$V_3 = 0.5 z_{3}^2$ , 并对其求导, 得$$ \begin{split} \dot{V}_3 =\;& z_3\rho_3\big[\mu_4\varphi_4-k_3z_3-\dot{\vartheta}_2-\mu_{3}\dot{\varphi}_3\big]\leq \\ &|z_3|\rho_{M3}(\varpi_3-k_3|z_3|) \end{split} $$ (47) 其中,
$\varpi_3$ 是大于零的常数, 代表未知动态的上界, 即对于$ t \in [0,\rho_{\max}) $ , 由极值定理有$|\mu_4\varphi_4- \dot{\vartheta}_2 - \mu_{3}\dot{\varphi}_3| \leq \varpi_3$ 成立. 由于$|z_3(t)| < \min\{\underline{\delta},\bar{\delta}\}$ ,$ \mu_3 $ ,$ \dot{\mu}_3 $ ,$ \mu_2 $ 和$ \dot{\vartheta}_2 $ 有界, 故$ z_3 $ 将收敛到集合$\Psi_{3} = \{z_3||z_3|\leq z_{M3}\}$ 内且$ z_{M3} = \{z_{3}(0)|,\varpi_3/k_3\} $ . 所以, 中间控制信号$ \vartheta_3 $ 以及它的微分$ \dot{\vartheta}_3 $ 是有界的. 根据引理 2, 中间误差$ e_3 $ 保持在预设的边界(6)之内.4) 定义
$V_4 =0.5z_{4}^{2}$ , 并对其求导$$ \begin{split} \dot{V}_4 =\;& z_4\rho_4\bigg[\frac{1}{J_m}u - \frac{k_f}{J_m}(x_3 - x_1)) + d_2-\dot{\vartheta}_3-\mu_{4}\dot{\varphi}_3\bigg] \leq\\ &|z_4|\rho_{M4}\Bigg[\frac{\varpi_4-k_fk_4z_4}{J_{m}}+\frac{k_fd_{m}}{J_m}\Bigg]\\[-10pt] \end{split} $$ (48) 其中,
$\varpi_4$ 是大于零的常数, 代表未知动态的上界, 即对于$ t\in[0,\rho_{\max}) $ , 由极值定理可知$|-k_{f}(x_3- x_1)/J_m-\dot{\vartheta}_3-\mu_4\dot{\vartheta}_3|\leq\varpi_3$ . 由于$ \mu_{4} $ ,$ \dot{\mu}_4 $ ,$ \mu_3 $ ,$ \dot{\vartheta}_3 $ 有界, 可以得到$ z_4 $ 收敛到集合$\Psi_4 = \{z_4||z_4|\leq z_{M4}\}$ ($ z_{M4} = \max\{|z_4(0)|,(\varpi_4+k_f \bar d_2)/(k_fk_4)\} $ )内. 所以, 实际控制律$ u $ 以及控制误差$ e_4 $ 在区间$t \in [0,\rho_{\max})$ 上是有界的.步骤 3. 接下来证明上述结论对
$ \rho_{\max} = \infty $ 成立. 由式(28)可知,$ z(t)\in\bar{\Omega}_{u} $ ,$ \forall t \in [0,\rho_{\max}) $ , 其中集合$ \bar{\Omega} = [\underline{\delta},\bar{\delta}]\times[\underline{\delta},\bar{\delta}]\times[\underline{\delta},\bar{\delta}]\times[\underline{\delta},\bar{\delta}] $ 是非空紧集. 由此可以得到$ \bar{\Omega}_{\mu}\subset\Omega_{\mu} $ . 假设$ \rho_{\max}< +\infty $ , 根据命题1知, 存在一个时间常数$ t^{'}\in[0,\rho_{\max}) $ , 使得$ z(t^{'})\not \in \bar{\Omega}_{\mu} $ . 这与前述结论互相矛盾. 故可得$ \rho_{\max} = \infty $ 成立.□ 注 1. 本文提出的控制器参数主要分为两组: 一组是预设性能函数参数
$ \underline{\delta} $ ,$ \bar{\delta} $ ,$ a $ ,$ \varphi_{0} $ ,$ \varphi_{\infty} $ ; 另一组是控制增益参数$k_{i},\; i = 1,\cdots,4$ . 在实际的工程应用中, 可选择合适的参数$ \underline{\delta}_{i} $ ,$ \bar{\delta}_{i} $ ,$ \varphi_{i}(0) $ , 使其满足初始条件$ -\underline{\delta}_{i}(0)\varphi_{i}(0)<e_{i}(0)<\bar{\delta}_{i}(0)\varphi_{i}(0) $ . 其中, 稳态误差边界$ \varphi_{i\infty} $ 在开始阶段可设置较大数值并在调节过程中逐渐减小. 此外, 如果控制器增益$ k_i $ 选择偏大则会导致控制量振动, 故需综合考虑控制性能和控制变量幅值.4. 实验验证
4.1 实验装置
为验证本文所提的控制方法, 本节开展实验研究. 实验采用的双惯量伺服系统实验平台如图4所示, 该系统为四电机驱动伺服系统, 由4个松下交流电机作为驱动电机, 其脉宽调制放大器集成在驱动板卡(Panasonic MCDDT3520)中, 采用米格永磁同步电机(180ST-M35105)作为负载, 其编码器分辨率为 360 度/64000 转; 4个数字信号处理板卡用于实现电机与上位机的通信, 上位机为Pentium 3.0 GHz 的 PC 机, 采用C++ 语言在 CCS 5.0 环境下实现软件开发. 上位机通过编码器和传感器的采样信号, 实时采集电机和负载的位置和速度, 并提供相应的控制命令实现电机的在线控制. 在控制器实现中, 采样时间为
$ {t_s} = 0.001\;{\rm{s}} $ . 系统模型的参数如表1所示.表 1 系统参数Table 1 System parameters参数 数值 单位 电机惯量${J_m}$ 0.026 $ {\rm{kg \cdot {m^2}}}$ 负载惯量${J_l}$ 0.0113 ${\rm{kg \cdot {m^2}}}$ 弹性系数${K_l}$ 56 ${\rm{Nm/rad}}$ 4.2 实验结果
首先分别采用变化缓慢的正弦信号
$x_d = 3\times \sin(2\pi t/ 8)$ 和变化快速的正弦信号$x_d = 8\sin(2\pi t/4)$ 作为跟踪参考信号. 实验结果如图5和图6所示. 图5描述了变化缓慢期望轨迹下的双惯量伺服系统的位置跟踪和跟踪误差, 图6给出了快速时变期望轨迹的位置跟踪和跟踪误差. 从图5可以看出, 期望信号变化缓慢的情况下, 本文提出的控制方法能够使得系统输出跟踪上期望轨迹且产生的跟踪较小. 同样地, 从图6中可以发现, 在快速变化的期望轨迹下, 本文提出的控制算法也能够实现精确的位置跟踪. 从上述实验结果可以发现, 本文提出的控制策略在正弦轨迹跟踪控制下能够抑制双惯量伺服系统的扰动, 并能够保证双惯量伺服系统的跟踪性能.为了更好地验证本文方法的良好性能, 采用以下3种方法作为比较: 1)本文方法. 选择预设性能函数参数
$ \varphi_{0i} = 0.6 $ ,$ \varphi_{\infty i} = 0.1 $ 以及$ a_{i} = 1.5 $ ; 控制器参数设置为$ k_1 = 3 $ ,$ k_2 = 6 $ ,$ k_3 = 7 $ ,$ k_4 = 2 $ . 2) 动态面控制. 动态面控制器参数如文献[29]所示. 3) 自适应神经网络控制. 自适应神经网络控制器参数如文献[30]所示. 对比实验结果如图7所示.此外, 本文采用以下3种性能指标来定量比较3种控制方法的跟踪性能: 1) 跟踪误差的最大绝对值:
$M_{e} = \max \nolimits_{i = 1,\cdots,N}\{|e_{1}(i)|\}$ ; 2) 跟踪误差平均值:$\mu_{e} = ({1}/{N})\sum_{i = 1}^{N}|e_1(i)|$ ; 3) 跟踪误差的标准差:$\sigma_{e} = \sqrt{({1}/{N})\sum_{i = 1}^{N}[|e_1(i)|-\mu_{e}]^{2}}$ . 以上性能指标如表2所示.表 2 性能指标Table 2 Performance indexes方法 $M_{e}$ $\mu_{e}$ $\sigma_{e}$ 本文方法 0.1587 0.0413 0.00004 动态面方法 0.3104 0.1171 0.00009 自适应神经控制 0.3081 0.0757 0.00007 从实验结果(图7和表2)可以看出, 与另外两种控制方法(自适应神经控制与动态面控制) 相比较, 本文提出的控制方法能够达到满意的控制性能, 并且跟踪误差能够保持在预先设定的边界之内. 通过比较本文方法与自适应神经控制方法可以发现, 本文采用预设性能函数方法可以有效地抑制双惯量伺服系统存在的扰动, 提高系统的瞬态性能与稳态性能; 而对比动态面控制方法, 本文方法的跟踪性能优于动态面控制方法, 且由于在控制器设计中避免了一阶滤波运算, 从而减少了计算复杂度. 此外, 从表2中可以发现, 本文提出的控制方法由于采用预设性能函数可以提高控制性能, 产生了较小的
$ M_{e} $ ,$ \mu_{e} $ 和$ \sigma_{e} $ . 而对比动态面方法和自适应神经网络方法可知, 自适应神经网络控制器的性能指标(如$ M_{e} $ ,$ \sigma_{e} $ )小于动态面控制方法.最后, 为了验证所提出方法对双惯量伺服系统的实用性, 还采用阶跃信号
$ x_d = 10 \; {\rm{rad}}$ 作为参考信号. 预设性能函数参数为$ \varphi_{i0} = 1.2 $ ,$ \varphi_{i\infty} = 0.1 $ ,$ a_i = 1.2 $ . 其他的控制参数与正弦参考信号相同. 图8描述了3种控制方法的位置跟踪和跟踪误差. 从图8中可以发现, 与另外两种方法相比较, 本文提出的控制方法的上升时间更快, 没有产生超调, 并能够快速地到达稳态. 而动态面方法产生了较大的超调且跟踪误差较大, 自适应控制的到达稳态时间最长.从以上实验结果可以看出, 本文提出的预设性能控制方法可以提高双惯量伺服系统的瞬态响应与稳态性能. 此外, 与另外两种控制方法相比较, 本文提出的控制方法避免使用函数逼近器, 在有效地抑制双惯量伺服系统存在的外部扰动影响的同时, 降低了计算复杂度.
5. 总结与展望
本文提出了一种不依赖于函数逼近器的类比例预设性能状态反馈控制方法, 通过定义预设性能函数对双惯量伺服系统的瞬态响应和稳态性能进行预先设计. 在此基础上, 借助于递归策略设计了状态反馈控制器, 避免了由函数逼近器带来的计算复杂性问题, 同时消除了传统的Backstepping方法存在的复杂性爆炸问题. 实验结果表明, 相比于其他自适应控制策略, 本文提出的方法能够提高双惯量伺服系统的瞬态性能和稳态性能, 并且结构简单, 利于在实际中应用. 后续将针对多电机驱动的二惯量系统, 研究伺服系统的结构参数与控制器一体化设计方法.
-
表 1 数据集概述表
Table 1 Statistics of the evaluation datasets
数据集 用户 物品 字段 样本 稀疏度 MovieLens-1M 6040 3883 5 1000 K 95.74% Niconico 20566 13195 7 1045 K 99.62% 表 2 超参对 ACCDN Top -30 推荐效果的影响 (Niconico数据集)
Table 2 ACCDN′s hyper-parameters′ infulence on the Top-30 recommendation for Niconico
固定参数 调节参数 预测准确率 (%) HR@30 NDCG@30 K=16,
T=32L=1 71.85 0.1659 0.0685 L=2 82.54 0.2545 0.0872 L=3 88.67 0.3001 0.0971 L=3,
T=32K=8 84.91 0.2683 0.0905 K=16 88.67 0.3001 0.0971 K= 24 89.02 0.3089 0.0972 L=3,
K=16T=8 80.22 0.2244 0.0868 T=16 84.58 0.2696 0.0919 T=32 88.67 0.3001 0.0971 表 3 推荐列表评析结果
Table 3 The evaluation results of recommendation lists between baselines and ACCDN
HR MovieLens-1 M Niconico HR@5 HR@10 HR@20 HR@30 HR@5 HR@10 HR@20 HR@30 CFN 0.0395 0.0788 0.1480 0.1923 0.0358 0.0676 0.1205 0.1747 FM 0.0498 0.0953 0.1899 0.2785 0.0471 0.0902 0.1659 0.2580 DeepFM 0.0577 0.1168 0.2101 0.3043 0.0543 0.1013 0.1928 0.2773 NCF 0.0543 0.1175 0.2081 0.2976 0.0485 0.0964 0.1799 0.2618 xDeepFM 0.0584 0.1250 0.2113 0.3109 0.0594 0.1032 0.2038 0.2843 CFM 0.0612 0.1233 0.2198 0.3177 0.0589 0.1054 0.2077 0.2917 ACCDN 0.0593 0.1237 0.2254 0.3253 0.0590 0.1069 0.2136 0.3001 NDCG MovieLens-1 MM Niconico NG@5 NG@10 NG@20 NG@30 NG@5 NG@10 NG@20 NG@30 CFN 0.0326 0.0475 0.0610 0.0738 0.0308 0.0425 0.0535 0.0694 FM 0.0382 0.0504 0.0658 0.0790 0.0339 0.0492 0.0617 0.0760 DeepFM 0.0415 0.0549 0.0720 0.0853 0.0403 0.0544 0.0689 0.0832 NCF 0.0444 0.0612 0.0779 0.0901 0.0420 0.0535 0.0712 0.0859 xDeepFM 0.0493 0.0684 0.0852 0.0940 0.0448 0.0565 0.0723 0.0901 CFM 0.0470 0.0649 0.0815 0.0921 0.0487 0.0566 0.0728 0.0914 ACCDN 0.0524 0.0697 0.0862 0.1027 0.0463 0.0583 0.0750 0.0971 注: ACCDN(--h) 表示本文模型在注意力机制模块不加人用户行为值进行交互. 表 4 Top-5动态推荐对比示例
Table 4 The examples of the dynamic Top-5 recommendation
用户1 喜欢类型 1) 动作 2) 冒险 3) 超凡 4) 运动 原Top-5推荐 xDeepFM 1. Tengen Toppa Gurren Lagann 动作/冒险/机甲 2. Mononoke Hime 动作/冒险/魔幻 3.Fate/Zero2 动作/超凡/魔幻
4. Fullmetal Alchemis 动作/冒险/魔幻 5. Hunter x Hunter 动作/冒险/超凡CFM 1. One Piece 动作/冒险/超凡/喜剧 2.Fate/Zero2 动作/超凡/魔幻 3. JoJo no Kimyou na Bouken 动作/超凡/冒险/青春
4. Kizumonogatari II 动作/悬疑/超凡 5. Hellsing Ultimate 动作/惊悚/超凡本文模型 1. Hunter x Hunter 动作/冒险/超凡 2. JoJo no Kimyou na Bouken 动作/超凡/冒险/青春 3. Fate/Zero 动作/超凡/魔幻
4. Fate/Zero2 动作/超凡/魔幻 5. One Piece 动作/冒险/超凡/喜剧增加三次用户行为: 1. Tonari no Totoro 动作/喜剧/超凡 2. Kuroko no Basket 校园/运动/青春 3. Redline 动作/赛车/科幻/运动 新Top-5推荐 xDeepFM 无变化 CFM 无变化 本文模型 1. JoJo no Kimyou na Bouken 动作/超凡/冒险/青春 2. One Piece 动作/冒险/超凡/喜剧 3. Fate/Zero 动作/超凡/魔幻
4. Fairy Tail 动作/冒险/喜剧/青春 5. Hunter x Hunter 动作/冒险/超凡用户2 喜欢类型 1) 惊悚 2) 超凡 3) 动作 原Top-5推荐 xDeepFM 1. Hellsing Ultimate 动作/惊悚/超凡 2. Akira 冒险/惊悚/超凡/科幻 3. Paprika 魔幻/惊悚/神秘
4. Vampire Hunter D 动作/魔幻/惊悚 5. Another 惊悚/恐怖/超凡CFM 1. Hellsing Ultimate 动作/惊悚/超凡 2. Ajin Part 1: Shoudou 动作/惊悚/神秘 3. Ajin 动作/惊悚/神秘
4. Change!! Getter Robo 动作/冒险/惊悚/科幻 5. Memories 惊悚/科幻本文模型 1. Higurashi no Naku Koro ni 惊悚/神秘/恐怖 2.Tokyo Ghoul 惊悚/超凡/动作/青春 3. Change!! Getter Robo 动作/冒险/
惊悚/科幻 4. Jigoku Shoujo 惊悚/神秘/超凡 5. Gakkou no Kaidan 惊悚/超凡增加三次用户行为: 1. Ano Natsu de Matteru 喜剧/生活 2. Ling Qi 动作/喜剧/超凡 3. One Piece 动作/冒险/超凡/喜剧 新Top-5推荐 xDeepFM 无变化 CFM 无变化 本文模型 1.Tokyo Ghoul 惊悚/超凡/动作/青春 2. Change!! Getter Robo 动作/冒险/惊悚/科幻 3. One Piece 动作/冒险/超凡/喜剧
4. Sankarea 喜剧/超凡/生活 5. Kemonozume 动作/惊悚/超凡 -
[1] Adomavicius G, Tuzhilin A. Toward the next generation of recommender systems: a survey of the state-of-the-art and possible extensions. IEEE Transactions on Knowledge and Data Engineering, 2015, 17(6): 734-749. [2] Zhang S, Yao L, Sun A, Tay Y. Deep learning based recommender system: A survey and new perspectives. ACM Computing Surveys, 2017. [3] Rendle S. Factorization machines. In: Proceedings of the IEEE International Conference on Data Mining. Sydney, Australia: IEEE, 2011. 995−1000 [4] Blondel M, Fujino A, Ueda N, Ishihata M. Higher-order factorization machines. In: Proceedings of Advances in Neural Information Processing Systems. New York, USA: Curran Associates Inc, 2016. 3359−3367 [5] Koren Y. Factorization meets the neighborhood: A multifaceted collaborative fifiltering model. In: Proceedings of 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Las Vegas Nevada, USA: SIGKDD, 2008. 426-434 [6] Koren Y, Bell R, Volinsky C. Matrix factorization techniques for recommender systems. Computer, 2009, 42(8): 30-37. doi: 10.1109/MC.2009.263 [7] Bharat K, Kamba T, Albers M. Personalized, interactive news on the Web. Multimedia Systems, 1998, 6(5): 349-358. doi: 10.1007/s005300050098 [8] Herlocker J L, Konstan J A, Borchers A, Riedl J. An algorithmic framework for performing collaborative filtering. In: Proceedings of the 22nd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York, USA: ACM, 1999. 230−237 [9] Salakhutdinov R, Mnih A. Probabilistic matrix factorization. In: Proceedings of Advances in Neural Information Processing Systems. New York, USA: NIPS, 2008. 1257–1264 [10] Lee J, Kim S, Lebanon G, Singer Y. Local low-rank matrix: approximation. In: Proceedings of 30th International Conference on Machine Learning. Atlanta, USA: ICML, 2013. 741−749 [11] Sedhain S, Menon A K, Sanner S, Xie L. Autorec: autoencoders meet collaborative filtering. In: Proceedings of the 24th International Conference on World Wide Web. Florence, Italy: WWW, 2015. 111−112 [12] Strub F, Mary J. Collaborative filtering with stacked denoising autoencoders and sparse inputs. NIPS Workshop, 2015. [13] Wu Y, DuBois C, Zheng A X, Ester M. Collaborative denoising auto-encoders for top-n recommender systems. In: Proceedings of the 9th ACM International Conference on Web Search and Data Mining. San Francisco, USA: WSDM, 2016. 153−162 [14] Salakhutdinov R, Mnih A, Hinton G. Restricted Boltzmann machines for collaborativeffltering. In: Proceedings of 24th International Conference on Machine Learning. Corvallis, USA: ICML, 2007. 791−798 [15] Jia X, Li X, Li K, Gopalakrishnan V, et al. Collaborative restricted Boltzmann machine for social event recommendation. In: Proceedings of International Conference on Advances in Social Networks Analysis and Mining. San Francisco, USA: IEEE, 2016. 402−405 [16] 李金忠, 刘关俊, 闫春钢, 蒋昌俊. 排序学习研究进展与展望. 自动化学报, 2018, 44(8): 1345-1369.Li Jin-Zhong, Liu Guan-Jun, Yan Chun-Gang, Jiang Chang-Jun. Research advances and prospects of learning to rank. Acta Automatica Sinica, 2018, 44(8): 1345-1369. [17] Strub F, Gaudel R, Mary J. Hybrid recommender system based on autoencoders. In: Proceedings of the 1st Workshop on Deep Learning for Recommender Systems. Boston, USA: ICPS, 2016. 11−16 [18] Dong X, Yu L, Wu Z, et al. A hybrid Collaborative filtering model with deep structure for recommender systems. In: Proceeding of 31st AAAI Conference on Artificial Intelligence. San Francisco, USA: AAAI, 2017. 1309−1315 [19] Liang D, Krishnan R G, Hoffman M D, Jebara T. Variational autoencoders for collaborative filtering. In: Proceedings of the 2018 Web Conference. Lyon, France: IEEE, 2018. [20] He X, Liao L, Zhang H, Nie L, Hu X, Chua T. Neural collaborative filtering. In: Proceedings of the 26th International Conference on World Wide Web. Perth, Australia: ACM, 2017. 173−182 [21] Cheng H T, Koc L, Harmsen J, et al. Wide & deep learning for recommender systems. In: Proceedings of the 1st Workshop on the Deep Learning for Recommender Systems. Boston, USA: ICPS, 2016. 7−10 [22] Guo H, Tang R, Ye Y, Li Z, He X. A factorization-machine based neural network for CTR prediction. arXiv preprint, arXiv: 1703.04247, 2017. [23] Lian J, Zhou X, Zhang F, Chen Z, Xie X, Sun G. xDeepFM: Combining explicit and implicit feature interactions for recommender systems. In: Proceedings of 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. London, UK: SIGKDD, 2018. [24] Zheng L, Noroozi V, Yu P S. Joint deep modeling of users and items using reviews for recommendation. In: Proceedings of the 10th ACM International Conference on Web Search and Data Mining. Cambridge, UK: ACM WSDM, 2017. 425−434 [25] Kim D, Park C, Oh J, Lee S, Yu H. Convolutional matrix factorization for document context-aware recommendation. In: Proceedings of the 10th ACM Conference on Recommender Systems. Boston, USA: RecSys, 2016. 233−240 [26] Covington P, Adams J, Sargin E. Deep neural networks for YouTube recommendations. In: Proceedings of the 10th ACM Conference on Recommender Systems. Boston, USA: RecSys, 2016. 191−198 [27] Soh H, Sanner S, White M, Jamieson G. Deep sequential recommendation for personalized adaptive user interfaces. In: Proceedings of the 22nd International Conference on Intelligent User Interfaces. Limassol, Cyprus: ACM, 2017. 589–593 [28] Suglia A, Greco C, Musto C, Gemmis M, Lops P, Semeraro G. A deep architecture for content-based recommendations exploiting recurrent neural networks. In: Proceedings of the 25th Conference on User Modeling Adaptation and Personalization. Bratislava, Slovakia: UMAP, 2017. 202−211 [29] Li Z, Zhao H, Liu Q, Huang Z, Mei T, Chen E. Learning from history and present: Next-item recommendation via discriminatively exploiting user behaviors. arXiv, preprint, arXiv: 1808.01075, 2018. [30] Xin X, Chen B, He X, Wang D, Ding Y, Jose H M. CFM: Convolutional factorization machines for context-aware recommendation. In: Proceedings of the International Joint Conference on Artificial Intelligence. Macao, China: IJCAI, 2019. 3926−3932 [31] Jiang J, Yang D, Xiao Y, Shen C. Convolutional Gaussian embeddings for personalized recommendation with uncertainty. In: Proceedings of the International Joint Conference on Artificial Intelligence. Macao, China: IJCAI, 2019. 2642−2648 [32] Christakopoulou E, Karypis G. Local latent space models for top-n recommendation. In: Proceedings of 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. London, UK: SIGKDD, 2018. 1235−1243 [33] Zhou X, Liu D, Lian J, Xie X. Collaborative metric learning with memory network for multi-relational recommender systems. In: Proceedings of the International Joint Conference on Artificial Intelligence. Macao, China: IJCAI, 2019. [34] Chae D, Kang J, Kim S, Lee J. CFGAN: A generic collaborative filtering framework based on generative adversarial networks. In: Proceedings of the 27th ACM International Conference on Information and Knowledge Management. Torino, Italy: CIKM, 2018. 137−146 [35] 李慧, 马小平, 施珺, 李存华, 仲兆满, 蔡虹. 复杂网络环境下基于信任传递的推荐模型研究. 自动化学报, 2018, 44(2): 363-376.Li Hui, Ma Xiao-Ping, Shi Jun, Li Cun-Hua, Zhong Zhao-Man, Cai Hong. A recommendation model by means of trust transition in complex network environment. ACTA AUTOMATICA SINICA, 2018, 44(2): 363-376. [36] Chen J, Zhang H, He X, Nie L, Liu W, Chua T. Attentive collaborative filtering: Multimedia recommendation with item- and component-level attention. In: Proceedings of the 40th International ACM SIGIR Conference. Tokyo, Japan: SIGIR, 2017. 335−344 [37] 冯永, 陈以刚, 强保华. 融合社交因素和评论文本卷积网络模型的汽车推荐研究. 自动化学报, 2019, 45(3): 518-529.Feng Yong, Chen Yi-Gang, Qiang Bao-Hua. Social and comment text CNN model based automobile recommendation. ACTA AUTOMATICA SINICA, 2019, 45(3): 518-529. [38] Xu Z, Chen C, Lukasiewicz O, Miao Y, Meng X. Tag-aware personalized recommendation using a deep-semantic similarity model with negative sampling. In: Proceedings of the 25th ACM International Conference on Information and Knowledge Management. Indianapolis, USA: CIKM, 2016. 1921–1924 [39] Rawat Y S, Kankanhalli M S. ConTagNet: Exploiting user context for image tag recommendation. In: Proceedings of the 2016 ACM on Multimedia Conference. Amsterdam, Netherland: ACM, 2016. 1102−1106 [40] Luong M, Pham H, Manning C D. Effective approaches to attention-based neural machine translation. arXiv preprint, arXiv: 1508.04025v5, 2015. [41] Vaswani A, Shazeer N, Parmar N, et al. Attention Is All You Need. arXiv preprint, arXiv: 1706.03762v5, 2017. [42] Jarvelin K, Kekalainen J. Cumulated gain-based evaluation of IR techniques. ACM Transactions on Information Systems, 2002, 20(4): 422-446. doi: 10.1145/582415.582418 期刊类型引用(0)
其他类型引用(2)
-