2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于多维时态关联规则的演化模糊推理预测算法

王玲 孟建瑶 李俊飞 彭开香

裴惠琴, 陈世明, 赖强, 陈谦. 异质相依群体系统的协同一致性追踪. 自动化学报, 2018, 44(8): 1528-1536. doi: 10.16383/j.aas.2017.c160852
引用本文: 王玲, 孟建瑶, 李俊飞, 彭开香. 基于多维时态关联规则的演化模糊推理预测算法. 自动化学报, 2018, 44(8): 1446-1459. doi: 10.16383/j.aas.2018.c170222
PEI Hui-Qin, CHEN Shi-Ming, LAI Qiang, CHEN Qian. Cooperative Consensus Tracking of Heterogeneous Interdependent Group Systems. ACTA AUTOMATICA SINICA, 2018, 44(8): 1528-1536. doi: 10.16383/j.aas.2017.c160852
Citation: WANG Ling, MENG Jian-Yao, LI Jun-Fei, PENG Kai-Xiang. An Evolving Fuzzy Inference Algorithm With Multi-dimensional Temporal Association Rules. ACTA AUTOMATICA SINICA, 2018, 44(8): 1446-1459. doi: 10.16383/j.aas.2018.c170222

基于多维时态关联规则的演化模糊推理预测算法

doi: 10.16383/j.aas.2018.c170222
基金项目: 

国家自然基科学金 61572073

详细信息
    作者简介:

    孟建瑶  北京科技大学自动化学院硕士研究生.主要研究方向为数据挖掘和机器学习.E-mail:18810481455@163.com

    李俊飞  北京科技大学自动化学院硕士研究生.主要研究方向为数据挖掘和机器学习.E-mail:hpuljfei@163.com

    彭开香  北京科技大学自动化学院教授.主要研究方向为复杂工业系统的故障诊断与一体化控制.E-mail:kaixiang@ustb.edu.cn

    通讯作者:

    王玲  北京科技大学自动化学院副教授.主要研究方向为数据挖掘, 机器学习与复杂系统建模.本文通信作者.E-mail:lingwang@ustb.edu.cn

An Evolving Fuzzy Inference Algorithm With Multi-dimensional Temporal Association Rules

Funds: 

National Natural Science Foundation of China 61572073

More Information
    Author Bio:

     Master student at the School of Automation and Electrical Engineering, University of Science and Technology Beijing. Her research interest covers data mining and machine learning

     Master student at the School of Automation and Electrical Engineering, University of Science and Technology Beijing. His research interest covers data mining and machine learning

     Professor at the School of Automation and Electrical Engineering, University of Science and Technology Beijing. His research interest covers fault diagnosis and integrated control for complex industrial system

    Corresponding author: WANG Ling  Associate professor at the School of Automation and Electrical Engineering, University of Science and Technology Beijing. Her research interest covers data mining, machine learning, and complex system modeling. Corresponding author of this paper
  • 摘要: 挖掘时态关联规则的目的是为了发现带有时态信息的项集之间有趣的关系.由于数据库经常动态更新,时态关联规则的挖掘也应该适应数据库的更新.然而,现有的大多数算法不仅需要重新挖掘更新的数据库,浪费了大量的时间和效率,而且不能利用已存在的规则定量地预测某些项的变化趋势.本文提出了一个基于多维时态关联规则的演化模糊推理预测建模算法(Evolving fuzzy inference model based on multidimensional temporal association rules,EFI-MTAR),主要优势是构建了一种基于多维时态关联规则的模糊推理建模算法(Fuzzy inference modeling algorithm based on multidimensional temporal association rules,FI-MTAR),实现了对时间序列的定量预测.此外,为了降低规则更新的代价和加快规则预测的速度,提出了概念漂移检测策略来处理时间序列数据以适应数据库的动态更新.实验结果表明了本文提出算法的有效性和准确性.
  • 多维实时序列数据是现实世界中一种普遍存在且具有重要意义的数据类型, 例如工业现场的监控数据、互联网节点的通信流量数据、气象数据、医疗监测数据以及语音视频数据等.这些数据通常以时间点或时间区间的形式存在, 且呈现出多属性、非平稳、动态性以及信息的非线性等特征, 因此, 如何有效地从这些海量实时序列数据中挖掘有用的知识, 并进行实时预测已经成为各个领域的研究热点.

    近年来, 时间序列定量预测技术已经开展了许多方法的研究, 例如文献[1-2]通过组合模型的方式来预测时间序列.文献[3]采用时间搜索模型将连续时间序列数据转换为离散空间来挖掘股票数据中的频繁模式, 在此基础上对股票价格进行短期趋势预测.文献[4]通过应用多元自适应回归曲线和逐步回归建立基于指标选择的时间序列模型.此外, 还通过支持向量回归(Support vector regression, SVR)建立预测模型, 并采用遗传算法(Genetic algorithm, GA)进行优化.文献[5]针对时序动态关联规则挖掘中, 支持度向量在时间特性上不宜观察其整体变化趋势与预测问题, 提出将小波变换应用到动态关联规则挖掘中, 并建立自回归模型预测整体趋势变化.但这些方法主要还是将时间序列数据作为一个整体来分析和构建全局模型.

    值得注意的是, 能够观察到的多维实时序列数据往往仅是系统的部分演化数据, 无法通过历史数据建立一个全局模型覆盖整个数据空间.为了及时有效地分析多维实时序列数据, 往往更为合理的方式是对时间序列的局部可用数据进行在线分析, 而不是全局序列数据.关联规则挖掘[6]可以发现存在于数据中属性之间有趣的关联关系, 以语言和规则相结合的产物呈现最终的挖掘结果, 更易于操作人员的理解和管理者的决策支持.考虑到时间序列的特性, 衍生出了时态关联规则挖掘方法[7-12], 实际是加了时间约束的关联规则, 目的是找出时态事务集中同一维属性与时间之间的关联, 以及基于时域的不同维属性之间的关系等, 更好地挖掘隐藏在数据中的与时间关联的知识.因此, 我们的重点是发现多维实时序列数据中的局部模式, 当某一属性发生变化后或导致多个属性紧接着发生变化, 它们之间可能是按时间的顺序关系或因果关系.针对多维实时序列数据的时态关联规则挖掘吸引了一些学者进行研究.文献[13]提出了基于两个项的时态关系来挖掘时态关联规则, 但在挖掘的过程中对参数的依赖性较强, 且并不适合获取多个项之间的时态关系.文献[14]基于密度的子空间聚类将集群定义为存在于多维数据集的子空间中的高密度区域, 提出一种将多元时间序列转换为符号序列的算法, 能够捕获时间序列变量组之间的相互依赖性和共同变化的顺序模式.文献[15]提出一种新型的多属性时间序列模式, 通过修剪单时间序列中的冗余模式以及避免过度计数的关联, 捕获时间序列变量组之间的相互依赖和共同变化的顺序模式.文献[16]为了避免一段时间出现的频繁项目对结果的影响, 将时间转化为粒度, 并考虑不同级别粒度的时态数据挖掘, 设计了一个三阶段的挖掘框架.

    虽然这种时态关联规则已经保留了多维时间序列隐含的过程变化信息, 定性地描述了多维时间序列数据间的时态关系, 但这种知识并没有提供定量预测多维时间序列的未来运动趋势的能力.通过重构时态关联规则的前件和后件, 并借鉴模糊Takagi-Sugeno (T-S)模型的规则形式构造局部模型可以估计多维时间序列的未来值.此外, 上述方法主要针对离线数据进行挖掘, 但时态数据库通常会动态更新, 时态关联规则挖掘要与数据的变化保持同步, 避免对数据集中所有的数据重新进行挖掘而增加计算复杂度.因此, 本文提出了基于多维时态关联规则的演化模糊推理算法, 主要包含初始时态关联规则挖掘、基于多维时态关联规则的模糊推理预测、概念漂移检测与系统演化更新三个部分: 1)采集部分时间序列数据集完成时态关联规则的初始化挖掘; 2)借鉴区间TS模糊推理方法重构时态关联规则, 利用优化算法辨识规则后件参数, 进而实现对时态数据的模糊推理预测; 3)随着时间序列流数据不断添加到数据库, 需要增量地挖掘时态关联规则.为了适应时间序列数据发生概念的漂移, 利用滑动窗技术划分时间序列数据.若当前滑动窗中的数据发生概念漂移, 则认为已有规则库中的时态关联规则已不再适用当前窗口中的数据, 需要对当前窗口中的数据重新进行时态关联规则的挖掘, 并将所得规则按时间顺序存储到规则库中; 若当前滑动窗中的数据没有发生概念漂移, 则需对时态关联规则对应的数据点进行更新, 继续等待下一个时间序列滑动窗口的到来, 直到时间序列数据采集结束.

    目前, 针对时态关联规则提出了很多研究方法, 通常我们处理的时间序列对象是数值属性, 离散化后的项所处的时间区间往往不同, 因此, 发现不同时间序列对象不同时间区间的多维数值时态关联规则更加符合现实, 对时态数据的变化趋势具有一定的预测作用.本文感兴趣的是发现多维时间序列的片段模式之间的先后关联性, 因此必须找到这些片段模式.我们采用了一种基于多维时间序列形态特征的相似性的动态聚类算法[17]提取时间序列的片段模式, 基本思想是通过时间序列降维压缩获取时间序列片段, 根据这些时间序列片段的形态特征进行相似性度量, 进而通过动态聚类的方法发现片段模式.本文以时间区间中的多元时间序列数据集$S$ $=$ $\{ {{s_1}, {s_2}, \cdots , {s_i}, \cdots , {s_m}} \}$ $(1 \le i \le m)$为例展开说明, 其中, $m$表示时间序列属性个数.令${\tilde s_i} =\{ {I_{i1}}$, ${I_{i2}}$, $\cdots , {I_{ij}}, \cdots , {I_{i{q_i}}}\}$表示时间序列${s_i}$的模式序列项集, ${I_{ij}}$对应片段模式的第$j$个离散化项, ${q_i}$为时间序列${s_i}$的片段模式的个数.

    本文的多维时态关联规则的挖掘与其他关联规则一样, 就是寻找满足某种时态约束的频繁发生的模式序列.考虑树结构在规则挖掘中无需产生候选项集等优势, 采用一种基于频繁项集树的时态关联规则挖掘算法[18], 构建树结构与频繁项集挖掘同时进行, 只需要扫描时态数据库一次, 以时间区间为单位表示数据的有效时间区间, 能够有效地计算频繁项集的时态置信度, 提高了规则挖掘效率.整个算法的核心仍然是寻找频集, 基本思想是: 1)在多元时间序列数据集降维离散化的基础上, 将所得离散时态事务集转换为布尔离散时态矩阵; 2)根据布尔离散时态矩阵及向量运算得到时态频繁1-项集和频繁2-项集; 3)由所得时态频繁项集(考虑了项集之间的时态关系)构建初始频繁项集树, 包含任意两个频繁1-项集间的关联关系, 用于频繁$k$ $(k \ge3)$-项集的生成; 4)由初始频繁项集树得到完整频繁项集树; 5)遍历所得完整频繁项集树, 得到所有时态频繁项集; 6)由所得频繁项集生成强时态关联规则.

    时态关联规则挖掘的最终目是通过所得时态关联规则反映数据集中隐藏的时态关联信息, 用于新数据的分类预测等应用.但目前时态关联规则的形式为

    $ \begin{align} Rule_{[{T_1}, {T_2}]}^k:&\ {{\rm }}(I_{1{j_1}}^k, [T_b^n, T_e^n]) \cap \cdots \cap\nonumber\\ &\ (I_{i{j_i}}^k, [T_b^v, T_e^v]) \; \cap\cdots \cap \nonumber\\ &\ (I_{m{j_m}}^k, [T_b^1, T_e^1]{{\rm )}}\mathop {\longrightarrow }\limits^{[{T_1}, {T_2}]} \nonumber\\ &\ (I_{(m + 1){j_{(m + 1)}}}^k, [T_b^0, T_e^0]) \end{align} $

    (1)

    其中, $[T_b^n, T_e^n] \cup \cdots \cup [T_b^v, T_e^v] \cup \cdots \cup$ $ [T_b^1, T_e^1] \cup [T_b^0, T_e^0] \in [{T_1}, {T_2}]$, 规则的前件中的$(I_{1{j_i}}^k, [T_b^n, T_e^n])$表示第1维时间序列在$t- n$时刻对应的时间区间$[T_b^n, T_e^n]$的第${j_1}$类的模式项集, 规则后件中的$(I_{(m + 1){j_{(m + 1)}}}^k$, $[T_b^0, T_e^0])$表示第$m + 1$维时间序列在当前$t$时刻对应的时间区间$[T_b^0, T_e^0]$的第${j_{({m + 1})}}$类的模式项集.这里的模式项集对应的时间序列片段模式, 只是定性描述了多维时间序列数据之间的时态区间的变化模式, 因此可以认为目前时态关联规则的形式并不适用对新数据进行定量预测, 为了能够定量地刻画未来时间区间内的实时运动轨迹, 需要对时态关联规则的模式项集定量表征.考虑到模糊推理模型在复杂系统预测建模中的优势, 本课题拟借鉴模糊T-S模型的规则形式, 重构模糊推理时态关联规则以实现定量预测.

    在钢铁、冶金、建材、化工等流程工业中存在一类耗能大、排污大和工艺复杂的大型生产设备, 例如炼铁的高炉、炼钢的转炉、球团竖炉、烧结机以及水泥回转窑等.它们工艺流程极其复杂, 描述工况和产品质量的参数繁多、工况的自由度难以确定.由于不确定性的存在, 很难获得精确的输入输出数据, 还没有很好的数据物理方程实现精确描述, 很多情况下, 能够获得的是变量或参数的某一变化范围.因此, 可以采用区间数建立对象的动力学模型.

    近年来, 区间回归[19-20]和区间时间序列预测[21]逐渐成为一个新的研究领域.从本质上看, 现有的区间回归和区间时间序列预测仍是在欧氏空间中建立模型.文献[22-24]提出基于运动模式的建模和控制, 将实际的多维工况模式经主成分分析(Principal component analysis, PCA)压缩至一维后, 研究一维运动模式的建模和控制方法.但实际的工况模式一般都是多维的, 为了更好地描述系统的动力学特性, 需要研究多维运动模式的建模问题.文献[25]以烧结实际生产的数据为例, 利用原始数据构建二维模式运动空间, 然后在模式运动空间中建立二维带输入的区间自回归模型, 描述了烧结终点的动力学特性.文献[26]定义一种多维区间T-S模糊模型, 并以此构建多维运动模式的预测模型, 以烧结生产过程的实际数据为例, 验证了所提出的多维运动模式预测模型的有效性.

    为了便于描述多维时间序列变化趋势的预测模型, 根据片段模式定义了多维时间序列的区间T-S模糊模型.

    定义1. 给定多维区间时间序列$\tilde S(t)$, 其中

    $ \begin{align} \tilde S(t) = \,&\begin{bmatrix} {{{\tilde s}_1}(t)}\\ {{{\tilde s}_2}(t)}\\ \vdots \\ {{{\tilde s}_i}(t)} \\ \vdots \\ {{{\tilde s}_m}(t)} \end{bmatrix} = \begin{bmatrix} {{I_{1{j_1}}}(t)}\\ {{I_{2{j_2}}}(t)}\\ \vdots \\ {{I_{i{j_i}}}(t)}\\ \vdots\\ {{I_{m{j_m}}}(t)} \end{bmatrix} = \nonumber\\[2mm]& \begin{bmatrix} {(y_{c1{j_1}}^{}(t), \Delta {y_{1{j_1}}}(t))}\\ {(y_{c2{j_2}}^{}(t), \Delta {y_{2{j_2}}}(t))}\\ \vdots \\ {(y_{ci{j_i}}^{}(t), \Delta {y_{i{j_i}}}(t))}\\ \vdots \\ {(y_{cm{j_m}}^{}(t), \Delta {y_{m{j_m}}}(t))} \end{bmatrix} \end{align} $

    (2)

    其中, ${I_{i{j_i}}}(t)$为第$i$个时间序列在第$t$个时间区间$[T_b^t, T_e^t]$的第${j_i}$类的模式项集, $y_{ci{j_i}}^{}(t)$和$\Delta {y_{i{j_i}}}(t)$分别为该模式项集对应区间的数值的中心和区间的数值的幅度变化, $y_{i{j_i}}^{}(t) \ge 0$, $\Delta {y_{i{j_i}}}(t) \ge 0$, $i =1$, $2$, $\cdots , m, {j_i} \in \{ {1, 2, \cdots , {q_i}} \}$, 其中${q_i}$为时间序列${s_i}$经过离散化后得到的模式类别的个数, 则多维区间T-S模糊模型的定义为

    $ \begin{align*} {R^k}:&\ {{\bf If}}~~y_{c1{j_1}}^{}(t - 1)~~{\bf is}~~f_{11}^k~~{{\bf and}}\\ &\ y_{c2{j_2}}^{}(t - 1)~~{\bf is}~~f_{21}^k, \cdots , \\ &\ y_{cm{j_m}}^{}(t - 1)~~{\bf is}~~f_{m1}^k, \cdots , \\ &\ y_{c1{j_1}}^{}(t - n)~~{\bf is}~~f_{1n}^k~~{{\bf and}}\\ &\ y_{c2{j_2}}^{}(t - n)~~{\bf is}~~f_{2n}^k, \cdots , \\ &\ y_{cm{j_m}}^{}(t - n)~~{\bf is}~~f_{mn}^k \end{align*} $

    $ \begin{align}&\begin{array}{l} {{\bf Then }}~~\tilde S(t) = \left[ {\begin{array}{*{20}{c}} {\tilde s_1^k(t)}\\ {\tilde s_2^k(t)}\\ {\begin{array}{*{20}{c}} {\begin{array}{*{20}{c}} \vdots \\ {\tilde s_i^k(t)} \end{array}}\\ \vdots \end{array}}\\ {\tilde s_m^k(t)} \end{array}} \right] = \end{array}\nonumber\\ &\qquad \begin{array}{l} \left[ {\begin{array}{*{20}{c}} {(y_{c1{j_1}}^k(t), \Delta y_{1{j_1}}^k(t))}\\ {(y_{c2{j_2}}^k(t), \Delta y_{2{j_2}}^k(t))}\\ {\begin{array}{*{20}{c}} \vdots \\ {(y_{ci{j_i}}^k(t), \Delta y_{i{j_i}}^k(t))}\\ \vdots \end{array}}\\ {(y_{cm{j_n}}^k(t), \Delta y_{m{j_m}}^k(t))} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {\tilde \theta _{10}^k}\\ {\tilde \theta _{20}^k}\\ \vdots \\ {\tilde \theta _{i0}^k}\\ \vdots \\ {\tilde \theta _{m0}^k} \end{array}} \right] + \\ \left[ {\begin{array}{*{20}{c}} {\tilde \theta _{11}^k}&{\tilde \theta _{12}^k}& \cdots &{\tilde \theta _{1i}^k}& \cdots &{\tilde \theta _{1m}^k}\\ {\tilde \theta _{21}^k}&{\tilde \theta _{22}^k}& \cdots &{\tilde \theta _{2i}^k}& \cdots &{\tilde \theta _{2m}^k}\\ {\vdots}&{\vdots}& \ddots &{\vdots}& \ddots &{\vdots}\\ {\tilde \theta _{i1}^k}&{\tilde \theta _{i2}^k}& \cdots &{\tilde \theta _{ii}^k}& \cdots &{\tilde \theta _{mm}^k}\\ {\vdots}&{\vdots}& \ddots &{\vdots}& \ddots &{\vdots}\\ {\tilde \theta _{m1}^k}&{\tilde \theta _{m2}^k}& \cdots &{\tilde \theta _{mi}^k}& \cdots &{\tilde \theta _{mm}^k} \end{array}} \right] \times \\ \left[ {\begin{array}{*{20}{c}} {y_{c1{j_1}}^k(t - 1)}\\ {y_{c2{j_2}}^k(t - 1)}\\ {\begin{array}{*{20}{c}} \vdots \\ {y_{ci{j_i}}^k(t - 1)}\\ \vdots \end{array}}\\ {y_{cm{j_m}}^k(t - 1)} \end{array}} \right] + \cdots + \\ \left[ \begin{array}{*{20}{c}} {\tilde \theta _{1(nn - n + 1)}^k}&{\tilde \theta _{1(nn - n + 2)}^k}\\ {\tilde \theta _{2(nn - n + 1)}^k}&{\tilde \theta _{2(nn - n + 2)}^k}\\ \vdots&\vdots \\ {\tilde \theta _{i(nn - n + 1)}^k}&{\tilde \theta _{i(nn - n + 2)}^k}\\ \vdots&\vdots \\ {\tilde \theta _{m(nn - n + 1)}^k}&{\tilde \theta _{m(nn - n + 2)}^k} \end{array}\begin{array}{*{20}{c}} \cdots &{\tilde \theta _{1(nn)}^k}\\ \cdots&\vdots \\ {}& \vdots \\ \ddots&\vdots \\ {}& \vdots \\ \cdots &{\tilde \theta _{m(nn)}^k} \end{array} \right] \times \\\left[ \begin{array}{*{20}{c}} {y_{c1{j_1}}^k(t - n)}\\ {y_{c2{j_2}}^k(t - n)}\\ {\begin{array}{*{20}{c}} \vdots \\ {y_{ci{j_i}}^k(t - n)}\\ \vdots \end{array}}\\ {y_{cm{j_m}}^k(t - n)} \end{array} \right] \end{array}\end{align} $

    (3)

    其中, $\tilde \theta _{ip}^k$为区间参数, $f_{ig}^k$为模糊集, $i = 1, 2, \cdots $, $m$, $p = 0, 1, \cdots , nn$, $g = 1, 2, \cdots , n$, $k = 1, 2, \cdots $, $l$, $n$为模型的阶次, $l$为模型规则数.

    多维区间T-S模糊模型的最终输出为

    $ \begin{align}\tilde S(t) = \displaystyle\frac{{\sum\limits_{k = 1}^l {{w_k}{{\tilde s}^k}(t)} }}{{\sum\limits_{k = 1}^l {{w_k}} }} \end{align} $

    (4)

    其中,

    $ \begin{align}{w_k} = \prod\limits_{i = 1}^m {\prod\limits_{v = 1}^n {f_{iv}^k(y_{ci{j_i}}^{}(t - v))}} \end{align} $

    (5)

    $f_{iv}^k(y_{ci{j_i}}^{}(t - v))$代表$y_{ci{j_i}}^{}(t - v)$隶属于模糊集$f_{iv}^k$的隶属度.

    目前其他研究者所提算法[19-26]主要是利用区间模糊逻辑获取确定的模糊推理规则用于预测, 而本文所提算法是基于数据挖掘的结果迅速地实现预测.通过在多维时态关联规则挖掘算法中最小支持度和最小置信度的分别设置, 所获得的时态关联规则可以明确地表示数据集中的潜在信息.

    根据式(1)所示的时态关联规则, 当有新的离散时态事务样本$TI{D_{\rm new}}$待预测时, 首先实现规则的匹配, 若满足如下两个条件, 则认为离散时态事务$TI{D_{\rm new}}$与时态关联规则$Rule_{[{T_1}, {T_2}]}^k$相匹配.

    1) $T_b^{{\rm Rule}_{[{T_1}, {T_2}]}^k} \le T_b^{TI{D_{\rm new}}} \le T_e^{TI{D_{\rm new}}} \le T_e^{{\rm Rule}_{[{T_1}, {T_2}]}^k}$, 即离散时态事务在时态关联规则的有效时间内出现.

    2) ${I_{{\rm Rule}_{[{T_1}, {T_2}]}^k}} \subseteq {I_{TI{D_{\rm new}}}}$, 即前后件项集${I_{\rm Rule_{[{T_1}, {T_2}]}^k}}$包含于项集${I_{TI{D_{\rm new}}}}$中.

    对于与规则匹配的新事务, 为了定量地实现对新样本事务输出的精确预测, 重构了基于多维区间时态关联规则的模糊推理预测模型.

    $ \begin{align} {R^k}:&\ {{\bf If}}~~dx_{c1{j_1}}^{}(t - 1)~~{\bf is}~~1~~{\rm{\bf{and}}}\\ &\ dx_{c2{j_2}}^{}(t - 1)~~{\bf is}~~ 1, \cdots , \\ &\ dx_{c(m - 1){j_{(m - 1)}}}^{}(t - 1)~~{\bf is}~~f_{(m - 1)1}^k, \\ &\ dx_{cm{j_m}}^{}(t - 1)~~{\bf is}~~1, \cdots , \\ &\ d{x_{ci{j_i}}}(t - v)~~ {\bf{is}}~~{{1}}~~{\bf{and}}\\ &\ dx_{c2{j_2}}^{}(t - 1)~~{\bf is}~~1, \cdots , \\ &\ d{x_{ci{j_i}}}(t - v)~~ {\bf is}~~f_{iv}^k, \cdots , \\ &\ dx_{cm{j_m}}^{}(t - 1)~~{\bf is}~~1, \cdots , \\ &\ dx_{c1{j_1}}^{}(t - n)~~ {\bf is}~~f_{1n}^k\;{\bf{and}}\\ &\ dx_{c2{j_2}}^{}(t - n)~~{\bf is}~~1, \cdots , \\ &\ dx_{cm{j_m}}^{}(t - n)~~{\bf is}~~1\notag\\ &\ {\rm{\bf Then}}~~dx_{c(m + 1){j_{_{(m + 1)}}}}^k(t) = \tilde \theta _{m0}^k \, +\notag\\ &\ \left[ {\begin{array}{*{20}{c}} {\tilde \theta _{m1}^k}&{\tilde \theta _{m2}^k}& \cdots &{\tilde \theta _{mi}^k}& \cdots &{\tilde \theta _{mm}^k} \end{array}} \right] \times\notag \\ &\ \left[ {\begin{array}{*{20}{c}} {dx_{c1{j_1}}^k(t - 1)}\\ {dx_{c2{j_2}}^k(t - 1)}\\ {\begin{array}{*{20}{c}} \vdots \\ {dx_{ci{j_i}}^k(t - 1)}\\ \vdots \end{array}}\\ {dx_{cm{j_m}}^k(t - 1)} \end{array}} \right] + \cdots + \notag\\[0mm] &\ \left[ {\tilde \theta _{m(nn - n + 1)}^k\;\tilde \theta _{m(nn - n + 2)}^k \cdots \tilde \theta _{m(nn - n + i)}^k \cdots \tilde \theta _{m(nn)}^k} \!\right]\!\times \notag\\[0mm] &\ \left[ {\begin{array}{*{20}{c}} {dx_{c1{j_1}}^k(t - n)}\\ {dx_{c2{j_2}}^k(t - n)}\\ {\begin{array}{*{20}{c}} \vdots \\ {dx_{ci{j_i}}^k(t - n)}\\ \vdots \end{array}}\\ {dx_{cm{j_m}}^k(t - n)} \end{array}} \right] \end{align} $

    (6)

    其中, $\tilde \theta _{mp}^k = (\tilde \theta _{cmp}^k, \tilde \theta _{rmp}^k)$为区间参数, $\tilde \theta _{cmp}^k$和$\tilde \theta _{rmp}^k$分别为区间参数的中心和半径, $p = 0, 1, \cdots , nn$, $k$ $=$ $1, 2, \cdots , l$, $k$为模糊规则数; $[dx_{c1{j_1}}^k(t - v)$ $dx_{c2{j_2}}^k(t$ - $v)$ $ \cdots$ $dx_{ci{j_i}}^k(t - v)$ $\cdots$ $dx_{cm{j_m}}^k(t - v){]^{{\rm T}}}$ $(v=1$, $2, \cdots , n)$为片段模式$[dx_{1{j_1}}^k(t - v)$ $dx_{2{j_2}}^k(t - v)$ $\cdots$ $dx_{i{j_i}}^k(t- v)$ $\cdots $ $dx_{m{j_m}}^k(t - v){]^{{\rm T}}}$的中心值; 如果某片段模式的隶属函数为1, 表明该时刻对应的某类项集在此阶段没有变化; $dx_{c(m + 1){j_{(m + 1)}}}^k(t)$为第$k$条规则中第$m{{\rm + }}1$个时间序列在$t$时刻对应的时间区间$[T_b^0, T_e^0]$内项集${j_{m{{\rm + }}1}}$所对应样本的模糊推理预测模型输出.

    基于多维区间时态关联规则的模糊推理模型的最终输出为

    $ \begin{align}d{x_{c(m + 1){j_{m + 1}}}}(t) = \displaystyle\frac{{\sum\limits_{k = 1}^l {{w_k}dx_{cm{j_m}}^k(t)} }}{{\sum\limits_{k = 1}^l {{w_k}} }}\end{align} $

    (7)

    其中,

    $ \begin{align}{w_k} = \prod\limits_{i = 1}^m {\prod\limits_{v = 1}^n {f_{iv}^k(dx_{ci{j_i}}^{}(t - v))} }\end{align} $

    (8)

    $f_{iv}^k(dx_{ci{j_i}}^{}(t - v))$代表$dx_{ci{j_i}}^{}(t - v)$隶属于模糊集$f_{iv}^k$的隶属度, 这里采用区间隶属函数

    $ \begin{align} f_{iv}^k(dx_{ci{j_i}}^{}(t - v))=\frac{1}{{1 + {E_1}+{E_2} + {E_3}}} \end{align} $

    (9)

    其中,

    $ \begin{align*} {E_1} = &\ \exp \bigg( - \frac{1}{{\sigma _{i{j_i}}^k(t - v)}}\, \times\\ &\ (d{x_{ci{j_i}}}(t - v) - x_{i{j_i}\min }^k(t - v)) \bigg) \\[1mm] {E_2} =&\ \exp \bigg( \frac{1}{{\sigma _{i{j_i}}^k(t - v)}}\, \times\\ &\ (d{x_{ci{j_i}}}(t - v) - x_{i{j_i}\max }^k(t - v)) \bigg) \\[1mm] {E_3} =&\ \exp \bigg( \frac{1}{{\sigma _{i{j_i}}^k(t - v)}}\, \times\\ &\ (x_{i{j_i}\min }^k(t - v) - x_{i{j_i}\max }^k(t - v)) \bigg) \end{align*} $

    $d{x_{{ci}{j_i}}}(t - v)$表示第$i$个时间序列的$t - v$时刻对应项集中的中心值; $x_{i{j_{i\min }}}^k(t - v)$, $x_{i{j_i}\max }^k(t - v)$和$\sigma _{i{j_i}}^k(t - v)$分别表示第$k$个规则中第$i$个时间序列在$t - v$时刻对应的项集${j_i}$包含的样本的最小值、最大值和标准差.

    令${\tilde w_k} = {{{w_k}}}/{{\sum\nolimits_{k = 1}^l {{w_k}} }}$, 式(7)可以进一步整理, 得

    $ \begin{align} & d{x_{c(m + 1){j_{m + 1}}}}(t) = \sum\limits_{k = 1}^l {{{\tilde w}_k}dx_{cm{j_m}}^k(t)} = \\ &\sum\limits_{k = 1}^l {{{\tilde w}_k}\Bigg\{ {\tilde \theta _{m0}^k + } } \left[ {\tilde \theta _{m1}^k\;\tilde \theta _{m2}^k \cdots \tilde \theta _{mi}^k \cdots \tilde \theta _{mm}^k} \right] \times \\[1mm] &\left[ {\begin{array}{*{20}{c}} {dx_{c1{j_1}}^k(t - 1)}\\ {dx_{c2{j_2}}^k(t - 1)}\\ {\begin{array}{*{20}{c}} \vdots \\ {dx_{ci{j_i}}^k(t - 1)}\\ \vdots \end{array}}\\ {dx_{cm{j_m}}^k(t - 1)} \end{array}} \right] + \cdots + \\[1mm] &\left[ {\tilde \theta _{m(nn - n + 1)}^k\;\tilde \theta _{m(nn - n + 2)}^k \cdots \tilde \theta _{m(nn - n + i)}^k \cdots \tilde \theta _{m(nn)}^k} \right]\times\\[1mm] &\left[ {\begin{array}{*{20}{c}} {dx_{c1{j_1}}^k(t - n)}\\ {dx_{c2{j_2}}^k(t - n)}\\ {\begin{array}{*{20}{c}} \vdots \\ {dx_{ci{j_i}}^k(t - n)}\\ \vdots \end{array}}\\ {dx_{cm{j_m}}^k(t - n)} \end{array}} \right] \Bigg\} = \\ &\ \sum\limits_{k = 1}^l {{{\tilde w}_k}} \left[ {({\theta _{cm0}}, {\theta _{rm0}})} \right] + \sum\limits_{k = 1}^l {{{\tilde w}_k}}\, \times \\ &\left[(\tilde \theta _{cm1}^k, \tilde \theta _{rm1}^k)(\tilde \theta _{cm2}^k, \tilde \theta _{rm2}^k) \cdots (\tilde \theta _{cmi}^k, \tilde \theta _{rmi}^k) \cdots\right.\notag \\ &\left.(\tilde \theta _{cmm}^k, \tilde \theta _{rm1}^k)\right] \left[dx_{c1{j_1}}^k(t - 1)dx_{c2{j_2}}^k(t - 1) \cdots\right.\notag \\ &\left.dx_{ci{j_i}}^k(t - 1) \cdots dx_{cm{j_m}}^k(t - 1)\right]^{{\rm T}} + \cdots + \notag \\ &\sum\limits_{k = 1}^l {{{\tilde w}_k}}\left[ (\tilde \theta _{cm(nn - n + 1)}^k, \tilde \theta _{rm(nn - n + 1)}^k )\, \times\right.\notag \\ &\ (\tilde \theta _{cm(nn - n + 2)}^k, \tilde \theta _{rm(nn - n + 2)}^k) \cdots\notag \\ &\left.(\tilde \theta _{cm(nn - n + i)}^k, \tilde \theta _{rm(nn - n + i)}^k) \cdots (\tilde \theta _{cm(nn)}^k, \tilde \theta _{rm(nn)}^k)\right] \times\notag \\ &\left[dx_{c1{j_1}}^k(t - n)dx_{c2{j_2}}^k(t - n) \cdots dx_{ci{j_i}}^k(t - n) \cdots\right. \notag \\ &\left.dx_{cm{j_m}}^k(t - n)\right]^{{\rm T}} = \notag \\ &\sum\limits_{k = 1}^l {{{\tilde w}_k}} \left[ {({{(\tilde \theta _{mc}^k)}^{{\rm T}}}X(t), {{(\tilde \theta _{mr}^k)}^{{\rm T}}}\left| {X(t)} \right|)} \right]=\notag \\ &\left[ {((\tilde \theta _{mc}^{{\rm T}}\tilde X(t), (\tilde \theta _{mr}^{{\rm T}} | {\tilde X(t)} |)} \right] \end{align} $

    (10)

    其中,

    $ \begin{align*} &{(\tilde \theta _{mc}^k)^{{\rm T}}} = \left[ {\theta _{cm0}^k, \theta _{cm1}^k, \theta _{cm2}^k, \cdots , \theta _{cm(nn - 1)}^k, \theta _{cm(nn)}^k} \right]\\ &{(\tilde \theta _{rc}^k)^{{\rm T}}} = \left[ {\theta _{rm0}^k, \theta _{rm1}^k, \theta _{rm2}^k, \cdots , \theta _{rm(nn - 1)}^k, \theta _{rm(nn)}^k} \right]\\ & \tilde \theta _{mc}^{{\rm T}} = \left[ {{{(\tilde \theta _{mc}^1)}^{{\rm T}}}, {{(\tilde \theta _{mc}^2)}^{{\rm T}}}, \cdots , {{(\tilde \theta _{mc}^l)}^{{\rm T}}}} \right]\\ &\tilde \theta _{mr}^{{\rm T}} = \left[ {{{(\tilde \theta _{mr}^1)}^{{\rm T}}}, {{(\tilde \theta _{mr}^2)}^{{\rm T}}}, \cdots , {{(\tilde \theta _{mr}^l)}^{{\rm T}}}} \right]\\ &\tilde X(t) = \sum\limits_{k = 1}^l {{w_k}} \left[1, dx_{c1{j_1}}^{}(t - 1), dx_{c2{j_2}}^{}(t - 1), \cdots , \right.\\ &\qquad\quad\, dx_{cm{j_m}}^{}(t - 1), \cdots , dx_{c1{j_1}}^k(t - n), \\ &\qquad\quad \left.dx_{c2{j_2}}^k(t - n), \cdots , dx_{cm{j_m}}^k(t - n)\right]\\ &\left| {\tilde X(t)} \right| = \sum\limits_{k = 1}^l {{w_k} } \left[1, \left| {dx_{c1{j_1}}^{}(t - 1)} \right|, \right.\\ &\qquad\qquad\, \left| {dx_{c2{j_2}}^{}(t - 1)} \right|, \cdots , \\ &\qquad\qquad\, \left| {dx_{cm{j_m}}^{}(t - 1)} \right|, \cdots , \left| {dx_{c1{j_1}}^k(t - n)} \right|, \\ &\qquad\qquad \left.\left| {dx_{c2{j_2}}^k(t - n)} \right|, \cdots , \left| {dx_{cm{j_m}}^k(t - n)} \right|\right] \end{align*} $

    基于多维时态关联规则的模糊推理预测模型中的区间参数可通过使下式中的目标函数$J$在约束条件$\theta _{rmp}^k \ge 0$取得极小求得, 其中, $p=0, 1, 2, \cdots$, $nn$, 且有

    $ \begin{align} \mathop {\min }\limits_{{{\bf{ \pmb{\mathsf{ θ}} }}_{mc}}, {{\bf{ \pmb{\mathsf{ θ}} }}_{rc}}} J =&\ \sum\limits_{t = 1}^n {{{\left[ {dx_{cm{j_m}}^L(t) - d\tilde x_{cm{j_m}}^L(t)} \right]}^2}} \, + \notag\\ &\ \sum\limits_{t = 1}^n {{{\left[ {dx_{cm{j_m}}^U(t) - d\tilde x_{cm{j_m}}^U(t)} \right]}^2}}\\&{\rm s.t.}\ \ \theta _{rmp}^k \ge 0, \quad k = 1, 2, \cdots , l \end{align} $

    (11)

    其中, $d\tilde x_{cm{j_m}}^U(t)$和$d\tilde x_{cm{j_m}}^L(t)$分别为预测模型输出$d\tilde x_{cm{j_m}}^{}(t)$的上界和下界, $dx_{cm{j_m}}^U(t)$和$dx_{cm{j_m}}^L(t)$分别为真实模式类别变量$dx_{cm{j_m}}^{}(t)$的上界和下界.

    为了求解式(11)中的约束优化问题, 对该式进行整理, 根据文献[26]进一步得到与式(11)同解的二次优化问题.

    $ \begin{align} &\mathop {\min }\limits_{{{\bf{ \pmb{\mathsf{ θ}} }}_{mc}}, {{\bf{ \pmb{\mathsf{ θ}} }}_{rc}}} J = \left[ {\begin{array}{*{20}{c}} {\theta _{mc}^{{\rm T}}}&{\theta _{mr}^{{\rm T}}} \end{array}} \right] \times\notag \\ &\ \left[ {\begin{array}{*{20}{c}} {\sum\limits_{t = 1}^n {2X(t){X^{{\rm T}}}(t)} }&{}\\ {}&{\sum\limits_{t = 1}^n {2\left| {X(t)} \right|{{\left| {X(t)} \right|}^{{\rm T}}}} } \end{array}} \right] \times\notag \\ &\ \left[ {\begin{array}{*{20}{c}} {{\theta _{mc}}}\\ {{\theta _{mr}}} \end{array}} \right] - \left[ {\begin{array}{*{20}{c}} {\theta _{mc}^{{\rm T}}}&{\theta _{mr}^{{\rm T}}} \end{array}} \right] \times\notag \\ &\ \left[2\sum\limits_{t = 1}^n {X(t)(dx_{c(m + ){j_{m + 1}}}^U(t) + dx_{c(m + 1){j_{m + 1}}}^L(t)), }\right.\notag \\ &\ \left.2\sum\limits_{t = 1}^n {\left| {X(t)} \right|(dx_{c(m + 1){j_{m + 1}}}^U(t) - dx_{c(m + 1){j_{m + 1}}}^L(t))} \right]^{{\rm T}} \end{align} $

    (12)

    概念漂移[27]是指随着时间推移或时序数据的更新, 时间序列数据自身分布及结构等发生变化.通过对时序数据的概念漂移检测, 发现当前数据与原先状态的异同, 进而判断规则库中的已有关联规则是否适用于当前时序数据, 从而作出相应处理.判断当前滑动窗是否发生概念漂移, 主要考虑以下两种情况, 只要满足任意一种情况, 都认为发生了概念漂移:

    1) 规则覆盖率

    如前所述, 如果满足规则匹配的条件, 则在此基础上统计没有规则可匹配的离散时态事务数$m$.若$({m / N})>{\varepsilon _{th}}$, 即如果当前读取的时间序列滑动窗对应的离散时态数据集中无规则可匹配的样本事务所占比例大于给定阈值, 则发生了概念漂移.其中, $N$表示离散时态事务集中所含离散时态事务数, $m$是离散时态事务集中无规则匹配的离散时态事务数, ${\varepsilon _{th}}$是规则不匹配比例阈值, 本文取值范围设置为$[0.3$, $0.5]$.

    2) 时间序列的相似度

    假定当前时间序列滑动窗的时间区间为$[{T_1}$, ${T_2}]$, 则在时间$t = {T_1} - 1$处, 表示上一个滑动窗演化更新处理完成, 系统已有时态关联规则的所有候选1-项集及其支持度对$ \langle {C_1}, \sup ({C_1}) \rangle $构成的集合为$C_1^{{T_1} - 1}$, 所有频繁1-项集及其支持度对$\langle {F_1}$, $\sup ({F_1}) \rangle$构成的集合为$F_1^{{T_1} - 1}$.若集合$F_1^{{T_1} - 1}$与集合$F_1^{{T_2}}$ (表示当前时间${T_2}$获得的所有频繁1-项集)所含项集元素不同, 则需对集合$C_1^{{T_1} - 1}$及集合$C_1^{{T_2}}$中所含项集进行如下处理:对两集合所含项集取并集(时间也合并), 所得项集构成集合${C^{[{T_1} - 1, {T_2}]}}$, 对比集合${C^{[{T_1} - 1, {T_2}]}}$中所含项集, 将集合$C_1^{{T_1} - 1}$及集合$C_1^{{T_2}}$中不含有的项集补全, 对应支持度记为零, 这样可以将集合$C_1^{{T_1} - 1}$及$C_1^{{T_2}}$中所含项集元素变为相同.将集合$C_1^{{T_1} - 1}$及$C_1^{{T_2}}$中所含项集支持度看成是两等长序列, 分别记为${s_{C_1^{{T_1} - 1}}}$和${s_{C_1^{{T_2}}}}$, 利用式(13)计算两序列间的相似性$sim({s_{C_1^{{T_1} - 1}}}, {s_{C_1^{{T_2}}}})$, 若$sim({s_{C_1^{{T_1} - 1}}}$, ${s_{C_1^{{T_2}}}}) < {\eta _{th}}$, 则认为当前数据发生了概念漂移, 其中${\eta _{th}}$是用户给定的最小相似性阈值, 本文取值范围设置为$[0.7, 0.9]$.

    $ \begin{align} sim({s_{C_1^{{T_1} - 1}}}, {s_{C_1^{{T_2}}}}) = \frac{{\sum\limits_{i = 1}^p {{s_{C_1^{{T_1} - 1}}}(i)\times {s_{C_1^{{T_2}}}}(i)} }}{{\sqrt {\sum\limits_{i = 1}^p {{s^2_{C_1^{{T_1} - 1}}}{{(i)}}} } \sqrt {\sum\limits_{i = 1}^p {{s^2_{C_1^{{T_2}}}}{{(i)}}} } }}\end{align} $

    (13)

    其中, $p$是序列长度, ${s_{C_1^{{T_1} - 1}}}(i)$, ${s_{C_1^{{T_2}}}}(i)$是序列${s_{C_1^{{T_1} - 1}}}$, ${s_{C_1^{{T_2}}}}$中第$i$个元素.

    若时间序列滑动窗发生概念漂移, 则需利用时态关联规则挖掘算法对滑动窗重新进行基时态关联规则的挖掘, 并对规则库进行规则更新, 进而实现基于多维时态关联规则的模糊推理预测建模; 否则, 认为当前已有时态关联规则与滑动窗相匹配, 无需进行时态关联规则的挖掘更新, 继续等待下一个滑动窗, 实现系统演化更新.

    系统演化更新是指在充分利用已有规则库$R$的基础上, 对系统中新加入的时间序列滑动窗中的数据进行选择性处理, 从而提高数据挖掘的效率, 实现系统的自适应变化.本文采用滑动窗技术分析系统的演化更新.根据Hoeffding[28]边界检测数据的分布, 自动确定滑动窗口的大小.具体的滑动窗口的实现过程见图 1所示.

    图 1  滑动窗的实现过程
    Fig. 1  The implementation process of sliding window

    图 1中, ${w_0}$表示系统进行初始关联规则挖掘的滑动时间窗的大小, ${w_i}$ $(1 \le i \le n)$表示系统在第$i$次演化更新时滑动窗口的大小, 其中, ${w_{i1}}$ $( 0$ $\le | {{w_{i1}}} |$ $\le$ $| {{w_i}} | )$表示当前滑动窗口中与规则匹配的样本数据窗口大小, ${w_{i2}}$ $( {0 \le | {{w_{i2}}} | \le | {{w_i}} |} )$表示当前滑动窗中无规则匹配的样本数据窗口大小, 且$| {{w_{i1}}} |+ | {{w_{i2}}} |$ $=$ $| {{w_i}} |$; 根据概念漂移的第一种情况, 如果当前窗口中无规则匹配的事务数所占比例大于给定阈值, 则保留窗口${w_{i2}}$中的样本数据, 删除窗口${w_{i1}}$中的样本数据, 同时接收新的数据填充窗口${w_{i1}}$, 在更新数据的基础上重新挖掘.系统演化更新的具体流程如图 2所示, 首先, 当时间序列数据库读入的时间序列数据达到设定时间长度, 则存储当前时间序列滑动窗的数据.然后, 通过概念漂移模块对读取的时间序列滑动窗进行概念漂移检测, 判断当前时间序列数据是否发生改变或是否适用当前规则库中的关联规则.

    图 2  系统演化更新
    Fig. 2  The update process of system evolving system evolving window

    为了对所提算法的性能及有效性进行验证, 实验使用UCI数据库[29]中的多个时间序列数据集(Air Quality数据集, Istanbul数据集及Synthetic Control Chart数据集)分别设计并对比3种不同的实验方案(如表 1所示).首先, 考虑到本文提出的算法(方案2)采用了一种频繁项集树结构挖掘时态关联规则, 为了对比类似挖掘算法的影响, 选择方案1进行对比研究, 其采用了FP-growth树结构来挖掘时态关联规则.其次, 考虑到本文提出的算法(方案2)采用了模糊推理进行预测, 而我们正是借鉴了TS模糊推理方法的思路, 为此, 采用方案3进行对比研究.

    表 1  对比方案
    Table 1  The comparison program
    对比方案方案简述
    方案1利用FP-growth[30]算法进行时态关联规则挖掘, 然后利用FI-MTAR算法进行推理预测
    方案2利用时态关联规则算法[18]和EFI-MTAR算法演化模糊推理
    方案3直接利用TS模糊推理[31]进行推理预测
    下载: 导出CSV 
    | 显示表格

    定义2 (分类正确率). 对于包含$n$条离散事务的离散事务集, 将每条离散事务与已有规则进行匹配, 若存在$m$条离散事务与已有规则匹配, 则分类正确率为

    $ \begin{align}CA = \frac{m}{n} \times 100\, \% \end{align} $

    (14)

    定义3 (均方根误差RMSE).

    $ \begin{align}RMSE = \sqrt {\frac{{\sum\limits_{i = 1}^n {{{(\hat y - {y_i})}^2}} }}{n}} \end{align} $

    (15)

    其中, $n$表示数据样本个数, $\hat y$表示样本预测输出, ${y_i}$表示样本实际输出.

    为了验证基于时态关联规则的模糊推理预测性能以及更好地理解规则的物理意义, 以Air Quality数据集中部分数据挖掘的时态关联规则为例进行仿真实验和说明.

    $ \begin{align} &(21\left| {[35, 36]) \cap } \right.(31\left| {[37, 40]} \right.) \xrightarrow{[1, 49]} (61\left| {[41, 45])} \right., \notag\\ &\qquad\qquad\ \ \, \sup = 0.17, {{\rm conf}} = 0.73, {{\rm imp}} = 0.70\end{align} $

    (16)

    规则的前件包含项$\left\{ {21} \right\}$、$\left\{ {31} \right\}$以及它们发生的有效时间区间$[35, 36]$和$[37, 40]$, 规则的后件包含项$\left\{ {61} \right\}$以及它发生的有效时间区间$[41, 45]$.根据时间序列变量离散化得到的这些项集, 可以对应到Air Quality数据集的时间序列的序列片段模式, 如表 2所示.

    表 2  离散化项集的序列片段模式
    Table 2  The segment patterns of the time series for the discrete item
    时间序列变量离散斜率斜率对幅值变归一化变化
    化项均值应角度化均值幅值均值
    PT08.S2(NMHC)2174.2589.25144.20.48
    NOx(GT)31-31.6-87.1-92.4-0.16
    PT08.S5(O3)6180.889.3911.10.45
    下载: 导出CSV 
    | 显示表格

    因此, 规则可以进一步表示为

    $ \begin{align} &{{\rm (NOx}}\left( {{{\rm GT}}} \right){{\rm \{ }}\bar k~{{\rm = - 31}}{{\rm .6;}}\Delta \bar y~{{\rm = - 92}}{{\rm .4\} }}\notag\\ &\qquad \left| {[2004.03.11.01, 2004.03.11.02])} \right.{{\rm , }}\notag\\ &{{\rm (PT}}0{{\rm 8}}.{{\rm S2}}\left( {{{\rm NMHC}}} \right){{\rm \{ }}\bar k~{{\rm = 74}}{{\rm .25;}}\Delta \bar y~{{\rm = 144}}{{\rm .2\} }}\notag\\ &\qquad \left| {[2004.03.11.03, 2004.03.11.05])} \right.\notag\\ &\xrightarrow{[2004.03.10.18, 2004.03.11.12]} \notag\\ & {{\rm (PT08}}{{\rm .S5(O3)}}{{\rm \{ }}\bar k~{{\rm = 80}}{{\rm .8;}}\Delta \bar y~{{\rm = 911}}{{\rm .1\} }}\notag\\ &\qquad \left| {[2004.03.11.06, 2004.03.11.10])} \right., \notag\\ &\qquad\qquad\qquad \sup = 0.17, ~~{{\rm conf}} = 1, ~~{{\rm imp}} = 0.60 \end{align} $

    (17)

    其中, $\bar k$表示斜率的均值; $\Delta \bar y$表示幅值变化的均值.但形如式(17)的规则还是难以理解其时间序列的变化趋势, 为此, 进一步给出了序列片段模式的语义描述, 如表 3所示.

    表 3  序列片段模式的语义描述
    Table 3  The semantic description of the segment patterns
    斜率对应角度范围语义描述归一化变化幅值范围语义描述
    $[-90, -60]$剧烈下降 $[-1, -0.6]$大幅下降
    $[-60, -30]$快速下降 $[-0.6, -0.3]$中幅下降
    $[-30, 0 ]$平稳下降 $[-0.3, 0]$小幅下降
    $[0, 30]$平稳上升 $[0, 0.3]$小幅上升
    $[30, 60]$快速上升 $[0.3, 0.6]$中幅上升
    $[60, 90]$剧烈上升 $[0.6, 1]$大幅上升
    下载: 导出CSV 
    | 显示表格

    上述规则可以进一步描述为:在2004年3月10日18时到2004年3月11日12时的时间区间中, 时间序列NOx(GT)如果在时间2004年3月11日1时到2004年3月11日2时内(即时间区间[35, 36])按照快速小幅下降的趋势变化, 而时间序列PT08.S2(NMHC)在时间2004年3月11日3时到2004年3月11日5时内(即时间区间[37, 39])按照剧烈中幅上升的趋势变化, 则可以得到时间序列PT08.S5(O3)在时间2004年3月11日6时到2004年3月11日10时内(即时间区间$[41, 45]$), 将会按照剧烈中幅上升的趋势变化.

    在此基础上, 仿真实验采用本文提出的基于多维时态关联规则的模糊推理模型进行预测, 具体形式为

    $ \begin{align} R:&\ {{\bf If}}~~dx_{c1{j_1}}^{}(t - 1)~~{\bf is}~~1~~{\bf{and}}\notag\\ &\ dx_{c2{j_2}}^{}(t - 1)~~{\bf is}~~{f_{21}}, ~dx_{c3{j_3}}^{}(t - 1)~~{\bf is}~~1, \notag\\ &\ d{x_{c1{j_1}}}(t - 2)~~{\bf{is}}~~{f_{12}}~~{\bf{and}}\notag\\ &\ dx_{c2{j_2}}^{}(t - 1)~~{\bf is}~~1, ~~d{x_{c3{j_3}}}(t - 2)~~{\bf{is}}~~1\notag\\ &\ {\bf{Then}}~~dx_{c3{j_3}}^{}(t) =\notag\\ &\ \tilde \theta _{30}^{} + \left[ {\begin{array}{*{20}{c}} {\tilde \theta _{31}^{}}&{\tilde \theta _{32}^{}}&{\tilde \theta _{33}^{}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {dx_{c1{j_1}}^{}(t - 1)}\\ {dx_{c2{j_2}}^{}(t - 1)}\\ {dx_{c3{j_3}}^{}(t - 1)} \end{array}} \right] + \notag\\ &\ \left[ {\begin{array}{*{20}{c}} {\tilde \theta _{34}^{}}&{\tilde \theta _{35}^{}}&{\tilde \theta _{36}^{}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {dx_{c1{j_1}}^{}(t - 2)}\\ {dx_{c2{j_2}}^{}(t - 2)}\\ {dx_{c3{j_3}}^{}(t - 2)} \end{array}} \right]{\bf{ }} \end{align} $

    (18)

    进一步整理得到:

    $ \begin{align} R: &\ {{\bf If}}~~dx_{c2{j_2}}^{}(t - 1)~~{\bf is}~~{f_{21}}~~{\bf and}\notag\\ &\ d{x_{c1{j_1}}}(t - 2)~~{{\bf is}}~~{f_{12}}\notag\\ &\ {{\bf Then}}~~dx_{c3{j_3}}^{}(t) =\notag \\ &\ \tilde \theta _{30}^{} + \tilde \theta _{32}^{}dx_{c2{j_2}}^{}(t - 1) + \tilde \theta _{34}^{}dx_{c1{j_1}}^{}(t - 2) \end{align} $

    (19)

    其中, 模型的阶次为2, $d{x_{c1{j_1}}}(t - 2)$对应的是时态关联规则前件中的项$(21| {[35, 36])}$, $dx_{c2{j_2}}^{}(t - 1)$对应的是时态关联规则前件中的项$(31| {[37, 40]})$, $dx_{c3{j_3}}^{}(t)$对应的是时态关联规则后件中的项$(61| {[41, 45])}$, 采用其中30条样本用于训练, 10条样本用于测试, 由式(10)~(12), 辨识得到的该条规则的模糊推理模型的后件参数为

    $ \begin{align} &\left[ {\begin{array}{*{20}{c}} {\tilde \theta _{30}^{}}&{\tilde \theta _{32}^{}}&{\tilde \theta _{34}^{}} \end{array}} \right] =\notag \\ &\quad \left[ {\begin{array}{*{20}{c}} {(0.092, 31.2)}&{(1.0181, 72.1)}&{(0.2182, 405)} \end{array}} \right] %&\left[ {\tilde \theta _{30}^{}\;\tilde \theta _{32}^{}\;\tilde \theta _{34}^{}} \right]=\notag\\ %&\quad \left[ {(0.092, 31.2)\;(1.0181, 72.1)\;(0.2182, 405)} \right] \end{align} $

    (20)

    基于本文提出的基于多维时态关联规则的模糊推理模型进行预测, 表 4给出了最终预测输出的上下界的均方根误差.

    表 4  最终预测输出上下界均方根误差
    Table 4  The RMSE of upper bound and lower bound for the prediction output
    $dx_{c3{j_3}}^L$ $dx_{c3{j_3}}^U$
    0.16560.1803
    下载: 导出CSV 
    | 显示表格

    为验证滑动窗口大小对系统演化更新效果的影响, 该部分利用Air Quality时间序列数据集, 在系统演化更新过程中, 分别人为定义滑动窗口大小为$5\, {{\% }}$, $10\, {{\% }}$, $15\, {{\% }}$, $20\, {{\% }}$和$25\, {{\% }}$, 利用自动确定滑动窗口大小的方法确定滑动窗口大小为$7\, {{\% }}$, 对比不同滑动窗口大小情况下, 系统演化更新过程中产生的时态关联规则的规则数、规则分类正确率及预测均方根误差, 结果如表 5所示.

    表 5  不同滑动窗口的演化更新效果
    Table 5  The evolution effect of different sliding window size
    评价指标演化次数滑动窗口大小本文方法
    5 % 10 % 15 % 20 % 7 %
    Rules01617191917
    12019222418
    22021242620
    32121252921
    42427293321
    52524303424
    62529313323
    CA00.9090.8990.8760.8660.911
    10.8790.9040.8510.8510.906
    20.8860.9090.8460.8390.916
    30.8910.8960.8490.8320.919
    40.8760.8870.8510.8420.924
    50.8690.8790.8540.8470.896
    60.8810.8960.8620.8590.909
    RMSE00.1440.1520.1870.1970.137
    10.1790.1450.2210.2240.145
    20.1680.1390.2340.2640.121
    30.1590.1570.2270.2790.112
    40.1870.1650.2240.2410.104
    50.1940.1830.2090.2360.154
    60.1750.1560.2010.2140.146
    下载: 导出CSV 
    | 显示表格

    不同滑动窗口大小导致演化次数不同, 滑动窗口大小为$10\, {{\% }}$时, 演化次数为12次; 滑动窗口为$25\, {{\% }}$时, 演化次数为6次, 为了方便比较, 本文选择共有演化次数为6次.如表 5所示, 在不同大小的滑动窗口下系统演化更新时所得规则数不同, 且滑动窗口越大, 产生的规则数也相对较多; 自动确定滑动窗口中均具有最高的分类正确率; 针对不同演化次数, 系统所得规则的预测误差的波动变化不大.同一演化次数中, 自动确定的滑动窗口中均具有最低的预测均方根误差.

    为验证本文提出的方案2在获取规则的个数、分类准确率(如表 6所示)和预测性能(如表 7所示)方面的有效性, 首先通过算法自动确定滑动窗口大小, 进而确定各个数据集的演化次数, 分别为13次、6次和7次.

    表 6  不同数据集的有效性和准确性对比
    Table 6  Comparison of the validity and accuracy of different data sets
    数据集演化方案1方案2
    次数RulesCARulesCA
    Air Quality0350.902170.911
    1490.897180.906
    2540.879200.916
    3620.887210.919
    4660.874210.924
    5710.867240.896
    6780.874230.909
    7870.894200.921
    8940.886230.914
    9990.879250.900
    101010.875270.894
    111090.874240.898
    121120.895240.927
    131190.9004260.932
    Istanbul0320.806190.855
    1360.814170.881
    2390.743210.805
    3510.807210.801
    4570.764210.805
    5670.794250.801
    6740.7778230.889
    0650.904440.946
    1780.882490.891
    2860.856490.888
    Synthetic3990.862560.875
    Control41080.843480.851
    Chart51100.856530.956
    61140.854590.896
    71240.889480.926
    下载: 导出CSV 
    | 显示表格
    表 7  拟合误差
    Table 7  Fitting error
    数据集演化次数方案1方案2方案3
    00.1890.1370.168
    10.1950.1450.172
    20.1760.1210.156
    30.1690.1120.144
    40.1620.1040.136
    Air50.2010.1540.159
    Quality60.1940.1460.174
    70.1560.1080.144
    80.1860.1330.176
    90.1970.1480.185
    100.2110.1580.195
    110.1970.1550.186
    120.1540.0990.129
    130.1460.0910.132
    Istanbul00.1440.0940.129
    10.1840.1390.165
    20.2260.1720.208
    30.1980.1490.184
    40.1880.1390.171
    50.2090.1680.196
    60.1480.1030.139
    00.1320.0720.095
    10.1540.0940.124
    20.1690.1130.146
    Synthetic30.1870.1320.167
    Control40.2060.1490.182
    Chart50.1290.0760.109
    60.1380.0920.116
    70.1550.0870.126
    下载: 导出CSV 
    | 显示表格

    表 6可以看出, 与方案1重新挖掘规则相比, 由于采用了概念漂移处理机制, 方案2的演化更新系统不仅减少了挖掘规则的数量, 而且节省了存储空间, 提高了算法效率, 证明了方案2的有效性.此外, 通过对比两种方案所得规则的分类正确率, 可以看到方案2的各演化更新阶段所得规则具有较高的分类正确率, 说明演化更新所得规则具有较好的性能.最后, 评估三种方案对时间序列变化趋势的预测性能, 如表 7所示, 与其他两个方案相比, 方案2的模型预测误差最小.对比方案3与方案1, 本文提出的方案2具有更好的准确性.

    这里, 分别以三种时间序列数据集的最后一次演化更新时滑动窗口中数据的$70\, {{\% }}$作为训练样本, $30\, {{\% }}$作为测试样本. 图 3~5给出了测试样本的三种方案的输出预测值与实际值的拟合曲线.可以看到, 对于三种数据集, 方案1的拟合值与实际值相差最大, 方案3次之, 本文所提的方案2的拟合值几乎与原有时间序列重合, 具有更好的预测准确性.

    图 3  数据集Air Quality的拟合曲线
    Fig. 3  The fitting curve of the data set Air Quality
    图 4  数据集Istanbul的拟合曲线
    Fig. 4  The fitting curve of the data set Istanbul
    图 5  数据集Synthetic Control Chart的拟合曲线
    Fig. 5  The fitting curve of the data set Synthetic Control Chart

    为了处理时间序列数据, 时态关联规则挖掘广泛地用于各种实际应用.通常时态数据库中的时间序列数据是动态变化的, 而现有的时态关联规则挖掘技术对于最近更新的数据进行挖掘时, 往往要依赖所有的时间序列数据进行重复挖掘, 造成了资源的浪费.本文提出了一种新的算法, 不仅可以动态更新时态关联规则, 而且通过结合模糊推理可以实现时态关联规则的推理预测.本文采用了滑动窗技术对时间序列分块处理, 通过概念漂移检测实现系统演化更新, 避免了重复性地对模型进行重建的工作.

    此外, 为了更有效地利用时态关联规则进行定量预测, 构建了基于多维时态关联规则的模糊推理预测方法, 通过实验对比研究, 表明了本文算法的有效性、可扩展性和准确性.


  • 本文责任编委 张敏灵
  • 图  1  滑动窗的实现过程

    Fig.  1  The implementation process of sliding window

    图  2  系统演化更新

    Fig.  2  The update process of system evolving system evolving window

    图  3  数据集Air Quality的拟合曲线

    Fig.  3  The fitting curve of the data set Air Quality

    图  4  数据集Istanbul的拟合曲线

    Fig.  4  The fitting curve of the data set Istanbul

    图  5  数据集Synthetic Control Chart的拟合曲线

    Fig.  5  The fitting curve of the data set Synthetic Control Chart

    表  1  对比方案

    Table  1  The comparison program

    对比方案方案简述
    方案1利用FP-growth[30]算法进行时态关联规则挖掘, 然后利用FI-MTAR算法进行推理预测
    方案2利用时态关联规则算法[18]和EFI-MTAR算法演化模糊推理
    方案3直接利用TS模糊推理[31]进行推理预测
    下载: 导出CSV

    表  2  离散化项集的序列片段模式

    Table  2  The segment patterns of the time series for the discrete item

    时间序列变量离散斜率斜率对幅值变归一化变化
    化项均值应角度化均值幅值均值
    PT08.S2(NMHC)2174.2589.25144.20.48
    NOx(GT)31-31.6-87.1-92.4-0.16
    PT08.S5(O3)6180.889.3911.10.45
    下载: 导出CSV

    表  3  序列片段模式的语义描述

    Table  3  The semantic description of the segment patterns

    斜率对应角度范围语义描述归一化变化幅值范围语义描述
    $[-90, -60]$剧烈下降 $[-1, -0.6]$大幅下降
    $[-60, -30]$快速下降 $[-0.6, -0.3]$中幅下降
    $[-30, 0 ]$平稳下降 $[-0.3, 0]$小幅下降
    $[0, 30]$平稳上升 $[0, 0.3]$小幅上升
    $[30, 60]$快速上升 $[0.3, 0.6]$中幅上升
    $[60, 90]$剧烈上升 $[0.6, 1]$大幅上升
    下载: 导出CSV

    表  4  最终预测输出上下界均方根误差

    Table  4  The RMSE of upper bound and lower bound for the prediction output

    $dx_{c3{j_3}}^L$ $dx_{c3{j_3}}^U$
    0.16560.1803
    下载: 导出CSV

    表  5  不同滑动窗口的演化更新效果

    Table  5  The evolution effect of different sliding window size

    评价指标演化次数滑动窗口大小本文方法
    5 % 10 % 15 % 20 % 7 %
    Rules01617191917
    12019222418
    22021242620
    32121252921
    42427293321
    52524303424
    62529313323
    CA00.9090.8990.8760.8660.911
    10.8790.9040.8510.8510.906
    20.8860.9090.8460.8390.916
    30.8910.8960.8490.8320.919
    40.8760.8870.8510.8420.924
    50.8690.8790.8540.8470.896
    60.8810.8960.8620.8590.909
    RMSE00.1440.1520.1870.1970.137
    10.1790.1450.2210.2240.145
    20.1680.1390.2340.2640.121
    30.1590.1570.2270.2790.112
    40.1870.1650.2240.2410.104
    50.1940.1830.2090.2360.154
    60.1750.1560.2010.2140.146
    下载: 导出CSV

    表  6  不同数据集的有效性和准确性对比

    Table  6  Comparison of the validity and accuracy of different data sets

    数据集演化方案1方案2
    次数RulesCARulesCA
    Air Quality0350.902170.911
    1490.897180.906
    2540.879200.916
    3620.887210.919
    4660.874210.924
    5710.867240.896
    6780.874230.909
    7870.894200.921
    8940.886230.914
    9990.879250.900
    101010.875270.894
    111090.874240.898
    121120.895240.927
    131190.9004260.932
    Istanbul0320.806190.855
    1360.814170.881
    2390.743210.805
    3510.807210.801
    4570.764210.805
    5670.794250.801
    6740.7778230.889
    0650.904440.946
    1780.882490.891
    2860.856490.888
    Synthetic3990.862560.875
    Control41080.843480.851
    Chart51100.856530.956
    61140.854590.896
    71240.889480.926
    下载: 导出CSV

    表  7  拟合误差

    Table  7  Fitting error

    数据集演化次数方案1方案2方案3
    00.1890.1370.168
    10.1950.1450.172
    20.1760.1210.156
    30.1690.1120.144
    40.1620.1040.136
    Air50.2010.1540.159
    Quality60.1940.1460.174
    70.1560.1080.144
    80.1860.1330.176
    90.1970.1480.185
    100.2110.1580.195
    110.1970.1550.186
    120.1540.0990.129
    130.1460.0910.132
    Istanbul00.1440.0940.129
    10.1840.1390.165
    20.2260.1720.208
    30.1980.1490.184
    40.1880.1390.171
    50.2090.1680.196
    60.1480.1030.139
    00.1320.0720.095
    10.1540.0940.124
    20.1690.1130.146
    Synthetic30.1870.1320.167
    Control40.2060.1490.182
    Chart50.1290.0760.109
    60.1380.0920.116
    70.1550.0870.126
    下载: 导出CSV
  • [1] Yolcu U, Aladag C H, Egrioglu E, Uslu V R. Time-series forecasting with a novel fuzzy time-series approach:an example for Istanbul stock market. Journal of Statistical Computation and Simulation, 2013, 83(4):599-612 doi: 10.1080/00949655.2011.630000
    [2] Cheng C H, Yang J H. Rough-set rule induction to build fuzzy time series model in forecasting stock price. In: Proceedings of the 12th Conference on International Fuzzy Systems and Knowledge Discovery (FSKD). Zhangjiajie, China: IEEE, 2015. 278-284
    [3] Aslanargun A, Mammadov M, Yazici B, Yolacan S. Comparison of ARIMA, neural networks and hybrid models in time series:tourist arrival forecasting. Journal of Statistical Computation and Simulation, 2007, 77(1):29-53 doi: 10.1080/10629360600564874
    [4] Cheng C H, Shiu H Y. A novel GA-SVR time series model based on selected indicators method for forecasting stock price. In: Proceedings of the 2014 International Conference on Information Science, Electronics and Electrical Engineering (ISEEE). Sapporo, Japan: IEEE, 2014. 395-399 http://ieeexplore.ieee.org/document/6948139/
    [5] 赵昊, 汪涛, 许凡, 方彦军.时序动态关联规则挖掘中趋势变化与预测.河南科技大学学报:自然科学版, 2015, 36(6):40-45 http://d.old.wanfangdata.com.cn/Periodical/lygxyxb201506009

    Zhao Hao, Wang Tao, Xu Fan, Fang Yan-Jun. Change tendency and forecast on time series in dynamic association rules mining. Journal of Henan University of Science and Technology:Natural Science, 2015, 36(6):40-45 http://d.old.wanfangdata.com.cn/Periodical/lygxyxb201506009
    [6] Zeng Y, Yin S Q, Liu J Y, Zhang M. Research of improved FP-Growth algorithm in association rules mining. Scientific Programming, 2015, 2015: Article No. 910281 http://dl.acm.org/citation.cfm?id=2814689
    [7] Xiao Y Y, Tian Y, Zhao Q H. Optimizing frequent time-window selection for association rules mining in a temporal database using a variable neighbourhood search. Computers and Operations Research, 2014, 52:241-250 doi: 10.1016/j.cor.2013.09.018
    [8] Adhikari J, Rao P R. Identifying calendar-based periodic patterns. Emerging Paradigms in Machine Learning. Berlin, Heidelberg: Springer, 2013. 329-357
    [9] Ben Ahmed E, Nabli A, Gargouri F. On line mining of cyclic association rules from parallel dimension hierarchies. Real World Data Mining Applications. Cham: Springer International Publishing, 2015. 31-50
    [10] Matthews S G, Gongora M A, Hopgood A A, Ahmadi S. Web usage mining with evolutionary extraction of temporal fuzzy association rules. Knowledge-Based Systems, 2013, 54:66-72 doi: 10.1016/j.knosys.2013.09.003
    [11] Yang H D, Yang C C. Using health-consumer-contributed data to detect adverse drug reactions by association mining with temporal analysis. ACM Transactions on Intelligent Systems and Technology, 2015, 6(4):Article No. 55 http://cn.bing.com/academic/profile?id=9ccd1892b9c3ad2a731759c442bdcbeb&encoded=0&v=paper_preview&mkt=zh-cn
    [12] Nath B, Bhattacharyya D K, Ghosh A. Incremental association rule mining:a survey. Wiley Interdisciplinary Reviews:Data Mining and Knowledge Discovery, 2013, 3(3):157-169 doi: 10.1002/widm.1086
    [13] Zhuang D E H, Li G C L, Wong A K C. Discovery of temporal associations in multivariate time series. IEEE Transactions on Knowledge and Data Engineering, 2014, 26(12):2969-2982 doi: 10.1109/TKDE.2014.2310219
    [14] Hong T P, Lan G C, Su J H, Wu P S, Wang S L. Discovery of temporal association rules with hierarchical granular framework. Applied Computing and Informatics, 2016, 12(2):134-141 doi: 10.1016/j.aci.2016.01.003
    [15] Sirisha G N V G, Shashi M. A new multivariate time series transformation technique using closed interesting subspaces. In: Proceedings of the 2015 International Mining Intelligence and Knowledge Exploration. Cham: Springer, 2015. 392-405 doi: 10.1007/978-3-319-26832-3_37
    [16] Mohd K N, Mustapha A, Ahmad M H. Effect of temporal relationships in associative rule mining for web log data. The Scientific World Journal, 2014, 2014:Article No. 813983 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=Doaj000003740544
    [17] 王玲, 孟建瑶, 徐培培, 彭开香.基于多维时间序列形态特征的相似性动态聚类算法.工程科学学报, 2017, 39(7):1114-1122 http://d.old.wanfangdata.com.cn/Periodical/bjkjdxxb201707019

    Wang Ling, Meng Jian-Yao, Xu Pei-Pei, Peng Kai-Xiang. Similarity dynamical clustering algorithm based on multidimensional shape features for time series. Chinese Journal of Engineering, 2017, 39(7):1114-1122 http://d.old.wanfangdata.com.cn/Periodical/bjkjdxxb201707019
    [18] Pankaj G, Sagar B B. Discovering weighted calendar-based temporal relationship rules using frequent pattern tree. Indian Journal of Science and Technology, 2016, 9(28). DOI: 10.17485/ijst/2016/v9i28/98455
    [19] 徐正光. 智能自动化的模式识别方法及其工程实现[博士学位论文], 北京科技大学自动化学院, 中国, 2001.

    Xu Zheng-Guang. Pattern recognition method of intelligent automation and its implementation in engineering[Ph. D. dissertation], College of Automation, University of Science and Technology, China, 2001.
    [20] Sun C P, Gao Q, Yu H, Xu Z G. Study on moving pattern based faultdetection method. Applied Mechanics and Materials, 2013, 427-429:1463-1466 doi: 10.4028/www.scientific.net/AMM.427-429
    [21] Xu Z G, Sun C P. Moving pattern-based forecasting model of a class of complex dynamical systems. In: Proceedings of the 50th IEEE Conference on Decision and Control and European Control Conference (CDC-ECC). Orlando, FL, USA: IEEE, 2011. 4967-4972 http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=6161015
    [22] Xu Z G, Sun C P. Moving pattern-based approach to modeling of a class of complex production processes. In: Proceedings of the 2011 IEEE International Conference on Fuzzy Systems. Taipei, China: IEEE, 2011. 2282-2287 http://ieeexplore.ieee.org/document/6007651/
    [23] 徐正光, 孙昌平, 吴金霞.基于区间数度量的运动模式建模与控制.控制理论与应用, 2012, 29(9):1115-1124 http://d.old.wanfangdata.com.cn/Periodical/kzllyyy201209003

    Xu Zheng-Guang, Sun Chang-Ping, Wu Jin-Xia. Moving pattern measured by interval number for modeling and control. Control Theory and Application, 2012, 29(9):1115-1124 http://d.old.wanfangdata.com.cn/Periodical/kzllyyy201209003
    [24] 徐正光, 孙昌平.基于区间T-S模糊模型的运动模式预测.控制与决策, 2012, 27(11):1699-1705 http://d.old.wanfangdata.com.cn/Periodical/kzyjc201211017

    Xu Zheng-Guang, Sun Chang-Ping. Moving pattern forecasting using interval T-S fuzzy model. Control and Decision, 2012, 27(11):1699-1705 http://d.old.wanfangdata.com.cn/Periodical/kzyjc201211017
    [25] 丁园, 王斌, 鄢进冲, 潘昪.基于二维区间自回归模型的烧结终点预测.烧结球团, 2017, 42(3):1-6, 15 http://d.old.wanfangdata.com.cn/Periodical/sjqt201703001

    Ding Yuan, Wang Bin, Yan Jin-Chong, Pan Sheng. Prediction of burning through point based on two-dimensional interval autoregressive model. Sintering and Pelletizing, 2017, 42(3):1-6, 15 http://d.old.wanfangdata.com.cn/Periodical/sjqt201703001
    [26] 孙昌平, 徐正光.基于多维区间T-S模糊模型的多维运动模式预测.控制与决策, 2016, 31(9):1569-1576 http://d.old.wanfangdata.com.cn/Periodical/kzyjc201609005

    Sun Chang-Ping, Xu Zheng-Guang. Multi-dimensional moving pattern prediction based on multi-dimensional interval T-S fuzzy model. Control and Decision, 2016, 31(9):1569-1576 http://d.old.wanfangdata.com.cn/Periodical/kzyjc201609005
    [27] Dries A, Rückert U. Adaptive concept drift detection. Statistical Analysis and Data Mining, 2009, 2(5-6):311-327 http://d.old.wanfangdata.com.cn/Periodical/jsjxb201707005
    [28] Buntine W. Learning classification trees. Statistics and Computing, 1992, 2(2):63-73 doi: 10.1007/BF01889584
    [29] Aha D. UCI Machine learning repository: Center for machine learning and intelligent systems[Online], available: http://archive.ics.uci.edu/ml, August 25, 2017
    [30] Wang H B, Liu Y C, Wang C D. Research on association rule algorithm based on distributed and weighted FP-growth. Advances in Multimedia, Software Engineering and Computing. Berlin, Heidelberg: Springer, 2011, 1: 133-138 doi: 10.1007/978-3-642-25989-0_24
    [31] Wang J S, Zhang Y, Sun S F. Multiple T-S fuzzy neural networks soft sensing modeling of flotation process based on fuzzy C-means clustering algorithm. Advances in Neural Network Research and Applications. Berlin, Heidelberg: Springer, 2010. 137-144
  • 期刊类型引用(10)

    1. 刘峰杉,樊军. 步态过程中人体下肢运动的实时预测. 制造业自动化. 2024(06): 80-84 . 百度学术
    2. 陈孝慈,谭章禄. 基于改进递归区间2型直觉FNN的时间序列预测. 统计与决策. 2024(20): 61-66 . 百度学术
    3. 杨宇晴,王德睿,丁进良. 基于RAGAN的工业过程运行指标前馈-反馈多步校正. 自动化学报. 2023(05): 999-1009 . 本站查看
    4. 李俊,王康,张群. 基于关联规则的大坝变形性态预判模型. 西北水电. 2022(01): 73-77 . 百度学术
    5. 辛春花,郭艳光,鲁晓波. 大型数据库中利用强化学习改进treap的关联规则挖掘算法. 计算机应用研究. 2021(01): 88-92 . 百度学术
    6. 赵宏伟. 基于智能数据分析的电子档案转递查询方法. 信息技术. 2021(09): 39-44 . 百度学术
    7. 周永章,陈川,张旗,王功文,肖凡,沈文杰,卞静,王亚,杨威,焦守涛,刘艳鹏,韩枫. 地质大数据分析的若干工具与应用. 大地构造与成矿学. 2020(02): 173-182 . 百度学术
    8. 孙小虎,秦浩,张亚平,王超. 基于关联规则的电网大数据质量校验方法研究. 电子设计工程. 2020(21): 145-148+153 . 百度学术
    9. 赵丹枫,黄雁玲,黄冬梅,林俊辰,宋巍. 海洋多要素长时间序列的motif规则树构建方法研究. 海洋通报. 2020(05): 558-566 . 百度学术
    10. 金晖,谭文斌. 基于关联规则的职业定位推理算法研究. 无线互联科技. 2019(12): 108-109 . 百度学术

    其他类型引用(6)

  • 加载中
  • 图(5) / 表(7)
    计量
    • 文章访问数:  2192
    • HTML全文浏览量:  288
    • PDF下载量:  743
    • 被引次数: 16
    出版历程
    • 收稿日期:  2017-04-28
    • 录用日期:  2017-11-22
    • 刊出日期:  2018-08-20

    目录

    /

    返回文章
    返回