2.793

2018影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于拉普拉斯特征映射学习的隐基于拉普拉斯特征映射学习的隐

石家宇 陈博 俞立

石家宇, 陈博, 俞立. 基于拉普拉斯特征映射学习的隐基于拉普拉斯特征映射学习的隐. 自动化学报, 2020, 45(1): 1−7. doi: 10.16383/j.aas.c190551
引用本文: 石家宇, 陈博, 俞立. 基于拉普拉斯特征映射学习的隐基于拉普拉斯特征映射学习的隐. 自动化学报, 2020, 45(1): 1−7. doi: 10.16383/j.aas.c190551
SHI Jia-Yu, Chen Bo, Yu Li. Stealthy FDI attack detection based on laplacian eigenmaps learning strategy. Acta Automatica Sinica, 2020, 45(1): 1−7. doi: 10.16383/j.aas.c190551
Citation: SHI Jia-Yu, Chen Bo, Yu Li. Stealthy FDI attack detection based on laplacian eigenmaps learning strategy. Acta Automatica Sinica, 2020, 45(1): 1−7. doi: 10.16383/j.aas.c190551

基于拉普拉斯特征映射学习的隐基于拉普拉斯特征映射学习的隐


DOI: 10.16383/j.aas.c190551
详细信息
    作者简介:

    浙江工业大学硕士研究生. 主要研究方向为信息物理系统安全. E-mail: jiayu_shi0621@163.com

    浙江工业大学信息工程学院教授. 主要研究方向为信息融合, 攻击信号检测, 安全估计与控制, 信息物理系统. 本文通信作者. E-mail: bchen@aliyun.com

    浙江工业大学信息工程学院教授. 主要研究方向为网络化控制, 信息融合, 信息物理系统. E-mail: lyu@zjut.edu.cn

  • 基金项目:  国家自然科学基金项目(61973277, 61673351), 浙江省自然科学基金项目(LR20F030004)资助
  • 中图分类号: Y

Stealthy FDI Attack Detection Based on Laplacian Eigenmaps Learning Strategy

More Information
  • Fund Project:  Supported by the National Natural Science Foundation of China (61973277, 61673351), and Zhejiang Provincial Natural Science Foundation of China (LR20F030004)
  • 摘要: 智能电网中的隐匿虚假数据入侵(False Data Injection,FDI)攻击能够绕过坏数据检测机制, 导致控制中心做出错误的状态估计, 进而干扰电力系统的正常运行. 由于电网系统具有复杂的拓扑结构, 故基于传统机器学习的攻击信号检测方法存在维度过高带来的过拟合问题, 而深度学习检测方法则存在训练时间长、占用大量计算资源的问题. 为此, 针对智能电网中的隐匿FDI攻击信号, 提出了基于拉普拉斯特征映射降维的神经网络检测学习算法, 不仅降低了陷入过拟合的风险, 同时也提高了隐匿FDI攻击检测学习算法的泛化能力. 最后, 在IEEE57-Bus电力系统模型中验证了所提方法的优点和有效性.
  • 图  1  基于拉普拉斯特征映射降维学习的检测机制

    Fig.  1  Detection mechanism based on laplacian eigenmaps

    图  2  神经网络示意图

    Fig.  2  Neural network

    图  3  IEEE 57-Bus系统

    Fig.  3  IEEE 57-Bus system

    图  4  隐匿FDI攻击对系统状态估计的影响

    Fig.  4  The effect of stealthy FDI attack on system state estimation

    图  5  节点30的状态变化曲线

    Fig.  5  The state curve of node 30

    图  6  不同环境噪声下的残差变化

    Fig.  6  Residual change under different environmental noise

    图  7  LE降维后的样本点分布

    Fig.  7  Sample distribution after LE dimension reduction

    图  8  PCA降维后的样本点分布

    Fig.  8  Sample distribution after PCA dimension reduction

    图  9  收敛效果

    Fig.  9  Convergence Performance

    图  10  四种检测机制在不同隐患测量数k下的检测精度ACC

    Fig.  10  Detection accuracy of four detection mechanisms

    图  11  四种检测机制在不同隐患测量数k下的误报率FPR

    Fig.  11  The false positive rate of four detection mechanisms

    图  12  四种检测方法在不同环境噪声中的检测精度ACC变化

    Fig.  12  Detection accuracy of three detection mechanisms in different environmental noises

    图  13  四种检测方法在不同环境噪声中的误报率FPR变化

    Fig.  13  False positive rate of three detection mechanisms in different environmental noises

    图  14  阈值$\tau$对检测精度的影响

    Fig.  14  The effect of threshold $\tau$ on detection accuracy

  • [1] 1 Eklas H, Imtiaj K, Fuad U N, Sarder S S, Samiul H S. Application of big data and machine learning in smart grid, and associated security concerns: A Review. IEEE Access, 2019, 7: 13960−13988 doi:  10.1109/ACCESS.2019.2894819
    [2] 2 Liang G Q, Weller S R, Zhao J H, Luo F J, Dong Z Y. The 2015 Ukraine blackout: implications for false data injection attacks. IEEE Transactions on Power Systems, 2017, 32(4): 3317−3318 doi:  10.1109/TPWRS.2016.2631891
    [3] 王琦, 邰伟, 汤奕, 倪明. 面向电力信息物理系统的虚假数据注入攻击研究综述. 自动化学报, 2019, 45(1): 72−83

    3 Wang Qi, Tai Wei, Tang Yi, Ni Ming. A Review on false data injection attack toward cyber-physical power system. Acta Automatica Sinica, 2019, 45(1): 72−83
    [4] 4 Yao L, Peng N, Michael K R. False data injection attacks against state estimation in electric power grids. ACM Transactions on Information and System Security, 2011, 14(1): No. 13, 33 pages
    [5] 5 Kim T T, Poor H V. Strategic protection against data injection attacks on power grids. IEEE Transactions on Smart Grid, 2011, 2(2): 326−333 doi:  10.1109/TSG.2011.2119336
    [6] 6 Ansari M H, Vakili V T, Bahrak B, Tavassoli P. Graph theoretical defense mechanisms against false data injection attacks in smart grids. Journal of Modern Power Systems and Clean Energy, 2018, 6(5): 860−871 doi:  10.1007/s40565-018-0432-2
    [7] Liu L C, Esmalifalak M, Han Z. Detection of false data injection in power grid Exploiting Low Rank and Sparsity. International Conference on Communications. Budapest, Hungary: IEEE, 2013.
    [8] 8 Liang G Q, Zhao J H, Luo F J, Weller S R, Dong Z Y. A review of false data injection attacks against modern power systems. IEEE Transactions on Smart Grid, 2017, 8(4): 1630−1638 doi:  10.1109/TSG.2015.2495133
    [9] Shan Ke-Meng, Qi Dong-Lian. Distributed dection of false data injection in smart grid and location of error estimation. In: Proceedings of the 36th Chinese Control Conference. Dalian, China: 2017.
    [10] 10 Ozay M, Esnaola I, Vural F T Y, Kulkarni S R, Poor H V. Machine learning methods for attack detection in the smart grid. IEEE Transactions on Neural Networks and Learing Systems, 2015, 27(8): 1773−1786
    [11] 11 Esmalifalak M, Liu L C, Nguyen N, Zheng R, Han Z. Detecting stealthy false data injection using machine learning in smart grid. IEEE Systems Journal, 2014, 11(3): 1644−1652
    [12] 12 He Y B, Mendis G J, Wei J. Real-time detection of false data injection attacks in smart grid: a deep learning-based intelligent mechanism. IEEE Transactions on Smart Grid, 2017, 8(5): 2505−2516 doi:  10.1109/TSG.2017.2703842
    [13] 13 Yu J Q, Huo Y H, Li V O K. Online false data injection attack detection with wavelet transform and deep neural networks. IEEE Transactions on Industrial Informatics, 2018, 14(7): 3271−3280 doi:  10.1109/TII.2018.2825243
    [14] 14 Sun Y B, Fu M Y, Wang B C, Zhang H S, Marelli D. Dynamic state estimation for power networks using distributed MAP technique. Automatica, 2016, 73: 27−37 doi:  10.1016/j.automatica.2016.06.015
    [15] Ali A, Antonio G E. Power System State Estimation: Theory and Implementation. CRC Press, 2004.115−142
    [16] 16 Yu Z H, Chin W L. Blind false data injection attack using PCA approximation method in smart grid. IEEE Transactions on Smart Grid, 2015, 6(3): 1219−1226 doi:  10.1109/TSG.2014.2382714
    [17] 17 Belkin M, Niyogi P. Laplacian eigenmaps for dimensionality reduction and data representation. Neural Computation, 2003, 15(6): 1373−1396 doi:  10.1162/089976603321780317
    [18] 18 Rumelhart D E, Hinton G E, Williams R J. Learning representations by back-propagating errors. Nature, 1986, 323(6088): 533−536 doi:  10.1038/323533a0
    [19] 19 Ray D Z, Carlos E M S, Robert J T. MATPOWER: Steadystate operations, planning, and analysis tools for power systems research and education. IEEE Transactions on Power Systems, 2011, 26(1): 12−19 doi:  10.1109/TPWRS.2010.2051168
    [20] 20 Hochreiter S, Schmidhuber J. Long Short-term Memory. Neural Computation, 1997, 9(8): 1735−1780 doi:  10.1162/neco.1997.9.8.1735
  • [1] 张琦, 陈峰, 张涛, 袁志明. 高速铁路列车连带晚点的智能预测及特征识别[J]. 自动化学报, doi: 10.16383/j.aas.c190188
    [2] 李雪, 李雯婷, 杜大军, 孙庆, 费敏锐. 拒绝服务攻击下基于UKF的智能电网动态状态估计研究[J]. 自动化学报, doi: 10.16383/j.aas.2018.c180431
    [3] 王鼎, 穆朝絮, 刘德荣. 基于迭代神经动态规划的数据驱动非线性近似最优调节[J]. 自动化学报, doi: 10.16383/j.aas.2017.c160272
    [4] 王澄, 刘德荣, 魏庆来, 赵冬斌, 夏振超. 带有储能设备的智能电网电能迭代自适应动态规划最优控制[J]. 自动化学报, doi: 10.3724/SP.J.1004.2014.01984
    [5] 梅生伟, 朱建全. 智能电网中的若干数学与控制科学问题及其展望[J]. 自动化学报, doi: 10.3724/SP.J.1004.2013.00119
    [6] 陈杰, 李志平, 张国柱. 变结构神经网络自适应鲁棒控制[J]. 自动化学报, doi: 10.3724/SP.J.1004.2010.00174
    [7] 彭济根, 倪元华, 乔红. 柔性关节机操手的神经网络控制[J]. 自动化学报, doi: 10.1360/aas-007-0175
    [8] 邢进生, 万百五, 冯祖仁. 神经网络输出两阶段优化及其应用[J]. 自动化学报
    [9] 李树涛, 王耀南, 张昌凡. 基于燃烧火焰图象特征的回转窑神经网络控制系统[J]. 自动化学报
    [10] 杨尔辅, 徐用懋. 一种小波-神经网络多变量混合过程模型及其应用[J]. 自动化学报
    [11] 朱大铭, 马绍汉, 魏道政. 二进制映射神经网络的几何学习算法及其应用[J]. 自动化学报
    [12] 李文彪, 宁静, 潘士先. 一种神经网络体视协同算法[J]. 自动化学报
    [13] 刘慧, 许晓鸣, 张钟俊. 小脑模型神经网络改进算法的研究[J]. 自动化学报
    [14] 胡泽新. 基于神经网络的滤波器[J]. 自动化学报
    [15] 邓志东, 孙增圻, 张再兴. 一种模糊CMAC神经网络[J]. 自动化学报
    [16] 张承福, 赵刚. 联想记忆神经网络的训练[J]. 自动化学报
    [17] 张承福, 赵刚. 联想记忆神经网络的若干问题[J]. 自动化学报
    [18] 钱大群, 孙振飞. 神经网络的知识获取与行为解释[J]. 自动化学报
    [19] 倪先锋, 陈宗基, 周绥平. 基于神经网络的非线性学习控制研究[J]. 自动化学报
    [20] 应行仁, 曾南. 采用BP神经网络记忆模糊规则的控制[J]. 自动化学报
  • 加载中
图(14)
计量
  • 文章访问数:  136
  • HTML全文浏览量:  82
  • PDF下载量:  7
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-07-26
  • 录用日期:  2019-12-15
  • 网络出版日期:  2020-01-06

基于拉普拉斯特征映射学习的隐基于拉普拉斯特征映射学习的隐

doi: 10.16383/j.aas.c190551
    作者简介:

    浙江工业大学硕士研究生. 主要研究方向为信息物理系统安全. E-mail: jiayu_shi0621@163.com

    浙江工业大学信息工程学院教授. 主要研究方向为信息融合, 攻击信号检测, 安全估计与控制, 信息物理系统. 本文通信作者. E-mail: bchen@aliyun.com

    浙江工业大学信息工程学院教授. 主要研究方向为网络化控制, 信息融合, 信息物理系统. E-mail: lyu@zjut.edu.cn

基金项目:  国家自然科学基金项目(61973277, 61673351), 浙江省自然科学基金项目(LR20F030004)资助
  • 中图分类号: Y

摘要: 智能电网中的隐匿虚假数据入侵(False Data Injection,FDI)攻击能够绕过坏数据检测机制, 导致控制中心做出错误的状态估计, 进而干扰电力系统的正常运行. 由于电网系统具有复杂的拓扑结构, 故基于传统机器学习的攻击信号检测方法存在维度过高带来的过拟合问题, 而深度学习检测方法则存在训练时间长、占用大量计算资源的问题. 为此, 针对智能电网中的隐匿FDI攻击信号, 提出了基于拉普拉斯特征映射降维的神经网络检测学习算法, 不仅降低了陷入过拟合的风险, 同时也提高了隐匿FDI攻击检测学习算法的泛化能力. 最后, 在IEEE57-Bus电力系统模型中验证了所提方法的优点和有效性.

English Abstract

  • 智能电网作为下一代电力系统, 通过采用先进的数字信息和通信技术能够实现电网各个环节重要运行参数的在线监测和实时信息掌控, 并在此基础上整合物联网技术和大数据分析, 实现了更环保、更安全和更高效的电力管理[1]. 在发电侧, 由于电能无法大量存储, 控制中心需要密切监控电网运行参数, 以控制电网中的发电与电能消耗相平衡. 在电网侧, 系统也需要估计系统的运行状态, 将其用于最优潮流算法以制定发电方案, 实现经济上的最优调度. 因此需要有大量的信息控制设备和通信传感网络接入电网, 实时发送各个节点的测量值到控制中心, 确保电力系统的高效经济可靠运行. 但是通信设施的接入, 也让智能电网面临着潜在的网络攻击风险, 成为军事或恐怖活动的目标, 例如2015年12月的乌克兰电网攻击事件, 造成了30个变电站被关闭, 约有23万人无法用电[2]. 特别地, 隐匿虚假数据入侵(False Data Injection, FDI)攻击可以绕过电力系统中传统的坏数据检测机制, 通过篡改测量数据, 使得对电力系统的状态估计不准确, 进而干扰控制中心决策以扰乱电力市场正常秩序, 存在重大的经济和安全隐患[3].

    FDI攻击自2009年提出以来[4], 便受到了国内外学者的广泛关注. 针对不同的FDI攻击场景提出了相应的保护策略和攻击检测方案. 在保护策略方面, 主要是通过放置相量测量单元(Phasor Measurement Units, PMU)来增强通信安全. 注意到PMU是配备有全球定位系统(Global Positioning System, GPS)技术的测量设备, 通过与GPS时间同步, PMU能够为电网中地理上分散的节点提供精确的同步相量测量, 使得攻击者更难以篡改PMU收集的测量数据[5]. 然而, 高昂的成本却制约着大规模地部署PMU, 因此如何找到放置PMU的关键位置以最大限度地减少PMU的数量对于保护电力系统免受FDI攻击起着重要的作用. 为此, Poor等[5]提出了一种关键节点保护机制, 通过选择关键节点实施保护以尽可能提高攻击者的攻击成本. 文献[6]从图论的角度分析智能电网的结构, 提出了一种启发式算法来寻找最佳的测量保护集, 达到防御效果. 与此同时, 在攻击检测方面, Liu等[7]利用状态测量的时间相关性, 以及FDI攻击的稀疏性来检测广义上的FDI攻击[8]. 文献[9]提出了一种分布式状态估计方法, 根据估计结果的偏差判断是否遭受FDI攻击, 且能够准确定位被篡改的状态变量. 对于具有特殊结构的隐匿FDI攻击, 文献[10]-[13]则将其看作是一个统计学习问题, 把历史数据作为训练样本, 根据攻击向量 会让正常测量值与被攻击测量值产生“距离”上的变化这一特征[10], 采用机器学习方法对测量值做分类, 以实现隐匿FDI攻击检测的目的. 具体地, Ozay[10]采用了感知机, k近邻, 支持向量机等经典机器学习方法验证其检测效果. Esmalifalak[11]提出了分布式的支持向量机(Support Vector Machine, SVM)方法, 验证了机器学习方法在隐匿FDI攻击检测中的有效性. 除了传统的机器学习方法, 深度学习因其具有自动提取原始数据特征, 能够提取更深层更抽象特征信息的特性, 也受到了许多学者的关注. 文献[12]便提出了一种基于深度学习的检测机制, 采用深度信念网络(Deep Belief Networks, DBN)作为检测模型, 并结合条件高斯-伯努利受限玻尔兹曼机(Conditional Gaussian-Bernoulli Restricted Boltzmann Machines,CGBRBM)提取 高维时间特征, 以降低训练深度神经网络的复杂度与训练时间, 仿真结果表明其方法比神经网络和SVM的检测方法有更高的检测精度. 文献[13]则针对交流状态估计中的隐匿FDI攻击, 提出了一种结合小波变换和深度神经网络的检测机制, 其中小波变换提取空间上的相关性, 深度神经网络则抓取时域中的特征. 为了得到更好的训练结果, [13]构造了20万个训练样本以保证样本能够包含所有隐匿FDI攻击特征, 最终的训练结果能够很好的提取系统在时域和空间域上的特征, 达到了满意的检测精度, 但在训练过程中也耗费了大量的时间与计算资源.

    虽然传统机器学习方法在检测隐匿FDI攻击方面取得了一些进展, 但都是在训练集和测试集具有高度相似性的前提下得到的, 因此当测试集与训练集出现较大差异时, 传统机器学习方法将很大可能出现差的学习效果. 而且电力系统往往是高度复杂的, 其历史数据的维度往往是几百甚至几千维, 这使得传统机器学习方法面临“维数灾难”的问题, 训练结果容易出现过拟合, 进而限制了泛化能力. 而近年来的深度学习方法的性能虽然不受维数的限制, 但也存在训练时间长、占用大量计算资源的缺陷. 因此, 在利用机器学习方法检测隐匿FDI攻击中, 通过降维避免训练结果过拟合, 减少模型训练时间显得尤为重要. 为此, 本文提出 了基于拉普拉斯特征映射降维的神经网络检测学习机制, 通过拉普拉斯特征映射方法来提取攻击向量的信息, 将测量数据预先降维处理, 再用于训练神经网络得到合 适的检测模型. 在MATPOWER中的IEEE 57-bus上进行了实验验证, 并与没有降维预处理的神经网络训练结果, 深度神经网络训练结果以及利用主成分分析降维预处理后的训练结果做了对比. 实验结果表明, 在智能电网的大规模量测数据压缩降维方面, 拉普拉斯特征映射相比 主成分分析能够很好地提取低维特征, 所提出的方法不仅可以有效的检测出隐匿FDI攻击, 而且其泛化性能优于单独使用神经网络和深度神经网络的检测方法.

    • 电力系统中的状态估计是指根据各个总线上仪表的测量数据, 来估计系统的状态, 其中测量包括总线电压、总线有功和无功功率, 状态变量包括总线电压和电压相角, 其交流潮流模型的表达形式为:

      $$ {\bf{z}} = h({\bf{x}})+{\bf{n}} $$ (1)

      其中, $ {\bf{x}}\in \mathbb{R}^{D} $为电网的状态变量, 即节点电压和相角变量, $ {\bf{z}}\in \mathbb{R}^{N} $为测量向量, 是传感器的测量数据, $ {\bf{n}}\in \mathbb{R}^{N} $是测量噪声, $ h({\bf{x}}) $则表示测量值与状态变量之间的非线性关系, 其形式由电网的拓扑结构及总线上的参数决定[14]. 在这里我们假设噪声服从均值为0, 协方差矩阵为$ {{\Lambda }} $的高斯分布, 且系统的状态在一段时间内的变化是缓慢的, 因此可以通过在操作点附近泰勒展开, 将非线性的交流模型做线性近似, 得到直流潮流模型, 其数学描述为:

      $$ {\bf{z}} = {\bf{H}}{\bf{x}}+{\bf{n}} $$ (2)

      其中$ {\bf{H}}\in\mathbb{R}^{N\times D} $是测量雅可比矩阵, 则状态向量估计可以通过加权最小二乘估计求解得到[15]:

      $$ \hat{{\bf{x}}} = ({\bf{H}}^\intercal{{\Lambda }}{\bf{H}})^{-1}{\bf{H}}^\intercal{{\Lambda }}{\bf{z}} $$ (3)
    • FDI攻击是指攻击者通过篡改传感器中的测量数据使得系统产生错误的状态估计, 进而使控制中心做出错误决策. 当电网遭受到攻击时, 量测方程(2)变为:

      $$ \widetilde{{\bf{z}}} = {\bf{H}}{\bf{x}}+{\bf{a}}+{\bf{n}} $$ (4)

      其中, $ {\bf{a}}\in \mathbb{R}^{N} $为攻击向量. 针对攻击信号$ {\bf{a}} $, 常用的检测方法就是坏数据检测(Bad Data Detection, BDD)[15], 即:

      $$ \gamma = \lVert\widetilde{{\bf{z}}}-{\bf{H}}\hat{{\bf{x}}}\rVert_{2} $$ (5)

      当测量残差超过一定阈值$ \gamma>\epsilon_0 $, 就判断为受到攻击, 其中$ \epsilon_0 $为需要设定的阈值.

      从BDD检测机制来看, 如果攻击者知道系统的拓扑结构$ {\bf{H}} $, 可以构造隐匿FDI攻击向量$ {\bf{a}} = {\bf{H}}{\bf{c}} $在不改变测量残差的情况下对系统状态估计造成影响[4]. 当遭遇隐匿FDI攻击时, 由式(5)可得:

      $$ \begin{array}{l} \begin{split} \gamma =& \lVert\widetilde{{\bf{z}}}-{\bf{H}}\hat{{\bf{x}}}\rVert_{2} =\\& \lVert\widetilde{{\bf{z}}}-{\bf{H}}({\bf{H}}^\intercal{{\Lambda }}{\bf{H}})^{-1}{\bf{H}}^\intercal{{\Lambda }}\widetilde{{\bf{z}}}\rVert_{2}= \\& \lVert{\bf{n}}-{\bf{H}}({\bf{H}}^\intercal{{\Lambda }}{\bf{H}})^{-1}{\bf{H}}^\intercal{{\Lambda }}{\bf{n}}\rVert_{2} \end{split} \end{array} $$ (6)

      从上式可以看出测得的残差$ \gamma $的大小只受噪声影响, 传统的BDD检测方法并不能检测出隐匿虚假数据入侵攻击.

      然而要构造这类攻击也并不容易, 攻击者需要掌握电网系统的各种电气参数和拓扑信息($ {\bf{H}} $雅可比矩阵), 或者掌握系统所有的测量信息, 利用主成分分析(PCA)构造攻击向量[16]. 即使攻击者能够掌握这些信息, 也会受到各种资源等因素的限制, 只能篡改部分测量设备的数据. 因此在这里我们定义$ I = \{i_1,\cdots,i_k\} $表示攻击者无法篡改的测量的下标集合, $ \bar{I} $为对应的补集, 则雅可比矩阵$ {\bf{H}} $可以拆分为$ {\bf{H}}_I $$ {\bf{H}}_{\bar{I}} $两部分, $ {\bf{H}}_{I} $表示集合$ {I} $中下标对应的行, $ {\bf{H}}_{\bar{I}} $则为补集$ \bar{I} $中下标对应的行, 从而隐匿FDI攻击可以表示为如下形式:

      $${\bf{a}} = \left[ {\begin{array}{*{20}{c}} {{{\bf{H}}_{\bar I}}{\bf{c}}}\\ {{{\bf{H}}_I}{\bf{c}}} \end{array}} \right]$$ (7)

      其中,$ {\bf{H}}_{\bar{I}}{\bf{c}} $表示能被篡改数据的部分, $ {\bf{H}}_{I}{\bf{c}} $则是不能篡改的部分. 因此只要令$ {\bf{H}}_{I}{\bf{c}} = 0 $, 通过求解出的$ {\bf{H}}_{I} $零空间, 如果有非零解, 且$ {\bf{H}}_{\bar{I}}{\bf{c}} $的元素不全为零, 就可以构造出满足隐匿条件的攻击向量$ {\bf{a}} $. 上述构造方法能保证构造出来的攻击向量攻击者都可以实现. 从中我们也可以发现当$ {\bf{H}}_{I} $列满秩时, $ {\bf{H}}_{I}{\bf{c}} = 0 $只有零解, 意味着攻击者无法进行隐匿虚假数据入侵.

      通过上述分析, 攻击者可以构建针对直流状态估计的攻击向量, 且不会被基于残差的坏数据检测方法检测到. 因此如何设计一种隐匿FDI攻击的检测方法是本文要解决的问题.

    • 由(1.2)节可知, 隐匿FDI攻击可以绕过传统的坏数据检测, 故如何基于机器学方法训练分类器以识别系统是否受到攻击 为这一问题提供了可行的解决思路. 然而, 随着电网规模的不断扩大, 测量数据的维数也成倍增长, 进而导致机器学习 检测方法面临维数灾难挑战, 使得训练结果存在陷入过拟合的风险. 为了克服上述缺点, 本文提出了如下图所示的检测机制:

      图  1  基于拉普拉斯特征映射降维学习的检测机制

      Figure 1.  Detection mechanism based on laplacian eigenmaps

      首先我们采用拉普拉斯特征映射对历史数据进行降维预处理, 从而提取低维流形特征, 使降维后的数据相比原始数据更易处理, 然后借助于神经网络学习方法训练分类器以实现隐匿FDI攻击信号的检测.

    • 拉普拉斯特征映射(Laplacian Eigenmaps, LE)是一种非线性的降维方法, 用局部的角度去构建数据之间的关系, 可以反映出数据内在的流形结构[17]. 它的直观思想是希望相互间有关系的点在降维后的空间中尽可能的靠近, 其最小化的目标函数是:

      $$\sum\limits_{ij} {{{\left( {{u^{(i)}} - {u^{(j)}}} \right)}^2}} {w_{ij}}$$ (8)

      其中, $ u^{(i)} = \left(u_{1}^{(i)},u_{2}^{(i)},\cdots,u_{n}^{(i)}\right)^\intercal $为样本$ z^{(i)} $降到n维后的点, $ w_{ij} $是测量样本$ z^{(i)} $$ z^{(j)} $之间的连接权重.$ w_{ij} $是根据两个样本点是否接近来确定的, 首先利用(k-Nearest Neighbor, kNN)方法确定是否在样本$ z^{(i)} $$ z^{(j)} $之间设置边连接, 若$ z^{(i)} $$ z^{(j)} $$ k $个最近邻居中, 则将$ z^{(i)} $$ z^{(j)} $相连, $ k $是一个预先设定的值, 或者设定合适的$ \varepsilon $, 将$ \lVert{z^{(i)}-z^{(j)}}\rVert^{2}\leq\varepsilon $的节点相连接; 然后确定权重大小, 采用Heat kernel函数, 将相连节点的权重设置为$ \displaystyle w_{ij} = e^{-\frac{\lVert{z^{(i)}-z^{(j)}}\rVert^{2}}{t}} $, 这里的$ t $为预先设定的值, 也可以令$ t = \infty $, 简单的将所有相连节点的权重设为$ w_{ij} = 1 $, 其他未连接的均为0; 最终可以得到一个对称邻接矩阵$ W $.

      通过最小化目标函数(8), 保证了相近的$ z^{(i)} $$ z^{(j)} $映射后$ u^{(i)} $$ u^{(j)} $两点仍能够保持相近. 目标函数经过整理后可以表示为如下二次型的形式:

      $$ \begin{array}{l} \begin{split} &\sum_{ij}\lVert{u^{(i)}-u^{(j)}}\rVert^{2}w_{ij}=\\ &\sum_{ij}\left(\lVert{u^{(i)}}\rVert^{2}+\lVert{u^{(j)}}\rVert^{2}-2\left(u^{(i)}\right)^{\intercal}\left(u^{(j)}\right)\right)w_{ij}=\\ &\sum_{i}\lVert{u^{(i)}}\rVert^{2}D_{ii}+\sum_{j}\lVert{u^{(j)}}\rVert^{2}D_{jj}-\\&2\sum_{i,j}\left(u^{(i)}\right)^{\intercal}\left(u^{(j)}\right)w_{ij}=\\ &2{\bf{u}}^{\intercal}L{\bf{u}} \end{split} \end{array} $$ (9)

      其中, $ {\bf{u}} = \left(u^{(1)},u^{(2)},\cdots,u^{(m)}\right)^{\intercal} $, m表示样本集中的样本数量, $ L = D-W $为拉普拉斯矩阵, $ D $是一个对角矩阵, 满足$ D_{ii} = \sum_{j}w_{ij} $, $ W $是一个对称邻接矩阵, 且拉普拉斯矩阵$ L $是半正定的.

      最终需要求解如下最小化问题:

      $$ \begin{array}{l} \begin{split} \mathop{\arg\min}_{{\bf{u}}}\quad{\bf{u}}^{\intercal}L{\bf{u}} \\\mbox{s.t.}\quad{\bf{u}}^{\intercal}D{\bf{u}} = 1 \end{split} \end{array} $$ (10)

      其中, 约束$ {\bf{u}}^{\intercal}D{\bf{u}} = 1 $避免了缩放的影响, 最小化目标函数的向量$ {\bf{u}} $由广义特征值问题的最小特征值解给出[16]:

      $$ L{\bf{u}} = \lambda D{\bf{u}} $$ (11)

      求解得到的非零特征值所对应的特征向量就是降维后的输出.

      通过上述方法将训练样本降维处理, 选择最大的两个广义特征值对应的广义特征向量作为低维流形特征. 然后基于低维流形特征, 建立如图2所示的三层神经网络, 有输入层、隐藏层和输出层组成[18].

      图  2  神经网络示意图

      Figure 2.  Neural network

      其中, 输入层有2个神经元组成, 为原始数据降维后得到的$ u = (u_{1},u_{2})^{\intercal} $. 隐藏层由5个神经元组成, 通过下式计算得到:

      $${t_h} = \sigma \left( {\sum\limits_{i = 1}^2 {{\omega _{hi}}} {u_i} + {\omega _h}} \right),\quad h = 1,2, \cdots ,5$$ (12)

      其中, $ \omega_h $对应每个隐藏层神经元的偏置, $ \omega_{hi} $对应输入$ u_i $到神经元$ t_h $的权重, $ \sigma $则是激活函数$\displaystyle \sigma(x) = \frac{1}{1+e^{-x}} $. 最后输出层有2个神经元$ \hat{y}_1,\hat{y}_2 $组成, 当他们的输出值大于0.5时, 分别表示受到攻击与未受到攻击两种检测结果, 其表达式为:

      $${\hat y_j} = \sigma \left( {\sum\limits_{h = 1}^5 {{\upsilon _{jh}}} {t_h} + {\upsilon _j}} \right),\quad j = 1,2$$ (13)

      其中, $ \upsilon_j $为对应输出的偏置, $ \upsilon_{jh} $为对应输入$ t_h $到输出$ \hat{y}_j $的权重. 最后通过求解以下最优化问题来训练得到权重$ \omega_{hi},\upsilon_{jh} $和偏置$ \omega_h,\upsilon_j $:

      $$\min \frac{1}{2}\sum\limits_{k = 1}^m {\sum\limits_{j = 1}^2 {{{\left( {{y_{kj}} - {{\hat y}_{kj}}} \right)}^2}} } $$ (14)

      其中, $ y_{kj} $为样本$ x_k $的标签. 综上所述, 最终的检测算法步骤归纳如下:

      算法

      Step 1. 收集历史测量数据

      $ Z = \left[z^{(1)},\cdots,z^{(m)}\right]^{\intercal} $

      Step 2. 拉普拉斯特征映射降维预处理

      A. 构建邻接矩阵$ W $

      For $ i = 1,\cdots,m $

      For $ j = 1,\cdots,m $

      if $ z^{(j)} $$ z^{(i)} $$ k $个邻居中

      $ w_{ij} = e^{-\frac{\lVert{z^{(i)}-z^{(j)}}\rVert^{2}}{t}} $

      else

      $ w_{ij} = 0 $

      B. 特征映射

      求解广义特征问题

      $ L{\bf{u}} = \lambda D{\bf{u}} $

      得到降维处理后的样本

      $ {\bf{u}} = \left(u^{(1)},u^{(2)},\cdots,u^{(m)}\right)^{\intercal} $

      Step 3. BP算法训练神经网络

      在0附近初始化权重$ \omega_{hi},\upsilon_{jh} $和偏置$ \omega_{h},\upsilon_{j} $

      Repeat

      for all $ \left(u^{(k)},y_k\right) $ do

      1)计算当前样本的输出$ \hat{y}_k $

      2)计算输出层梯度

      $ g_j = \hat{y}_{kj}\left(1-\hat{y}_{kj}\right)\left(y_{kj}-\hat{y}_{kj}\right) $

      3)计算隐藏层梯度

      $ e_h = t_h\left(1-t_h\right)\sum_{j = 1}^{2}\upsilon_{jh}g_j $

      4)更新权重$ \omega_{hi},\upsilon_{jh} $和偏置$ \omega_{h},\upsilon_{j} $

      $ \upsilon_{jh} = \upsilon_{jh}+\eta g_jt_h,\upsilon_{j} = \upsilon_{j}+\eta g_j $

      $ \omega_{hi} = \omega_{hi}+\eta e_hu_i,\omega_{h} = \omega_{h}\eta e_h $

      end

      Until达到停止条件

      Step 4. 将新的测量放入历史数据降维处理, 作为神经网络检测模型的输入, 得到检测结果

    • 本文利用IEEE 57-Bus系统模型验证所提出隐匿FDI攻击检测方法的优点和有效性, 即: 采用LE降维、PCA降维的样本集分别训练了神经网络检测模型, 以及未降维预处理的样本集训练了神经网络与深度神经网络模型 并做对比与分析, 其中系统的测量雅可比矩阵$ {\bf{H}} $来自MATPOWER工具箱[19]. 通过对MATPOWER中的案例进行潮流计算得到电网的系统状态$ x\in \mathbb{R}^{D} $, 并用于计算得到系统的量测$ z\in \mathbb{R}^{N} $. IEEE 57-Bus系统如图3所示, 其中状态维数$ D = 113 $, 测量维数$ N = 217 $, 这些测量信息将作为本文提出学习算法的训练样本.

      图  3  IEEE 57-Bus系统

      Figure 3.  IEEE 57-Bus system

    • 在实验中, 我们考虑攻击者可以访问系统中的$ k $个测量, 可以理解为电网系统中, 这$ k $个测量存在被FDI攻击的隐患, 而其余的测量受到保护. 例如: 在这$ k $个节点配备了PMU, 则测量信息不易被篡改. 事实上, 由于成本限制, 电网系统不能在每个节点上设置PMU; 与此同时, 攻击者往往也只能够入侵电网中的部分测量, 因此这种假设符合实际情况. 注意到当$ k\leq104 $时, 意味着系统中受保护的节点超过状态的维数, 从被攻击者的角度, 防御方完全可以选取合适的量测节点, 使得$ {\bf{H}}_{I}{\bf{c}} = 0 $只有零解, 让攻击者无法构造隐匿FDI攻击[10]. 因此, 在实验中我们选取了$ k = 190,170,150,130 $四种攻击场景做了仿真验证. 且为了令构造的攻击向量更有“实际意义”, 能够对智能电网系统造成有效的影响, 我们还对攻击引起的状态向量变化做了进一步地限制.

      $$ \lVert{\bf{c}}\rVert_{\infty}\geq\tau $$ (15)

      其中, $ {\bf{c}} $为隐匿FDI攻击对系统状态的影响, 即隐匿FDI攻击要对智能电网系统中至少一个状态造成超过大小为$ \tau $的篡改. 由于在现实中针对电力系统的网络攻击案例并不多见, 且很难得到真实的数据, 因此我们还不能确定$ \tau $值的大小, 对此我们在仿真实验中设置了$ \tau = 1,5,10,15 $这四种情况来分别检验所提出方法的有效性.

      此外, 为了验证检测模型的泛化能力, 我们设置了不同的环境噪声$ N(0,\sigma) $, $ \sigma = 0.01,0.25,0.50,0.75,1.00 $. 通过求解$ {\bf{H}}_{I}{\bf{c}} = 0 $, 构造隐匿攻击向量$ a $, 并针对不同的$ \tau,k $$ \sigma $重复1 000次来分别生成训练和测试样本$ Z = [z^{(1)},\cdots,z^{(m)}]^{\intercal} $. 训练和测试的样本中分别包含500个被攻击的样本和500个未被攻击的样本. 根据前文式(7)的隐匿FDI攻击构造方法, 我们设置环境噪声$ \sigma = 0.01 $, 状态变化阈值$ \tau = 10 $, 得到一个篡改了18个测量数据的隐匿FDI攻击, 其对系统状态估计的影响如图4所示.

      图  4  隐匿FDI攻击对系统状态估计的影响

      Figure 4.  The effect of stealthy FDI attack on system state estimation

      图4可以看到所构造的隐匿FDI攻击对系统中的部分状态估计产生了很大的影响. 例如: 节点20, 30, 50, 51以及52的电压相角都出现了不同大小的偏差, 而系统的残差几乎没有变化, 攻击前的残差为0.0688, 攻击后的残差为0.0895. 其中节点30的状态变化如图5所示, 从第20分钟开始受到隐匿FDI攻击, 攻击持续时间为十分钟.

      图  5  节点30的状态变化曲线

      Figure 5.  The state curve of node 30

      进一步地, 在不同环境噪声下的系统被隐匿FDI攻击前后的平均残差变化如图6所示, 被攻击后的残差变化很小, 可见利用残差检测的方法对隐匿FDI攻击是无效的, 且环境噪声变化对残差的影响也很显著.

      图  6  不同环境噪声下的残差变化

      Figure 6.  Residual change under different environmental noise

    • 将样本集进行拉普拉斯特征映射降维处理, 取最小的两个非零特征值对应的广义特征向量, 数据降维后的二维空间分布如图7所示.

      图  7  LE降维后的样本点分布

      Figure 7.  Sample distribution after LE dimension reduction

      此外, 我们也比较了PCA降维的效果, 采用PCA方法选择协方差矩阵最大的两个特征值对应的特征向量, 将高维数据压缩到二维, 降维后的样本点分布如图8所示.

      图  8  PCA降维后的样本点分布

      Figure 8.  Sample distribution after PCA dimension reduction

      图7图8可以看到直接用PCA方法将数据降到二维丢失了许多主成分信息, 降维后样本点是杂糅在一起的, 而应用拉普拉斯特征映射降维后, 正常的测量数据都聚集在一起, 且与被攻击样本有明显的分离, 便于机器学习方法找到决策平面. 拉普拉斯特征映射降维方法之所以能够很好的区分数据点, 是因为两类数据间的距离存在如下的关系[10]:

      $${\left\| {{{\bar z}_i} - {{\bar z}_j}} \right\|_2} = \left\{ {\begin{aligned}& {{{\left\| {{z_i} - {z_j}} \right\|}_2} + {{\left\| {{a_i} - {a_j}} \right\|}_2}}\;\;{{\rm{if}}\;i,j \in \bar S}\\& {{{\left\| {{z_i} - {z_j}} \right\|}_2} + {{\left\| {{a_i}} \right\|}_2}}\;\;\;\;\;\;\;\;\;\;{{\rm{if}}\;i \in \bar S,j \in S}\\& {{{\left\| {{z_i} - {z_j}} \right\|}_2}}\qquad \qquad\qquad\;{{\rm{if}}\;i,j \in S} \end{aligned}} \right.$$ (16)

      其中, $ S $表示正常样本的集合, $ \bar{S} $表示被攻击样本的集合, $ \bar{z}_i $,$ z_i $分别为正常测量和被攻击的测量, $ a_i $为攻击向量, 可以看出被攻击的样本和未被攻击的样本存在一定的距离$ \lVert a\rVert_2 $. 拉普拉斯特征映射在构建邻接图的时候也抓取了这些信息, 只要选取合适的邻居个数$ k $, 就可以使得所有未被攻击的样本点之间有一个非零的权重, 且与被攻击的样本无连接. 最后通过求解优化问题, 使得$ S $中的样本降维后尽可能接近, 而且尽可能不包含$ \bar{S} $中的样本, 因此具有区分异常点的特性.

    • 本文采用接受者操作特征(Receiver Operating Characteristic, ROC)曲线中的假阳性率($ FPR $, False Positive Rate)和准确率($ ACC $, Accuracy)作为评价各个算法优劣的指标, $ FPR $$ ACC $计算方式如下:

      $$\left\{ {\begin{aligned}& {FPR = FP/\left( {FP + TN} \right)}\\& {ACC = \left( {TP + TN} \right)/\left( {TP + FN + FP + TN} \right)} \end{aligned}} \right.$$ (17)

      其中, $ TP $$ FP $$ TN $$ FN $分别表示正确分类的被攻击样本、错误分类的正常样本、正确分类的正常样本和错误分类的被攻击样本. $ FPR $表示正常样本被误分为被攻击的概率, 定义为误报率, $ ACC $则为所有样本被正确分类的概率, 定义为检测精度. 我们希望检测精度高的同时, 发生误报的概率也尽可能的低, 因为即使是1 %的误报率, 在不断生成的测量数据面前, 也会产生频繁的误报, 对电网控制带来很大影响, 所以我们的目标是$ ACC $指标尽可能高, 而$ FPR $指标尽可能低, 或者为零.

      这里取噪声方差为$ \sigma = 0.01 $, 状态变化阈值$ \tau = 10 $, 生成原始样本集, 用于训练深度神经网络和一个三层的神经网络, 并将LE降维处理后和PCA降维处理后的样本集分别训练神经网络, 其中深度神经网络我们采用了长短时记忆网络(Long Short-Term Memory,LSTM)[20], 由输入特征数为217的输入层, 具有100个隐藏单元的双向LSTM层, 大小为9的全连接层, softmax层和分类层五层结构组成. 则它们的迭代收敛效果如图9所示. 由此图可知发现, 基于拉普拉斯特征映射降维的神经网络均方误差最小, 与深度神经网络的均方误差一致, 且收敛速度要比深度神经网络快很多, 与而基于主成分分析的神经网络收敛效果不明显, 均方误差较大.

      图  9  收敛效果

      Figure 9.  Convergence Performance

      然后将训练好的检测模型在另外的测试样本中检验检测精度与误报率, 通过多次的训练并测试, 得到各个算法的ROC曲线如图10-11所示.

      图  10  四种检测机制在不同隐患测量数k下的检测精度ACC

      Figure 10.  Detection accuracy of four detection mechanisms

      图  11  四种检测机制在不同隐患测量数k下的误报率FPR

      Figure 11.  The false positive rate of four detection mechanisms

      图10-11可以看出, 基于神经网络的检测方法有较高的检测精度, 精度可以达到90 %左右, 但是误报率达到了8 %左右, 这意味着平均每$ 100 $次检测, 会错误报警$ 8 $次, 因此在实际当中不能将神经网络方法直接用于隐匿FDI攻击检测. 而采用PCA降维预处理的训练结果, 由于丢掉了大部分主成分信息, 检测效果反而下降明显, 其误报率也达到了30 %以上. 此外, 深度神经网络具有很高的检测精度, 均达到了98 %以上, 且误报率都在0.3 %以下. 最后本文的检测机制的检测精度均达到了95 %以上, 且误报率均在0.5 %以下, 最少能达到0.1 %, 相比神经网络的方法, 基于LE降维学习方法的检测精度提升明显, 且十分接近深度神经网络的检测效果.

      此外, 为了验证检测模型的泛化能力, 我们在隐患测量数$ k = 150 $, 状态变化阈值$ \tau = 10 $的情景下, 用上述训练得到的检测模型分别对不同噪声环境下的测试样本做了检测, 其中PCA降维预处理的检测模型由于测试精度不高, 便不再讨论其泛化性能, 检测结果如图12-13所示.

      图  12  四种检测方法在不同环境噪声中的检测精度ACC变化

      Figure 12.  Detection accuracy of three detection mechanisms in different environmental noises

      图  13  四种检测方法在不同环境噪声中的误报率FPR变化

      Figure 13.  False positive rate of three detection mechanisms in different environmental noises

      图12-13中的仿真结果可以看出, 单纯神经网络检测方法的性能易受到环境噪声变化的影响, 噪声变大时, 检测精度下降明显, 误报率也在7 %以上. 深度神经网络的检测精度也在噪声变大时, 出现了一定幅度的下降, 但也保持了90 %以上的检测精度和5 %以下的误报率. 而本文提出的检测机制几乎不受噪声变化的影响, 随着噪声增大, 检测精度并没有显著下降, 仍均有95 %以上的检测精度, 误报率也不超过0.8 %. 因此, 与神经网络方法相比, 所提出的LE降维学习方法具有更好的泛化性能和鲁棒性.

      最后, 考虑到状态变化阈值的选取对检测结果会有明显的影响, 我们在隐患测量数$ k = 150 $, 噪声方差为$ \sigma = 0.01 $的情景下, 用上述训练得到的检测模型对不同的$ \tau $值的测试样本做了检测, 检测结果如下图所示.

      图14可以看出, 系统状态量篡改的幅值越大, 检测效率也越高, 而当攻击改变的状态量较小时, 三种方法的检测精度都有显著的降低, 其中本文提出的检测机制受阈值影响最小, 可见本文所提出方法具有很好的鲁棒性.

      图  14  阈值$\tau$对检测精度的影响

      Figure 14.  The effect of threshold $\tau$ on detection accuracy

    • 本文针对电力系统中隐匿FDI攻击信号的检测问题, 利用拉普拉斯特征映射将历史数据映射到低维空间, 然后通过构建合适的神经网络结构以建立相应的检测模型, 从而形成基于拉普拉斯特征映射降维学习的隐匿FDI攻击信号检测机制. 最后通过IEEE 57-Bus模型验证了这种检测机制的有效性. 仿真结果表明采用拉普拉斯特征映射方法能够使正常的测量数据与受攻击的数据很好地分离; 相比于神经网络方法, 这种检测机制能明显提升检测精度, 达到与深度神经网络接近的检测效果. 进一步的, 相比于深度神经网络, 本文的方法不仅能有相似的检测精度, 并且在训练时间上花费更少, 且具有更好的泛化能力.

参考文献 (20)

目录

    /

    返回文章
    返回