-
摘要: 由于复杂装备系统缺少可工程应用的弹性度量方法, 且传统可靠性工程难以描述装备从故障到修复全过程的性质, 因此考虑装备系统在工作过程中性能变化的连续性以及扰动、故障和修复的不确定性, 利用可靠性工程相关参数, 针对无子系统的简单装备提出一种混合型弹性度量方法. 在此基础上, 考虑子系统对复杂系统的影响, 以及复杂系统故障和修复概率, 提出一种针对复杂装备系统的弹性度量方法. 最后, 通过基于弹性理论的组件重要度计算案例, 评估复杂装备系统各个子系统性能变化对整个装备的影响重要程度, 验证了方法的可行性和有效性.Abstract: Because of the engineering resilience theory has few applicable measurement formulas for equipment systems, and because of the traditional reliability engineering is difficult to describe the whole process of equipment from fault to repair, considering the continuity of performance change and the uncertainty of disturbance, fault occurrence and repair in the working process of the equipment system, a hybrid resilience measurement method is proposed for the simple equipment without subsystems by using the parameters of reliability engineering. On this basis, considering the influence of subsystems on complex systems and the possibility of complex system failure and repair, a resilience measurement method for complex equipment systems is proposed. Finally, a component importance calculation method based on resilience theory is presented to evaluate the influence of the performance change of each subsystem overall complex equipment system, and the effectiveness of the method is verified by simulation.
-
Key words:
- Resilience /
- reliability engineering /
- complex system /
- component importance
-
在可靠性工程领域中, 已开展了可靠性[1]、鲁棒性[2]、恢复性[3]等相关研究, 但大部分是针对装备从故障到修复过程中的某一阶段, 难以从系统的角度描述装备全过程的性能变化情况. “弹性”自引入生态学以来, 就得到了各个领域的关注, 并快速发展, 其主要用于描述“系统遭受扰动后, 抵御、吸收和恢复的能力”[4], 能够更为全面地反映装备从遭受故障到修复的整个过程.
2004年, Leveson[5]在研究系统安全工程时, 提出了一种新的事故发生模型, 奠定了弹性工程的基础. 随后, 越来越多的学者对弹性的概念进行了研究[6-9]. Henry等[10]认为“弹性”不同于可靠性工程, 其本质是依赖于时间的函数, 并将弹性过程分为三个状态和两个过程(如图1所示). 目前, 大量研究主要集中于军事系统[11-14]和弹性电网[15-18]方面, 研究焦点也逐渐从定义转向弹性建模和度量[19].
弹性度量是弹性工程从定性研究走向定量研究的关键. 不同学者因研究对象不同, 在对系统弹性进行度量时也有所侧重[20-21], 并没有统一的标准化方法. 目前关于弹性度量的研究主要是从系统弹性定义出发, 并围绕系统性能下降情况和恢复情况展开, 其主要可以分为确定型度量和概率型度量两大类[22-23].
确定型度量方法主要是依据系统弹性过程中性能的变化来度量系统的弹性. Bruneau等[24]和Cimellaro等[25]分别将系统遭受扰动至性能恢复过程中性能的损失和剩余性能作为弹性的度量, 黄浪等[26]将系统性能的下降与应有性能之比作为弹性的度量, 可以看作是Bruneau方法的归一化. Reed等[27]、Zobel等[28-29]和Ouyang等[30-31]也都是以性能变化积分的形式对弹性进行度量. Li等[32]在以积分形式对弹性度量的基础上, 增加了恢复时间作为弹性的度量方式. 以上方法都假设系统性能变化是唯一确定的, 并没有考虑扰动及性能变化的不确定性.
概率型度量是考虑到系统受到扰动、性能降低以及恢复时间都存在随机性, 利用概率等参数进行度量的方法. Bruneau等[24]通过系统性能降级和恢复时间达到阈值的概率进行度量, Chang等[33]给出了具体公式. 与之类似, Li等[34]用系统在${t_0}$时刻处于故障域且在${t_1}$时刻处于安全域的概率度量弹性. Cimellaro等[25]通过考虑多种不确定因素的期望对弹性进行度量. 上述方法主要考虑了系统遭受扰动后的不确定性, 但并未考虑遭受扰动后系统性能变化过程的连续性. Ouyang等[30-31]将系统性能积分比概率化后求期望对弹性进行度量, 虽然无法得到具体的概率分布, 但该方法很好地建立起了概率型度量和确定型度量之间的联系.
上述方法均通过性能变化及相关概率等通用的系统描述方式进行弹性度量, 并未涉及系统自身所固有的特定属性, 因此, 也有不少学者考虑系统的特殊性, 通过系统固有参数对弹性进行度量. 石建伟等[35]在对军事体系超网的研究中, 以性能恢复时间度量系统弹性. 崔琼等[36]针对指挥信息系统超网, 将系统各阶段能力的乘积作为系统弹性的度量. 荣明等[37]在对作战体系进行研究时, 将各个系统的鲁棒性(性能降低程度和速度)和恢复性(性能恢复程度和速度)进行整合, 得出体系结构弹性的度量. Zhang等[38]利用网络固有参数分别定义了边弹性和节点弹性, 通过对网络流速的分析, 并结合上述两种弹性得出网络弹性的度量.
由于装备系统所遭受扰动的不确定性、遭受扰动后性能变化的多样性, 以及装备性能变化过程的连续性, 单独采用确定型、概率型度量方法或直接通过固有参数对弹性进行描述, 均难以反映装备从故障到修复全过程的性能. 因此, 本文主要从弹性工程理论出发, 采用装备固有的可靠性工程参数, 考虑装备性能变化全过程和不确定性, 对复杂装备系统进行度量. 本文的主要内容安排如下: 第1节提出了一种简单装备系统弹性度量方法; 第2节结合子系统性能和系统结构对整个系统的影响, 对复杂装备系统弹性进行了度量; 第3节是弹性度量的一个应用案例, 对给定系统下参数变化对弹性的影响以及基于弹性度量的组件重要度进行了仿真分析; 第4节对全文进行了总结.
1. 简单装备系统弹性度量方法
在某项任务中, 装备系统的弹性过程表现为遭受扰动至系统恢复. 其中性能恢复既可以从系统工程的角度通过任务重组, 使其现有能力能够满足新任务的需求; 也可从装备本身出发, 通过对故障件的维修使性能得到恢复. 本文主要考虑装备可靠性工程相关理论, 从装备故障和修复的角度出发对弹性过程进行描述, 即装备系统所受扰动并造成影响的形式主要表现为故障, 性能恢复过程为故障修复.
其遭受扰动后的弹性过程为装备故障并修复的过程. 因此, 选取装备固有的可靠性工程参数对弹性进行度量, 可以将装备的维护、故障、维修等过程联系起来, 系统地描述装备性能变化全过程.
装备系统从结构复杂性上可分为简单系统和复杂系统. 其中, 简单系统为不包含子系统的装备系统, 通常为装备最小可更换单元, 故障模式单一, 其可靠性工程参数如故障率、平均故障间隔时间(Mean time between failure, MTBF)、修复率和平均故障修复时间(Mean time to repair, MTTR)唯一确定.
1.1 弹性度量表征参数
1)故障率: 是装备在t时刻发生故障的概率, 是与时间相关的函数, 反映装备的可靠性. 对于典型装备故障服从“浴盆曲线”, 其工作稳定后故障率近似为常数.
2) MTBF: 标志着一个装备平均无故障时间, 为该型装备寿命的平均值, 反映装备的可靠性.
3)修复率: 是装备在t时刻被修复的概率, 反映装备的修复性. 当维修时间服从指数分布时, 修复率为常数.
4) MTTR: 是排除故障所需实际修复时间的平均值, 包含了维修时间和维修等待时间, 反映装备的修复性.
以上参数根据装备的不同服从不同的分布(如指数分布、对数正态分布等)[39], 在工程上可通过统计或加速寿命试验得到近似值.
1.2 混合型弹性度量方法
对于装备系统, 单一采用确定型或概率型弹性度量均难以全面描述装备系统的弹性过程, 需充分考虑性能变化的连续性和故障发生及修复的不确定性.
在Cimellaro等[25]关于弹性度量方法的基础上, 考虑一簇可能发生的性能变化, 若令${\boldsymbol{Q}}(t)$表示系统在扰动后性能变化曲线的集合, 且${Q_i}(t) \in {\boldsymbol{Q}}(t)$, $P(i)$为对应曲线的概率, 则装备系统弹性的度量表达式可表示为
$$R = \sum\limits_{{Q_i} \in {\boldsymbol{Q}}} {P(i)\int {{Q_i}(t){\rm{d}}t} } $$ (1) 其中, 性能变化曲线由扰动和恢复事件、性能变化情况及整个过程耗时共同确定. 但性能变化曲线通常难以直接获得, 对于具体系统, 必须从其特性出发得到可行的弹性度量表达式. 考虑弹性过程的连续性和随机性, 将系统弹性表示为弹性过程的几个阶段之和.
$$R = \frac{{\sum\limits_X {\sum\limits_{{{\boldsymbol{Q}}_F}} {\sum\limits_{{{\boldsymbol{Q}}_R}} {({R_1} + {R_2} + {R_3} + {R_4})} } } }}{{t_2^* - {t_0}}}$$ (2) 式中, R为系统弹性, X为扰动事件的集合, ${{\boldsymbol{Q}}_F}$为性能降级曲线的集合, ${{\boldsymbol{Q}}_R}$为性能恢复曲线的集合, ${t_0}$和$t_2^*$分别为扰动发生时刻和系统允许的最大恢复时刻, ${R_i},\; {i = 1, \cdots ,4}$, 分别为系统在性能降级、性能维持、性能恢复和性能恢复后四个阶段中, 系统性能可能发生的一簇变化积分的期望, 其中后一阶段可能的性能变化与前一阶段性能的变化情况相关.
图2阴影部分面积为某次扰动后系统剩余性能的积分, 式(2)为系统剩余性能积分的期望与系统应有性能积分(图中矩形ABCD面积)之比. $R_1 $ ~ $R_4 $分别为图中矩形$ABB_1A_1 $、$A_1B_1B_2A_2 $、$A_2B_2B_3A_3 $、$A_3B_3CD^* $阴影部分面积, 表达式为
$${R_1} = {P_F}(x){P_{Fq}}({Q_F}|x)\int_{{t_0}}^{{t_1}} {{Q_F}(t){\rm{d}}t} $$ (3) $${R_2} = {P_F}(x){P_{Fq}}({Q_F}|x){P_{Rq}}({Q_R}|x,{Q_F})\int_{{t_1}}^{t_1^*} {{Q_F}({t_1}){\rm{d}}t} $$ (4) $${R_3} = {P_R}(x){P_{Rq}}({Q_R}|x,{Q_F})\int_{t_1^*}^{{t_2}} {{Q_R}(t){\rm{d}}t} $$ (5) $${R_4} = {P_R}(x){P_{Rq}}({Q_R}|x,{Q_F})\int_{{t_2}}^{t_2^*} {{Q_R}({t_2}){\rm{d}}t} $$ (6) 其中, ${P_F}(x)$是系统发生扰动$x$的概率; ${P_F}({Q_F}|x)$是系统在扰动x条件下性能降低曲线为QF(t)的条件概率; ${P_R}(x)$是系统在扰动x下的恢复率; ${P_R}({Q_R}| x, {Q_F})$是系统在扰动x, 性能降低曲线${Q_F}(t)$条件下, 性能恢复曲线为${Q_R}(t)$的条件概率; ${t_1}$, $t_1^*$, ${t_2}$和$t_2^* $分别是系统性能降级完毕时刻、性能开始恢复时刻、性能恢复完毕时刻以及系统允许的最大恢复时间, 由扰动$x、$性能降级过程和性能恢复过程共同确定.
1.3 简单装备系统弹性度量
装备系统扰动主要来自于装备故障, 性能恢复来自维修事件. 因此, ${P_F}(x)$为系统发生故障$x$的概率, ${P_R}(x)$为系统在故障$x$时的修复率. 对于简单装备系统, 由于故障模式单一, 上述参数可以用装备的故障率${P_F}$和修复率${P_R}$表示, 且条件概率${P_F}({Q_F}|x) = 1$, ${P_R}({Q_R}|x,{Q_F}) = 1$.
通常情况下, 故障瞬间装备系统性能降低至某一恒定值, 并且在修复完成时刻性能恢复至一定水平. 因此, 根据式(1) ~ (5), 简单装备系统的弹性度量可以表示为
$$\begin{split} R = \;&(1 - {P_F}) +\frac{1}{T} {P_F}({P_R}({{MTTR}} \times {q_F}\; +\\ & {{MTBF}} \times {q_R}) + (1 - {P_R}){q_F}T) \end{split} $$ (7) 其中, ${P_F}$为装备的故障率, ${P_R}$为修复率, ${q_F}$为归一化的系统降级后性能, ${q_R}$为归一化的系统修复后性能, $T = {{MTTR}} + {{MTBF}}$. 图3展示了装备系统发生故障并恢复的性能变化过程, R为图中阴影部分面积与$ABCD $面积之比的期望.
式(7)主要分为两部分: 第1部分$1 - {P_F}$表示系统无故障的情况; 第2部分${P_F}({P_R}({{MTTR}} \times {q_F} + {{MTBF}} \times {q_R}) + (1 - {P_R}){q_F}T) / T$表示系统发生故障的情况. 括号内也包含两部分, ${P_R}(MTTR \times {q_F} + MTTR \times{q_R})$表示可修复的情况; $(1 - {P_R}){q_F}T$表示无法修复的情况.
若令$\alpha ={{{{MTTR}}} / T}$表示系统失效时间比, 此时, 式(7)可化为
$$R = (1 - {P_F})\alpha {q_F} + {P_R}(1 - \alpha ){q_R}$$ (8) 其中, ${q_R}$的取值范围为 $[{q_F},1]$, 其余所有参数的取值范围均为 $[0,1]$.
1.4 灵敏度分析
由式(8)可以看出, 影响装备系统弹性的主要因素为故障率${P_F}$、修复率${P_R}$、故障后性能${q_F}$、修复后性能${q_R}$和系统失效时间比$\alpha $.
当其中一个参数确定时, 令其余参数在取值范围内变化, 所得R的均值作为该参数在此确定值下的弹性度量期望. 上述参数的弹性期望变化如图4所示, 其中${P_R}$和$\alpha $的变化曲线重合. 不同参数对应的弹性期望变化速度如图5所示. 可以看出, ${P_R}$的弹性期望变化速度最快, 其次是${q_F}$和${q_R}$, 变化最慢的是${P_F}$和$\alpha $; 对于弹性期望均值, ${q_R}$明显低于其他参数.
在对系统进行设计或优化时, 应优先考虑优化对弹性影响程度最大的参数, 最后考虑对弹性影响最小的参数. 可以看出, 针对上述情况, 在参数进行优化时, 应按照如下重要顺序考虑:
1)使系统修复率足够高, 实质是提高系统的恢复性;
2)使系统故障后性能尽可能保持, 实质是提高系统的鲁棒性;
3)保证系统修复后性能足够高, 实质是提高系统的恢复性;
4)确保系统故障率和系统故障时间比足够低, 是恢复性和可靠性的共同体现.
2. 复杂装备系统弹性度量
复杂装备为包含子系统的装备系统, 其中各子系统均含有各自的故障率$P_F $, 修复率$P_R $, $MTBF $和$MTTR $等参数, 共同构成整个复杂系统的可靠性工程参数. 且构成复杂系统的子系统可靠性相互独立, 任何子系统的故障和修复对其他子系统无影响.
2.1 复杂系统特征分析
多个子系统构成的复杂系统特性由子系统特征及其相互关系共同构成. 在可靠性工程中, 通常认为系统故障导致性能丧失. 子系统故障时, 复杂系统可能出现性能丧失、下降和无影响三种情况, 而采用单一的故障率$P_F $、修复率$P_R $、$MTTR $ 和$MTBF $等参数无法全面准确描述该情况. 因此, 从简单装备到复杂装备是从单一参数组描述到多参数组描述的过程. 如由两个子系统组成的复杂系统, 无故障的概率为$(1 - {P_{F1}})(1 - {P_{F2}})$, 故障的概率由${P_{F1}}(1 - {P_{F2}})$(仅子系统1故障)、$(1 - {P_{F1}}){P_{F2}}$(仅子系统2故障)、${P_{F1}}{P_{F2}}$(子系统均故障)共同表示, 且系统故障时性能并未完全丧失, 由故障子系统所决定.
子系统按照一定关系组成复杂系统, 既有功能的“涌现”, 也存在冗余设计, 性能并不是简单的叠加关系. 因此, 当子系统故障时, 复杂系统性能的下降需综合考虑各子系统性能及其相互关系.
图6为一个信息传输系统的网络拓扑结构图, 其中节点$S $为初始节点, 节点$T $为终末节点, 网络的边表示各子系统, 边的权值为单位时间子系统的最大传输量, 节点表示子系统的逻辑关系. 该系统最大传输速率实质上为复杂网络最大流, 通过采用Ford-Fulkerson法、最短增广链法、预流推进法等优化算法可求得该系统的最大传输速率为6, 子系统1和子系统2的传输速率分别为5和2, 二者之和大于系统最大传输速率.
2.2 复杂系统弹性度量基本思路
构成复杂系统的子系统均可能发生故障, 各自的故障对整个系统的影响也不同, 且对子系统修复时可能无法修复所有子系统. 假设系统发生故障时, 所有故障子系统均同时失效, 且在此次系统故障未修复时, 无新的子系统发生故障, 则包含两个子系统的弹性过程如图7所示. 其中, ${T_i}={{ MTT}}{{{R}}_i} + {{MTB}}{{{F}}_i}$, ${{MTT}}{{{R}}_i}$和${{MTB}}{{{F}}_i}$分别为各子系统的平均故障修复时间和平均故障间隔时间.
采用式(1)度量复杂系统弹性依然可行, 与简单系统的区别是, ${Q_i}(t) \in {\boldsymbol{Q}}(t)$表示其中某一种变化情况. 如图8所示, 这种情况包括了扰动后无子系统发生故障、故障后至少一个子系统修复以及故障后所有子系统均无法修复的所有可能.
复杂系统故障与否取决于子系统的故障率. 若复杂系统由n个子系统组成, 故障子系统数量为k, 当至少有一个子系统出现故障时, 复杂系统共存在$\sum\nolimits_{k = 1}^n {C_n^k}$种故障情况, 若i个故障子系统被修复, 则包含了$\sum\nolimits_{i = 1}^k {C_k^i}$种修复情况. 故障情况和修复情况及其概率对应了式(2) ~ (5)中不同的性能降级曲线和性能恢复曲线及其条件概率.
当多个子系统发生故障时, 修复顺序不同会导致差异化的性能变化曲线, 即修复策略是复杂系统弹性的重要影响因素. 本文假设装备均在理想情况下进行维修, 即充足的资源能够保障所有故障的子系统同时修复, 且故障子系统的性能为0 (有故障), 子系统修复后性能恢复至1 (无故障).
2.3 复杂系统弹性度量计算方法
令${\boldsymbol{X}}$表示故障子系统的一簇集合, $X$为其中一个故障子系统的集合, ${q_F}(X)$表示集合$X$中的子系统故障时, 整个复杂系统的性能. ${\boldsymbol{Y}}$表示某一集合的子系统故障后, 修复子系统的一簇集合, 对于$Y \in {\boldsymbol{Y}}$, 有$Y \subset X$.
由于子系统在故障后同时修复, 因此子系统按照$MTTR $从小至大的顺序完成修复事件. 对于修复子系统集合$Y$, 各子系统按照修复顺序进行编号. 令${q_R}(X|i)$为编号i的子系统修复后系统的性能, ${q_R}(X|0) = {q_F}(X)$为系统故障后性能, ${T_i}$为该子系统的$MTTR $, ${T_0} = 0$为初始时刻, $T = \max ({{MTTR}}\; + {{MTBF}})$为弹性过程总用时, 则复杂系统弹性过程可由式(9) ~ (11)表示.
$${\tilde{R}_1} = \prod\limits_{i = 1}^n {(1 - {P_{{F_i}}})} $$ (9) $${\tilde{R}_2} = \prod\limits_{i \in X} {(1 - {P_{{R_i}}})} \times {q_F}(X)T$$ (10) $$\begin{aligned}[b] {\tilde{R}_3} = \;&\sum\limits_Y \prod\limits_{i \in Y} {{P_{{R_i}}}} \prod\limits_{i \notin Y} {(1 - {P_{{R_i}}})} \;\times\\ &\sum\limits_{i \in Y} {\left[{q_R}(X|i - 1)({T_i} - {T_{i - 1}})\right]} \end{aligned}$$ (11) 其中, $\tilde{R}_1 $表示系统无故障情况, $\tilde{R}_2 $表示系统故障后无法修复情况, $\tilde{R}_3 $表示系统故障后可修复情况.
由于集合X中子系统发生故障的概率为$\prod\nolimits_{i \in X} {{P_{{F_i}}}} \prod\nolimits_{i \notin X} {(1 - {P_{{F_i}}})},$ 则复杂系统弹性可表示为
$$R = {\tilde{R}_1} + \sum\limits_X \prod\limits_{i \in X} {{P_{{F_i}}}} \prod\limits_{i \notin X} \frac{ {(1 - {P_{{F_i}}})}({\tilde{R}_2} + {\tilde{R}_3})} {T}$$ (12) 图9展示了含有2个子系统的复杂系统性能变化曲线, 包括系统无故障$(A\text{-}H\text{-}L) $、故障后无法修复$(A\text{-}B\text{-}C\text{-}E\text{-}I) $、故障后部分子系统修复$(A\text{-}B\text{-}C\text{-} D\text{-} G\text{-}K$和$A\text{-}B\text{-}C\text{-}E\text{-}F\text{-}J) $、故障后完全修复$(A\text{-}B\text{-}C\text{-}D\text{-} G\text{-}H\text{-}L)$等. 对于该系统, 上述表达式表示了虚线与坐标轴围成的部分面积的期望.
2.4 与简单系统弹性度量关系
简单系统可通过一组可靠性参数度量其弹性, 考虑到构成复杂系统的多个子系统的多种可能变化, 其弹性度量应基于多组可靠性参数. 当复杂系统弹性子系统数量为1时, 系统简化为简单系统, 此时只存在一组故障−修复模式. 系统无故障即为该子系统无故障, 则式(9)可写为
$${\tilde{R}_1} = 1 - {P_F}$$ (13) 系统故障后不可修复即为该子系统无法修复, 则式(10)可写为
$${\tilde{R}_2} = (1 - {P_R}){q_F}T$$ (14) 系统可修复即为该子系统可修复, 则式(11)可写为
$${\tilde{R}_3} = {P_R}({{MTTR}} \times {q_F} + {{MTBF}} \times {q_R})$$ (15) 此时, 故障子系统集合$X$仅含有1个子系统, 式(12)可写为
$$R = {\tilde{R}_1} +\frac{ {P_F}({\tilde{R}_2} + {\tilde{R}_3})}{T}$$ (16) 将式(13) ~ (15)代入后, 式(16)与简单系统弹性度量式(7)相同. 说明简单系统弹性度量是复杂系统弹性度量的一种特殊情况.
3. 应用案例分析
本文以某一信息传输系统为例, 分析可靠性参数变化对系统弹性的影响, 通过基于弹性理论的组件重要度对各子系统对系统的影响进行分析.
3.1 复杂装备系统弹性分析
对于某一由12个子系统构成的信息传输系统, 其网络拓扑结构如图10所示, 其中$S $为初始节点, $T $为终末节点, 网络的边为各子系统, 边的权值为子系统的最大传输速率, 节点表示子系统的逻辑关系. 各子系统的故障率$P_F $、修复率$P_R $、$MTTR $和$MTBF $由表1所示. 不同装备由于功能的不同, 系统性能的衡量标准也不同, 该信息传输系统的性能可采用系统的最大传输速率(从$S $至$T $)来衡量. 按图6中所述优化算法可求得系统的最大传输速率为14.
表 1 复杂系统可靠性参数Table 1 Reliability parameters complex system序号 PF (%) PR (%) MTTR (h) MTBF (h) 1 2 70 2.0 8.0 2 2 80 3.0 7.0 3 3 80 2.5 7.5 4 5 70 2.0 8.0 5 3 75 2.5 7.5 6 2 85 3.5 6.5 7 3 80 3.0 7.0 8 4 75 2.5 7.5 9 2 80 2.0 8.0 10 4 85 3.0 7.0 11 3 75 2.5 7.5 12 1 65 2.0 8.0 表2为故障子系统的一簇集合${\boldsymbol{X}}$和故障子系统集合$X$下修复子系统一簇集合${\boldsymbol{Y}}$的部分数据, 其中空集表示无故障或无修复. 经计算, 该系统的弹性为R = 0.7154.
表 2 故障和修复子系统集合(部分)Table 2 The sets of failed and repaired subsystems (portion)X Y $\emptyset $ $\emptyset $ [1] $\emptyset $, [1] [1, 2] $\emptyset $, [1], [2], [1, 2] [1, 2, 3] $\emptyset $, [1], [2], [3], [1, 2], [1, 3], [2, 3], [1, 2, 3] [1, 2, 3, 4] $\emptyset $, [1], [2], [3], [4], [1, 2], [1, 3], [1, 4],
[2, 3], [2, 4], [3, 4], [1, 2, 3], [1, 2, 4],
[1, 3, 4], [2, 3, 4], [1, 2, 3, 4]${\bf{\vdots } }$ ${\bf{\vdots} }$ 通过计算, 所有子系统的故障率$P_F $、修复率$P_R $、$MTTR $和$MTBF $与系统弹性的关系如图11所示.
可以看出, 当$P_F $提高$/P_R $降低$/MTTR $增大/$MTBF $减小时, 系统弹性减小; 当$P_F $降低$/P_R $提高$/MTTR $减小$/MTBF $增大时, 系统弹性增大. 故障率变化对系统弹性的影响较其他参数大. 该变化趋势与简单装备系统弹性度量中各参数对弹性的影响一致.
3.2 基于弹性理论的组件重要度分析
组件重要度作为描述复杂系统中子系统的一种重要参数, 可以提供系统优化设计或可靠性增长的方向, 提高系统设计优化的效费比, 避免过设计、欠设计等问题. 目前已有学者通过子系统变化对系统弹性的影响来衡量组件重要度[22, 40-41]. 本文结合上述思想, 采用子系统故障前后系统弹性的变化对组件重要度进行衡量和分析.
定义 1. 子系统i的重要度是该子系统故障状态下系统弹性与正常情况下系统弹性的归一化差值.
当子系统i在扰动下必然故障且不可恢复时, 则${P_{{F_i}}} = 1$且${P_{{R_i}}} = 0$, 此时该子系统的重要度可表示为
$$CI{R_i} = \frac{{R - R({P_{{F_i}}} = 1,{P_{{R_i}}} = 0)}}{{\max \{ R - R({P_{{F_i}}} = 1,{P_{{R_i}}} = 0)\} }}$$ (13) 其中, $R({P_{{F_i}}} = 1,{P_{{R_i}}} = 0)$为子系统i故障时复杂装备系统的弹性.
通过计算可得各子系统故障时系统的弹性和组件重要度如图12所示, 具体值见表3.
表 3 归一化的子系统重要度Table 3 The normalized importance of subsystems序号 RF CIR 1 0.0188 0.9881 2 0.0137 0.9953 3 0.0189 0.9880 4 0.0238 0.9809 5 0.0239 0.9808 6 0.0188 0.9881 7 0.0172 0.9904 8 0.0188 0.9881 9 0.0188 0.9881 10 0.0104 1.0000 11 0.0223 0.9831 12 0.0137 0.9953 由仿真结果可得, 系统的组件重要度从高到低依次为10, (2, 12), 7, (1, 6, 8, 9), 3, 11, 4, 5 (括号内数值表示重要度相同). 对于该复杂系统, 子系统4和子系统5的组件重要度均较低, 从网络拓扑结构也可看出, 这2个子系统在系统传输过程中主要承担了节点$A $和节点$B $输出的备份功能; 子系统10的重要度较高, 这是因为传输至节点T的通路只有子系统10和子系统12, 且子系统10的最大传输速率更高, 其故障必将严重影响整个系统. 可以看出, 采用本文所提出的弹性度量方法, 按照通常采用的组件重要度计算方法, 能够合理地反映出系统的应对扰动的能力和子系统的重要程度.
4. 结束语
本文根据装备系统的特点, 基于传统的弹性度量方法, 利用故障率、修复率等可靠性工程参数, 分别给出了简单系统和复杂系统的混合型弹性度量方法, 并对参数的灵敏度进行了分析. 最后通过基于弹性理论的组件重要度应用案例, 分析了子系统对系统的影响. 结果表明, 该度量方法能够较好地描述装备系统在遭受故障时性能的维持及修复能力. 本文针对复杂装备系统的弹性度量方法, 假设为理想状况, 即维修资源足够所有故障子系统同时修复. 当维修人员和备件有限时, 维修策略将影响度量公式中的系统修复部分的结果, 该情况下弹性度量公式如何表示, 以及如何选取最优维修策略, 是下一步需要解决的问题.
-
表 1 复杂系统可靠性参数
Table 1 Reliability parameters complex system
序号 PF (%) PR (%) MTTR (h) MTBF (h) 1 2 70 2.0 8.0 2 2 80 3.0 7.0 3 3 80 2.5 7.5 4 5 70 2.0 8.0 5 3 75 2.5 7.5 6 2 85 3.5 6.5 7 3 80 3.0 7.0 8 4 75 2.5 7.5 9 2 80 2.0 8.0 10 4 85 3.0 7.0 11 3 75 2.5 7.5 12 1 65 2.0 8.0 表 2 故障和修复子系统集合(部分)
Table 2 The sets of failed and repaired subsystems (portion)
X Y $\emptyset $ $\emptyset $ [1] $\emptyset $, [1] [1, 2] $\emptyset $, [1], [2], [1, 2] [1, 2, 3] $\emptyset $, [1], [2], [3], [1, 2], [1, 3], [2, 3], [1, 2, 3] [1, 2, 3, 4] $\emptyset $, [1], [2], [3], [4], [1, 2], [1, 3], [1, 4],
[2, 3], [2, 4], [3, 4], [1, 2, 3], [1, 2, 4],
[1, 3, 4], [2, 3, 4], [1, 2, 3, 4]${\bf{\vdots } }$ ${\bf{\vdots} }$ 表 3 归一化的子系统重要度
Table 3 The normalized importance of subsystems
序号 RF CIR 1 0.0188 0.9881 2 0.0137 0.9953 3 0.0189 0.9880 4 0.0238 0.9809 5 0.0239 0.9808 6 0.0188 0.9881 7 0.0172 0.9904 8 0.0188 0.9881 9 0.0188 0.9881 10 0.0104 1.0000 11 0.0223 0.9831 12 0.0137 0.9953 -
[1] Feng G, Patelli E, Beer M, Coolen F P A. Imprecise system reliability and component importance based on survival signature. Reliability Engineering & System Safety, 2016, 150: 116-125 [2] Cats O, Koppenol G J, Warnier M. Robustness assessment of link capacity reduction for complex networks: Application for public transport systems. Reliability Engineering & System Safety, 2017, 167: 544-553 [3] Jiang W, Xie C H, Zhuang M Y, Shou Y H, Tang Y C. Sensor data fusion with Z-numbers and its application in fault diagnosis. Sensors, 2016, 16(9): Article No. 1509 doi: 10.3390/s16091509 [4] Holling C S. Resilience and stability of ecological systems. Annual Review of Ecology and Systematics, 1973, 4: 1-23 doi: 10.1146/annurev.es.04.110173.000245 [5] Leveson N. A new accident model for engineering safer systems. Safety Science, 2004, 42(4): 237-270 doi: 10.1016/S0925-7535(03)00047-X [6] Aven T. On some recent definitions and analysis frameworks for risk, vulnerability, and resilience. Risk Analysis, 2011, 31(4): 515-522 doi: 10.1111/j.1539-6924.2010.01528.x [7] Neches R. Engineered Resilient Systems DoD Science and Technology Priority Area. Washington: Office of the Deputy Assistant Secretary of Defense for Systems Engineering, 2012 [8] Scott L. Engineered Resilient Systems DoD Science and Technology Priority. Washington: Office of the Deputy Assistant Secretary of Defense for Systems Engineering, 2012 [9] Carlson J, Bassett G, Buehring W, Collins M, Folga S, Haffenden B, et al. Resilience: Theory and Application, Technical Report: ANL/DIS-12-1, Argonne National Laboratory, 2012 [10] Henry D, Ramirez-Marquez J E. Generic metrics and quantitative approaches for system resilience as a function of time. Reliability Engineering & System Safety, 2012, 99: 114-122 [11] Goerger S R, Madni A M, Eslinger O J. Engineered resilient systems: A DoD perspective. Procedia Computer Science, 2014, 28: 865-872 doi: 10.1016/j.procs.2014.03.103 [12] 蓝羽石, 周光霞, 王珩, 易侃. 韧性指挥信息系统构建机理及实现研究. 指挥与控制学报, 2015, 1(3): 284-291Lan Yu-Shi, Zhou Guang-Xia, Wang Heng, Yi Kan. Construction mechanism and implementation of resilient command information systems. Journal of Command and Control, 2015, 1(3): 284-291 [13] 费爱国. 韧性指挥与控制系统设计相关问题探析. 指挥信息系统与技术, 2017, 8(2): 1-4Fei Ai-Guo. Analysis on related issues about resilient command and control system design. Command Information System and Technology, 2017, 8(2): 1-4 [14] 崔琼, 李建华. 网络化指挥信息系统弹性度量方法. 军事运筹与系统工程, 2016, 30(4): 18-24, 48Cui Qiong, Li Jian-Hua. Resilience measurement of networked command information system. Military Operations Research and Assessment, 2016, 30(4): 18-24, 48 [15] 杨飞生, 汪璟, 潘泉, 康沛沛. 网络攻击下信息物理融合电力系统的弹性事件触发控制. 自动化学报, 2019, 45(1): 110-119Yang Fei-Sheng, Wang Jing, Pan Quan, Kang Pei-Pei. Resilient event-triggered control of grid cyber-physical systems against cyber attack. Acta Automatica Sinica, 2019, 45(1): 110-119 [16] Toroghi S S H, Thomas V M. A framework for the resilience analysis of electric infrastructure systems including temporary generation systems. Reliability Engineering & System Safety, 2020, 202: Article No. 107013 [17] Azarbahram A, Amini A, Sojoodi M. Resilient fixed-order distributed dynamic output feedback load frequency control design for interconnected multi-area power systems. IEEE/CAA Journal of Automatica Sinica, 2019, 6(5): 1139-1151 doi: 10.1109/JAS.2019.1911687 [18] Mishra S, Anderson K, Miller B, Boyer K, Warren A. Microgrid resilience: A holistic approach for assessing threats, identifying vulnerabilities, and designing corresponding mitigation strategies. Applied Energy, 2020, 264: Article No. 114726 doi: 10.1016/j.apenergy.2020.114726 [19] Patriarca R, Bergström J, Di Gravio G, Costantino F. Resilience engineering: Current status of the research and future challenges. Safety Science, 2018, 102: 79-100 doi: 10.1016/j.ssci.2017.10.005 [20] Li X H, Zhao P, Li L X. Resilience and reliability analysis of P2P network systems. Operations Research Letters, 2010, 38(1): 20-26 doi: 10.1016/j.orl.2009.09.006 [21] Tran H T, Balchanos M, Domerçant J C, Mavris D N. A framework for the quantitative assessment of performance-based system resilience. Reliability Engineering & System Safety, 2017, 158: 73-84 [22] 李瑞莹, 杜时佳, 康锐. 复杂系统弹性建模与评估. 北京: 化学工业出版社, 2019.Li Rui-Ying, Du Shi-Jia, Kang Rui. Modeling and Evaluation of Complex System Resilience. Beijing: Chemical Industry Press, 2019. [23] Jin C, Li R Y, Kang R. Analysis and comparison of three measures for system resilience. Risk, Reliability and Safety: Innovating Theory and Practice. London: CRC Press, 2016. 2145−2151 [24] Bruneau M, Chang S E, Eguchi R T, Lee G C, O'Rourke T D, Reinhorn A M, et al. A framework to quantitatively assess and enhance the seismic resilience of communities. Earthquake Spectra, 2003, 19(4): 733-752 doi: 10.1193/1.1623497 [25] Cimellaro G P, Reinhorn A M, Bruneau M. Seismic resilience of a hospital system. Structure and Infrastructure Engineering, 2010, 6(1-2): 127-144 doi: 10.1080/15732470802663847 [26] 黄浪, 吴超, 王秉. 系统安全韧性的塑造与评估建模. 中国安全生产科学技术, 2016, 12(12): 15-21Huang Lang, Wu Chao, Wang Bing. Modeling on shaping and assessment of system safety resilience. Journal of Safety Science and Technology, 2016, 12(12): 15-21 [27] Reed D A, Kapur K C, Christie R D. Methodology for assessing the resilience of networked infrastructure. IEEE Systems Journal, 2009, 3(2): 174-180 doi: 10.1109/JSYST.2009.2017396 [28] Zobel C W. Representing perceived tradeoffs in defining disaster resilience. Decision Support Systems, 2011, 50(2): 394-403 doi: 10.1016/j.dss.2010.10.001 [29] Zobel C W, Khansa L. Characterizing multi-event disaster resilience. Computers & Operations Research, 2014, 42: 83-94 [30] Ouyang M, Dueñas-Osorio L, Min X. A three-stage resilience analysis framework for urban infrastructure systems. Structural Safety, 2012, 36-37: 23-31 doi: 10.1016/j.strusafe.2011.12.004 [31] Ouyang M, Wang Z H. Resilience assessment of interdependent infrastructure systems: With a focus on joint restoration modeling and analysis. Reliability Engineering & System Safety, 2015, 141: 74-82 [32] Li Z L, Jin C, Hu P, Wang C. Resilience-based transportation network recovery strategy during emergency recovery phase under uncertainty. Reliability Engineering & System Safety, 2019, 188: 503-514 [33] Chang S E, Shinozuka M. Measuring improvements in the disaster resilience of communities. Earthquake Spectra, 2004, 20(3): 739-755 doi: 10.1193/1.1775796 [34] Li Y, Lence B J. Estimating resilience for water resources systems. Water Resources Research, 2007, 43(7): Article No. W07422 [35] 石建伟, 刘俊先, 姜志平, 权冀川. 基于超网络的军事体系韧性评估. 指挥与控制学报, 2017, 3(3): 213-217Shi Jian-Wei, Liu Jun-Xian, Jiang Zhi-Ping, Quan Ji-Chuan. Evaluating military system of systems resilience using super networks. Journal of Command and Control, 2017, 3(3): 213-217 [36] 崔琼, 李建华, 冉淏丹, 南明莉. 基于任务能力的指挥信息系统超网络弹性度量. 指挥与控制学报, 2017, 3(2): 137-143Cui Qiong, Li Jian-Hua, Ran Hao-Dan, Nan Ming-Li. Resilience measurement of command information system super-network based on mission capability. Journal of Command and Control, 2017, 3(2): 137-143 [37] 荣明, 胡晓峰, 杨镜宇. 基于试验床的作战体系弹性评估研究. 系统仿真学报, 2018, 30(12): 4711-4717Rong Ming, Hu Xiao-Feng, Yang Jing-Yu. Research on assessment of operation system's resilience based on test bed. Journal of System Simulation, 2018, 30(12): 4711-4717 [38] Zhang C, Xu X, Dui H. Resilience Measure of Network Systems by Node and Edge Indicators. Reliability Engineering & System Safety, 2020, 202: Article No. 107035 [39] 康建设, 宋文渊, 白永生, 田霞. 装备可靠性工程. 北京: 国防工业出版社, 2019.Kang Jian-She, Song Wen-Yuan, Bai Yong-Sheng, Tian Xia. Equipment Reliability Engineering. Beijing: National Defense Industry Press, 2019. [40] Whitson J C, Ramirez-Marquez J E. Resiliency as a component importance measure in network reliability. Reliability Engineering & System Safety, 2009, 94(10): 1685-1693 [41] 潘星, 张国忠, 张跃东, 康锐. 工程弹性系统与系统弹性理论研究综述. 系统工程与电子技术, 2019, 41(9): 2006-2015 doi: 10.3969/j.issn.1001-506X.2019.09.13Pan Xing, Zhang Guo-Zhong, Zhang Yue-Dong, Kang Rui. Review of engineered resilient systems and system resilience theory. Systems Engineering and Electronics, 2019, 41(9): 2006-2015 doi: 10.3969/j.issn.1001-506X.2019.09.13 期刊类型引用(4)
1. 李明华. 武器装备体系工程的理论发展及航天领域应用探索. 导弹与航天运载技术(中英文). 2025(01): 1-7 . 百度学术
2. 刘晓倩,张英俊,秦家虎,李卓凡,梁伟玲,李宗溪. 模糊认知图学习算法及应用综述. 自动化学报. 2024(03): 450-474 . 本站查看
3. 谷晓燕,李俊,张景浩. 指挥信息系统韧性度量评估研究. 火力与指挥控制. 2024(09): 1-10 . 百度学术
4. 孟乐,张琳,孟宪良,王振洋,张搏. 基于节点重要度的作战装备系统弹性恢复策略. 装甲兵学报. 2022(04): 69-74 . 百度学术
其他类型引用(2)
-