2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

混合动力电动汽车的跟车控制与能量管理

赵秀春 郭戈

赵秀春, 郭戈. 混合动力电动汽车的跟车控制与能量管理. 自动化学报, 2022, 48(1): 162−170 doi: 10.16383/j.aas.c200136
引用本文: 赵秀春, 郭戈. 混合动力电动汽车的跟车控制与能量管理. 自动化学报, 2022, 48(1): 162−170 doi: 10.16383/j.aas.c200136
Zhao Xiu-Chun, Guo Ge. Tracking control and energy management of hybrid electric vehicles. Acta Automatica Sinica, 2022, 48(1): 162−170 doi: 10.16383/j.aas.c200136
Citation: Zhao Xiu-Chun, Guo Ge. Tracking control and energy management of hybrid electric vehicles. Acta Automatica Sinica, 2022, 48(1): 162−170 doi: 10.16383/j.aas.c200136

混合动力电动汽车的跟车控制与能量管理

doi: 10.16383/j.aas.c200136
基金项目: 国家自然科学基金(U1808205, 61573077, 61973053, 51975089, 51575079), 辽宁省教育厅科学研究经费(LJYT201915)资助
详细信息
    作者简介:

    赵秀春:大连民族大学讲师, 大连理工大学控制科学与工程专业博士研究生. 2006年获得东北大学硕士学位. 主要研究方向为车辆控制技术, 混合动力电动汽车能量管理. E-mail: zxc_xiu@163.com

    郭戈:东北大学教授. 1998年获得东北大学博士学位. 主要研究方向为智能交通系统, 运动目标检测跟踪网络. 本文通信作者. E-mail: geguo@yeah.net

Tracking Control and Energy Management of Hybrid Electric Vehicles

Funds: Supported by National Natural Science Foundation of China (U1808205, 61573077, 61973053, 51975089, 51575079), and Scientific Research Fund of Liaoning Provincial Education Department (LJYT201915)
More Information
    Author Bio:

    ZHAO Xiu-Chun Lecturer at Dalian Minzu University, Ph. D. candidate at Control Science and Engineering, Dalian University of Technology. She received her master degree from Northeastern Unversity in 2006. Her research interest covers vehicle control technology, and hybrid electric vehicle energy management

    GUO Ge Professor at Northeastern University. He received his Ph. D. degree from Northeastern University in 1998. His research interest covers intelligent transportation system, and moving target detection and tracking with network. Corresponding author of this paper

  • 摘要: 混合动力电动汽车(Hybrid electric vehicles, HEVs)的能量管理问题至关重要, 而混合动力电动汽车的跟车控制不仅涉及跟车效果与安全性, 也影响着能量的高效利用. 将HEVs的跟车控制与能量管理相结合, 提出一种基于安全距离的HEVs车辆跟踪与能量管理控制方法. 首先, 考虑坡度、载荷变动建立了HEVs车辆跟车系统的非线性模型, 并基于安全距离, 提出一种基于道路观测器的动态面控制(Dynamic surface control, DSC)进行车辆跟踪控制. 然后, 结合跟踪控制下工况循环, 采用滚动动态规划(Dynamic programming, DP)算法进行混合动力电动汽车能量实时优化控制. 最后, 通过仿真研究进行验证.
  • 当前智能信息时代, 数据体量高速增长, 数据特性纷繁复杂. 如何从大数据中去粗取精、去伪存真地挖掘出有效的知识是数据挖掘领域所关注的关键问题. 而如何从海量的具有不确定性的数据信息中挖掘和提炼出确定性的知识则是知识发现领域和认知科学领域所关注的关键问题. 因此, 对于不确定性信息的转化和处理的研究就受到了诸多学者的关注. 基于此, 1965年, Zadeh[1]提出模糊集(Fuzzy sets) 理论, 其能够有效地刻画和处理不确定性信息. Zadeh[1]认为任一对象总在一定程度上属于某一个集合或目标概念, 也可以在不同程度上属于多个集合或目标概念. 因此, 其给出了“隶属度”的定义, 通过在有限非空论域$ U = \left\{ {{x_1},\;{x_2},\; \cdots ,\;{x_n}} \right\} $上给定一个映射函数$ {\mu _A}:U \to \left[ {0,\;1} \right] $, $x \to {\mu _A}( x )$来描述一个对象$ x $隶属于某一目标概念的程度, 称$ A $为$ U $上的一个模糊集, 称${\mu _A}( x )$为$ A $的隶属度函数, 其表示对象$ x $隶属于$ A $的程度, 其中$0 \le {\mu _A}( x ) \le 1$. 然而, 精确的隶属度值就像是一把双刃剑. 虽然模糊集能够通过隶属度函数和精确的隶属度值来有效地刻画一个模糊性概念, 但是对于部分隶属度差距非常小的对象, 有时无需进行严格区分, 即对于一般目标概念的刻画和描述并不总是需要完全精确的隶属度, 反而可以通过一些特定值来表示那些非常相似的对象. 这与人类习惯通过已有知识来近似刻画未知事物的认知思想相类似. 此外, 较高的精度需求也伴随着巨大的计算损耗, 这在模糊集数据体量较大时尤其明显, 也极大地影响了模糊集理论的应用[2].

    为解决上述问题, Pedrycz[2]提出阴影集(Shadowed set, SS)理论: 一种针对模糊信息数据分析的三支近似表达模型. 它可以有效地对模糊集中具有精确值的不确定性对象进行近似表达, 从而减少模糊决策过程中不确定性对象的决策划分成本和计算损耗. 如对于信息检索问题, 可以通过一对给定的近似划分阈值过滤掉大量与检索目标无关的记录, 以快速响应模糊查询的需求[2]. 而阴影集的核心思想便是通过一对决策阈值$ \left( {\alpha ,\;\beta } \right) $$( 0 \le \beta < \alpha \le 1 )$将模糊集$ A $中具有不确定性的对象$ x $划分到三个互不相交的区域, 即提升域$\left( {{\mu _A}( x ) \ge \alpha } \right)$、减小域$\left( {{\mu _A}( x ) \le \beta } \right)$和阴影域$ \left( {\beta < {\mu _A}( x ) < \alpha } \right) $. 其中这三个区域分别用常数值1、0以及区间值$ \left[ {0,\;1} \right] $来表示, ${\mu _A}( {{x_i}} )$表示对象$ {x_i} $隶属于模糊集$ A $, 即目标概念的程度. 阴影集通过这种不太精确的、粗糙的三支近似表达形式替换掉原模糊集中精确值的表达形式, 这有效减少了模糊集中的冗余信息, 即可以理解为一种针对精确值数据信息的粒化处理手段, 这也使得阴影集相比模糊集在处理不确定性信息时更加简洁和高效.

    由于阴影集在不确定性信息处理过程中所表现出来的简单性和有效性, 使其吸引了大量学者展开研究, 并将其应用到诸多领域. 对此, 本文通过梳理当前研究现状, 将围绕阴影集所展开的研究工作归纳为四个方面, 如图1所示, 即: 1) 阴影集的模型构建; 2) 阴影集的理论性质; 3) 阴影集的数据分析; 4) 阴影集的应用研究. 其中, 在阴影集的模型构建方面, 主要关注: 1) 阴影集的表达形式, 尤其是阴影域的表示; 2) 决策阈值对$ \left( {\alpha ,\;\beta } \right) $的求取方法和语义解释. 在阴影集的理论性质方面, 主要关注: 1) 基于阴影集的模糊关系、结构解释、逻辑运算或数学性质等; 2) 基于不同模糊集下的阴影集构建分析. 在阴影集的数据分析方面, 主要关注: 1) 基于阴影集的聚类/分类算法; 2) 基于阴影集的数据预处理. 在阴影集的应用研究方面, 主要关注: 1) 图像分类和识别; 2) 医疗信息处理; 3) 文本分析; 4) 决策推荐.

    图 1  阴影集研究的四个主要方面
    Fig. 1  Four main aspects of shadowed set research

    本文的研究贡献总结如下: 1) 梳理了阴影集模型的历史发展脉络, 总结了不同阴影集模型之间的区别和联系, 介绍了不同模型的核心思想和构建步骤; 2) 按类别和时间对当前阴影集在各个方面的研究现状以及不同研究工作之间的递进关系进行了分析和总结; 3) 分析了阴影集与其他不确定性问题处理理论之间的联系, 尤其是相关联的模糊集、粗糙集以及三支决策理论, 并通过应用实例分析了其相互之间的互补性; 4) 深入分析了当前阴影集研究领域中所存在的挑战性问题, 以及潜在的研究方向和可能的研究思路. 本文的逻辑性研究框图如图2所示.

    图 2  研究框图
    Fig. 2  Research framework diagram

    1998年, Pedrycz[2]首次提出阴影集理论, 即Pedrycz经典阴影集, 并通过构造一对决策划分阈值$ \left( {\alpha ,\;\beta } \right) $将模糊集合近似划分为三个部分. 随后, Pedrycz 和Vukovich[3]讨论了其作为粒计算可能载体的作用, 并分析了其与模糊集之间的关系[4]. Cattaneo和Ciucci[56] 研究了阴影集的代数结构, 并在阴影集表达形式基础上首次提出用常数值0.5来近似表达阴影域, 即 0.5SS (0.5 shadowed set). 随后, Deng和Yao[78] 结合贝叶斯理论, 提出基于隶属度均值的决策理论阴影集(Mean value based decision theoretic shadowed set, MDTSS), 并通过最小化划分动作所造成的决策代价来寻找最优$ \left( {\alpha ,\;\beta } \right) $. 此外, Yao等[9]基于阴影集进一步提出针对模糊集的通用三支近似框架, 并总结了计算$ \left( {\alpha ,\;\beta } \right) $的三个准则, 即不确定性不变性、最小距离和最小代价. Zhang和Yao[1011] 则提出博弈论阴影集(Game theoretic shadowed set, GTSS), 其结合博弈论的折中原则分析了阴影集不同划分操作所造成的隶属度误差之间的竞争关系, 并通过重复博弈机制来求取最优$ \left( {\alpha ,\;\beta } \right) $, 为决策阈值的求取提供了新的语义解释, 并为阴影集的构建提供了一种新颖的视角. Zhang等[12]从熵的角度出发, 提出区间阴影集(Interval shadowed set, ISS), 其用区间值$ \left[ {\beta ,\;\alpha } \right] $代替$ \left[ {0,\;1} \right] $来表示阴影域, 并定义一种测量阴影域模糊熵的方法, 通过建立平衡三个区域不确定性的目标函数(即模糊熵)来求取构建ISS模型的决策阈值. Gao等[13] 则从熵的角度出发, 提出模糊熵均值阴影集(Mean entropy based shadowed set, MESS), 其讨论分析了不同划分操作所产生的模糊熵损失, 并提出相应决策划分规则, 通过规则推导出不涉及人为设定参数的$ \left( {\alpha ,\;\beta } \right) $. 随后, 对MESS进行了迭代改进, 使其具有更小的熵损失. 受GTSS模型的启发, Zhang等[14] 和高满[15]还从熵的角度出发, 基于博弈论的折中原则分析了阴影集不同划分操作所造成的熵损失, 从博弈对象、策略、收益函数和停止条件四个方面展开讨论, 构建了基于模糊熵的博弈论阴影集(Game theoretic shadowed set based on fuzzy entropy, FE-GTSS). 近期, Luo等[16]在ISS模型的基础上, 提出一种改进模型, 即 New-ISS. Gao等[17]则在GTSS和FE-GTSS模型的基础上, 进一步提出基于不确定性和决策代价博弈分析的阴影集(Shadowed set based on game analysis of uncertainty and decision cost, UC-GTSS).

    显然, 这些模型设计了不同的三支近似表达形式或阈值计算方法, 以增强阴影集的语义解释或近似划分能力. 在表达形式方面, 可总结如图3所示. 图3(a)为SS模型, 图3(b)为ISS和New-ISS模型, 其阴影域通过区间值$ \left[ {\beta ,\;\alpha } \right] $表示. 图3(c)代表了0.5SS、MDTSS、MESS、GTSS、FE-GTSS和UC-GTSS模型, 区别在于阴影域由一个常数值$ \delta $表示, 而非区间值. 其中在0.5SS、GTSS和UC-GTSS模型中, $ \delta = 0.5 $; 在MDTSS模型中, $ \delta $通过隶属度均值$ \overline \delta $表示; 在MESS模型中, $ \delta $通过模糊熵均值$ {\delta ^ * } $表示; 而FE-GTSS则讨论了$ \delta $为0.5和$ {\delta ^ * } $两种情况下的模型构建. 图3(d)是Yao等[9]所提出的三支近似通用表达框架, 如式(1)所示, 三个近似域分别通过三个常数值$ \left\{ {p,\;m,\;n} \right\} $表示, 其具体数值可根据待解决问题和应用场景来设定, 不局限于某一固定值.

    图 3  阴影集的几种三支近似表达形式
    Fig. 3  Several three-way approximate expressions of shadowed set
    $$ \begin{equation} {S_{{\mu _A}}}(x) = \left\{ \begin{aligned} &p,&&{\mu _A}(x) \ge \alpha \\ &m,&&\beta < {\mu _A}(x) < \alpha \\& n,&&{\mu _A}(x) \le \beta \end{aligned} \right. \end{equation} $$ (1)

    总结不同阴影集模型的特性如表1所示. 下面详细介绍不同阴影集模型的核心思想和构建步骤.

    表 1  不同阴影集之间的区别和联系
    Table 1  The difference and relation between different shadowed sets
    年份 文献 模型 阴影域 构建准则 分析视角 构建方法 人为参数设定 时间复杂度
    1998 [2] SS $[ {0,\;1} ]$ 不确定性不变性 不确定性损失 最优化目标函数 $\mathrm{O}( n )$
    2003 [56] 0.5SS 0.5 不确定性不变性 不确定性损失 最优化目标函数 $\mathrm{O}( n )$
    2013, 2014, 2017 [79] MDTSS $\overline \delta $ 最小成本 隶属度误差 决策划分规则推导 ${\lambda _e},\;{\lambda _r},\;{\lambda _{s \downarrow }},\;{\lambda _{s \uparrow }}$ $\mathrm{O}( n )$
    2018, 2020 [1011] GTSS 0.5 最小成本 隶属度误差 博弈竞争机制 ${c_E},\;{c_R}$ $\mathrm{O}( {{n^2}} )$
    2020 [12] ISS $[ {\beta ,\;\alpha } ]$ 不确定性不变性 不确定性损失 最优化目标函数 $\mathrm{O}( n )$
    2020 [13] MESS ${\delta ^ * }$ 不确定性不变性 不确定性损失 决策划分规则推导 $\mathrm{O}( n )$
    2020 [1415] FE-GTSS 0.5, $\overline \delta $ 不确定性不变性 不确定性损失 博弈竞争机制 ${c_E},\;{c_R}$ $\mathrm{O}( {\mathrm{lo{g_2}}n} )$
    2023 [16] New-ISS $[ {\beta ,\;\alpha } ]$ 不确定性不变性 不确定性损失 最优化目标函数 $\mathrm{O}( {n\mathrm{lo{g_2}}n} )$
    2023 [17] UC-GTSS 0.5 最小成本,
    不确定性不变性
    隶属度误差,
    不确定性损失
    博弈竞争机制 ${c_E},\;{c_R}$ $\mathrm{O}( n )$
    下载: 导出CSV 
    | 显示表格
    1.1.1   经典阴影集

    定义1[1] (模糊集). 设在非空有限集$ U $上的映射$ {\mu _A}:U \to [ {0,\;1} ] $, $ x \to {\mu _A}( x ) $, 其中$ U = $ $ \{ {x_1},\;{x_2},\; \cdots , \;{x_n} \} $, $ A $表示$ U $上的一个模糊集, $ {\mu _A}( x ) $表示$ A $的隶属度函数, 其意味着集合中对象$ x $属于模糊概念$ A $的程度, 值越大则隶属程度越高, 反之则越低.

    定义2[2] (阴影集). 设$ U $为非空有限论域, $ \alpha $和$ \beta $为两个实数且满足不等式 $ 0 \le \beta < 0.5 \,< \,\alpha\, \le \,1 $, $ \alpha + \beta = 1 $, 则定义$ U $到集合$ \{ 0,\;[0,\;1],\;1\} $的映射函数$ S:U \to \left\{ {0,\;\left[ {0,\;1} \right],\;1} \right\} $为阴影集, 如下所示

    $$ \begin{equation} {S_{{\mu _A}}}(x) = \left\{ \begin{aligned} &1,&&{\mu _A}(x) \ge \alpha \\ &\left[ {0,\;1} \right],&&\beta < {\mu _A}(x) < \alpha \\ &0,&&{\mu _A}(x) \le \beta \end{aligned} \right. \end{equation} $$ (2)

    对决策划分阈值$ ( {\alpha ,\;\beta } ) $的求取, Pedrycz[2]提出不确定性不变性准则, 即通过平衡提升域$El{e_{( {\alpha ,\;\beta } )}}( {{\mu _A}} )$、减小域$ Re{d_{\left( {\alpha ,\;\beta } \right)}}\left( {{\mu _A}} \right) $和阴影域$Shado{w_{( {\alpha ,\;\beta } )}} ( {{\mu _A}} )$之间的不确定性变化 (即模糊熵变化) 来求取和解释最优$ \left( {\alpha ,\;\beta } \right) $, 如图3(a)和式(3)所示

    $$ \begin{equation} El{e_{\left( {\alpha,\; \beta } \right)}}\left( {{\mu _A}} \right) + Re{d_{\left( {\alpha,\; \beta } \right)}}\left( {{\mu _A}} \right) = Shado{w_{\left( {\alpha,\; \beta } \right)}}\left( {{\mu _A}} \right) \end{equation} $$ (3)

    随后, 将其转化为最优化问题: 对于给定的任意模糊集, 通过最小化模糊熵损失求取最优$ \left( {\alpha ,\;\beta } \right) $, 即式(4). 其中$ {V_{{\left( {\alpha ,\;\beta } \right)}}}\left( {{\mu _A}} \right) $为目标函数, 如式(5)所示

    $$ \begin{equation} \arg \mathop {\min }\limits_{{\left( {\alpha ,\;\beta } \right)}} {V_{{\left( {\alpha ,\;\beta } \right)}}}\left( {{\mu _A}} \right) \end{equation} $$ (4)
    $$ \begin{split} {V_{{\left( {\alpha ,\;\beta } \right)}}}\left( {{\mu _A}} \right) = \;&\left| {El{e_{\left( {\alpha ,\;\beta } \right)}}\left( {{\mu _A}} \right) + Re{d_{\left( {\alpha ,\;\beta } \right)}}\left( {{\mu _A}} \right) - } \right.\\&\left. {Shado{w_{\left( {\alpha ,\;\beta } \right)}}\left( {{\mu _A}} \right)} \right| \\[-1pt]\end{split} $$ (5)

    基于决策阈值对$ \left( {\alpha ,\;\beta } \right) $, 模糊集中的对象$ x $将被近似划分到三个子集: 当$ {\mu _A}(x) \ge \alpha $时, $ x $被划分到$ El{e_{\left( {\alpha ,\;\beta } \right)}}\left( {{\mu _A}} \right) $; 当$ {\mu _A}(x) \le \beta $时, $ x $被划分到$ Re{d_{\left( {\alpha ,\;\beta } \right)}}\left( {{\mu _A}} \right) $; 当$ \beta < {\mu _A}(x) < \alpha $时, $ x $被划分到$ Shado{w_{\left( {\alpha ,\;\beta } \right)}}\left( {{\mu _A}} \right) $.

    1.1.2   决策理论阴影集

    Cattaneo和Ciucci[56]提出用隶属度常数值0.5来表示阴影域, 而不再是式(2)中的区间值[0, 1], 其意味着阴影域中的对象具有最大的不确定性. 随后, Deng和Yao[78]分析认为用固定值0.5并不能总是合理地代表所有对象的不确定性, 因此提出采用模糊集对象的隶属度平均值$ \overline \delta $来表示阴影域对象的隶属度水平, 其更能反映真实数据的分布情况, 如图3(c)和式(6)所示, 其中$ S\left( {{\mu _A}} \right) = $ $ \{ x \in U| {0 < } {\mu _A}( x ) < 1 \} $表示不确定性对象的集合, $ card\left( \cdot \right) $表示集合的基.

    $$ \begin{equation} \overline \delta = \frac{{\sum\limits_{x \in S\left( {{\mu _A}} \right)} {{\mu _A}( {{x}} )} }}{{card\left( {S\left( {{\mu _A}} \right)} \right)}} \end{equation} $$ (6)

    随后, Deng和Yao[78]结合贝叶斯决策理论, 以最小化阴影集三个区域中对象的决策划分代价为目标, 即最小代价准则, 求取最优$ \left( {\alpha ,\;\beta } \right) $, 提出MDTSS模型以及基于阴影集的决策理论三支近似模型. 结合图3(c) 可知, 对于$ \forall x \in U $, MDTSS给出了四种划分$ Actions = $ $ \left\{ {{a_e},\;{a_r},\;{a_{s \downarrow }},\;{a_{s \uparrow }}} \right\} $, 每种划分 $ a $ 均会造成相应决策误差 $ {E_a} $ 和决策代价 $ {\lambda _a} $, $ a \in Actions $, 总结如表2所示. 其中$ {a_e} $和$ {a_r} $分别表示将$ {\mu _A}( x ) $提升至1和减小至0的划分动作, $ {a_{s \downarrow }} $和$ {a_{s \uparrow }} $分别表示将$ {\mu _A}( x ) $减小至$ \delta $和提升至$ \delta $的划分动作, $ {E_a} $则表示对象的隶属度变化差值, $ {\lambda _a} $表示该划分动作的代价权重, 其值由专家经验设定.

    表 2  MDTSS中划分所造成的误差和代价
    Table 2  Error and cost caused by partitions in MDTSS
    划分操作 模糊集 阴影集 决策误差${E_a}$ 决策代价${\lambda _a}$
    ${a_e}$ ${\mu _A}( x )$ 1 $1 - {\mu _A}( x )$ ${\lambda _e}$
    ${a_r}$ ${\mu _A}( x )$ 0 ${\mu _A}( x ) - 0$ ${\lambda _r}$
    ${a_{s \downarrow }}$ ${\mu _A}( x ) \ge \delta $ $\delta $ ${\mu _A}( x ) - \delta $ ${\lambda _{s \downarrow }}$
    ${a_{s \uparrow }}$ ${\mu _A}( x ) < \delta $ $\delta $ $\delta - {\mu _A}( x )$ ${\lambda _{s \uparrow }}$
    下载: 导出CSV 
    | 显示表格

    MDTSS同样将$ \left( {\alpha ,\;\beta } \right) $的求取转换为最优化问题, 即式(7). 其中$ R\left( {\alpha ,\;\beta } \right) $为决策损失函数, 其表示论域$ U $中所有对象的决策总损失, 如式(8)所示. $ R\left( {a\left| x \right.} \right) $表示对象$ x $执行划分动作$ a $时所造成的损失, 通过决策误差$ {E_a} $和相应决策代价$ {\lambda _a} $的乘积表示. 进一步通过构建决策划分规则以及规则的约简和推导求取$ \left( {\alpha ,\;\beta } \right) $, 如式(9)所示, 其中$ {\lambda _e}, \; {\lambda _r}, {\lambda _{s \downarrow }},\;{\lambda _{s \uparrow }} $均大于等于0且满足 $ {\lambda _{s \downarrow }} \le {\lambda _r} $, $ {\lambda _{s \uparrow }} \le {\lambda _e} $, $ {\lambda _e} + {\lambda _{s \downarrow }} \ne 0 $, $ {\lambda _r} + {\lambda _{s \uparrow }} \ne 0 $.

    $$ \begin{equation} \arg \mathop {\min }\limits_{{\left( {\alpha ,\;\beta } \right)}} R\left( {\alpha ,\;\beta } \right) \end{equation} $$ (7)
    $$ \begin{split} R\left( {\alpha ,\;\beta } \right) = \;&\sum\limits_{x \in U} {R\left( {a\left| x \right.} \right)} = \sum\limits_{x \in U} {{E_a} \times {\lambda _a}} = \\ &\sum\limits_{x \in U} {{E_a}\left( {{\mu _A}( x )} \right) \times {\lambda _a}} \end{split} $$ (8)
    $$ \begin{equation} \alpha = \frac{{{\lambda _e} + \delta {\lambda _{s \downarrow }}}}{{{\lambda _e} + {\lambda _{s \downarrow }}}},\;\begin{array}{*{20}{c}} {} \end{array}\beta = \frac{{\delta {\lambda _{s \uparrow }}}}{{{\lambda _r} + {\lambda _{s \uparrow }}}} \end{equation} $$ (9)
    1.1.3   博弈论阴影集

    Zhang和Yao[1011]将博弈论与阴影集相结合, 提出GTSS模型. 而博弈论的最终目的是尽可能为不同博弈玩家找到对个人而言最有益的行为策略, 并构建一种状态, 在该状态下所有博弈玩家之间的收益都保持均衡或尽可能满足折中的原则[1819]. 基于此, Zhang和Yao[1011] 分析了阴影集中不同划分操作所造成隶属度误差之间的博弈关系, 引入博弈论的折中思想来平衡不同类型隶属度误差, 并通过重复博弈机制来求取最优$ \left( {\alpha ,\;\beta } \right) $.

    以连续型模糊隶属度函数为例, 如图4所示, 在阴影集近似划分过程中, 对象$ x $通过$ \left( {\alpha ,\;\beta } \right) $采取提升隶属度和减小隶属度这两种操作. 显然, 将形成两种误差: 提升误差$ TE_{\left( {\alpha ,\;\beta } \right)}^{Mem}\left( {{\mu _A}} \right) $ (黄色区域)和减小误差$ TR_{\left( {\alpha ,\;\beta } \right)}^{Mem}\left( {{\mu _A}} \right) $ (蓝色区域), 分别如式(10) 和式(11)所示, 其中$ {R_0}\left( {{\mu _A}} \right) $, $ {R_\delta }\left( {{\mu _A}} \right) $, $ {E_1}\left( {{\mu _A}} \right) $和$ {E_\delta }\left( {{\mu _A}} \right) $分别表示对象在不同区域隶属度变化所造成的误差.

    $$ \begin{equation} TE_{\left( {\alpha ,\;\beta } \right)}^{Mem}\left( {{\mu _A}} \right) = {E_1}\left( {{\mu _A}} \right) + {E_\delta }\left( {{\mu _A}} \right) \end{equation} $$ (10)
    $$ \begin{equation} TR_{\left( {\alpha ,\;\beta } \right)}^{Mem}\left( {{\mu _A}} \right) = {R_0}\left( {{\mu _A}} \right) + {R_\delta }\left( {{\mu _A}} \right) \end{equation} $$ (11)
    图 4  GTSS中两种隶属度误差随决策阈值的博弈变化
    Fig. 4  The game variation of two kinds of membership errors with decision threshold in GTSS

    显然, 由图4中黄色区域和蓝色区域可知, 这两种隶属度误差随$ \left( {\alpha ,\;\beta } \right) $的变化始终呈相反的变化趋势, 即一方增大, 另一方必然减小. Zhang和Yao[1011]认为这与博弈论的核心思想是相似的: 所有博弈玩家均试图最大化个人收益, 即最小化个人损失, 然而所有玩家的个人收益却会受到其他玩家行为策略的干扰, 形成合作或非合作博弈的局面. 因此, 基于折中原则的考虑, 所有玩家将寻找一种新的策略, 该策略令所有玩家的博弈收益形成平衡状态, 这种平衡是所有玩家的理想状态. 基于该策略, 玩家的个人收益既不是最好的, 也不是最坏的, 但却能够最大化所有玩家的总收益[1819]. 综上, GTSS模型将划分操作所形成的两种隶属度误差分别作为博弈对象, 将$ \left( {\alpha ,\;\beta } \right) $的阈值变化作为博弈策略, 以两种隶属度的总误差最小(即博弈收益最大)作为博弈目标, 进行博弈均衡分析, 构建如表3所示的博弈收益表, 并通过限定博弈策略的数量来迭代更新博弈收益表, 通过重复博弈的形式来寻找最优的决策划分阈值对$ \left( {\alpha ,\;\beta } \right) $. 为易于理解, 相比文献[1011], 在表3中对符号表示进行了简化.

    表 3  博弈机制下阴影集的博弈收益
    Table 3  Game payoff of shadowed set under game mechanism
    博弈对象 ${n_2}$
    博弈策略 ${\beta _1}$ ${\beta _2}$ $\cdots $ ${\beta _q}$
    ${n_1}$ ${\alpha _1}$ $\left\langle {{P_{{n_1}}}\left( {{\alpha _1},\;{\beta _1}} \right),\;{P_{{n_2}}}\left( {{\alpha _1},\;{\beta _1}} \right)} \right\rangle $ $\left\langle {{P_{{n_1}}}\left( {{\alpha _1},\;{\beta _2}} \right),\;{P_{{n_2}}}\left( {{\alpha _1},\;{\beta _2}} \right)} \right\rangle $ $\cdots $ $\left\langle {{P_{{n_1}}}\left( {{\alpha _1},\;{\beta _q}} \right),\;{P_{{n_2}}}\left( {{\alpha _1},\;{\beta _q}} \right)} \right\rangle $
    ${\alpha _2}$ $\left\langle {{P_{{n_1}}}\left( {{\alpha _2},\;{\beta _1}} \right),\;{P_{{n_2}}}\left( {{\alpha _2},\;{\beta _1}} \right)} \right\rangle $ $\left\langle {{P_{{n_1}}}\left( {{\alpha _2},\;{\beta _2}} \right),\;{P_{{n_2}}}\left( {{\alpha _2},\;{\beta _2}} \right)} \right\rangle $ $\cdots $ $\left\langle {{P_{{n_1}}}\left( {{\alpha _2},\;{\beta _q}} \right),\;{P_{{n_2}}}\left( {{\alpha _2},\;{\beta _q}} \right)} \right\rangle $
    $ \vdots$ $ \vdots$ $ \vdots$ $ \vdots$ $ \vdots$
    ${\alpha _p}$ $\left\langle {{P_{{n_1}}}\left( {{\alpha _p},\;{\beta _1}} \right),\;{P_{{n_2}}}\left( {{\alpha _p},\;{\beta _1}} \right)} \right\rangle $ $\left\langle {{P_{{n_1}}}\left( {{\alpha _p},\;{\beta _2}} \right),\;{P_{{n_2}}}\left( {{\alpha _p},\;{\beta _2}} \right)} \right\rangle $ $\cdots $ $\left\langle {{P_{{n_1}}}\left( {{\alpha _p},\;{\beta _q}} \right),\;{P_{{n_2}}}\left( {{\alpha _p},\;{\beta _q}} \right)} \right\rangle $
    下载: 导出CSV 
    | 显示表格

    表3可知, 在GTSS中, 博弈对象分别为$ {n_1} = TR_{\left( {\alpha ,\;\beta } \right)}^{Mem}({\mu _A}) $和$ {n_2} = TE_{\left( {\alpha ,\;\beta } \right)}^{Mem}({\mu _A}) $, 博弈策略集分别为$ {S_{{n_1}}} = \{ {{\alpha _1},\;{\alpha _2},\; \cdots ,\;{\alpha _p}} \} $ 和 $ {S_{{n_2}}} = \{ {\beta _1},\;{\beta _2},\; \cdots , \; {\beta _q} \} $, 其中$ p,\;q \in {\mathbf{N}^ + } $, $ {P_{{n_i}}}\left( {{\alpha _p},\;{\beta _q}} \right) $表示$ {n_i} $执行$ \left( {{\alpha _p},\;{\beta _q}} \right) $时的收益, 如式(12)及式(13)所示, 其通过一个常量值$ C $与隶属度损失的差值来表示. 其中, 常量值$ C $及收益函数可根据不同的研究背景和待解决问题来设定[11]. 在GTSS中, 博弈的停止条件 (即确定最优$ \left( {\alpha ,\;\beta } \right) $的条件)为: 使得$ P_{{n_1}}^{}\left( {{\alpha _p},\;{\beta _q}} \right) $和$ P_{{n_2}}^{}\left( {{\alpha _p},\;{\beta _q}} \right) $之和最大的$ \left( {{\alpha _p},\;{\beta _q}} \right) $.

    $$ \begin{equation} \begin{array}{l} P_{{n_1}}^{}\left( {{\alpha _p},\;{\beta _q}} \right) = C - TR_{\left( {{\alpha _p},\;{\beta _q}} \right)}^{Mem}\left( {{\mu _A}} \right) \end{array} \end{equation} $$ (12)
    $$ \begin{equation} \begin{array}{l} P_{{n_2}}^{}\left( {{\alpha _p},\;{\beta _q}} \right) = C - TE_{\left( {{\alpha _p},\;{\beta _q}} \right)}^{Mem}\left( {{\mu _A}} \right) \end{array} \end{equation} $$ (13)
    1.1.4   区间阴影集

    Zhang等[12]首先提出区间模糊熵的计算方法, 随后提出ISS模型, 其使用$ \left[ {\beta ,\;\alpha } \right] $来代表阴影域对象, 替代传统模型的[0, 1], 如定义3及图3(b)所示, 并以最小化模糊熵损失为目标构建求取最优$ \left( {\alpha ,\;\beta } \right) $的目标函数.

    定义3[12] (区间阴影集). 设$ U $为非空有限论域, $ \alpha $和$ \beta $为两个实数, 并且$ 0 \le \beta < \alpha \le 1 $, $ \alpha + \beta = 1 $, 则定义$ U $到$ \{ 0,\;[\beta ,\;\alpha ],\;1\} $的映射函数, 即$ {S^*}:U \to \{ 0,\;[\beta ,\;\alpha ],\;1\} $为区间阴影集, 如下所示

    $$ S_{{\mu _A}}^*(x) = \left\{ {\begin{aligned} &1,&&{{\mu _A}(x) \ge \alpha } \\ &0,&&{{\mu _A}(x) \le \beta }\\& {[\beta ,\;\alpha ]},&&{\beta < {\mu _A}(x) < \alpha } \end{aligned}} \right. $$ (14)

    相比定义2, Zhang等[12]分析认为区间$ [\beta ,\;\alpha ] $相比[0, 1]能够使得所构建阴影集与模糊集之间具有更小的不确定性损失, 即模糊熵损失, 而更小的模糊熵损失意味着阴影集更有效. 对此, 文献[24]曾指出: 阴影集本质上是对模糊集的一种符号表示, 即模糊信息的粒化处理, 而基于粒计算思想来看, 可理解为同样的知识在不同粒度层次下的体现, 前者是粗粒度, 后者是细粒度. 综上, 当阴影集与模糊集之间的熵损失越小, 则阴影集对模糊集的近似描述就越好, 即两者间所蕴含知识量和信息量的一致性就保存的越好.

    在ISS模型中, 模糊集与阴影集之间的不确定性损失通过模糊熵损失来衡量, 后者是Liu[20] 所提出的一种描述模糊集合不确定性程度的方法. Zhang等[12]分析发现传统模糊熵度量方法仅针对模糊集有效, 无法直接用于阴影集. 因此, 提出阴影集的模糊熵度量方法, 即针对阴影区间的模糊熵度量方法, 如式(15)所示, $ {\bar e_{[a,\;b]}}(x) $表示区间$ [a,\;b] $内对象$ x $的区间模糊熵, 其中$ [a,\;b] \subseteq [0,\;1] $, $ {\mu _A}(x) $等概率地取到$ [a,\;b] $中的任何值.

    $$ \begin{equation} {\bar e_{[a,\;b]}}(x) = \frac{1}{{b - a}}\int_a^b {{\mu _A}(x)(1 - {\mu _A}(x))} \mathrm{d}{\mu _A}(x) \end{equation} $$ (15)

    ISS模型同样通过平衡阴影集提升域模糊熵$ e_{\left( {\alpha ,\;\beta } \right)}^{Ele}({\mu _A}) $、减小域模糊熵$ e_{\left( {\alpha ,\;\beta } \right)}^{Red}({\mu _A}) $以及阴影域模糊熵$ e_{\left( {\alpha ,\;\beta } \right)}^{Shadow}({\mu _A}) $之间的变化来寻找最优$ (\alpha ,\;\beta ) $, 如图3(b) 及式(16)所示, 并将其转化为最优化问题, 通过最小化模糊熵损失来求取最优$ (\alpha ,\;\beta ) $, 如式(17)所示. 其中, $ {E_{(\alpha ,\;\beta )}}({\mu _A}) $为目标函数, 如式(18)所示.

    $$ \begin{equation} e_{\left( {\alpha ,\;\beta } \right)}^{Ele}({\mu _A}) + e_{\left( {\alpha ,\;\beta } \right)}^{Red}({\mu _A}) = e_{\left( {\alpha ,\;\beta } \right)}^{Shadow}({\mu _A}) \end{equation} $$ (16)
    $$ \begin{equation} \arg \mathop {\min }\limits_{(\alpha ,\;\beta )} {E_{(\alpha ,\;\beta )}}({\mu _A}) \end{equation} $$ (17)
    $$ \begin{split} {E_{(\alpha ,\;\beta )}}({\mu _A}) = \;&\left| {e_{\left( {\alpha ,\;\beta } \right)}^{Ele}({\mu _A}) + e_{\left( {\alpha ,\;\beta } \right)}^{Red}({\mu _A}) \;- } \right.\\ &\left. {\begin{array}{*{20}{c}} {} \end{array}e_{\left( {\alpha ,\;\beta } \right)}^{Shadow}({\mu _A})} \right| \end{split} $$ (18)

    综上, 可求得ISS模型的$ \left( {\alpha ,\;\beta } \right) $, 进而将模糊集中的对象近似划分到提升域、减小域和阴影域.

    1.1.5   基于模糊熵均值的决策理论阴影集

    针对0.5SS和MDTSS模型需要人为设定代价参数所带来的主观性问题以及模型模糊熵损失较大等问题, Gao等[13]提出MESS模型, 其从模糊熵的角度探讨了阴影域的表示, 分析了决策划分过程中不同划分行为所造成的熵损失, 在新提出的决策理论划分规则基础上, 推导出$ \left( {\alpha ,\;\beta } \right) $, 其无需人为设定代价参数, 避免了主观性, 并通过迭代的形式优化了$ \left( {\alpha ,\;\beta } \right) $. 基于定义2, MESS模型给出了新的三支近似映射形式, 即$ {S^*}:U \to \{ 0,\;{\delta ^{\rm{*}}},\;1\} $, 其利用全体模糊对象的模糊熵均值$ \mathop e\limits^\_ (A) $来表示阴影区域对象的不确定性水平, 即式(19) (处理连续型数据)及式(20)(处理离散型数据), 进而求得阴影域对象的隶属度代表值, 即式(21), 其中$ 0 < \delta _1^* \le 0.5 $, $ 0.5 \le \delta _2^* < 1 $且$ \delta _1^* + \delta _2^* = 1 $.

    $$ {\overline e _{lx}}(A) = \frac{{\int\limits_{x \in S({\mu _A})} {{\mu _A}(x)(1 - {\mu _A}(x))} \mathrm{d}x}}{{card(S({\mu _A}))}} $$ (19)
    $$ {\overline e _{ls}}(A) = \frac{{\sum\limits_{x \in S({\mu _A})} {{\mu _A}(x)(1 - {\mu _A}(x))} }}{{card(S({\mu _A}))}} $$ (20)
    $$ \begin{equation} \delta _1^* = \frac{{1 - \sqrt {1 - 4\mathop e\limits^\_ \left( A \right)} }}{2},\;\begin{array}{*{20}{c}} {} \end{array}\delta _2^* = \frac{{1 + \sqrt {1 - 4\mathop e\limits^\_ \left( A \right)} }}{2} \end{equation} $$ (21)

    对于$ \left( {\alpha ,\;\beta } \right) $的求取, 受MDTSS的启发, MESS结合贝叶斯决策理论, 并以最小化阴影集三个区域中对象的决策划分代价为目标构建目标函数, 与MDTSS所不同的是, MESS模型的决策代价为模糊熵损失, 而非隶属度损失. 给出阴影集的四种划分操作$ Actions = \left\{ {{a_e},\;{a_r},\;{a_{s \downarrow }},\;{a_{s \uparrow }}} \right\} $及其相应的模糊熵损失$ El(a| x ) $, $ a \in Actions $, 如表4所示.

    表 4  MESS中划分所造成的熵损失
    Table 4  Entropy loss caused by partitions in MESS
    划分动作 模糊集 阴影集 熵损失$El(a| x )$
    ${a_e}$ ${\mu _A}( x )$ 1 $El({a_e}| x )$
    ${a_r}$ ${\mu _A}( x )$ 0 $El({a_r}| x )$
    ${a_{s \downarrow }}$ ${\mu _A}( x ) \ge {\delta ^*}$ ${\delta ^*}$ $El({a_{s \downarrow }}| x )$
    ${a_{s \uparrow }}$ ${\mu _A}( x ) < {\delta ^*}$ ${\delta ^*}$ $El({a_{s \uparrow }}| x )$
    下载: 导出CSV 
    | 显示表格

    表4可知, 在MESS中, $ \forall x \in U $在执行划分操作时所造成的模糊熵损失函数$ El(a\left| x \right.) $, 如式(22)所示, $ {E_b} $和$ {E_e} $分别代表执行划分操作前和操作后的模糊熵. 进而构建$ U $中全体对象的损失函数$ El\left( {\alpha ,\;\beta } \right) $, 如式(23)所示, 将其视为最优化问题, 并进一步构建决策划分规则, 通过规则的约简和推导来求取$ \left( {\alpha ,\;\beta } \right) $, 分别如式(24)和式(25)所示, 其中$ \alpha + \beta = 1 $.

    $$ \begin{equation} El(a|x) = \left| {{E_e} - {E_b}} \right| \end{equation} $$ (22)
    $$ \begin{equation} El(\alpha ,\;\beta ) = \sum\limits_{x \in U} {El(a|x)} = \sum\limits_{x \in U} {\left| {{E_e} - {E_b}} \right|} \end{equation} $$ (23)
    $$ \begin{equation} \arg \mathop {\min }\limits_{(\alpha ,\;\beta )} El(\alpha ,\;\beta ) \end{equation} $$ (24)
    $$ \begin{equation} \alpha = \frac{{1 + \sqrt {1 - 2\delta _1^*\delta _2^*} }}{2},\;\begin{array}{*{20}{c}} {} \end{array}\beta = \frac{{1 - \sqrt {1 - 2\delta _1^*\delta _2^*} }}{2} \end{equation} $$ (25)

    此外, Gao等[13]分析基于上述步骤所求取的$ \left( {\alpha ,\;\beta } \right) $虽然减小了模糊熵损失, 但不能使MESS具有最小的模糊熵损失, 其主要原因是初次求取$ \mathop e\limits^\_ \left( A \right) $时, $ S({\mu _A}) = A $, 这其中包含了部分隶属度非常接近1或0的对象, 即确定性对象, 这使得$ \mathop e\limits^\_ \left( A \right) $在初次计算时不能充分代表$ A $中对象不确定性水平, 从而影响$ \left( {\alpha ,\;\beta } \right) $的计算. 因此, MESS采用了模型迭代的方法[13], 利用初次求取的$ \left( {\alpha ,\;\beta } \right) $来约束不确定性对象的集合, 筛选出不确定性较小的对象, 保留不确定性较大的对象, 用作下一次$ \mathop e\limits^\_ \left( A \right) $的求取, 从而实现最优$ \left( {\alpha ,\;\beta } \right) $的迭代搜索, 减小模型的模糊熵损失.

    1.1.6   基于模糊熵的博弈论阴影集

    传统GTSS通过对隶属度误差之间的博弈分析寻找最优$ \left( {\alpha ,\;\beta } \right) $, 然而其缺乏对不确定性变化的考虑, 这使得所构建GTSS虽然具有较小的隶属度误差, 但却可能存在较大的不确定性损失. 此外, 在GTSS中, 当$ \left( {\alpha ,\;\beta } \right) $的精度要求越高, 则博弈策略的搜索时间越长, 即最优$ \left( {\alpha ,\;\beta } \right) $的搜索效率较低. 因此, Zhang等[14] 提出FE-GTSS, 其遵循文献[24]提出阴影集时的初衷, 即最小化不确定性损失, 直接基于不确定性的视角, 结合博弈论的折中原理[1819], 对阴影集不同划分操作所造成的不确定性损失(即模糊熵损失)进行博弈分析. 并从博弈的对象、策略、收益函数和停止条件四个方面讨论了模型的构建步骤. 此外, FE-GTSS还采用二分法替换传统GTSS中的顺序查找法, 从而提高最优$ \left( {\alpha ,\;\beta } \right) $的查找效率. 此外, Zhang等[14]还基于对数据特性的考虑, 对模型进行了扩展分析.

    以连续型模糊隶属度函数为例, 如图5所示, 在阴影集近似划分过程中, $ \forall x $通过$ \left( {\alpha ,\;\beta } \right) $采取提升或减小隶属度这两种操作时, 将造成两种类型的模糊熵损失: 模糊熵提升的损失$ TE_{{\left( {\alpha ,\;\beta } \right)}}^{Ent}\left( {{\mu _A}} \right) $ (黄色区域)和模糊熵减小的损失$ TR_{{\left( {\alpha ,\;\beta } \right)}}^{Ent}\left( {{\mu _A}} \right) $ (蓝色区域), 分别如式(26)和式(27)所示, 其中$ {R_{e1}}({\mu _A}) $, $ {R_{e0}}({\mu _A}) $, $ {E_{\delta 1}}\left( {{\mu _A}} \right) $和$ {E_{\delta 2}}\left( {{\mu _A}} \right) $分别表示对象在不同区域模糊熵变化所造成的损失.

    图 5  FE-GTSS中两种模糊熵损失随决策阈值的博弈变化
    Fig. 5  The game variation of two fuzzy entropy losses with decision threshold in FE-GTSS
    $$ \begin{equation} TE_{(\alpha ,\;\beta )}^{Ent}\left( {{\mu _A}} \right) = {E_{\delta 1}}\left( {{\mu _A}} \right) + {E_{\delta 2}}\left( {{\mu _A}} \right) \end{equation} $$ (26)
    $$ \begin{equation} TR_{(\alpha ,\;\beta )}^{Ent}({\mu _A}) = {R_{e1}}({\mu _A}) + {R_{e0}}({\mu _A}) \end{equation} $$ (27)

    显然, 无论$ \left( {\alpha ,\;\beta } \right) $如何变化, 两种模糊熵损失始终呈相反的变化趋势, 即形成非合作型博弈. 因此, FE-GTSS模型将两种模糊熵损失作为相互博弈的对象, 即, $ {n_1} = TR_{(\alpha ,\;\beta )}^{Ent}\left( {{\mu _A}} \right) $, $ {n_2} = TE_{(\alpha ,\;\beta )}^{Ent}\left( {{\mu _A}} \right) $; 将$ \left( {\alpha ,\;\beta } \right) $的阈值变化作为博弈策略, 即$ {S_{{n_1}}} = \{ {\alpha _1}, {\alpha _2},\;\cdots ,\;{\alpha _p} \} $和$ {S_{{n_2}}} = \left\{ {{\beta _1},\;{\beta _2},\;\cdots ,\;{\beta _q}} \right\} $; 将模糊熵的总损失最小(即博弈收益最大)作为博弈目标, 博弈收益函数如式(28)及式(29)所示. 并构建如表3 所示的博弈收益表, 通过博弈均衡分析来搜索最优$ \left( {\alpha ,\;\beta } \right) $. 在FE-GTSS中, 博弈收益函数的设定以及常数值$ C $的设定可根据实际应用场景和待解决问题来设计. 博弈的停止条件为: 使得$ P_{{n_1}}^{}\left( {{\alpha _p},\;{\beta _q}} \right) $和$ P_{{n_2}}^{}\left( {{\alpha _p},\;{\beta _q}} \right) $之和最大的$ \left( {{\alpha _p},\;{\beta _q}} \right) $. 此时, FE-GTSS获得最大博弈收益, 即最小的模糊熵损失, 这更好地遵循了不确定性不变性准则.

    $$ \begin{equation} \begin{array}{l} P_{{n_1}}^{}\left( {{\alpha _p},\;{\beta _q}} \right) = C - TR_{\left( {{\alpha _p},\;{\beta _q}} \right)}^{Ent}\left( {{\mu _A}} \right) \end{array} \end{equation} $$ (28)
    $$ \begin{equation} \begin{array}{l} P_{{n_2}}^{}\left( {{\alpha _p},\;{\beta _q}} \right) = C - TE_{\left( {{\alpha _p},\;{\beta _q}} \right)}^{Ent}\left( {{\mu _A}} \right) \end{array} \end{equation} $$ (29)
    1.1.7   其他

    近期, Luo等[16]基于不确定性不变性准则, 在ISS模型的基础上提出一种改进模型, 即New-ISS, 设计一种新的不确定性平衡目标函数以及阈值对快速求取算法, 其目的是使得New-ISS模型具有更小的模糊熵损失和时间损耗. Gao等[17] 在GTSS和FE-GTSS模型的基础上, 继续将阴影集与博弈论相结合, 探究了基于多个构建准则约束条件下的阴影集构建方法, 提出基于不确定性和决策代价博弈分析的阴影集, 即UC-GTSS模型. 该工作着重讨论了如何通过博弈机制同时满足不确定性不变性准则和最小成本准则, 尝试将阴影集构建从传统的单一准则约束推广到多准则约束. 此外, 不同于当前阴影集构建准则都侧重于模型构建过程的语义解释和阈值确定的合理性, 该工作还从划分结果有效性的角度对UC-GTSS进行了扩展和讨论, 如近似分类精度与覆盖率之间的博弈, 划分区域的基尼系数之间的博弈等. 这些工作丰富了决策阈值的语义解释和合理性, 也增强了阴影集的应用价值, 使其能够满足更多的应用场景. 因篇幅限制, 不再详细介绍, 可参考文献[1617].

    鉴于阴影集对不确定性信息近似划分处理所体现出的有效性, 诸多学者围绕其理论性质展开了研究, 可总结如下两方面.

    在阴影集的模糊关系、结构解释、逻辑运算或数学性质等方面: 2003年, Cattaneo和Ciucci[56] 研究了阴影集与模糊集之间的关系, 并从代数的角度分析阴影集, 其定义一种BZMV代数结构, 使得给定一个模糊集可以返回特定的阴影集, 并对该代数结构进行了理论分析和证明, 并首次提出用精确值0.5来近似表达阴影域. 文献[34]以平衡数据的定性布尔描述和定量隶属度描述为目标, 结合粒计算的思想对阴影集进行阐述, 并详细介绍了其概念和被提出的动机, 分析了其基本逻辑运算和应用性, 并在模糊聚类场景中讨论分析了阴影集三个表达值的解释能力. 2013年, 区别于传统区间模糊数近似和梯形模糊数近似算法, Grzegorzewski[21]提出结合阴影集的模糊数近似算法, 并讨论其基本性质以及对细粒度计算的益处, 新算法能有效消除描述不精确现象时的过度精度问题, 并分析了新算法相比经典阴影集近似方法的优势. 2017年, Yao等[9]提出一个研究模糊集三支近似的通用框架, 用三值$ \{ n, m,\;p \} $的形式替代阴影集$ \left\{ {0,\;[0,\;1],\;1} \right\} $的表达形式, 即式(1), 并通过回顾现有研究总结了求取和解释阴影集$ \left( {\alpha ,\;\beta } \right) $的三个基本准则: 不确定性不变性, 最小距离, 最小成本, 其中最小距离准则是最小成本准则的一种特例[22]. 文献[2324]在文献[89]所提出的决策理论阴影集基础上, 采用一个变量值$ C $替换常量值0.5来表示阴影域, 并通过分析阴影集中的提升和降低操作, 引出四个划分代价参数, 进而建立新的目标函数. 详细讨论了$ C $值的四种特殊情况及其与$ \left( {\alpha ,\;\beta } \right) $的关系和性质. 并通过引入粒子群算法优化目标函数, 以最小化总代价为目标搜索最优$ C $值和相应的$ \left( {\alpha ,\;\beta } \right) $. 2019年, Zhou等[22, 25]详细分析了Pedrycz[2] 和Yao等[9]所构建的三支近似阴影集模型的连续性和凸性, 以及最优解的存在性和唯一性, 并发现即使在相同的优化模型下也会产生不同的近似划分区域, 这需要新的标准来构造阴影集, 因此提出被动和主动约束阴影集的概念, 分析了其数学性质, 并设计一种快速求取最优阈值的算法. 2019年, Zhao和Yao[26]提出一种三支模糊划分的概念框架, 其将阴影集的思想应用于非空模糊集簇, 从而构建该簇的三支近似, 即阴影集簇. 引入了$ \left( {\alpha ,\;\beta } \right) $的三对性质来定义、描述和分类三支模糊划分, 即$ \alpha $和$ \beta $的不相交性质、重叠性质和覆盖性质. 此外, 利用两组性质给出了三支模糊划分的一般定义, 并通过考虑所有可能的非等价性质子集得到了21种三支模糊划分, 深入研究了其中3种, 并分析了它们与划分、模糊划分和区间集簇之间的联系. 2020年, Ciucci和Yao[27]作为国际期刊Information Sciences的客座编辑, 发表特刊介绍了粒计算理论、阴影集理论以及三支决策理论三者之间的关系和协同作用, 并总结了部分代表性研究工作. 2022年, Boffa等[28]探讨了模糊集上聚合算子与阴影集上相应聚合算子之间的关系, 并重点研究了模糊集近似为阴影集的同态条件. 利用同态条件从所有潜在运算的集合中找到了阴影集上有运算意义的类, 并提出了满足同态条件的一类新聚合算子. 综上所述, 围绕阴影集理论性质的研究可总结如表5所示.

    表 5  阴影集理论性质的研究总结
    Table 5  Research summary of theoretical properties of shadowed set
    研究内容文献
    阴影集的代数结构[56]
    阴影集与粒计算的关系及被提出的动机[34]
    基于阴影集的模糊数近似方法及性质和益处[21]
    阴影集的三支近似通用表达框架及构建准则总结[9]
    阴影集阴影区域表达参数与决策阈值的关系和性质[2324]
    阴影集的连续性和凸性及最优解的存在性和唯一性[22, 25]
    基于阴影集的模糊划分框架及划分阈值的性质[26]
    阴影集、粒计算及三支决策理论三者间的协同作用[27]
    阴影集的聚合算子及其与模糊集之间的同态条件[28]
    下载: 导出CSV 
    | 显示表格

    基于不同模糊集下的阴影集构建分析方面: 2013年, Tahayori等[29]提出一种基于渐进数的模糊集模糊性表示方法, 并证明了模糊测度的不同选择可能导致不同阴影集. 随后, 提出一种针对任意模糊集的阴影集构建公式, 其通过去模糊化处理来计算从给定模糊集导出阴影集所需的最优阈值. 区别于Pedrycz[2]从三角模糊集和高斯模糊集等连续型论域求出阴影集的最优阈值, Tahayori等[29] 提出的方法能够处理离散型论域以及任意隶属函数所描述的模糊集, 并且其同时遵循不确定性不变性原则. 2017年, Cai等[30]认为在实际应用中具有时变隶属度的动态模糊集更为常见, 因此其探讨了基于动态模糊集的阴影集构建方法, 包括经典阴影集中三划分区域不确定性平衡的方法以及基于贝叶斯理论下最小化决策代价的方法. 2017年, Bose和Mali[31]采用模糊集基数的渐进形式来表示模糊集的模糊性, 并证明了两者之间的关系, 随后通过两个不同且非对称的阈值$ {\alpha _1} $和$ {\alpha _2} $来增强阴影域划分的灵活性, 即$ {\alpha _1} < 0.5 $, $ {\alpha _2} \ge 0.5 $且$ {\alpha _1} \ne 1 - {\alpha _2} $, 最后以最小化模糊性差异为目标, 求取构建阴影集的最优阈值. 2019年, 文献[3233] 以最小化不确定性差异为目标, 提出两种阴影集构建算法: 在文献[32]中描述了一种基于不确定性平衡的平均值方法, 阐述了如何从连续模糊隶属函数中求取最优划分阈值; 在文献[33]中则分析了在离散型模糊隶属函数下的最优划分阈值求取, 并且给出了量化给定集合不确定性的方法, 同时通过穷举搜索的形式寻找对模糊集近似的最佳对称阈值. 最近, William-West和Ibrahim[34]还提出一种针对不确定性和确定性平衡考虑的构建准则, 将阴影集的划分域从3个推广到5个, 讨论了最优阈值的求取, 并分析了其存在性和唯一性. 2020年, Campagner等[35] 基于信息论探讨了将直觉模糊集近似为阴影集的方法, 其目标依旧是最小化两者间的不确定性差异, 从而保持原始直觉模糊集中通过熵度量所表示的不确定性, 并提出三种构建阴影集的高效优化算法, 分别对应考虑了模糊性和知识的缺失性以及两者的整体考虑. 2021年, Yang和Yao[36] 研究了从Atanassov直觉模糊集构造阴影集的两种可能方案, 方案1将隶属度和非隶属度函数视为一对评估函数来构建, 方案2将隶属度和非隶属度函数组合成一个评估函数来构建. 前者应用于基于二评估的三支决策模型, 后者应用于基于单一评估的三支决策模型, 此外还引入了切比雪夫距离来解决评估过程中的阈值求取问题. 随后, 在2022年, Yao和Yang[37]基于商空间理论提出粒粗糙集、概率粒粗糙集以及粒阴影集三种三支近似模型, 并详细分析了模型的构造过程和理论性质, 其核心变化是将论域中的划分对象由单个对象改变为具有不可分辨关系的单个等价类. 特别地, 通过对距离函数和划分代价的考虑, 给出了构建粒阴影集时三个区域的决策划分规则. 此外, 还分析证明了使得三个模型近似结果一致的必要条件. 综上所述, 基于不同模糊集的阴影集构建研究可总结如表6所示.

    表 6  基于不同模糊集的阴影集构建研究总结
    Table 6  Research summary of shadowed set construction based on different fuzzy sets
    研究内容文献
    任意隶属度函数下模糊集的阴影集构建[29]
    基于时变隶属度的动态模糊集的阴影集构建[30]
    基于渐进形式表达模糊集模糊性时的阴影集构建[31]
    离散型模糊隶属函数下模糊集的阴影集构建[3233]
    基于直觉模糊集的阴影集构建[35]
    基于Atanassov直觉模糊集的阴影集构建[36]
    基于模糊对象粒化后模糊集的阴影集构建[37]
    下载: 导出CSV 
    | 显示表格

    阴影集的三支近似划分操作, 将部分原本具有一定程度不确定性的对象转变成了确定性的对象, 即处在提升域和减小域中分别赋值为1和0的模糊对象. 从粒计算的视角来看, 这种将海量对象个体粒化处理到三个区域的做法, 在一定程度上减小了数据体量, 提高了数据质量, 也使得阴影集在其他计算和知识推理过程中能够提供更高的效率和更好的可解释性. 因此, 自阴影集被提出后, 诸多学者就将其作为一种有效的数据处理工具, 广泛结合到了不同的数据分析方法中.

    基于阴影集的聚类算法方面: 2010年, Mitra等[38]基于阴影集提出一种结合模糊聚类和粗糙聚类的阴影C均值(Shadowed C-means, SCM) 聚类算法. 该算法能够实现划分阈值参数的自动求取, 减少人为因素的影响, 并且能够利用阴影集三划分的思想约减无效数据, 从而减小计算量, 能够有效处理类簇之间的重叠区域以及类簇边界中的不确定性对象. 2011年, Zhou等[39]在基于粗糙集的聚类方法中, 分析了近似区域阈值的求取对类簇所形成信息粒描述的有效性, 认为近似阈值的求取至关重要, 因为其反映了数据的结构特性. 因此在基于粗糙集的聚类研究中引入了阴影集, 目的是实现近似阈值的自适应获取, 解决粗糙C均值(Rough C-means, RCM)聚类算法和粗糙模糊C均值(Rough fuzzy C-means, RFCM)聚类算法中所存在的对象间缺少全局关系分析的问题, 并证明其有效性. 此外, 在2018年, Zhou等[40]还通过集成粗糙集、模糊集、阴影集和多粒度概念等粒计算技术, 提出了基于多粒度近似区域和阴影集的粗糙可能性C均值(Rough possibilistic C-means, MS-RPCM)聚类算法, 该算法可充分解决数据中涉及的以及由模型参数产生的不确定性问题, 并且该算法对于处理噪声环境具有较好的鲁棒性. 2011年, 郭晋华等[41]针对软聚类的研究工作, 在RCM和RFCM的基础上提出基于阴影集的粗糙模糊C均值(Shadowed rough fuzzy C-means, S-RFCM)聚类算法, 解决了RCM和RFCM需要人为设定阈值参数来划分不同决策区域所导致的强主观性问题. 而S-RFCM可以利用阴影集实现对数据本身特性的考虑, 从而自动化求取决策阈值, 自适应给出决策区域. 相类似地, 2013年, 汪海良等[42]基于经典阴影集, 提出新的粗糙模糊可能性C均值(Shadowed rough fuzzy possibility C-means, S-RFPCM) 聚类算法, 利用阴影集自动化求取传统RFPCM算法的决策划分阈值. 随后, Kong和Chen等[43]分析S-RFCM算法在处理非球形聚类数据时具有较差效果, 因此提出一种新的聚类方案, 其在S-RFCM算法基础上融入核方法以及傅立叶随机特征映射, 从而处理非球形数据以及数据中的异常值问题.

    2012年, Falcon等[44]提出一种处理增量数据的阴影集集群聚类算法, 分析了其相比基于C均值聚类算法的优势, 并将其应用于国家领土安全环境中风险源的可视化识别场景. 该算法能够对数据进行实时处理, 能很好地处理噪声和异常样本, 并且无需预先获得聚类数量. 2013年, 李秀馨等[45]基于卫星云图聚类分析的应用场景, 将阴影集与模糊C均值聚类算法、离子群优化算法相结合, 提出一种改进的聚类算法, 而阴影集的引入则有效去除了类簇中的异常值, 提升了算法有效性. 2015年, 蒙祖强等[46]在RFCM算法基础上, 结合混合蛙跳算法及阴影集来处理模糊类簇, 实现类簇划分阈值的自适应求取, 解决了RFCM算法的初值敏感、局部最优以及$ \left( {\alpha ,\;\beta } \right) $设定存在主观性的缺陷. 2016年, Li等[47]基于阴影集提出针对混合属性的聚类边界检测算法, 其利用阴影集对不同类簇进行划分, 根据贡献度更新类簇质心信息, 并不断迭代优化, 最终整合并输出所有类簇基于阴影集划分的边界集. 该算法可有效、准确地检测聚类边界, 还可提取指定聚类的边界点或数据集的整个边界, 并对噪声具有抑制作用. 文献[4849]基于集成学习和阴影集理论, 从三个角度考虑提出三种新颖的模糊聚类算法, 即, 结合阴影集的特征加权考虑, 结合阴影集和粗糙集的特征加权考虑, 以及基于两者的概率不相似函数混合数据考虑. 并在不同的应用场景和现实问题中分析了上述算法的有效性, 如民航机场噪声时间序列的预测、网络入侵的检测以及离群点噪声的检测等.

    文献[5051]在密度峰值聚类(Density peaks clustering, DPC)算法的基础上引入ISS模型, 从而自适应地获取用于设定类簇范围的截断距离, 而非传统的人为主观设定的方法, 同时利用ISS对类簇结果进行三支划分, 替换传统二支划分的聚类结果. 该方法能有效减少类簇的错误分类率, 并提升对噪声数据的抗噪性. 2019年, 雒僖等[52]利用阴影集理论对截集式可能性C均值聚类算法进行改进, 新算法利用阴影集自动求取划分阈值的优势来为每个类簇确定聚类核, 并实现截集门限的自动化选取. 2020年, Zhou等[53]结合阴影集提出广义多粒度RFCM算法, 很好地实现了数据拓扑结构的捕捉, 并解决了数据中包含的不确定信息, 包括模糊化系数产生的不确定性、边界域和重叠域中产生的不确定性. 此外, Zhou等[54]还分析了构造模糊集三支近似的几种方法, 并概括了三类准则: 基于不确定性平衡的准则, 基于原型的准则, 基于模型的分类误差与数据体量之间权衡的准则, 提出一种基于模糊集三支近似的通用无监督学习框架, 在此框架下使用不同数据集对不同构建准则的有效性进行了比较评估, 并给出推荐. 2022年, William-West等[55]在无监督学习框架下, 对SCM聚类算法进行了理论分析, 并定义了三种构建优化准则, 即确定域与不确定域之间的平衡准则、清晰度平衡准则和渐进性平衡准则, 并评估了每种准则的优势.

    基于阴影集的分类算法方面: 2020年, Yue等[56]设计一种新的阴影集来构造不确定性数据分类的阴影邻域. 新模型利用阶跃函数将邻域隶属度映射到三值集合$ \left\{ {0,\;1,\;0.5} \right\} $, 从而将邻域划分为特定的正、负和不确定边界域, 并通过阴影集的最优化原理来寻找阶跃函数中的阈值参数, 设计了相应的三支分类规则, 提出一种基于阴影邻域的三支分类算法. 随后, 文献[5758] 进一步提出一种基于半监督阴影集的三支分类方法, 其首先提出一种新的半监督阴影集来构造阴影邻域, 从而实现对含有部分标记的不确定性数据的三支分类, 随后设计了新的阴影集目标函数和分类规则来实现三支分类, 并分析了标记数据对阴影集构造的影响以及新方法的有效性. 文献[5962]基于阴影集理论提出一种多粒度三支聚类集成算法和一种快速KNN分类算法. 前者利用阴影集对基聚类进行处理, 从而形成三支聚类结果, 而对于基聚类的构造, 则分别采用模糊C均值算法和可能性C均值算法进行了探讨; 后者分类算法则利用三支聚类将训练样本进行划分, 从而实现数据样本约减, 优化数据样本质量, 提高分类效率, 而三支聚类的形成则基于阴影集来实现.

    基于阴影集的数据预处理方面: 文献[6365]提出一种训练数据筛选方法, 其利用阴影集将训练数据划分成三部分, 将正域和阴影域中的样本数据分别称之为核数据和边界数据, 并验证分析了这两个区域的数据作为训练样本能足够保留典型样本, 减少训练样本数据量并增强数据质量, 有效提高神经网络分类器的性能. 此外, 结合阴影集对训练样本数据筛选的优势, 苏小红等[66] 也利用阴影集来进行训练样本的筛选, 并提出一种改进的模糊SVM数据样本选择算法. 2012年, 周凡程等[67]结合阴影集提出一种提取候选断点集的新算法, 其根据候选断点在单属性上的分布来对数据样本进行分类, 并基于阴影集对决策分类结果进行三支划分, 从而选取候选断点集. 该算法能有效减少候选断点数目, 选出重要断点, 解决了连续属性离散化过程中冗余断点集过多所带来的噪声影响. 2012年, 王丹等[68]提出一种基于阴影集聚类的离群点检测算法. 首先从数据的全局特性和局部特性两个角度出发, 提出一种离群因子的定义, 离群因子值越大表示对象属于离群点的可能性越大, 该定义考虑了离群点的不确定性和欧氏距离. 随后, 融合阴影集及FCM算法, 通过对离群因子值的数据处理来筛选离群点, 该算法能够同时实现聚类和离群点的检测.

    综上所述, 可知阴影集在数据分析领域得到了广泛应用, 而不同研究内容对于引入阴影集的优势可总结如表7所示. 由表7可知, 在数据分析领域引入阴影集后的共性优势可总结为: 1)阈值的自动化求取; 2)数据体量的有效约减; 3)异常值或噪声样本的识别; 4)算法效率或精度的提升. 其中, 优势1)的原因是其利用了阴影集不确定性不变性准则求取决策划分阈值, 即式(3), 这无需人为设定参数, 避免了主观性影响. 优势2)和优势3)的原因本质上是阴影集对数据三划分处理所造成的. Pedrycz和 Vukovich[3]以聚类过程为例, 分析了阴影集对数据结构的解释和层次描述. 如图6所示, 基于阴影集的划分思想, 类簇将被划分成核心域、阴影域和不确定域, 三个区域的数据质量依次递减, 而核心域的数据常被视为典型数据点, 并且用于数据分析的下一阶段, 噪声和异常样本则常出现在阴影域或不确定域, 而后者中通常为高度非典型数据点. 显然, 优势4) 的原因则是优势2)和优势3) 所导致的必然结果, 因为约减和筛选后的数据体量更小且质量更高, 这将有益于算法性能的提升.

    表 7  基于阴影集的数据分析研究总结
    Table 7  Research summary of data analysis based on shadowed set
    类别 研究内容 文献 引入阴影集的优势
    聚类 基于阴影集的C均值聚类算法(SCM) [38] 实现了阈值自动化求取、数据约减、计算效率的提升
    基于多粒度近似区域和阴影集的粗糙可能性C均值聚类算法(MS-RPCM) [3940] 实现了阈值自动化求取、数据不确定性问题的解决、噪声抑制能力的增强
    基于阴影集的粗糙模糊C均值聚类算法(S-RFCM) [41] 实现了阈值自动化求取、异常值的有效识别
    基于阴影集的粗糙模糊可能性C均值聚类算法(S-RFPCM) [42] 实现了阈值自动化求取、异常值的有效识别
    结合傅立叶随机特征映射和阴影集的粗糙模糊C均值聚类算法(AR-SRFCM) [43] 实现了非球形数据类簇的有效处理、异常值的有效识别
    基于增量数据的阴影集集群聚类算法(OSC) [44] 实现了数据的实时处理、噪声样本的有效识别
    结合阴影集和粒子群优化算法的模糊C均值聚类算法(SP-FCM) [45] 实现了数据约减、异常值的有效识别、算法效率和精度的提升
    结合阴影集和混合蛙跳算法的粗糙模糊C均值聚类算法
    (SFLA-SRFCM)
    [46] 实现了初值敏感、局部最优和参数设置主观性问题的解决
    基于阴影集的高维混合属性数据集聚类边界检测算法
    (CHASM)
    [47] 实现了边界检测及噪声抑制能力的增强
    基于阴影集和集成学习的模糊聚类算法及应用场景 [4849] 实现了阈值自动化求取、异常值的有效识别, 算法鲁棒性增强
    基于区间阴影集的密度峰值聚类算法(ISS-DPC) [5051] 实现了错误分类率的减少、抗噪性的增强
    基于阴影集的截集式可能性C均值聚类算法(C-PCM) [52] 实现了截集门限的自动化选取
    基于阴影集的广义多粒度粗糙模糊C均值聚类算法(MSRFCM) [5354] 实现了数据拓扑结构的捕捉、数据不确定性问题的解决
    基于无监督学习框架下的阴影C均值聚类算法(SCM) [55] 实现了传统SCM算法聚类质量和效率的提升
    基于阴影集的多粒度三支聚类集成算法(MTWCES) [5960] 实现了数据不确定性问题的解决、聚类准确率的提升
    分类 基于阴影邻域的三支分类算法(3WC-SNB) [56] 实现了不确定性数据的有效分类、分类风险性的降低
    基于半监督阴影集的三支分类算法(3WC-SSN) [5758] 实现了不确定性数据的有效分类、分类风险性的降低
    基于阴影集的快速KNN分类算法(TWC-KNN) [6162] 实现了数据约减、数据质量的优化、分类效率的提高
    数据
    预处理
    基于阴影集的训练数据选择算法 [6366] 实现了训练数据质量的提升、训练效率和分类器性能的提升
    基于阴影集的候选断点集提取算法 [67] 实现了候选断点识别效率和准确率的提高
    基于阴影集聚类的离群点检测算法 [68] 实现了聚类离群点检测识别率和识别精度的提高
    下载: 导出CSV 
    | 显示表格
    图 6  阴影集在聚类过程中对数据结构的描述
    Fig. 6  Shadowed set describe the data structure in the clustering process

    阴影集的应用研究主要基于其三个优势: 1)能够实现对不确定性信息的综合考虑, 并给予合理的语义解释; 2)能够实现模糊信息的自动化三支近似划分处理, 规避人为设定参数所带来的主观性; 3) 作为有效的数据预处理工具, 能够实现数据的约减及质量的优化, 提升处理效率及后续模型性能. 因此, 这也使得阴影集被应用于诸多研究领域, 如图像分类与识别、医疗信息处理、文本分析、决策推荐等.

    在图像分类与识别方面: Mitra和Kundu[69]引入阴影集来处理遥感图像分割过程中像素重叠域的不确定性问题, 其从像素点聚类的角度入手, 结合SCM聚类算法, 通过对边界域之间的不确定性问题建模以及自适应划分来实现图像交叠区域的有效分割, 并通过定性和定量分析证明了该算法在遥感图像和合成图像分割问题上的有效性. Zhang等[70]基于阴影集提出一种图像检索算法, 并开发一种基于显著性检测和边缘检测的阴影集阈值参数自动选择技术. 该算法将图像划分为显著区域、阴影区域和非显著区域, 保留前两个区域来作为检索资源, 以提取图像的有效信息, 忽略无关信息, 有效减少了冗余信息, 降低了信息检索的复杂性, 并提高了图像检索精度. Alavi和Kargari[71]将阴影集与图像增强领域相结合, 提出一种增强图像灰度对比度的方法. 其通过设计新的隶属度函数来将图像灰度值映射到模糊空间, 并优化图像中的局部参数和全局参数, 从而实现图像对比度的自动提高, 这将有益于图像的进一步处理和应用, 如遥感、误差检测和医学图像分析等. 杨晨旭等[72]将阴影集应用到人脸图像分类过程中的性别判定问题, 提出一种两阶段的图像分类算法. 在第一阶段通过深度卷积神经网络模型分类, 并结合阴影集的思想将结果划分到正域、阴影域和负域; 在第二阶段将阴影域的不确定性图像再次进行分类, 最后融合两个阶段的分类结果, 从而实现图像分类精度的提升. 相类似地, 陈超凡等[73]将阴影集视为一种狭义的三支决策模型, 并基于此构建一种新的两阶段图像分类算法. 其首先使用深度学习方法在第一阶段对图像进行分类, 获得隶属度矩阵, 并利用阴影集对隶属度矩阵进行划分, 获得三支分类结果. 随后, 在第二阶段利用特征融合方法, 结合深度学习和机器学习优势, 对上一阶段阴影域中的对象进行二次分类. 最后, 综合输出两个阶段的分类结果, 实现分类精度的提高. Cai等[74]分析低质量伪标签的噪声样本会对图像分类产生负面影响, 并导致较差的分类结果, 因此提出一种基于阴影集的半监督样本选择网络, 用于噪声标记图像的分类. 该技术将阴影集理论和基于损失相似性的聚类方法相结合, 从而实现干净样本的自适应选择, 并引入一种高质量伪标签样本选择策略, 利用所选择的干净样本和高质量伪标签样本来训练网络, 进而完成图像分类. 该网络有效减少了训练样本的数量, 并提高了图像分类性能.

    在医疗信息处理方面: Bose和Mali[75]受阴影集的启发, 提出一种基于渐进式基数表示的阴影集双聚类模型, 并将其应用到基因表达的聚类问题中, 从而增强聚类混淆区域基因性质的识别, 通过酵母数据、血清数据和小鼠数据三个真实数据集验证了模型在基因表达中的有效性, 还结合统计学和生物学证明了阴影集在基因表达问题中的优越性. 随后, 在2022年, Bose和Mali[76]进一步将阴影集与基于乳房X光图像的乳腺癌检测场景相结合, 将所提出的基于渐进式基数表示的阴影集双聚类模型应用于X光图像的对比度增强和微钙化识别问题中, 而微钙化的有效识别有助于提高乳腺癌的识别率. 其基于阴影集的思想, 通过平衡图像不同区域的不确定性, 从而将图像划分成“背景、不同密度组织、微钙化”三类. 该方法有效增强了整体图像特性, 并可以准确地识别“微钙化”, 从而提升乳腺癌的识别率.

    在文本分析方面: Wang等[77]探索了基于阴影集的语言术语建模及其在多属性决策中的应用, 其为了有效表达语言变量, 开发一种基于数据驱动和语言术语场景的阴影集模型, 并将阴影集与勾股模糊集相结合, 定义了勾股阴影集, 讨论了相关运算规则和基本性质, 推导了勾股阴影集的分数函数, 并在此基础上提出一种新的处理语言术语的多属性决策方法, 新方法较好地解决了信息丢失或失真问题, 可以提供更合理和准确的决策结果. Li等[78]探究了基于区间数据驱动的阴影集模型构造及其在语言词建模中的应用, 针对语言学中常用的模糊集, 根据其形状引入四种阴影集, 分别命名为常规、左肩、右肩和无核阴影集. 随后, 利用两种统计方法来确定阴影集的形状和参数, 即容差极限法和百分位数法, 并提出三个新的评价指标来衡量所构建阴影集的不确定性捕获能力和准确性. Zhang等[79]将阴影集与特征提取领域相结合, 提出一种基于TF-IDF和GTSS模型的特征提取方法, 其中TF-IDF是一种衡量单词与文档关系的常用加权指标, 被广泛应用于文本分类或自然语言处理场景下的单词特征提取任务. 该方法利用GTSS的重复博弈机制, 对文档间每个单词TF-IDF差异值的重复学习来计算相关单词的划分阈值, 从而实现相关单词的特征提取和淘汰. 得益于阴影集的优势, 该方法能够在保持模型性能的同时, 提升处理效率.

    在决策推荐方面: He等[80]将阴影集与群决策领域结合, 提出一种基于阴影集的扩展TODIM方法, 来解决具有语言信息的大规模群体决策问题, 其中TODIM是一种经典交互式和多准则决策方法的缩写. 新方法可以同时允许决策者以模糊信息的形式表达意见, 并考虑了决策者在大规模群体决策问题中的心理行为. 其首先基于数据驱动, 结合阴影集构建一个用于建模语言术语的码本. 随后, 提出一种针对阴影集的相似性测度来检测决策者的社会关系. 最后, 为了提高决策效率, 提出一种基于阴影集的聚类模型来对决策者进行划分, 并通过装配厂选址实例说明新方法的可行性和合理性. Wu等[81]将阴影集与推荐系统相结合, 提出一种基于阴影集的推荐算法, 实现不确定性信息的有效处理, 从而降低决策风险, 提高决策质量. 其首先将邻域粗糙集引入到推荐系统中以识别活跃用户和相似用户. 随后, 基于邻域成员关系设计了新的基于不确定性不变性的阴影集, 并将用户划分到阴影集的三个区域. 最后, 对不同区域的用户做出决策, 即推荐、延迟推荐和保留推荐. 这为不同用户实现了个性化和合理化的推荐, 提高了推荐质量.

    综上所述, 不同应用领域对于引入阴影集的优势可总结如表8所示. 这些研究成果充分说明, 凭借着对模糊信息处理的优势, 阴影集可以为解决许多领域的一些算法瓶颈问题提供帮助, 而随着阴影集的不断发展和完善, 其应用领域也将会更加广泛.

    表 8  基于阴影集的应用研究总结
    Table 8  Summary of application research based on shadowed set
    类别 研究内容 文献 引入阴影集的优势
    图像分类
    与识别
    基于阴影集的遥感图像分割算法 [69] 解决了遥感图像像素交叠区域的不确定性问题, 并提高了遥感图像分割的准确性和稳定性
    基于阴影集的图像信息检索算法 [70] 有效减少了冗余信息, 降低了信息检索的复杂性, 提高了图像检索精度
    基于阴影集的图像对比度增强算法 [71] 优化了图像的局部和全局参数, 实现了图像对比度增强的自动化提升
    基于阴影集和人脸图像的两阶段性别分类算法 [72] 实现了图像数据的多阶段处理, 大大减少了训练时间损耗以及分类的不确定性, 提高了图像的分类精度
    基于阴影集的两阶段图像分类算法 [73] 实现了图像数据的多阶段处理, 大大减少了训练时间损耗以及分类的不确定性, 提高了图像的分类精度
    基于阴影集的半监督样本选择网络在噪声标记图像中的分类算法 [74] 实现了干净样本的自适应选取和高质量伪标签样本的有效选取, 减少了训练样本的数量, 并提高了图像分类性能
    医疗信息处理 基于阴影集的基因表达聚类问题及基因性质识别 [75] 增强了聚类混淆区域中基因性质识别的有效性和准确率
    基于阴影集的乳房X光图像对比度增强及微钙化识别 [76] 增强了图像不确定性区域的对比度以及微钙化的识别率, 提高了乳腺癌的识别率
    文本分析 基于阴影集的语言术语建模及其在多属性决策中的应用 [77] 解决了信息丢失或失真所引起的不确定性问题, 提供了更合理和准确的决策结果
    基于区间数据驱动的阴影集构建及其在语言词建模中的应用 [78] 实现了以区间数据驱动的阴影集模型构建, 为针对语言词问题的建模提供了一种新视角
    基于博弈论阴影集的文本词特征提取算法 [79] 实现了语言词特征的有效提取, 并提高了针对语言词的分类性能和分类效率
    决策推荐 基于阴影集的语言信息大规模群体决策算法 [80] 通过阴影集对语言术语进行建模, 实现了对群体决策者意见的综合考虑, 提高了群体决策的效率和有效性
    基于阴影集的用户个性化决策推荐算法 [81] 减少了推荐系统推荐过程中的不确定性, 增强了决策推荐质量, 并能够针对不同用户实现个性化推荐
    下载: 导出CSV 
    | 显示表格

    事实上, 在数据挖掘领域, 有众多处理不确定性问题的理论方法和模型, 阴影集理论只是其中一种, 而随着阴影集理论的不断发展, 其与其他方法之间的关系也更加紧密. 本节将探讨阴影集理论与其他不确定性问题处理理论模型的联系.

    在当前智能信息时代, 数据体量高速增长, 数据特性纷繁复杂. 大数据的特性可总结为4V[82], 即, Volume, Variety, Velocity, Value. 而如何从大数据中去粗取精、去伪存真地挖掘出有效知识则是一个关键问题. 传统方法有机器学习、统计学、证据理论、深度学习和归纳学习等. 然而, 在将数据转换为知识的过程中, 常常伴随着不确定性问题的存在, 比如: 1)由于数据的高噪、稀疏和多源异构特性所带来的不确定性; 2)由于模型设计、方法选择或参数主观设定所带来的不确定性; 3)由于知识的不完备性或概念漂移所带来的不确定性; 4) 由于知识结果融合、评价标准不一或可解释性差所带来的不确定性. 这使得传统数据分析、数据挖掘和处理的方式方法不能够完全适用, 需要新的数据计算范式和模式[83]. 而如何有效解决数据挖掘过程中所存在的不确定性则成为当前大数据领域知识发现的一个关键问题.

    在当前人工智能领域中, 粒计算[84]是用于信息处理的一种新的理念和计算范式, 主要用于处理不确定的、模糊的、不精确的、海量的数据信息, 其基本思想是利用不同粒化程度或不同粒度上的信息来实现对复杂问题的求解, 并不特指某一具体方法或模型, 而是一种方法论[8586]. 梁吉业等[82]曾分析, 从人工智能的视角来看: 粒计算根据实际问题用可行的近似解替换精确解, 从而实现对复杂问题的简化和求解效率的提升, 这是一种模拟人类思考和解决大规模复杂问题的自然模式. 而从数据处理与分析的视角来看: 粒计算采用信息粒的形式替换样本个体作为运算基本单元, 这种形式能够将复杂数据进行有效简化, 从而实现计算效率的提高. 此外, 王国胤等[87]曾分析, 知识空间的粒化是粒计算的核心问题之一, 因为知识粒的不确定性将直接对粒计算解决复杂问题的有效性产生影响. 因此, 在不同模型下研究数据和知识的不确定性表示与度量问题就受到了诸多学者的关注, 而当前围绕不确定性问题的粒计算理论模型有: 模糊集[1]、粗糙集[88]、商空间[89]、云模型[90]、阴影集[2]、三支决策[9192]、多尺度粗糙集模型[93]、形式概念分析[94]、多粒度认知计算[86, 9596]等, 其核心思想总结如表9所示.

    表 9  粒计算理论的主要模型及核心思想总结
    Table 9  Summary of the main models and core ideas of granular computing theory
    年份 文献 理论模型 核心思想
    1965 [1] 模糊集 通过使用隶属度函数来对模糊性概念或不确定性信息进行表示与处理, 并进一步通过取值范围在0到1之间的精确隶属度值来描述一个对象隶属于模糊性概念的程度
    1982 [88] 粗糙集 通过利用不可分辨关系构成对象的等价类, 实现对论域空间的近似划分, 并使用具有精确概念的上近似集和下近似集来实现对一个不精确概念的近似表示与度量
    1982 [94] 形式概念分析 通过对象集与属性集之间的某种关联关系, 建立由对象集与属性集对所形成的形式概念层次结构, 并利用哈斯图的形式呈现不同粒概念之间的复杂关系, 实现对知识的挖掘和不确定性推理
    1992 [89] 商空间 通过将复杂问题表示成不同粗细的粒度空间, 从而构建多粒度分层递阶空间结构, 通过由粗到细或由细到粗的方式在多粒度空间中进行近似逼近, 将多粒度空间中粒的解组合成原问题的解, 从而获得复杂问题的解
    1995 [90] 云模型 通过使用期望、熵和超熵三个参数来对不确定性知识进行描述, 融合人类认知过程中随机与模糊这两种不确定性, 实现知识内涵与外延的相互转换
    1998 [2] 阴影集 通过一对决策划分阈值来对模糊集进行近似划分处理, 并通过平衡不同划分区域的不确定性来构建阈值求取的目标函数, 利用这种粗糙的近似表达来替换模糊集过于精确的表达, 从而减少模糊决策过程中不确定性对象的决策划分成本和计算损耗
    2009, 2010 [9192] 三支决策 通过“三分而治”的思想将论域划分为三个子集, 即正域、负域和边界域, 并对不同子集采取不同的决策行为或分治策略, 即接受、拒绝和延迟决策, 进而对相应的行为或策略进行评价和反馈, 实现对复杂问题或信息不充分问题的求解
    2011 [93] 多尺度粗糙集模型 通过将属性的取值标记为不同尺度(粒度)层次, 进而讨论知识在不同尺度下的关系及变化规律, 以及在给定尺度好坏评价标准的情况下最优尺度层次的选择方法, 实现在最优尺度空间中对知识的表示和获取
    2018, 2019,
    2022
    [86, 9596] 多粒度认知计算 通过数据信息驱动, 融合人类“大范围首先”的认知机制(即“由粗粒度到细粒度”的认知过程)以及计算机的信息处理机制(即“由细粒度到粗粒度”的知识挖掘过程), 实现数据和知识双向驱动的空间变换和智能信息处理, 解决认知计算过程中的“数据与知识分离”问题
    下载: 导出CSV 
    | 显示表格

    综上所述, 简要给出不同粒计算理论模型之间的关系图谱, 如图7所示. 本节将主要关注与阴影集理论相关联的模型, 即讨论阴影集与模糊集、粗糙集以及三支决策理论之间的关系.

    图 7  不同粒计算理论模型之间的简要关系图谱
    Fig. 7  Brief relationship graph between different granular computing theory models

    阴影集与模糊集: 模糊集被认为是用于捕获、表示和处理模糊问题的载体之一, 正如表9中所述, 其通过构造隶属度函数以及精确的隶属度值来描述一个模糊性概念. 然而, 精确的隶属度值就像是一把双刃剑, 对于一般概念的描述并不总是需要完全精确的隶属度, 而且过度的精度也伴随着巨大的计算损耗[24]. 因此, 阴影集通过一种不太精确和粗糙的结构来近似描述模糊集, 其通过提升和减小隶属度的操作, 将原本分布在整个模糊集空间的不确定性缩小到了阴影区域[24], 即区间[0, 1], 并通过平衡不同区域的不确定性来求取决策划分阈值, 划分思想如图8所示.

    图 8  基于阴影集思想的模糊集近似划分示意图
    Fig. 8  Schematic diagram of fuzzy sets approximation partition based on shadowed set idea

    事实上, 文献[34]认为阴影集的这种映射结构也可以被视为模糊集三值逻辑的一种例子, 所不同的是后者缺乏对划分阈值的研究以及合理的语义解释, 而前者则对此做了充分的分析. 此外, Pedrycz[2]在首次提出阴影集理论时也曾指出: 可以将阴影集视为一种操作框架, 用于简化模糊集的处理, 增强对模糊集结果的解释. 简而言之, 阴影集是由模糊集诱导的信息粒, 在捕捉模糊集本质的同时, 减少模糊集过精度所带来的计算负担, 在计算和推理中提供了更高的效率和更好的可解释性.

    阴影集与粗糙集: 由表9可知, 粗糙集通过定义一对上下近似集来实现对不确定性概念或集合的近似表示与度量. 如图9所示, 在整个论域空间中, 粗糙集下近似集中的等价类, 即蓝色区域(正域), 被视为完全属于目标概念; 上下近似集差值中的等价类, 即灰色区域(边界域), 被视为不确定是否属于目标概念; 而上近似集之外的等价类, 即白色区域(负域), 被视为完全不属于目标概念.

    图 9  粗糙集理论模型示意图
    Fig. 9  Schematic diagram of rough sets theory model

    显然, 阴影集和粗糙集从模型思想来讲是相似的, 两者相似之处: 1) 粗糙集正域中等价类对象与阴影集中隶属度为1的对象都被视为完全属于目标概念; 2) 粗糙集边界域中等价类对象与阴影集中阴影域的对象都被视为不确定是否属于目标概念; 3) 粗糙集负域中等价类对象与阴影集中隶属度为0的对象都被视为完全不属于目标概念.

    此外, 文献[34]指出: 阴影集架起了模糊集与粗糙集之间的桥梁, 减少了两者在概念和算法上的差异, 揭示了它们是如何直接相关的. 而两者也有一些显著区别: 在粗糙集中, 划分对象是基于等价类的形式, 并且等价类对象是固定的, 近似空间被预先定义; 在阴影集中, 划分对象则是模糊数据的形式, 并且模糊对象是动态分配的, 近似空间逐步生成.

    阴影集与三支决策: 三支决策是Yao[9192]在粗糙集的基础上, 结合对损失风险的考虑以及贝叶斯理论所提出的一种处理不确定性决策问题的方法论, 其对粗糙集所形成的三个划分区域赋予了新的语义解释. 刘盾和梁德翠[97]分别从宏观和微观的角度将三支决策理论分为广义三支决策和狭义三支决策, 前者注重对概念内涵和外延的诠释, 后者注重三支决策在实际问题中的语义解释. Yao[98]进一步指出: 狭义三支决策指代具体的数学模型, 这些模型提供了特定条件下做出三支决策的方法; 而广义三支决策则更多指概念思想的理解, 难以用具体数学模型描述, 其研究重点是三支决策的哲学基础和方法论. 因此, Yao[99100]从宏观角度将三支决策表示为TAO (Trisecting-acting-outcome)模型, 其核心思想如图10所示, 其将整个论域空间划分为三个区域: 接受域、拒绝域和延迟决策域, 并对不同区域采取不同策略, 进而得到不同的分治结果.

    图 10  TAO模型示意图
    Fig. 10  Schematic diagram of TAO model

    显然, 阴影集三支近似划分的思想与三支决策三支划分的思想是一致的, 两者都将论域划分为三个区域, 并针对不同区域采取不同策略, 赋以不同的语义解释. 两者的相似之处: 1)均利用$ \left( {\alpha ,\;\beta } \right) $对$ U $进行三支划分, 形成三个子域; 2) 三支决策接受域中的对象被视为接受该对象属于决策目标类, 这与阴影集中隶属度为1的对象含义相同; 3)同理, 拒绝域中的对象与隶属度为0的对象含义相同, 延迟域中的对象与阴影域中的对象含义相同.

    此外, 文献[89]指出: 阴影集是模糊集的一种三支、三值或三区域近似的例子, 其思想与三支决策理论一样. 而文献[98, 101]指出: 与粗糙集类似, 三支决策也可以基于区间集或阴影集来实现, 这些集合论模型都是狭义三支决策的体现. 综上所述, 在三支决策理论提出以后, 阴影集可以被视为一种用于处理模糊数据的三支决策模型, 其三支近似的划分思想包含在三支决策理论思想的范畴之内. 换言之, 从宏观角度来看, 阴影集的思想包含在广义三支决策的思想范畴内; 从微观角度来看, 阴影集的数学模型则是狭义三支决策的具体体现.

    几种理论模型间的关系及互补性: 首先, 通过篮球运动员挑选这一应用实例来体现上述模型间的关系和互补性. 给定一个信息系统如表10所示, 论域$ U = \left\{ {{x_1},\;{x_2},\;\cdots ,\;{x_8}} \right\} $, 针对这一复杂目标, 设定条件属性集为 {身高, 力量, 篮球技术}, 决策属性中的1表示被选为篮球运动员, 0表示未被挑选. 显然, 三列属性下的数据格式不同, 身高属性下为模糊数据, 力量和技术属性下为字符型数据. 其中, 模糊数据可通过模糊集来表示, 并通过阴影集来近似处理, 即表10第三列, 处理后的属性值可被视为一种字符型数据. 此时, 综合考虑三列属性便可进行论域中对象的等价类划分, 即$ {U}/{C} = \{ {X_1},\;{X_2},\;\cdots , {X_7} \} $, 其中$ {X_1} = \left\{ {{x_1},\;{x_3}} \right\} $, $ {X_2} = \left\{ {{x_2}} \right\} $, $ {X_3} = \left\{ {{x_4}} \right\} $, $ {X_4} = \left\{ {{x_5}} \right\} $, $ {X_5} = \left\{ {{x_6}} \right\} $, $ {X_6} = \left\{ {{x_7}} \right\} $, $ {X_7} = \left\{ {{x_8}} \right\} $. 随后, 便可通过粗糙集对等价类进行三支决策划分, 而用于决策划分的粗糙集模型有多种, 如概率粗糙集和决策粗糙集, 而三支决策便是由决策粗糙集模型演变而来的, 更详细的介绍可参考文献[102104].

    表 10  篮球运动员挑选
    Table 10  Selection of basketball players
    对象 身高(m) 身高$({S_{{\mu _A}}}( x ))$ 力量 篮球技术 决策
    ${x_1}$ 1.95 1 1
    ${x_2}$ 2.00 1 一般 1
    ${x_3}$ 2.10 1 1
    ${x_4}$ 1.98 1 一般 0
    ${x_5}$ 1.85 [0, 1] 0
    ${x_6}$ 1.73 0 0
    ${x_7}$ 1.88 [0, 1] 1
    ${x_8}$ 1.70 0 1
    下载: 导出CSV 
    | 显示表格

    综上所述, 给出模糊集、粗糙集、阴影集、三支决策以及粒计算理论之间关系图, 如图11所示. 其中, 阴影集通过对模糊集中模糊数据的三支近似处理, 架起了模糊集与粗糙集之间的桥梁, 而近似处理后的数据可支持等价类的形成, 进而支持粗糙集进行决策划分. 三支决策则是粗糙集理论的扩展和外延, 粗糙集理论则是三支决策的特例和内涵, 三支决策的提出源于粗糙集, 但高于粗糙集[102]. 这几种模型的思想都包含在粒计算方法论的思想范畴内, 即利用不同粒化程度或不同粒度上的信息来实现对复杂问题的求解. 因此, 基于上述几种模型的互补性, 或许可通过集成的架构来处理包含多种数据形式的复杂目标任务, 对此, 本文不做详细探讨.

    图 11  上述模型之间的关系
    Fig. 11  The relationship between the above models

    本节围绕阴影集的模型构建、理论性质、数据分析及应用研究四个方面, 对当前若干具有挑战性的研究问题进行总结分析, 便于今后对它们做进一步的研究, 以期推动阴影集理论的不断发展和创新.

    1) 多数阴影集模型的构建仅考虑了单一准则的约束, 缺乏对多准则约束的综合考虑. 如表1所示, 当前阴影集的构建主要基于不确定性不变性约束准则和最小成本约束准则[9], 缺乏对其他类型约束准则的探讨以及多准则综合约束的考虑. 这使得所构建模型容易忽略其他准则, 仅在单一准则目标下达到最优, 但在其他准则下结果可能较差. 这同时也削弱了模型在实际应用场景中的适用性、扩展性和语义解释的合理性. 事实上, 在当前数据分析和知识发现领域的建模过程中, 对多个约束准则的综合考虑需求是非常普遍的. 如, 通常有多个准则来评估分类算法的结果, 即准确度、覆盖率或召回率等. 在分类任务中, 也总是期望每个评价准则都能达到最好, 而不仅只是其中一项. 此外, 同样作为不确定性问题的处理模型, 在粗糙集领域, 已经有针对多准则约束问题的粗糙集模型构建研究, 并在理论和应用方面衍生了诸多相关工作[105106]. 因此, 在阴影集模型构建方面, 如何综合考虑和平衡不同评价准则或多个优化目标, 从而将传统阴影集构建从单准则考虑推广到多准则考虑是一个值得研究的问题. 虽然Gao等[17]在最新的工作中结合博弈论初步探讨了不确定性和决策代价两种评价准则约束下的模型构建, 但对于多准则约束问题的解决方法并不唯一, 比如将阴影集与多目标优化算法、多任务学习或TOPSIS多指标融合算法结合等, 这依旧是一个值得探究的问题.

    2) 多数阴影集模型的构建仅考虑了单粒度(单粒层)空间, 缺乏在多粒度(多粒层)空间下的阴影集构建研究. 当前阴影集及各种扩展模型的构建所关注的问题可概括为两个方面: a)三个区域的表达形式; b) 决策阈值对的获取方法和语义解释. 并且都是基于单一模糊集所展开的, 该模糊集通常由单个属性所构成, 即形成单粒度(单粒层)空间. 缺乏对多个属性的综合考虑, 即多粒度(多粒层)空间下阴影集的三支近似划分研究. 这使得阴影集无法有效处理复杂目标概念的近似划分问题. 事实上, 在现实决策问题场景下, 一个复杂的目标概念往往需要考虑多种属性、标准或专家意见. 如, 在挑选篮球运动员时, 就需要同时考虑身高、体重、年龄、耐力等多种属性; 在诊断患者是否患有糖尿病时, 不同专家给出的诊断意见也可能并不相同. 而每种属性、标准或专家意见都可构成一个模糊集合, 即单粒度(单粒层)空间. 显然, 对于复杂的目标概念或决策问题, 往往需要同时考虑多个模糊集的近似划分结果, 即实现多粒度空间下的阴影集构建. 此外, Qian 等[107]曾在多粒度粗糙集的研究中指出: 在多源信息系统中, 每个特征属性都可诱导形成一个粒度(粒层)空间, 而从结合粒计算的视角来看, 基于单一属性进行粗糙集的近似划分所形成的是一个单粒度(单粒层)粗糙集. 因此, 同样从粒计算的观点来看, 基于单一模糊集的近似划分所形成的是单粒度(单粒层)阴影集, 而基于多个模糊集的近似划分所形成的则是多粒度(多粒层)阴影集. 因此, 如何将阴影集的构建从单粒度(单粒层)空间推广到多粒度(多粒层)空间, 并进一步研究其在多粒度(多粒层)空间下的表达形式、阈值选择、语义解释和划分结果的融合等, 都是值得探究的问题, 比如将阴影集与多粒度粗糙集或多尺度决策系统相结合等.

    3) 阴影集模型的研究大多是针对静态数据考虑的, 缺乏动态或增量数据背景下的阴影集构建研究. 当前阴影集模型主要研究对单个模糊集中不确定性对象的近似划分问题, 并且大多数只讨论了模糊对象是静态的情况, 其中模糊集可被视为是多源信息系统的某一列特征属性. 然而, 由当前智能信息时代所反映出的大数据4V特性[82]可知, 数据信息体量浩大且增长快速. 因此, 复杂动态的多源信息系统则更为常见, 并且现实场景中复杂目标概念的决策近似划分需求也更为常见. 显然, 这就需要在阴影集的构建过程中, 结合对动态或增量数据背景及需求的考虑, 以及对多列特征属性的综合考虑. 而对于信息系统的动态或增量情况大致可分为三种[108]: a)对象的添加和删除; b) 特征属性的添加和删除; c) 特征属性值的更新和修改. 虽然Cai等[30]探讨了基于动态模糊集的阴影集构建方法, 但其主要是对具有时变隶属度模糊集的考虑, 即模糊集的隶属度随时间变化的场景下阴影集的构建, 可以视为是对情况c)的考虑, 而对前两种情况的研究依旧缺乏. 因此, 如何在动态或增量数据背景下实现单粒度(单粒层)或多粒度(多粒层)阴影集的构建, 从而将阴影集从静态数据空间的考虑推广到动态或增量数据空间的考虑, 实现动态数据的知识挖掘就是一个值得探究的问题. 比如将阴影与序贯三支决策的思想相结合, 通过属性的动态添加来考虑模糊对象的逐步划分.

    4) 针对不同阴影集模型之间运算算子、规则及性质的研究还比较少, 并且缺乏针对不同模糊现象下不同运算需求的考虑. 由第2节分析可知, 阴影集有效地将模糊集和粗糙集联系了起来. 而从完善模型理论性质的角度来看, 对集合之间运算规则、方法设计及规律性质的研究是非常有必要的, 许多学者对此也做了相关研究. Pawlak[88] 提出并研究了粗糙集理论及其基本运算算子的设计. Zhang等[109] 进一步研究了粗糙集近似集的基本运算算子及其不确定性变化规律. Zadeh[1]提出并研究了模糊集的基本运算算子及性质. Pedrycz[2]提出并定义了阴影集的基本运算算子, 即模糊集的近似集. 最近, Boffa等[28] 以代数系统的同构方程为载体, 讨论和分析了阴影集与模糊集运算算子之间的关系. 此外, 由第1.1节可知, 随着阴影集理论的不断发展和完善, 已经衍生出诸多扩展阴影集模型, 对于阴影域的表达形式也有诸多改进, 如图3所示. 然而, 在当前对阴影集运算算子的研究中, 只分析了经典阴影集的基本算子, 即阴影域为区间值[0, 1] 的情况, 缺乏对不同阴影集之间运算算子、规则及性质的研究. 此外, 在模糊数学领域, 为了使模糊集能够对不同模糊现象进行合理描述, 在“析取合取”经典算子的基础上, 也衍生出了诸多模糊运算算子, 如代数和与积、有界和与积、Hamacher算子和Yager算子等. 这些算子优缺点及特性迥异, 可根据具体问题和需求选择使用. 然而, 当前对于阴影集运算算子的设计仅考虑了集合运算中经典的“析取合取”形式, 缺乏对不同模糊现象下不同运算需求的考虑. 因此, 如何定义不同阴影集模型之间的运算算子、运算规则, 并挖掘其中的运算性质就成为了一个值得探究的问题, 而参考当前模糊集运算算子来设计不同类型的阴影集运算算子或许是可行的方案. 这也将有助于探究不同阴影集模型之间的特性和优势以及结合的可能性, 更好地实现不确定性信息的处理和知识挖掘.

    5) 基于阴影集理论的数据分析及应用研究中, 还缺乏对不同扩展模型应用效果的探讨, 并且所构建的阴影集模型缺乏对任务需求的考虑. 由第1.3节和第1.4节可知, 阴影集被广泛应用于不同研究领域, 这得益于经典阴影集模型构建的简单性和对不确定性信息处理的有效性. 然而, 这些研究工作大多是结合经典阴影集模型所展开的, 缺乏对各种扩展模型的考虑. 由第1.1节可知, 在经典阴影集模型被提出后, 衍生出了各种改进模型和针对不同需求考虑的扩展模型. 显然, 其构造方法、模型优势及特性迥异, 并且不同模型对于数据分析和应用场景的影响也显著不同. 因此, 不同阴影集模型在数据分析和现实应用场景下的有效性是一个值得探究的问题. 此外, 当前阴影集模型的优劣评价主要是从不确定性信息处理的角度出发, 考虑了Yao等[9]所总结的三个准则. 然而, 这些评估准则更侧重于考虑模型构建和决策阈值的语义合理性解释, 缺乏对决策划分结果有效性评估的考虑. 这使得阴影集在模糊信息处理的体系下能获得有效的结果和解释, 但在其他研究任务体系下则可能未取得最好的结果. 因此, 如何以数据分析或实际应用任务为导向来构造阴影集模型的目标函数也是一个值得探究的问题. 比如, 基于聚类或分类的任务场景下, 以分类精度或准确度为目标来构建阴影集; 基于图像识别的任务场景下, 以识别准确率为目标来构建阴影集等.

    阴影集在不确定性信息处理过程中所表现出的简单性和有效性使其受到了大量学者的关注. 本文从四个方面对阴影集的研究工作进行了总结和分析: 在模型构建方面, 介绍了不同阴影集的核心思想、方法体系及模型差异, 如表1所示; 在理论性质方面, 介绍了基于阴影集的模糊关系、结构解释、逻辑运算或数学性质等研究, 以及基于不同模糊集的阴影集构建研究, 如表5表6所示; 在数据分析方面, 介绍了基于阴影集的聚类、分类算法以及数据预处理研究, 如表7所示; 在应用研究方面, 介绍了基于阴影集的图像分类与识别、医疗信息处理、文本分析和决策推荐研究, 如表8 所示. 此外, 还讨论分析了阴影集与粗糙集、模糊集和三支决策等处理不确定性问题的理论模型之间的联系、区别及互补性. 最后, 分析了当前所存在的若干挑战性问题, 即, 如何将阴影集的构建考虑从单准则约束推广到多准则约束; 如何从单粒度(单粒层)空间推广到多粒度(多粒层)空间; 如何从静态数据空间推广到动态或增量数据空间; 如何定义不同阴影集模型之间的运算算子、运算规则, 并挖掘其中的运算性质; 如何结合模糊集运算算子的考虑设计不同类型的阴影集运算算子; 如何以数据分析或实际应用任务为导向来构造阴影集模型的目标函数. 本文工作将为关注粒计算、不确定性问题处理和知识发现领域的研究者提供一些理论参考, 并促进阴影集的不断发展完善和推广应用.

  • 图  1  HEV控制系统

    Fig.  1  HEV control system

    图  2  Power-split HEV功率关系

    Fig.  2  Power-split HEV power relationship

    图  3  发动机燃油消耗率

    Fig.  3  Engine fuel consumption rate map in Advisor

    图  4  发动机燃油消耗率−功率曲线

    Fig.  4  Engine fuel consumption rate and power

    图  5  道路坡度

    Fig.  5  Road slope

    图  6  HEV车辆位置

    Fig.  6  Position profile of HEV

    图  7  HEV车辆速度曲线

    Fig.  7  Velocity profile of HEV

    图  8  速度工况曲线

    Fig.  8  Velocity cycle of HEV

    图  9  SOC变化曲线

    Fig.  9  SOC of HEV

    图  10  功率分配曲线

    Fig.  10  Power distribution of HEV

    表  1  HEV车辆主要参数

    Table  1  Parameters of HEV

    参数数值单位参数数值单位
    整车质量1332kg车轮半径0.287m
    重力加速度9.81N/kg迎风面积1.746m2
    车身长度3m空气密度1.29kg/m3
    风阻系数0.3滚动阻力系数0.3m/s
    下载: 导出CSV

    表  2  燃油消耗对比

    Table  2  Comparison of fuel consumption

    优化方法 (ECE 工况)燃油消耗 (l/100 km)提高 (%)
    Advisor6.3
    本文算法4.6812
    下载: 导出CSV
  • [1] Li L, Wang X Y, Song J. Fuel consumption optimization for smart hybrid electric vehicle during a car-following process. Mechanical Systems and Signal Processing, 2017, 87: 17-29
    [2] 赵秀春, 郭戈. 混合动力电动汽车能量管理策略研究综述. 自动化学报, 2016. 42(3): 321-334

    Zhao Xiu-Chun, Guo Ge. Survey on energy management strategies for hybrid electric vehicles. Actaautomatic sincia, 2016, 42(3): 321-334
    [3] Li X, Evangelou S. Torque-leveling threshold-changing rule-based control for parallel hybrid electric vehicles. IEEE Transactions on Vehicular Technology, 2019, 68(7): 6509-6523 doi: 10.1109/TVT.2019.2916720
    [4] Anbaran S A, Idris N R N, Jannati M, Aziz M J, Alsofyani I. Rule-based supervisory control of split-parallel hybrid electric vehicle. In: Proceedings of the 2014 IEEE Conference on Energy Conversion. Johor Bahru, Malaysia: IEEE Press, 2014. 7−12
    [5] Denis N, Dubois M R, Desrochers A. Fuzzy-based blended control for the energy management of a parallel plug-in hybrid electric vehicle. IET Intelligent Transport Systems, 2015, 9(1): 30-37 doi: 10.1049/iet-its.2014.0075
    [6] Murphey Y L, Park J, Chen Z H, Kuang M L, Masrur M A, Phillips A M. Intelligent hybrid vehicle power control Part I: machine learning of optimal vehicle power. IEEE Transactions on Vehicular Technology, 2012, 61(8): 3519-3530 doi: 10.1109/TVT.2012.2206064
    [7] Zhang R D and Tao J L. GA-based fuzzy energy management system for FC/SC-powered HEV considering H2 consumption and load variation. IEEE Transactions on Fuzzy Systems, 2018, 26(4): 1833-1843 doi: 10.1109/TFUZZ.2017.2779424
    [8] Liu J C, ChenY Z, Zhan J Y, Shang F. Heuristic dynamic programming based online energy management strategy for plug-in hybrid electric vehicles. IEEE Transactions on Vehicular Technology, 2019, 68(5): 4479-4493 doi: 10.1109/TVT.2019.2903119
    [9] 常远. 基于动态规划的并联混合动力动车组能量管理策略研究. 内燃机与配件, 2019. 8: 114-119 doi: 10.3969/j.issn.1674-957X.2019.10.055

    Chang Yuan. Research on energy management strategy of parallel hybrid electric multiple unit based on dynamic programming. Internal combustion engine and parts, 2019. 8: 114-119 doi: 10.3969/j.issn.1674-957X.2019.10.055
    [10] Larsson V, Johannesson M L, Egardt B, Karlsson S. Commuter route optimized energy management of hybrid electricvehicles. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(3): 1145-1154 doi: 10.1109/TITS.2013.2294723
    [11] Ko J, Ko S, Son H, Yoo B, Cheon J, Kim H. Development of brake system and regenerative braking cooperative control algorithm for automatic-transmission-based hybrid electric vehicles. IEEE Transactions on Vehicular Technology, 2015, 64(2): 431-440 doi: 10.1109/TVT.2014.2325056
    [12] Li G Q, Görges D. Ecological adaptive cruise control and energy management strategy for hybrid electric vehicles based on heuristic dynamic programming. IEEE Transactions on Intelligent Transportation Systems, 2019, 20(9): 3526-3535 doi: 10.1109/TITS.2018.2877389
    [13] Zeng X R, Wang J M. A parallel hybrid electric vehicle energy management strategy using stochastic model predictive control with road grade preview. IEEE Transactions on Control Systems Technology, 2015, 23(6): 2416-2423 doi: 10.1109/TCST.2015.2409235
    [14] Yan F J, Wang J M, Huang K S. Hybrid electric vehicle model predictive control torque-split strategy incorporating engine transient characteristics. IEEE Transactions on Vehicular Technology, 2012, 61(6): 2458-2467
    [15] Moon S, Moon I, Yi K. Design, tuning, and evaluation of a full-range adaptive cruise control system with collision avoidance. Control Engineering Practice, 2017, 5: 442-455
    [16] Chen J Z, Zhou Y, Liang H. Effects of ACC and CACC vehicles on traffic flow based on an improved variable time headway spacing strategy. IET Intelligent Transport Systems, 2019, 13(9): 1365-1373 doi: 10.1049/iet-its.2018.5296
    [17] 陈虹, 郭露露, 宫洵等. 智能时代的汽车控制. 自动化学报, 2020. 46(7): 1313-1332

    Chen Hong, Guo Lu-Lu, Gong Xun, et al. Automotive control in intelligent era. Actaautomatic sincia, 2020. 46(7): 1313-1332
    [18] Stefania S, Alessandro S, Antonio S V, et al. Platooning maneuvers in vehicular networks: a distributed and consensus-based approach. IEEE Transactions on Intelligent Vehicles, 2019, 4(1): 59-72 doi: 10.1109/TIV.2018.2886677
    [19] Wang C, Nijmeijer H. String stable heterogeneous vehicle platoon using cooperative adaptive cruise control. In: Proceedings of the 18th International Conference on Intelligent Transportation Systems. Las Palmas, Spain: IEEE, 2015. 1977−1982
    [20] Li Y F, Chen W B, Peeta S, Wang Y B. Platoon control of connected multi-vehicle systems under V2X communications: design and experiments. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(5): 1891-1902 doi: 10.1109/TITS.2019.2905039
    [21] Zheng Y, Li S E, Wang J Q, Cao D P, Li K Q. Stability and scalability of homogeneous vehicular platoon: study on the influence of information flow topologies. IEEE Transactions on Intelligent Transportation Systems, 2016, 17(1): 14-26 doi: 10.1109/TITS.2015.2402153
    [22] Luo Y, Chen T, and Li K. Multi-objective decoupling algorithm for active distance control of intelligent hybrid electric vehicle. Mechanical Systems and Signal Processing, 2015, 64-65: 29-45 doi: 10.1016/j.ymssp.2015.02.025
    [23] Di Cairano S, Bernardini D, Bemporad A, Kolmanovsky IV. Stochastic MPC with learning for driver-predictive vehicle control and its application to HEV energy management. IEEE Transactions on Control Systems Technology, 2014, 22(3): 1018-1031 doi: 10.1109/TCST.2013.2272179
    [24] Tajeddin S, Vajedi M, Azad N. A newton/GMRES approach to predictive ecological adaptive cruise control of a plug-in hybrid electric vehicle in carfollowing scenarios. IFAC-Papers Online, 2016, 49(21): 59-65 doi: 10.1016/j.ifacol.2016.10.511
    [25] Luo Y, Chen T, Zhang S W, Li K Q. Intelligent hybrid electric vehicle ACC with coordinated control of tracking ability, fuel economy, and ride comfort. IEEE Transactions on Intelligent Transportation Systems, 2015, 16(4): 2303-2308 doi: 10.1109/TITS.2014.2387356
    [26] Yu K J, Yang H Z, et al. Model predictive control for hybrid electric vehicle platooning using slope information. IEEE Transactions on Intelligent Transportation Systems, 2016, 17(7): 1894-1909 doi: 10.1109/TITS.2015.2513766
    [27] Guo G, Yue W. Autonomous platoon control allowing range-limited sensors. IEEE Transactions on Vehicular Technology, 2012, 61(7): 2901-2912.
    [28] 王琼, 郭戈. 车队速度滚动时域动态规划及非线性控制. 自动化学报, 2019. 45(5): 888-896 doi: 10.1109/TVT.2012.2203362

    Wang Qiong, Guo Ge. Platoon speed receding horizon dynamic programming and nonlinear control. Acta Automatica Sinica, 2019, 45(5): 888-896 doi: 10.1109/TVT.2012.2203362
    [29] Qu Z, Dawson D M, Lim S Y, Dorsey J F. A new class of robust control laws for tracking of robots. International Journal of Robotics Research, 1994, 13(4): 355-363 doi: 10.1177/027836499401300407
  • 期刊类型引用(5)

    1. 邵雨晴,张红娟,高妍. 电动汽车混合储能系统双判据多模式功率分配策略. 现代电力. 2025(01): 176-182 . 百度学术
    2. 付主木,朱龙龙,陶发展,李梦杨. 基于Stackelberg博弈的燃料电池混合动力汽车跟车能量管理. 河南科技大学学报(自然科学版). 2024(04): 1-9+115 . 百度学术
    3. 付主木,龚慧贤,宋书中,陶发展,孙昊琛. 燃料电池电动汽车改进深度强化学习能量管理. 河南科技大学学报(自然科学版). 2023(04): 41-48+6 . 百度学术
    4. 申永鹏,袁小芳,赵素娜,孟步敏,王耀南. 智能网联电动汽车节能优化控制研究进展与展望. 自动化学报. 2023(12): 2437-2456 . 本站查看
    5. 万欣,荀径,WU Guoyuan,赵子枞. 基于MPC的混合动力汽车能量管理策略. 北京交通大学学报. 2022(05): 149-158 . 百度学术

    其他类型引用(10)

  • 加载中
图(10) / 表(2)
计量
  • 文章访问数:  1060
  • HTML全文浏览量:  561
  • PDF下载量:  308
  • 被引次数: 15
出版历程
  • 收稿日期:  2020-03-16
  • 网络出版日期:  2021-08-05
  • 刊出日期:  2022-01-25

目录

/

返回文章
返回