高满 张清华 王国胤 姚一豫

高满, 张清华, 王国胤, 姚一豫. 针对模糊数据近似处理的阴影集研究综述. 自动化学报, 2024, 50(10): 1906−1927 doi: 10.16383/j.aas.c230808
引用本文: 高满, 张清华, 王国胤, 姚一豫. 针对模糊数据近似处理的阴影集研究综述. 自动化学报, 2024, 50(10): 1906−1927 doi: 10.16383/j.aas.c230808
Gao Man, Zhang Qing-Hua, Wang Guo-Yin, Yao Yi-Yu. Review of shadowed set for fuzzy data approximation processing. Acta Automatica Sinica, 2024, 50(10): 1906−1927 doi: 10.16383/j.aas.c230808
Citation: Gao Man, Zhang Qing-Hua, Wang Guo-Yin, Yao Yi-Yu. Review of shadowed set for fuzzy data approximation processing. Acta Automatica Sinica, 2024, 50(10): 1906−1927 doi: 10.16383/j.aas.c230808


doi: 10.16383/j.aas.c230808
基金项目: 国家重点研发计划(2021YFF0704101), 国家自然科学基金(62276038, 62221005), 重庆市创新群体研究项目(cstc2019jcyjcxttX0002), 重庆邮电大学博士人才培养计划(BYJS202109), 重庆市教委重点合作项目(HZ2021008)资助

    高满:重庆邮电大学计算机科学与技术学院博士研究生. 主要研究方向为粒计算, 三支决策和不确定性信息处理. E-mail: d200201005@stu.cqupt.edu.cn

    张清华:重庆邮电大学计算机科学与技术学院教授. 主要研究方向为粒计算, 不确定性信息处理和大数据智能. 本文通信作者. E-mail: zhangqh@cqupt.edu.cn

    王国胤:重庆师范大学重庆国家应用数学中心教授. 主要研究方向为粒计算, 认知计算和智能信息处理. E-mail: wanggy@cqupt.edu.cn

    姚一豫:里贾纳大学计算机科学系教授. 主要研究方向为三支决策, 粒计算和不确定性信息处理. E-mail: Yiyu.Yao@uregina.ca

Review of Shadowed Set for Fuzzy Data Approximation Processing

Funds: Supported by National Key Research and Development Program of China (2021YFF0704101), National Natural Science Foundation of China (62276038, 62221005), Foundation for Innovative Research Groups of Natural Science Foundation of Chongqing (cstc2019jcyjcxttX0002), Doctoral Talent Training Program of Chongqing University of Posts and Telecommunications (BYJS202109), and Key Cooperation Project of Chongqing Municipal Education Commission (HZ2021008)
    Author Bio:

    GAO Man Ph.D. candidate at the School of Computer Science and Technology, Chongqing University of Posts and Telecommunications. His research interest covers granular computing, three-way decision, and uncertainty information processing

    ZHANG Qing-Hua Professor at the School of Computer Science and Technology, Chongqing University of Posts and Telecommunications. His research interest covers granular computing, uncertainty information processing, and big data intelligence. Corresponding author of this paper

    WANG Guo-Yin Professor at the National Center for Applied Mathematics in Chongqing, Chongqing Normal University. His research interest covers granular computing, cognitive computing, and intelligent information processing

    YAO Yi-Yu Professor in the Department of Computer Science, University of Regina. His research interest covers three-way decision, granular computing, and uncertainty information processing

  • 摘要: 阴影集(Shadowed set, SS)是一种对模糊集进行三支近似处理的不确定性知识发现模型, 其能够对模糊集中具有精确值的不确定性对象进行有效的近似和划分, 从而减少模糊决策过程中不确定性对象的决策划分成本和计算损耗. 首先, 回顾阴影集的发展历程, 并从四个方面介绍其研究现状及内容, 即阴影集的模型构建、理论性质、数据分析以及应用研究. 通过总结分析它们的核心思想、方法体系、相互关系和区别等, 为该领域的后续研究提供借鉴. 随后, 讨论分析阴影集理论与其他不确定性问题处理理论模型的联系, 尤其是阴影集与模糊集、粗糙集和三支决策理论之间的区别、联系以及互补性. 最后, 围绕上述四个研究方面, 对当前若干具有挑战性的研究问题进行分析和展望.
  • 图  1  阴影集研究的四个主要方面

    Fig.  1  Four main aspects of shadowed set research

    图  2  研究框图

    Fig.  2  Research framework diagram

    图  3  阴影集的几种三支近似表达形式

    Fig.  3  Several three-way approximate expressions of shadowed set

    图  4  GTSS中两种隶属度误差随决策阈值的博弈变化

    Fig.  4  The game variation of two kinds of membership errors with decision threshold in GTSS

    图  5  FE-GTSS中两种模糊熵损失随决策阈值的博弈变化

    Fig.  5  The game variation of two fuzzy entropy losses with decision threshold in FE-GTSS

    图  6  阴影集在聚类过程中对数据结构的描述

    Fig.  6  Shadowed set describe the data structure in the clustering process

    图  7  不同粒计算理论模型之间的简要关系图谱

    Fig.  7  Brief relationship graph between different granular computing theory models

    图  8  基于阴影集思想的模糊集近似划分示意图

    Fig.  8  Schematic diagram of fuzzy sets approximation partition based on shadowed set idea

    图  9  粗糙集理论模型示意图

    Fig.  9  Schematic diagram of rough sets theory model

    图  10  TAO模型示意图

    Fig.  10  Schematic diagram of TAO model

    图  11  上述模型之间的关系

    Fig.  11  The relationship between the above models

    表  1  不同阴影集之间的区别和联系

    Table  1  The difference and relation between different shadowed sets

    年份 文献 模型 阴影域 构建准则 分析视角 构建方法 人为参数设定 时间复杂度
    1998 [2] SS $[ {0,\;1} ]$ 不确定性不变性 不确定性损失 最优化目标函数 $\mathrm{O}( n )$
    2003 [56] 0.5SS 0.5 不确定性不变性 不确定性损失 最优化目标函数 $\mathrm{O}( n )$
    2013, 2014, 2017 [79] MDTSS $\overline \delta $ 最小成本 隶属度误差 决策划分规则推导 ${\lambda _e},\;{\lambda _r},\;{\lambda _{s \downarrow }},\;{\lambda _{s \uparrow }}$ $\mathrm{O}( n )$
    2018, 2020 [1011] GTSS 0.5 最小成本 隶属度误差 博弈竞争机制 ${c_E},\;{c_R}$ $\mathrm{O}( {{n^2}} )$
    2020 [12] ISS $[ {\beta ,\;\alpha } ]$ 不确定性不变性 不确定性损失 最优化目标函数 $\mathrm{O}( n )$
    2020 [13] MESS ${\delta ^ * }$ 不确定性不变性 不确定性损失 决策划分规则推导 $\mathrm{O}( n )$
    2020 [1415] FE-GTSS 0.5, $\overline \delta $ 不确定性不变性 不确定性损失 博弈竞争机制 ${c_E},\;{c_R}$ $\mathrm{O}( {\mathrm{lo{g_2}}n} )$
    2023 [16] New-ISS $[ {\beta ,\;\alpha } ]$ 不确定性不变性 不确定性损失 最优化目标函数 $\mathrm{O}( {n\mathrm{lo{g_2}}n} )$
    2023 [17] UC-GTSS 0.5 最小成本,
    博弈竞争机制 ${c_E},\;{c_R}$ $\mathrm{O}( n )$
    下载: 导出CSV

    表  2  MDTSS中划分所造成的误差和代价

    Table  2  Error and cost caused by partitions in MDTSS

    划分操作 模糊集 阴影集 决策误差${E_a}$ 决策代价${\lambda _a}$
    ${a_e}$ ${\mu _A}( x )$ 1 $1 - {\mu _A}( x )$ ${\lambda _e}$
    ${a_r}$ ${\mu _A}( x )$ 0 ${\mu _A}( x ) - 0$ ${\lambda _r}$
    ${a_{s \downarrow }}$ ${\mu _A}( x ) \ge \delta $ $\delta $ ${\mu _A}( x ) - \delta $ ${\lambda _{s \downarrow }}$
    ${a_{s \uparrow }}$ ${\mu _A}( x ) < \delta $ $\delta $ $\delta - {\mu _A}( x )$ ${\lambda _{s \uparrow }}$
    下载: 导出CSV

    表  3  博弈机制下阴影集的博弈收益

    Table  3  Game payoff of shadowed set under game mechanism

    博弈对象 ${n_2}$
    博弈策略 ${\beta _1}$ ${\beta _2}$ $\cdots $ ${\beta _q}$
    ${n_1}$ ${\alpha _1}$ $\left\langle {{P_{{n_1}}}\left( {{\alpha _1},\;{\beta _1}} \right),\;{P_{{n_2}}}\left( {{\alpha _1},\;{\beta _1}} \right)} \right\rangle $ $\left\langle {{P_{{n_1}}}\left( {{\alpha _1},\;{\beta _2}} \right),\;{P_{{n_2}}}\left( {{\alpha _1},\;{\beta _2}} \right)} \right\rangle $ $\cdots $ $\left\langle {{P_{{n_1}}}\left( {{\alpha _1},\;{\beta _q}} \right),\;{P_{{n_2}}}\left( {{\alpha _1},\;{\beta _q}} \right)} \right\rangle $
    ${\alpha _2}$ $\left\langle {{P_{{n_1}}}\left( {{\alpha _2},\;{\beta _1}} \right),\;{P_{{n_2}}}\left( {{\alpha _2},\;{\beta _1}} \right)} \right\rangle $ $\left\langle {{P_{{n_1}}}\left( {{\alpha _2},\;{\beta _2}} \right),\;{P_{{n_2}}}\left( {{\alpha _2},\;{\beta _2}} \right)} \right\rangle $ $\cdots $ $\left\langle {{P_{{n_1}}}\left( {{\alpha _2},\;{\beta _q}} \right),\;{P_{{n_2}}}\left( {{\alpha _2},\;{\beta _q}} \right)} \right\rangle $
    $ \vdots$ $ \vdots$ $ \vdots$ $ \vdots$ $ \vdots$
    ${\alpha _p}$ $\left\langle {{P_{{n_1}}}\left( {{\alpha _p},\;{\beta _1}} \right),\;{P_{{n_2}}}\left( {{\alpha _p},\;{\beta _1}} \right)} \right\rangle $ $\left\langle {{P_{{n_1}}}\left( {{\alpha _p},\;{\beta _2}} \right),\;{P_{{n_2}}}\left( {{\alpha _p},\;{\beta _2}} \right)} \right\rangle $ $\cdots $ $\left\langle {{P_{{n_1}}}\left( {{\alpha _p},\;{\beta _q}} \right),\;{P_{{n_2}}}\left( {{\alpha _p},\;{\beta _q}} \right)} \right\rangle $
    下载: 导出CSV

    表  4  MESS中划分所造成的熵损失

    Table  4  Entropy loss caused by partitions in MESS

    划分动作 模糊集 阴影集 熵损失$El(a| x )$
    ${a_e}$ ${\mu _A}( x )$ 1 $El({a_e}| x )$
    ${a_r}$ ${\mu _A}( x )$ 0 $El({a_r}| x )$
    ${a_{s \downarrow }}$ ${\mu _A}( x ) \ge {\delta ^*}$ ${\delta ^*}$ $El({a_{s \downarrow }}| x )$
    ${a_{s \uparrow }}$ ${\mu _A}( x ) < {\delta ^*}$ ${\delta ^*}$ $El({a_{s \uparrow }}| x )$
    下载: 导出CSV

    表  5  阴影集理论性质的研究总结

    Table  5  Research summary of theoretical properties of shadowed set

    阴影集的连续性和凸性及最优解的存在性和唯一性[22, 25]
    下载: 导出CSV

    表  6  基于不同模糊集的阴影集构建研究总结

    Table  6  Research summary of shadowed set construction based on different fuzzy sets

    下载: 导出CSV

    表  7  基于阴影集的数据分析研究总结

    Table  7  Research summary of data analysis based on shadowed set

    类别 研究内容 文献 引入阴影集的优势
    聚类 基于阴影集的C均值聚类算法(SCM) [38] 实现了阈值自动化求取、数据约减、计算效率的提升
    基于多粒度近似区域和阴影集的粗糙可能性C均值聚类算法(MS-RPCM) [3940] 实现了阈值自动化求取、数据不确定性问题的解决、噪声抑制能力的增强
    基于阴影集的粗糙模糊C均值聚类算法(S-RFCM) [41] 实现了阈值自动化求取、异常值的有效识别
    基于阴影集的粗糙模糊可能性C均值聚类算法(S-RFPCM) [42] 实现了阈值自动化求取、异常值的有效识别
    结合傅立叶随机特征映射和阴影集的粗糙模糊C均值聚类算法(AR-SRFCM) [43] 实现了非球形数据类簇的有效处理、异常值的有效识别
    基于增量数据的阴影集集群聚类算法(OSC) [44] 实现了数据的实时处理、噪声样本的有效识别
    结合阴影集和粒子群优化算法的模糊C均值聚类算法(SP-FCM) [45] 实现了数据约减、异常值的有效识别、算法效率和精度的提升
    [46] 实现了初值敏感、局部最优和参数设置主观性问题的解决
    [47] 实现了边界检测及噪声抑制能力的增强
    基于阴影集和集成学习的模糊聚类算法及应用场景 [4849] 实现了阈值自动化求取、异常值的有效识别, 算法鲁棒性增强
    基于区间阴影集的密度峰值聚类算法(ISS-DPC) [5051] 实现了错误分类率的减少、抗噪性的增强
    基于阴影集的截集式可能性C均值聚类算法(C-PCM) [52] 实现了截集门限的自动化选取
    基于阴影集的广义多粒度粗糙模糊C均值聚类算法(MSRFCM) [5354] 实现了数据拓扑结构的捕捉、数据不确定性问题的解决
    基于无监督学习框架下的阴影C均值聚类算法(SCM) [55] 实现了传统SCM算法聚类质量和效率的提升
    基于阴影集的多粒度三支聚类集成算法(MTWCES) [5960] 实现了数据不确定性问题的解决、聚类准确率的提升
    分类 基于阴影邻域的三支分类算法(3WC-SNB) [56] 实现了不确定性数据的有效分类、分类风险性的降低
    基于半监督阴影集的三支分类算法(3WC-SSN) [5758] 实现了不确定性数据的有效分类、分类风险性的降低
    基于阴影集的快速KNN分类算法(TWC-KNN) [6162] 实现了数据约减、数据质量的优化、分类效率的提高
    基于阴影集的训练数据选择算法 [6366] 实现了训练数据质量的提升、训练效率和分类器性能的提升
    基于阴影集的候选断点集提取算法 [67] 实现了候选断点识别效率和准确率的提高
    基于阴影集聚类的离群点检测算法 [68] 实现了聚类离群点检测识别率和识别精度的提高
    下载: 导出CSV

    表  8  基于阴影集的应用研究总结

    Table  8  Summary of application research based on shadowed set

    类别 研究内容 文献 引入阴影集的优势
    基于阴影集的遥感图像分割算法 [69] 解决了遥感图像像素交叠区域的不确定性问题, 并提高了遥感图像分割的准确性和稳定性
    基于阴影集的图像信息检索算法 [70] 有效减少了冗余信息, 降低了信息检索的复杂性, 提高了图像检索精度
    基于阴影集的图像对比度增强算法 [71] 优化了图像的局部和全局参数, 实现了图像对比度增强的自动化提升
    基于阴影集和人脸图像的两阶段性别分类算法 [72] 实现了图像数据的多阶段处理, 大大减少了训练时间损耗以及分类的不确定性, 提高了图像的分类精度
    基于阴影集的两阶段图像分类算法 [73] 实现了图像数据的多阶段处理, 大大减少了训练时间损耗以及分类的不确定性, 提高了图像的分类精度
    基于阴影集的半监督样本选择网络在噪声标记图像中的分类算法 [74] 实现了干净样本的自适应选取和高质量伪标签样本的有效选取, 减少了训练样本的数量, 并提高了图像分类性能
    医疗信息处理 基于阴影集的基因表达聚类问题及基因性质识别 [75] 增强了聚类混淆区域中基因性质识别的有效性和准确率
    基于阴影集的乳房X光图像对比度增强及微钙化识别 [76] 增强了图像不确定性区域的对比度以及微钙化的识别率, 提高了乳腺癌的识别率
    文本分析 基于阴影集的语言术语建模及其在多属性决策中的应用 [77] 解决了信息丢失或失真所引起的不确定性问题, 提供了更合理和准确的决策结果
    基于区间数据驱动的阴影集构建及其在语言词建模中的应用 [78] 实现了以区间数据驱动的阴影集模型构建, 为针对语言词问题的建模提供了一种新视角
    基于博弈论阴影集的文本词特征提取算法 [79] 实现了语言词特征的有效提取, 并提高了针对语言词的分类性能和分类效率
    决策推荐 基于阴影集的语言信息大规模群体决策算法 [80] 通过阴影集对语言术语进行建模, 实现了对群体决策者意见的综合考虑, 提高了群体决策的效率和有效性
    基于阴影集的用户个性化决策推荐算法 [81] 减少了推荐系统推荐过程中的不确定性, 增强了决策推荐质量, 并能够针对不同用户实现个性化推荐
    下载: 导出CSV

    表  9  粒计算理论的主要模型及核心思想总结

    Table  9  Summary of the main models and core ideas of granular computing theory

    年份 文献 理论模型 核心思想
    1965 [1] 模糊集 通过使用隶属度函数来对模糊性概念或不确定性信息进行表示与处理, 并进一步通过取值范围在0到1之间的精确隶属度值来描述一个对象隶属于模糊性概念的程度
    1982 [88] 粗糙集 通过利用不可分辨关系构成对象的等价类, 实现对论域空间的近似划分, 并使用具有精确概念的上近似集和下近似集来实现对一个不精确概念的近似表示与度量
    1982 [94] 形式概念分析 通过对象集与属性集之间的某种关联关系, 建立由对象集与属性集对所形成的形式概念层次结构, 并利用哈斯图的形式呈现不同粒概念之间的复杂关系, 实现对知识的挖掘和不确定性推理
    1992 [89] 商空间 通过将复杂问题表示成不同粗细的粒度空间, 从而构建多粒度分层递阶空间结构, 通过由粗到细或由细到粗的方式在多粒度空间中进行近似逼近, 将多粒度空间中粒的解组合成原问题的解, 从而获得复杂问题的解
    1995 [90] 云模型 通过使用期望、熵和超熵三个参数来对不确定性知识进行描述, 融合人类认知过程中随机与模糊这两种不确定性, 实现知识内涵与外延的相互转换
    1998 [2] 阴影集 通过一对决策划分阈值来对模糊集进行近似划分处理, 并通过平衡不同划分区域的不确定性来构建阈值求取的目标函数, 利用这种粗糙的近似表达来替换模糊集过于精确的表达, 从而减少模糊决策过程中不确定性对象的决策划分成本和计算损耗
    2009, 2010 [9192] 三支决策 通过“三分而治”的思想将论域划分为三个子集, 即正域、负域和边界域, 并对不同子集采取不同的决策行为或分治策略, 即接受、拒绝和延迟决策, 进而对相应的行为或策略进行评价和反馈, 实现对复杂问题或信息不充分问题的求解
    2011 [93] 多尺度粗糙集模型 通过将属性的取值标记为不同尺度(粒度)层次, 进而讨论知识在不同尺度下的关系及变化规律, 以及在给定尺度好坏评价标准的情况下最优尺度层次的选择方法, 实现在最优尺度空间中对知识的表示和获取
    2018, 2019,
    [86, 9596] 多粒度认知计算 通过数据信息驱动, 融合人类“大范围首先”的认知机制(即“由粗粒度到细粒度”的认知过程)以及计算机的信息处理机制(即“由细粒度到粗粒度”的知识挖掘过程), 实现数据和知识双向驱动的空间变换和智能信息处理, 解决认知计算过程中的“数据与知识分离”问题
    下载: 导出CSV

    表  10  篮球运动员挑选

    Table  10  Selection of basketball players

    对象 身高(m) 身高$({S_{{\mu _A}}}( x ))$ 力量 篮球技术 决策
    ${x_1}$ 1.95 1 1
    ${x_2}$ 2.00 1 一般 1
    ${x_3}$ 2.10 1 1
    ${x_4}$ 1.98 1 一般 0
    ${x_5}$ 1.85 [0, 1] 0
    ${x_6}$ 1.73 0 0
    ${x_7}$ 1.88 [0, 1] 1
    ${x_8}$ 1.70 0 1
    下载: 导出CSV
图(11) / 表(10)
