2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

平行系统和数字孪生的一种数据驱动形式表示及计算框架

张俊 许沛东 王飞跃

张艳玲, 刘爱志, 孙长银. 间接互惠与合作演化的若干问题研究进展. 自动化学报, 2018, 44(1): 1-12. doi: 10.16383/j.aas.2018.c170200
引用本文: 张俊, 许沛东, 王飞跃. 平行系统和数字孪生的一种数据驱动形式表示及计算框架. 自动化学报, 2020, 46(7): 1346-1356. doi: 10.16383/j.aas.c200347
ZHANG Yan-Ling, LIU Ai-Zhi, SUN Chang-Yin. Development of Several Studies on Indirect Reciprocity and the Evolution of Cooperation. ACTA AUTOMATICA SINICA, 2018, 44(1): 1-12. doi: 10.16383/j.aas.2018.c170200
Citation: ZHANG Jun, XU Pei-Dong, WANG Fei-Yue. Parallel Systems and Digital Twins: A Data-driven Mathematical Representation and Computational Framework. ACTA AUTOMATICA SINICA, 2020, 46(7): 1346-1356. doi: 10.16383/j.aas.c200347

平行系统和数字孪生的一种数据驱动形式表示及计算框架

doi: 10.16383/j.aas.c200347
基金项目: 

国家重点研发计划 2018AAA0101504

详细信息
    作者简介:

    张俊  武汉大学电气与自动化学院教授. 2003年和2005年分别获得华中科技大学电子信息与通信工程系学士与硕士学位. 2008年获得亚利桑那州立大学电气工程博士学位.主要研究方向为智能系统, 人工智能, 知识自动化, 及其在智能电力和能源系统中的应用. E-mail: jun.zhang.ee@whu.edu.cn

    许沛东  武汉大学电气与自动化学院博士研究生. 2018年获得武汉大学电气工程学院硕士学位.主要研究方向为人工智能, 智能电网. E-mail: xupd@whu.edu.cn

    通讯作者:

    王飞跃  中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任, 中国科学院大学中国经济与社会安全研究中心主任, 青岛智能产业技术研究院院长.主要研究方向为平行系统的方法与应用, 社会计算, 平行智能以及知识自动化.本文通信作者. E-mail: feiyue.wang@ia.ac.cn

Parallel Systems and Digital Twins: A Data-driven Mathematical Representation and Computational Framework

Funds: 

National Key R & D Program of China 2018AAA0101504

More Information
    Author Bio:

    ZHANG Jun   Professor at the School of Electrical Engineering and Automation, Wuhan University. He received his bachelor and master degrees in electrical engineering from Huazhong University of Science and Technology, Wuhan, China, in 2003 and 2005, respectively, and his Ph. D. degree in electrical engineering from Arizona State University, USA, in 2008. His research interest covers intelligent systems, artificial intelligence, knowledge automation, and their applications in intelligent power and energy systems

    XU Pei-Dong   Ph. D. candidate at the School of Electrical Engineering and Automation, Wuhan University. He received his master degree from the School of Electrical Engineering, Wuhan University in 2018. His research interest covers artificial intelligence, smart grid

    Corresponding author: WANG Fei-Yue   State specially appointed expert and director of the State Key Laboratory for Management and Control of Complex Systems, Institute of Automation, Chinese Academy of Sciences. Director of China Economic and Social Security Research Center in University of Chinese Academy of Sciences. Dean of Qingdao Academy of Intelligent Industries. His research interest covers methods and applications for parallel systems, social computing, parallel intelligence, and knowledge automation. Corresponding author of this paper
  • 摘要: 旨在为平行系统及ACP方法建立一种数据驱动的数学形式和计算框架, 该形式与框架也适用于数字孪生系统.首先, 基于动态系统状态方程方法论, 给出了平行系统的虚实双系统表示方法, 基于此表示方法为平行系统问题提供了一种数学表示.围绕该表示, 讨论了虚实系统互动、平行系统与数字孪生系统异同等问题.然后, 为ACP方法提供了一种计算框架, 详细解释了人工系统(Artificial systems, A)、计算实验(Computational experiments, C)、平行执行(Parallel execution, P)的数学计算求解过程, 并讨论了“学习与训练”、“实验与评估”、“管理与控制”、灵捷–聚焦–收敛(AFC)、小数据-大数据-小智能等概念的相关数学表示, 并讨论了智能科学与平行系统数学架构的关系以及平行智能的内涵.最后, 以大学校园园区能源管理系统为案例, 为平行系统数学架构和方法提供一个直观的算例.
    Recommended by Associate Editor LIU De-Rong
  • 达尔文的进化论认为"物竞天择、适者生存", 说明竞争在进化中起核心的作用[1].依据这一理论, 在"弱肉强食"的生存斗争中, 适应性强的个体胜出, 适应性差的个体被淘汰.从而在激烈的生存斗争中, 每个个体均会从自身利益出发, 变得利己自私、唯利是图.然而, 从细菌群落到蜂群蚁群, 从狼群狮群围捕猎物到群居的大猩猩, 再到复杂而有序的人类社会, 合作行为无处不在[1-4].显然, 帮助对手会降低自身的适应度, 从而削弱自身的竞争优势, 合作的存在看似并不合理.面对广泛存在的合作行为, 达尔文本人也深感困惑, 在其著作中相应的解释只是一笔带过[5].

    合作行为广泛存在, 同时在很多领域中又十分匮乏.研究促进合作涌现的机制有以下三点益处: 1)有助于解释众多产生原因未知的现象, 例如, 细胞的癌变[6]、语言的产生[7]和集群行为[8]; 2)有助于解决我们面临的全球性问题, 例如, "公地悲剧" [9]、环境恶化[10]和资源枯竭[11]; 3)有助于破解互联网时代在虚拟世界中我们遇到的新问题, 例如, 网络欺诈[12]等违法犯罪行为.由此可见, 研究促进合作演化的机制对人类发展有着重大的现实意义和时代紧迫感.

    如何研究合作行为的演化?这是一个热点问题, 2005年 $Science$ 杂志就指出"合作行为如何进化"是21世纪最关键的25个科学问题之一[13].演化博弈论(Evolutionary game theory)为研究合作的演化提供一个有力的数学框架. Smith等首次将von Neumann开创的博弈论观点(大脑在利益冲突时做出理性决定)扩展为根据自然选择而得出决定[14], 这标志着演化博弈论的开创.近年来, 国内外越来越多的学者利用此理论研究促进合作涌现的机制[15-37].其中最著名的是哈佛大学的Nowak教授, 他对"综合进化论" (这一理论将突变、选择和进化的基本概念整合到一个数学框架中)的思想进行了扩展, 将囚徒困境放到演化的群体中进行研究. Nowak首次总结了促进合作涌现的5大机制[38]:亲缘选择(Kin selection)、直接互惠(Direct selection)、间接互惠(Indirect selection)、网络互惠(Network reciprocity)和群组选择(Group selection).亲缘选择意味着, 与谁的血缘关系越近, 就越倾向与之合作; 直接互惠意味着, 今天我帮助你, 明天你会帮助我; 间接互惠意味着, 今天我帮助你, 明天会有他人帮助我; 网络互惠意味着, 个体仅仅与邻居进行博弈, 合作者团簇最终胜出背叛者团簇; 群组选择意味着, 竞争既发生在个体之间, 也发生在群组之间.除了这5大机制, 最近的综述还归纳出另外5种促进合作演化的机制[39]:绿胡子选择(Green beard selection)、强互惠性(Strong reciprocity)、有成本的示好(Costly signaling)、集合选择(Set selection)和选择性参与(Optional participation).绿胡子选择意味着, 相似性越高的个体之间越容易发生合作; 强互惠性意味着, 个体愿意牺牲自身利益惩罚背叛行为; 有成本的示好意味着, 个体愿意承担成本吸引其他个体的关注; 集合选择意味着, 个体仅仅与相同集合的个体进行交互; 选择性参与意味着, 个体有权利拒绝与特定个体进行博弈.

    间接互惠是促进合作涌现的重要机制之一.相对于直接互惠, 间接互惠不再要求相同的个体间重复相遇, 同时利他个体能够从第三方获得收益, 这可以很好地解释陌生个体间的合作行为[40-46].大量的非亲缘、非直接的间接互惠行为在人类社会和动物世界中广泛存在.特别地, 人类社会中语言的出现[7, 47]、道德规范的形成[38]、社会的分工[39]以及人类大脑的发育[47]都与间接互惠密不可分.在经济全球化和进入网络时代的背景下, 电子商务大大地增加了陌生个体间交易的频率, 陌生个体间的一次性交互逐步取代传统的相识个体间的重复交互[37, 48-52].此时的交易主要依赖于声望和信任, 从而局部信息条件下个体信任被利用的"道德风险"不断增大[45].因此, 针对间接互惠如何促进合作涌现的研究吸引了演化生物学家、经济学家和社会科学家等学者的极大兴趣.

    间接互惠包括"上游互惠" (Upstream reciprocity)、"下游互惠" (Downstream reciprocity)和"广义互惠" (Generalized reciprocity)三种形式[45, 53-57].如图 1所示, "上游互惠"指的是, $B$ 得到 $A$ 的帮助后受到激励, 继而帮助 $C$ ; "下游互惠"指的是, $C$ 观察到 $A$ 曾经帮助了 $B$ , 因此帮助 $A$ , 这是一种建立在声望基础上的间接互惠; "广义互惠"指的是, $D$ 观察到 $A$ 帮助 $B$ , 于是 $D$ 帮助 $C$ . "上游互惠"并不能单独促进合作的涌现, 只有与直接互惠或者网络互惠相结合才能促进合作的涌现[56-57]. "下游互惠"和"广义互惠"均可单独促进合作的涌现, 不过前者是研究间接互惠的主流方向, 而关于后者的相关研究还甚少.目前, 针对间接互惠的研究方法主要有理论分析、蒙特卡罗仿真(Monte Carlo simulation)和实验验证(包括实验室实验、实地实验和在线实验).

    图 1  间接互惠的三种形式
    Fig. 1  Three kinds of indirect reciprocity

    接下来的文章从以下三方面归纳总结关于"下游互惠"的研究:经典的博弈模型、声望评估准则与行为准则和基于八卦的声望信息传播.

    在演化博弈论框架下研究间接互惠, 需要将个体之间发生的交互行为抽象为博弈模型.目前, 常被用来研究间接互惠的博弈模型包括捐助博弈(Donation game) [43-44, 58-72]、信任博弈(Trust game) [73-75]、独裁者博弈(Dictator game) [76-82]和公共品博弈(Public goods game) [83-88].

    1) 捐助博弈, 如图 2 (a)所示.一方为捐助者 $A$ , 另一方为接受者 $B$ :如果 $A$ 给予 $B$ 捐助, 则 $A$ 付出成本 $c$ 且 $B$ 得到收益 $b$ ( $b>c$ ); 如果 $A$ 不给予 $B$ 捐助, 则双方均未获得收益且没有损失.

    图 2  博弈模型及收益矩阵
    Fig. 2  Games and their payoff matrices

    2) 信任博弈, 如图 2 (b)所示.一方为投资者 $A$ , 另一方为响应者 $B$ : $A$ 将部分资金 $c$ (总额为 $R$ , $0\leq c\leq R$ )给予 $B$ , 从而 $B$ 获得收益 $r\times c$ ( $r>1$ ); 随后, $B$ 决定将其获得的部分收益 $a$ ( $0\leq a\leq r\times c$ )返还给 $A$ .最后, $A$ 获得收益 $R-c+a$ , $B$ 获得收益 $r\times c-a$ .

    3) 独裁者博弈, 如图 2 (c)所示.一方为独裁者 $A$ , 另一方为接受者 $B$ : $A$ 将部分资金 $c$ (总额为 $R$ , $0\leq c\leq R$ )分给 $B$ .无论 $A$ 给了 $B$ 多少, $B$ 只能接受, 没有拒绝的权利, 从而 $B$ 得到收益 $c$ , 而 $A$ 获得其余收益 $R-c$ .

    4) 公共品博弈, 如图 2 (d)所示.博弈的成员同时向公共资源池进行投资, 投资总额乘以增益系数 $r$ ( $1<r<$ 博弈人数)后平均分配给所有博弈成员, 每个成员的收益为所获得的回报减去自身的投资额.

    声望是间接互惠发挥作用的核心, 然而声望的建立首先面临的问题是如何评价个体声望的好与坏, 即如何构建声望评估准则.目前, 被广泛研究的评估准则包括"一阶评估"、"二阶评估"和"三阶评估" [43-44, 59-71, 85-101], 如表 1所示.

    表 1  声望评估准则
    Table 1  Reputation evaluation criterion
    声望评估准则 定义 数量(种) 典型的例子
    "一阶评估" 考虑捐助者行为 $2^2=4$ "形象分数"
    "二阶评估" 同时考虑捐助者行为和接受者声望 ${(2^2)}^2=16$ "温和准则"、"严苛准则"
    "三阶评估" 同时考虑捐助者行为和声望及接受者声望 ${({(2^2)}^2)}^2=256$
    下载: 导出CSV 
    | 显示表格

    "一阶评估"在评价个体声望时仅考虑捐助者行为(是否给予帮助).经典的"一阶评估"是"形象分数":当捐助者帮助接受者时, 捐助者的形象分数增加一分; 当捐助者拒绝帮助接受者时, 捐助者的形象分数减少一分. 1998年, Nowak等首次利用"形象分数"构建了刻画间接互惠的数学模型, 如图 3所示.他们认识到间接互惠在促进合作演化方面的巨大作用[43]:当玩家的声望由多值"形象分数"确定时, 蒙特卡罗仿真表明合作行为在群体中以较高频率涌现.之后, 这个结论被行为实验证实[63].与此同时, Nowak等理论分析了二值"形象分数" [43-44].稍后的理论研究表明很多因素导致合作行为在采取二值"形象分数"的群体中消失[64-66, 96].这种现象是由于此准则固有的困境:拒绝帮助形象差的玩家, 虽然惩罚了他们, 但同时也令自身形象变差[67, 97-98].显然, 仅考虑捐助者行为的二值"形象分数"会造成不公正的声望评价.最近, 理论工作揭示了多人博弈[68, 99]、三值"形象分数" (好、中性、坏) [69]或特定"一阶评估" (观察者根据捐赠者在以往多次行动中的表现确定其名声) [70, 100]可以克服这个困境, 促进合作行为的涌现.

    图 3  经典的间接互惠模型
    Fig. 3  Representative model about indirect reciprocity

    "二阶评估"也能弥补二值"形象分数"固有的缺陷:在评价个体声望时, 不仅考虑捐助者的行为(是否给予捐助), 还要考虑接受者的声望(好、坏).典型的"二阶评估"包括"温和准则"和"严苛准则", 如表 2所示.二者唯一的不同点在于, 前者认为拒绝帮助坏人会为捐助者带来好的声望, 而后者认为此行为会为捐助者带来坏的声望.学者在"二阶评估"中引入惩罚策略(不仅给被惩罚者带来损失, 而且惩罚者也要承担少量损失), 发现对背叛者置之不理比惩罚背叛者更有利于合作的涌现[71].

    表 2  典型的"二阶评估"
    Table 2  Representative "second-order evaluation"
    捐助者行为/接受者声望
    捐助/好 捐助/坏 不捐助/好 不捐助/坏
    "温和准则"
    "严苛准则"
    下载: 导出CSV 
    | 显示表格

    在"二阶评估"基础上, 额外考虑捐赠者的声望, 这种评估准则被称为"三阶评估" [91-92].例如, 名声差的人通过帮助好名声之人"收买"好名声.学者考察所有可能的"三阶评估", 假设群体最多拥有两种策略, 发现了8种评估准则可以令合作行为具有演化稳定性[93].这8种准则如表 3所示, 具有一些共性:与好人合作(捐助)其名声为好, 而背叛好人(不捐助)则为坏, 同时好人背叛坏人不会损坏名声.值得一提的是, 它们均不属于"一阶评估", 而其中两种属于"二阶评估", 分别为"温和准则"和"严苛准则".学者在群体共存多种策略的假设下对这两种准则进行研究[94].上述研究均假设群体共享相同评估准则, 而比较的是不同行为准则的竞争.鉴于认知差异会导致个体对于如何评估声望的理解不同, 学者也考虑了评估准则因人而异的情形[95, 101].

    表 3  8种促进合作演化的声望评估准则
    Table 3  Eight reputation evaluation criterions which favor the evolution of cooperation
    捐助者声望/接受者声望
    好/好 好/坏 坏/好 坏/坏
    捐助者捐助 未知 未知
    捐助者不捐助 未知
    下载: 导出CSV 
    | 显示表格

    关于间接互惠的早期研究假设个体仅帮助声望好的个体, 或者个体仅帮助形象分数高于某一阈值的个体[43-44, 64-68, 96-99].这些最简单的行为准则(行为准则是能否捐助的依据)要求个体仅根据对手的声望决定自己是否给予捐助.稍后, 略微复杂的行为准则, 例如个体决定是否捐助时需要同时考虑自身和对手的声望, 受到关注[69-71, 89-90, 94-95, 100-101].上述研究主要关注哪种声望评估准则更有利于合作的演化.最近, 学者们对较为复杂的行为准则如何影响合作涌现进行了探索[72, 87, 102].一些学者考察个体在决定是否捐助时对接受者的声望有一定的容忍范围(当接受者的声望在这个范围内则进行捐助), 通过仿真发现, 一定的声望容忍度有助于合作的涌现[87, 102].还有一些研究提出了一种基于向量的行为准则(捐助者将自身声望与接受者声望进行比较, 当至少满足三种条件中的两种时则进行捐助, 这三种条件包括声望近似、声望高于自己和声望低于自己), 通过仿真发现, "捐赠者会为与自己声望近似或者高于自己声望的接受者进行捐助"这种策略在较小的成本收益比下能够成为占优策略, 同时促进合作的演化[72].

    直接观察和八卦(个体之间通过交流, 共享彼此的声望信息)是声望信息传播的两种方式[45, 103-104], 如图 4所示.当群体规模较小时, 个体可以通过直接交互或者直接观察获得对方一手的声望信息.然而随着群体规模的扩大, 直接观察到所有个体行为变得不大可能, 必须通过与第三方交流来分享和传播二手的声望信息[104-105].可见在较大的群体中, 八卦常常是声望信息传播的主要方式.

    图 4  声望信息传播的两种方式
    Fig. 4  Two ways of reputation dispersal

    一些学者通过解析和仿真的方式对于八卦如何影响合作的涌现进行研究.此时的模型通常假设观察者以一定的概率 $q$ 了解玩家的声望(通过概率的形式简单模拟了声望的局部传播).针对"形象分数", Nowak等给出了简单的数学关系:当 $q$ 高于成本收益比 $c/b$ 时, 合作可以涌现[43-44].在"二阶评估"下, 类似的条件在两个调查中获得[106-107], 这两个调查最大区别在于, 当观察者未看到交互过程时, 捐赠者的名声保持不变或者设定为未知.若将交互划分为公开和私下两种(观察者一直看到公开交互而以概率 $q$ 看到私下交互), 类似的条件仍然满足[108].上述研究均假设 $q$ 为常数, 针对 $q$ 随时间推移而增大的情形(观察者越来越可能了解其余个体的声望), 也有学者进行了理论分析[109].

    八卦在传播声望信息过程中可能受到噪声的干扰和谎言的入侵, 导致不公正的声望评价.噪声一方面来源于不完整的观察给出不公正的声望, 另一方面来源于在声望传播过程中无意地误导他人; 而谎言则是故意传播虚假的声望信息而对他人进行误导.一项研究在声望传播中引入欺骗策略(传播虚假声望信息), 发现这种策略在没有其他机制的情形下导致群体合作演化的失败[110].另两项研究表明:当群体中没有虚假信息传播时, 八卦数量的增加有助于促进合作的演化; 而存在噪声干扰和谎言所导致的不公正评价时, 中等数量的八卦最有利于促进合作的演化[111-112].这两项研究是基于累加的八卦信息进行决策, 而最近的研究发现基于最新的八卦信息作出决策更能促进合作的演化[113].上述关于八卦的模型均没有加入声望传播所需的成本(例如时间的消耗).当考虑这种成本时, 结果表明间接互惠不再促进合作的演化[114].

    另一部分学者通过行为实验的方法对八卦进行研究, 主要发现如下.即使个体能够通过直接交互或者直接观察获取他人的一手声望信息, 实验发现个体也会倾向于基于八卦信息做出判断[115-117].八卦所传播的声望信息有助于个体甄别合作对象从而避免被欺骗, 并有效提高群体的合作水平[88, 103, 118].当八卦将个体的声望传播到未来会与其发生交互的个体时, 八卦可以促使个体更加关注自身声望并促进慷慨行为的产生[82, 119-121].八卦按照传播主题可以被划分为传播好名声和传播坏名声两种, 传播好名声的八卦更能够促进合作的涌现[115].社会网络结构允许个体可以在不同时间从多个来源获取彼此的声望信息, 这有助于减少信息传播中可能出现的误差[122-123]. "道德威慑"通过拆穿谎言后的惩罚机制维护八卦的可信性, 从而促进合作的涌现[124].当声望被视为可以买卖的物品时, 由于人类具有认知和辨别能力以及欺骗者为了购买声望会付出一定的收益而降低适应度, 因此, 虚假的声望对合作水平的影响并不明显[125-126].

    合作行为在很多领域中十分匮乏, 因此, 研究促进合作演化的机制对人类发展有着重大的现实意义和时代紧迫感. 2005年 $Science$ 杂志就指出"合作行为如何进化"是21世纪最关键的25个科学问题之一.在演化博弈论的框架下, 研究人员已提出一些促进合作演化的机制, 其中间接互惠是促进合作演化的最重要机制之一, 并已吸引了演化生物学家、经济学家和社会学家等学者的极大兴趣.它包括"上游互惠"、"下游互惠"和"广义互惠"三种方式: "上游互惠"并不能单独促进合作的涌现, 只有与直接互惠或者网络互惠相结合才能促进合作的涌现; "下游互惠"和"广义互惠"均可单独促进合作的涌现, 不过前者是研究间接互惠的主流方向, 而关于后者的相关研究还甚少.本文关注的是以声望为核心的"下游互惠", 具体而言, 个体通过帮助他人建立自己在群体中的好声望, 从而期待未来获得他人的帮助.

    本文从三个方面对关于"下游互惠"的研究进行总结.首先, 回顾了在演化博弈论框架下研究间接互惠的博弈模型:捐助博弈、信任博弈、独裁者博弈和公共品博弈.其次, 回顾了被广泛研究的三类声望评估准则: "一阶评估"、"二阶评估"和"三阶评估".相关研究假设采用比较简单的行为准则, 而聚焦于哪种声望评估准则能够促进合作的演化.同时回顾了关于较为复杂的行为准则如何促进合作演化的一些研究.再次, 回顾了利用解析方法和仿真方法对八卦如何促进合作演化进行的研究.解析研究一般假设个体以一定的概率获得彼此的声望信息, 这个概率通常为常值, 个别研究假设其可随时间变化.仿真研究假设更加复杂的模型, 例如八卦不再如实传递信息, 而是融入了噪声和谎言.同时也回顾了利用行为实验对八卦进行的研究, 内容十分宽泛.

    基于声望的间接互惠具有广阔的研究前景, 其未来可能的研究方向有复杂网络上的间接互惠、声望传播系统的鲁棒性、声望共享系统的建立和间接互惠在P2P网络中的应用.

    目前, 大部分理论研究均是在混合均匀群体中获得的[127-129].然而, 绝大多数现实社会中的群体并非混合均匀的, 个体之间的交互和声望传播都是利用复杂网络实现的.在演化博弈论框架下, 未涉及间接互惠的静态复杂网络和动态复杂网络已被广泛研究[130-142], 而只有较少研究关注复杂网络上的间接互惠[143-147].文献[143]发现在社会网络中, 根据声望选择交互伙伴这种行为有助于促进合作的演化.文献[144-145]假设小世界网络和无标度网络等复杂网络可以重构(断边重连), 发现声望共享"联盟"的存在有助于促进群体合作.文献[146-147]假设直接互惠和间接互惠同时存在于网络上, 发现间接互惠有助于刻画现实社会的无标度网络的形成.

    虽然科研人员已经对于复杂网络上的间接互惠进行了一些初步的探索, 但是还有很多问题需要进一步研究.例如, 上述研究均认为声望是通过观察获得的公共信息(即声望全局可知), 然而在现实社会中, 声望多数情况下是通过八卦进行传播的, 由此可见, 静态或动态复杂网络上八卦这种声望传播方式如何影响合作的演化是一个值得深入研究的方向.

    八卦是大规模群体中声望传播的主要方式, 它在传播声望信息过程中可能受到噪声的干扰和谎言的入侵, 从而导致不公正的声望评价.噪声一方面来源于不完整的观察给出不公正的声望, 另一方面来源于在声望传播过程中无意地误导他人; 而谎言则是故意传播虚假的声望信息而对他人进行误导.一项研究在声望传播中引入欺骗策略(传播虚假声望信息), 发现这种策略在没有其他机制的情形下导致群体合作演化的失败[110].另两项研究表明:当群体中没有虚假信息传播时, 八卦数量的增加有助于促进合作的演化; 而存在噪声干扰和谎言所导致的不公正评价时, 中等数量的八卦最有利于促进合作的演化[111-112].这两项研究是基于累加的八卦信息进行决策, 而最近的研究发现基于最新的八卦信息作出决策更能促进合作的演化[113].

    科研人员已经对于加入噪声和谎言的八卦进行了初步的探索, 但已研究的模型还有很多可以改进的地方, 相应的结果并不全面.在未来的研究中, 我们需要建立更加合适的模型, 结合现实生活提出能够抵抗噪声干扰和谎言入侵的八卦, 令声望传播系统具有鲁棒性, 进而发现能够促进合作演化且强抗干扰的机制.

    以往关于间接互惠的绝大多数研究均没有考虑个体间声望共享所需的成本.但在实际中, 人们在评价和分享他人声望的过程中需要耗费时间和精力.例如, 在网络购物平台中, 人们需要花费时间和精力去评价所购买的产品或者服务.近期的一项研究表明, 当考虑声望共享所需成本时, 间接互惠无法促进合作的涌现[114].

    随着经济全球化和网络时代的到来, 陌生个体间的交易日益频繁.为什么人们会不计成本、不厌其烦地和陌生人分享他人的真实声望呢?目前的研究还没有给出一个满意的答复.因此, 我们需要针对考虑声望共享所需成本的模型, 提出能够建立声望共享系统且促进合作涌现的有效机制.

    近年来, P2P (Peer to peer)网络应用广泛, 因此对其研究发展快速.在P2P网络中, 参与者共享自身所拥有的一部分硬件资源(存储能力、网络连接能力和打印机等), 这些共享资源通过网络提供服务和内容, 能被其他对等节点(Peer)直接访问而无需经过中间实体.在此网络中的参与者既是资源、服务和内容的提供者(Server), 又是资源、服务和内容的获取者(Client).合作是确保所有参与者获得所需服务的关键, 出于恶意和自私的非合作行为往往导致参与者获得较少服务甚至一无所获.消除非合作行为的有效机制包括信任机制和激励机制.信任机制指的是根据参与者的交互历史计算他的可信任值[148-153], 例如, eBay声望系统[151]、Beta声望系统[152]、Eigentrust声望系统[148]和Powertrust声望系统[153].激励机制包括金钱激励和非金钱激励[154-157].

    鉴于P2P网络中个人利益和集体利益相冲突, 经典博弈理论已被广泛用来研究此类网络[154, 157-160].不过经典博弈理论假设参与者完全理性且拥有全局信息.这些假设并不现实, 同时经典博弈理论不能描述参与者策略的动态演化过程及策略在整个系统中的传播过程.近来, 可以克服上述缺点的演化博弈论被用来研究P2P网络[155, 161-165].文献[161]假设P2P网络是混合均匀且有无限节点, 并利用复制动力学研究三种激励机制的稳定性.文献[162]同样利用复制动力学发现一种延拓的模仿动力学可以改进整个网络路径选择的效率, 从而避免路径上的过载或长延迟.文献[163]假设P2P网络具有有限节点, 分别在混合均匀网络和同型结构网络上研究一种激励机制(Reciprocation-based incentive mechanism).文献[164]将关于同类激励机制的研究推广到异型结构的P2P网络.文献[155, 165]假设P2P网络具有有限节点, 利用计算机仿真调查两种信任机制.上述研究是针对一般性的P2P网络, 还有一些研究利用演化博弈论分析特殊的P2P网络, 例如基于P2P的无线传感网络[166-169]和基于P2P的车辆自组织网络[170].

    科研人员已利用演化博弈论对P2P网络进行了一些探索, 本文主体部分总结了在演化博弈论框架下对于间接互惠的研究成果, 一个自然的想法是将这些研究思路应用到关于P2P网络的研究中.大体思路有以下4点:

    1) 声望评估准则可视作信任机制.将"一阶评估"、"二阶评估"或"三阶评估"作为信任机制集合, 寻找能够令P2P网络中合作行为稳定的信任机制.

    2) 行为准则可视为激励机制.将已研究过的行为准则构成激励机制集合, 寻找能够令P2P网络高效、有序运行的激励机制.

    3) 在P2P网络的声望传播过程中融入八卦, 研究八卦对于网络稳定性的影响.

    4) 可以将深度学习方法[171]与间接互惠机制结合, 来研究网络控制问题[172-174].

    致谢: 对北京科技大学自动化学院刘剑、孟祥钰、古鹏飞和王雷等同学给予的帮助表示感谢!
  • 本文责任编委  刘德荣
  • 图  1  平行系统理论与ACP方法

    Fig.  1  Parallel system theory and ACP method

    图  2  美国某大学校园电网的网络拓扑

    Fig.  2  The network topology of the campus network of an American university

    图  3  校园能源社区系统管控流程

    Fig.  3  Management and control process of campus energy community system

    图  4  夏季场景中6个目标楼宇的总体社会成本与不同室内温度设置的比较

    Fig.  4  Comparison of the total social cost of six target buildings and different indoor temperature settings in summer

    表  1  用于训练目标建筑物的隐藏神经元的数量和训练结果的回归R值

    Table  1  The number of hidden neurons used to train the target building and the regression R value of training results

    编号 建筑名 隐藏神经元(个) R值
    1 里奇中心 30 0.88
    2 法律大楼 20 0.96
    3 斯特姆礼堂 30 0.96
    4 丹尼尔大楼 30 0.86
    5 纽曼中心 50 0.86
    6 奥林中心 5 0.94
    下载: 导出CSV
  • [1] Wang F Y. Shadow Systems: A New Concept for Nested and Embedded Co-simulation for Intelligent Systems. Tucson, Arizona State, USA: University of Arizona, 1994.
    [2] 王飞跃.平行系统方法与复杂系统的管理和控制.控制与决策, 2004, 19(5): 485-489, 514 http://d.old.wanfangdata.com.cn/Periodical/kzyjc200405002

    Wang Fei-Yue. Parallel system methods for management and control of complex systems. Control and Decision, 2004, 19(5): 485-489, 514 http://d.old.wanfangdata.com.cn/Periodical/kzyjc200405002
    [3] 王飞跃.关于复杂系统的建模、分析、控制和管理.复杂系统与复杂性科学, 2006, 3(2): 26-34 http://d.old.wanfangdata.com.cn/Periodical/fzxtyfzxkx200602004

    Wang Fei-Yue. On the modeling, analysis, control and management of complex systems. Complex Systems and Complexity Science, 2006, 3(2): 26-34 http://d.old.wanfangdata.com.cn/Periodical/fzxtyfzxkx200602004
    [4] 王飞跃.平行控制:数据驱动的计算控制方法.自动化学报, 2013, 39(4): 293-302 doi: 10.3724/SP.J.1004.2013.00293

    Wang Fei-Yue. Parallel Control: A Method for Data-Driven and Computational Control. Acta Automatica Sinica, 2013, 39(4): 293-302. doi: 10.3724/SP.J.1004.2013.00293
    [5] 王飞跃.平行控制与数字孪生:控制理论的回顾与展望.智能科学与技术学报, 2020, 2(3): 213-222

    Wang Fei-Yue. Parallel control and digital twins: Control Theory revisited and reshaped. Chinese Journal of Intelligent Science and Technology, 2020, 2(3): 213-222
    [6] 杨林瑶, 陈思远, 王晓, 张俊, 王成红.数字孪生与平行系统:发展现状、对比及展望.自动化学报, 2019, 45(11): 2001-2031 doi: 10.16383/j.aas.2019.y000002

    Yang Lin-Yao, Chen Si-Yuan, Wang Xiao, Zhang Jun, Wang Cheng-Hong. Digital twins and parallel systems: State of the art, comparisons and prospect. Acta Automatica Sinica, 2019, 45(11): 2001-2031 doi: 10.16383/j.aas.2019.y000002
    [7] 王飞跃, 刘德荣, 熊刚, 程长建, 赵冬斌.复杂系统的平行控制理论及应用.复杂系统与复杂性科学, 2012, 9(3): 1-12 http://d.old.wanfangdata.com.cn/Periodical/fzxtyfzxkx201203001

    Wang Fei-Yue, Liu De-Rong, Xiong Gang, Cheng Chang-Jian, Zhao Dong-Bin. Parallel control theory of complex systems and applications. Complex Systems and Complexity Science, 2012, 9(3): 1-12 http://d.old.wanfangdata.com.cn/Periodical/fzxtyfzxkx201203001
    [8] Wang F Y, Wang X, Li L X, Li L. Steps toward parallel intelligence. IEEE/CAA Journal of Automatica Sinica, 2016, 3(4): 345-348 http://d.old.wanfangdata.com.cn/Periodical/zdhxb-ywb201604001
    [9] 李力, 林懿伦, 曹东璞, 郑南宁, 王飞跃.平行学习—机器学习的一个新型理论框架.自动化学报, 2017, 43(1): 1-8 doi: 10.16383/j.aas.2017.y000001

    Li Li, Lin Yi-Lun, Cao Dong-Pu, Zheng Nan-Ning, Wang Fei-Yue. Parallel learning — a new framework for machine learning. Acta Automatica Sinica, 2017, 43(1): 1-8 doi: 10.16383/j.aas.2017.y000001
    [10] Wang F Y, Zhang J, Wei Q L, Zheng X H, Li L. PDP: Parallel dynamic programming. IEEE/CAA Journal of Automatica Sinica, 2017, 4(1): 1-5 http://d.old.wanfangdata.com.cn/Periodical/gpxygpfx200512007
    [11] Wang F Y, Zhang J J, Zheng X H, Yuan Y, Dai X X, Zhang J, et al. Where does AlphaGo go: From church-turing thesis to alphago thesis and beyond. IEEE/CAA Journal of Automatica Sinica, 2016, 3(2): 113-120 http://cn.bing.com/academic/profile?id=1a2559dd75dbcccdd436bdd38af37c14&encoded=0&v=paper_preview&mkt=zh-cn
    [12] Wei Q L, Li H Y, Wang F Y. Parallel control for continuous-time linear systems: A case study. IEEE/CAA Journal of Automatica Sinica, 2020, 7(4): 919-928 http://d.old.wanfangdata.com.cn/Periodical/zdhxb-ywb202004001
    [13] 王飞跃. X5.0:平行时代的平行智能体系.中国计算机学会通讯, 2015, 11(5): 10-14 http://d.old.wanfangdata.com.cn/NSTLQK/NSTL_QKJJ0210208514/

    Wang Fei-Yue. X5.0: parallel intelligence in parallel age. Communications of CCF, 2015, 11(5): 10-14 http://d.old.wanfangdata.com.cn/NSTLQK/NSTL_QKJJ0210208514/
    [14] (Koller D, Friedman N[著], 王飞跃, 韩素青[译].概率图模型:原理与技术.北京:清华大学出版社, 2015.

    Koller D, Friedman N[Author], Wang Fei-Yue, Han Su-Qing[Translator]. Probabilistic Graphical Models. Beijing: Tsinghua University Press, 2015.
    [15] Singhal A. Introducing the knowledge graph: Things, not strings[Online], available: https://www.blog.google/products/search/introducing-knowledge-graph-things-not/, February 26, 2020
    [16] 王飞跃.软件定义的系统与知识自动化:从牛顿到默顿的平行升华.自动化学报, 2015, 41(1): 1-8 doi: 10.16383/j.aas.2015.c000001

    Wang Fei-Yue. Software-defined systems and knowledge automation: A parallel paradigm shift from Newton to Merton. Acta Automatica Sinica, 2015, 41(1): 1-8 doi: 10.16383/j.aas.2015.c000001
    [17] Tan K C, Lee T H, Khor E F. Evolutionary algorithms for multi-objective optimization: Performance assessments and comparisons. Artificial Intelligence Review, 2002, 17(4): 251-290 doi: 10.1023-A-1015516501242/
    [18] 王飞跃.词计算和语言动力学系统的计算理论框架.模式识别与人工智能, 2001, 14(4): 377-384 http://d.old.wanfangdata.com.cn/Periodical/mssbyrgzn200104001

    Wang Fei-Yue. Computing with words and a framework for computational linguistic dynamic systems. Pattern Recognition and Artificial Intelligence, 2001, 14(4): 377-384 http://d.old.wanfangdata.com.cn/Periodical/mssbyrgzn200104001
    [19] 王飞跃.词计算和语言动力学系统的基本问题和研究.自动化学报, 2005, 31(6): 844-852 http://www.aas.net.cn/article/id/15941

    Wang Fei-Yue. Fundamental issues in research of computing with words and linguistic dynamic systems. Acta Automatica Sinica, 2005, 31(6): 844-852 http://www.aas.net.cn/article/id/15941
    [20] 王飞跃, 张俊.智联网:概念、问题和平台.自动化学报, 2017, 43(12): 2061-2070 doi: 10.16383/j.aas.2017.y000006

    Wang Fei-Yue, Zhang Jun. Internet of minds: The concept, issues and platforms. Acta Automatica Sinica, 2017, 43(12): 2061-2070 doi: 10.16383/j.aas.2017.y000006
    [21] 王飞跃, 张军, 张俊, 王晓.工业智联网:基本概念、关键技术与核心应用.自动化学报, 2018, 44(9): 1606-1617 doi: 10.16383/j.aas.2018.y000004

    Wang Fei-Yue, Zhang Jun, Zhang Jun, Wang Xiao. Industrial internet of minds: Concept, technology and application. Acta Automatica Sinica, 2018, 44(9): 1606-1617 doi: 10.16383/j.aas.2018.y000004
    [22] Roweis S T, Saul L K. Nonlinear dimensionality reduction by locally linear embedding. Science, 2001, 290(5500): 2323-2326 doi: 10.1126-science.290.5500.2323/
    [23] Almalaq A, Hao J, Zhang J J, Wang F Y. Parallel building: A complex system approach for smart building energy management. IEEE/CAA Journal of Automatica Sinica, 2019, 6(6): 1452-1461 http://d.old.wanfangdata.com.cn/Periodical/zdhxb-ywb201906015
    [24] 马世乾, 崇志强, 何富林, 郝君, 张俊, 宫晓燕.平行能源系统:博弈的复杂社会技术系统.电力系统及其自动化学报, 2019, 31(8): 59-65, 85 http://d.old.wanfangdata.com.cn/Periodical/dlxtjqzdhxb201908011

    Ma Shi-Qian, Chong Zhi-Qiang, He Fu-Lin, Hao Jun, Zhang Jun, Gong Xiao-Yan. Parallel energy systems: A game method for composite social-technical systems. Proceedings of the CSU – EPSA, 2019, 31(8): 59-65, 85 http://d.old.wanfangdata.com.cn/Periodical/dlxtjqzdhxb201908011
    [25] Zhang J J, Gao D W, Zhang Y C, Wang X, Zhao X Y, Duan D L, et al. Social energy: Mining energy from the society. IEEE/CAA Journal of Automatica Sinica, 2017, 4(3): 466-482 http://d.old.wanfangdata.com.cn/OAPaper/oai_arXiv.org_1311.5158
    [26] 张俊, 王飞跃, 方舟.社会能源:从社会中获取能源.智能科学与技术学报, 2019, 1(1): 7-20 http://d.old.wanfangdata.com.cn/Periodical/hjbh201018018

    Zhang Jun, Wang Fei-Yue, Fang Zhou. Social energy: Mining energy from the society. Chinese Journal of Intelligent Science and Technology, 2019, 1(1): 7-20 http://d.old.wanfangdata.com.cn/Periodical/hjbh201018018
    [27] Wang F Y, Zhang J J, Qin R, Yuan Y. Social energy: Emerging token economy for energy production and consumption. IEEE Transactions on Computational Social Systems, 2019, 6(3): 388-393 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=10.1177/0306312786016002008
  • 期刊类型引用(29)

    1. 李倩,聂简,黄鸿殿,孔庆宇,奔粤阳. 基于大脑海马认知机理的主从式AUV协同定位方法. 中国惯性技术学报. 2024(01): 27-33 . 百度学术
    2. 游雄,李科,田江鹏,杨剑,余岸竹,贾奋励. 机器地图信息加工模型. 武汉大学学报(信息科学版). 2024(04): 516-526 . 百度学术
    3. 高昊,王仁茂. 基于类脑仿生的环境感知技术. 舰船电子对抗. 2024(05): 42-46+55 . 百度学术
    4. 陈荟慧,钟委钊. 基于人机协作的高质量城市图像采集方法. 应用科学学报. 2023(05): 801-814 . 百度学术
    5. 朱祥维,沈丹,肖凯,马岳鑫,廖祥,古富强,余芳文,高柯夫,刘经南. 类脑导航的机理、算法、实现与展望. 航空学报. 2023(19): 6-38 . 百度学术
    6. 于乃功,廖诣深. 基于鼠脑内嗅—海马认知机制的移动机器人空间定位模型. 生物医学工程学杂志. 2022(02): 217-227 . 百度学术
    7. 刘溢,阳加远,张驰. 一种基于RTX的移动机器人实时控制平台. 电子技术与软件工程. 2022(08): 169-172 . 百度学术
    8. 于子航,王改云. 基于路径积分强化的机器人目标导向运动控制. 计算机仿真. 2022(07): 412-415+516 . 百度学术
    9. 董卫华,刘毅龙,黑巧松,杨天宇. 泛地图空间认知理论与方法研究框架. 武汉大学学报(信息科学版). 2022(12): 2007-2014 . 百度学术
    10. 阮晓钢,李鹏,朱晓庆,刘鹏飞. 基于目标导向行为和空间拓扑记忆的视觉导航方法. 计算机学报. 2021(03): 594-608 . 百度学术
    11. 赵辰豪,吴德伟,韩昆,代传金. 无环境信息下多尺度网格细胞群空间表征模型. 系统工程与电子技术. 2021(03): 814-822 . 百度学术
    12. 阮晓钢,柴洁,武悦,张晓平,黄静. 基于海马体位置细胞的认知地图构建与导航. 自动化学报. 2021(03): 666-677 . 本站查看
    13. 冀俊忠,刘金铎,邹爱笑,杨翠翠. 一种融合多源信息的脑效应连接网络蚁群学习算法. 自动化学报. 2021(04): 864-881 . 本站查看
    14. 万刚,武易天. 地图空间认知的数学基础. 测绘学报. 2021(06): 726-738 . 百度学术
    15. 洪涛,史涛,任红格. 一种改进型RatSLAM算法构建认知地图的研究. 现代计算机. 2021(21): 47-52 . 百度学术
    16. 韩昆,吴德伟,来磊. 类脑导航中基于差分Hebbian学习的网格细胞构建模型. 系统工程与电子技术. 2020(03): 674-679 . 百度学术
    17. 黄宜庆,王正刚,王徽,葛愿. 基于边缘梯度算法的多移动机器人协作地图构建. 信息与控制. 2020(01): 62-68 . 百度学术
    18. 于乃功,廖诣深,郑相国. 一种基于海马位置细胞选择机制的空间认知模型. 生物医学工程学杂志. 2020(01): 27-37 . 百度学术
    19. 胡小平,毛军,范晨,张礼廉,何晓峰,韩国良,范颖. 仿生导航技术综述. 导航定位与授时. 2020(04): 1-10 . 百度学术
    20. 于乃功,冯慧,廖诣深,郑相国. 一种基于感知速度与感知角度的网格野计算模型. 生物医学工程学杂志. 2020(05): 863-874 . 百度学术
    21. 晁丽君,熊智,杨闯,华冰,王雅婷,刘建业. 无人飞行器三维类脑SLAM自主导航方法. 飞控与探测. 2020(05): 35-43 . 百度学术
    22. 张孝伍. 图上的概率分布及位置方向信息的表征方法. 青岛理工大学学报. 2019(01): 113-121 . 百度学术
    23. 方略,何洪军. 基于鼠脑海马位置细胞与Q学习面向目标导航. 生物信息学. 2019(01): 31-38 . 百度学术
    24. 王均,凌有铸,王静. 基于特征融合的仿生SLAM算法研究. 安徽工程大学学报. 2019(02): 26-33 . 百度学术
    25. 刘建业,杨闯,熊智,赖际舟,熊骏. 无人机类脑吸引子神经网络导航技术. 导航定位与授时. 2019(05): 52-60 . 百度学术
    26. 韩昆,吴德伟,来磊,杨林. 自主导航条件下网格细胞放电模型. 电子科技大学学报. 2019(05): 711-716 . 百度学术
    27. 丛明,邹强,刘冬,杜宇. 定位细胞认知机理启发的机器人导航研究综述. 机械工程学报. 2019(23): 1-12 . 百度学术
    28. 邹强,丛明,刘冬,杜宇. 仿鼠脑海马的机器人地图构建与路径规划方法. 华中科技大学学报(自然科学版). 2018(12): 83-88 . 百度学术
    29. 吴德伟,何晶,韩昆,李卉. 无人作战平台认知导航及其类脑实现思想. 空军工程大学学报(自然科学版). 2018(06): 33-38 . 百度学术

    其他类型引用(28)

  • 加载中
  • 图(4) / 表(1)
    计量
    • 文章访问数:  2318
    • HTML全文浏览量:  353
    • PDF下载量:  670
    • 被引次数: 57
    出版历程
    • 收稿日期:  2020-05-23
    • 录用日期:  2020-07-02
    • 刊出日期:  2020-07-01

    目录

    /

    返回文章
    返回