-
摘要:
时间差分算法(Temporal difference methods, TD)是一类模型无关的强化学习算法. 该算法拥有较低的方差和可以在线(On-line)学习的优点, 得到了广泛的应用. 但对于一种给定的TD算法, 往往只能通过调整步长参数或其他超参数来加速收敛, 这也就造成了加速TD算法收敛的方法匮乏. 针对此问题提出了一种利用蒙特卡洛算法(Monte Carlo methods, MC)来加速TD算法收敛的方法(Accelerate TD by MC, ATDMC). 该方法不仅可以适用于绝大部分的TD算法, 而且不需要改变在线学习的方式. 为了证明方法的有效性, 分别在同策略(On-policy)评估、异策略(Off-policy)评估和控制(Control)三个方面进行了实验. 实验结果表明ATDMC方法可以有效地加速各类TD算法.
Abstract:Temporal difference methods (TD) methods are a class of model-free reinforcement learning methods. TD methods have been widely used, which have a low variance and can learn on-line. But for a given TD method, there is only one approach that adjusts the step size or other parameters to accelerate the convergence, which leads to a lack of methods to make it. To solve this problem, we introduce a method for accelerating TD methods based on Monte Carlo (MC) methods, which not only can be applied to most of the TD methods, but also do not need to change the way of on-line learning. In order to demonstrate the effectiveness of the method, experiments were carried out in the three aspects: the on-policy evaluation, off-policy evaluation and control. The experimental results show that the accelerate TD by MC (ATDMC) method can effectively accelerate TD methods.
-
多机协同空战是指由两架或两架以上的作战飞机互相配合、相互协作, 完成对空作战任务的一种战争方式, 包括协同机动、协同打击及火力掩护等环节, 是现代海、陆、空、天、电一体化作战模式在多机空战中的具体体现[1]. 因此, 提高多机协同效率, 对于掌握战场制空权、提高对空作战任务成功率和减少作战伤亡都具有重大意义. 世界各国也越来越关注和重视有助于提高机群整体作战效能的协同空战的研究. 然而, 相较于单架战机的空战决策, 多机协同问题涉及的实体类型更多、决策空间更大、复杂程度更高.
目前, 自主空战决策的算法研究, 依据其核心内涵的不同, 主要分为数学求解、机器搜索以及数据驱动三类方法.
第一类是基于数学求解的空战决策方法. 该方法最早可以追溯到上世纪Isaacs[2]提出的利用数学形式解解决追逐问题, 但Isaacs提出的方法缺乏严格的数学证明, 只适用于简单的空战场景[3]. 随着优化控制理论在20世纪60年代被提出, 学者们开始尝试用该理论解决空战决策问题. 早期的研究将空战问题简化为纯追逐问题[4] (即一方被指定为追逐者, 另一方为被追逐者, 空战过程中, 角色不发生更改), 在空战优化目标以及飞行动力学的限制下, 采用Hamilton方程求解. 进入20世纪80年代后, 战机与导弹性能显著提升, 传统纯追逐形式的空战被超视距空战替代, 敌我攻防角色转换频繁, 固定角色的纯追逐优化问题不再使用, 针对双目标优化的研究被大量开展[5-8]. 双目标分别是给定战场态势, 确定最终空战结局; 给定空战结局, 优化战机机动动作.
第二类是基于机器搜索的空战决策方法. 目前较为成熟可行的空战机动决策算法, 如影像图[9-10]、马尔科夫方法[11-12]、蒙特卡洛搜索[13]、矩阵决策[14-15]、决策树[16]、近似动态规划[17-18]等, 均是基于类似思路展开的. 欧建军等[19]引入偏好规划理论解决不确定环境下态势评估不准确的问题; 奚之飞等[20]引入描述多目标威胁的威力势场理论来构建态势评价函数; 韩统等[21]设计了一种协同威胁指数, 强调战机协同关系对战场态势的影响; 嵇慧明等[22]结合距离、高度、速度、角度、性能要素构建战机综合优势函数; 王炫等[23]建立进化式专家系统树框架; 周同乐等[24]提出将战场态势与任务效益相结合的目标函数; 左家亮等[25]利用深度神经网络的预测能力来启发决策序列搜索; 刘树林[26]提出一种专家意见、会议判断与统计分析相结合的评价方法.
第三类是基于数据驱动的空战决策方法. 基于数据驱动的方法以神经网络技术为主, 该技术分为两类: 一类是将空战机动决策问题转变为分类(模式识别)问题, 输入实时战场态势, 输出战机采取的机动动作[27-28]; 另一类与前向搜索方法类似, 采用动态贝叶斯网络, 对不同战场态势下敌、我机机动动作的概率分布进行仿真、预测, 判定我机采取的动作[29-30]. 目前, 基于强化学习(Reinforcement learning, RL) 的空战决策技术[31-33]最为流行, 以Q-learning算法为例, 该技术重点研究Q值的设计方法, 目标是获得准确的战场态势到动作决策的映射关系.
上述三类研究方向也存在如下问题.
1) 基于数学求解的空战决策方法. 是最理想也是最难以实现的, 因为该方法要求严格的数学逻辑证明, 模型构建复杂. 仅针对较为简单的空战形式有效, 如规避导弹、拦截卫星等, 但当面临三维空间复杂机动的缠斗空战问题时, 适用性较为有限.
2)基于机器搜索的空战决策方法. 本质在于解决任务规划、态势评估、目标分配等辅助决策问题, 遵循“设计态势评估函数评价战场态势、使用智能优化算法搜索最优策略”的逻辑内核. 所以, 这类方法具有专家经验要求较高、态势评估函数设计复杂且粒度难以把握、机动动作策略库空间较小、优化算法搜索效率低、难以满足战场实时性决策的要求、场景简单且泛化性能差的通病.
3)基于数据驱动的空战决策方法. 以强化学习为例, 很多研究只提到强化学习的概念, 本质上仍属于机器搜索的范畴, 仅利用神经网络的预测能力为优化搜索算法提供启发式经验; 一些研究仅适用于简单的一对一空战场景, 并且需要大量专家经验支撑, 如评价函数、态势估计、飞行动力学模型的设计等, 这类研究难以移植到复杂场景, 泛化性能较差; 一些研究虽然提出了多机协同的概念, 但只是简单地将多机问题分解为单机问题来解决, 较难提炼出协同战法.
鉴于上述不同方法的缺点, 本文提出一种“集中式训练–分布式执行”的多机协同空战决策流程框架. 该框架不需要对空战环境以及战机飞行动力学进行建模、对专家经验的需求较小、具有实时决策的能力, 且本文提出的4种算法改进机制能有效提高模型训练的效率和稳定性, 实现了使用强化学习算法解决多机协同空战决策问题的技术途径.
本文首先从构建整个决策流程框架入手, 设计模型的训练与执行架构; 然后, 针对多机空战场景的特点, 设计了4种改进近端策略优化(Proximal policy optimization[34], PPO)算法的机制, 针对性提高了多机协同对抗场景下深度强化学习算法的效果; 最后, 在兵棋推演平台上仿真, 测试本文提出的决策流程框架以及改进算法的效果, 并总结模型涌现出的5种典型战法, 实验结果验证了本文方法的有效性和实用性.
1. 深度强化学习背景知识
强化学习是机器学习的一个重要领域, 其本质是描述和解决智能体在与环境的交互过程中学习策略以最大化回报或实现特定目标的问题. 与监督学习不同, 强化学习中的智能体不被告知如何选择正确的动作, 而是通过智能体不断与环境交互试错, 从而学习到当前任务最优或较优的策略, 能够有效地解决在自然科学、社会科学以及工程应用等领域中存在的序贯决策问题.
现有强化学习方法利用马尔科夫决策过程(Markov decision process, MDP)从理论方面对RL问题进行基础建模. MDP由一个五元组
$\langle S,\;A, $ $ \;R,\;T,\;\gamma \rangle$ 定义, 其中,$S$ 表示由有限状态集合组成的环境;$A$ 表示可采取的一组有限动作集; 状态转移函数$T\!:S \times A \to \Delta (S)$ 表示将某一状态−动作对映射到可能的后继状态的概率分布,$\Delta (S)$ 表示状态全集的概率分布, 对于状态$s,\;s' \in S$ 以及$a \in A,$ 函数$T$ 确定了采取动作$a$ 后, 环境由状态$s$ 转移到状态$s'$ 的概率; 奖赏函数$R(s,\;a,\;s')$ 定义了状态转移获得的立即奖赏;$\gamma $ 是折扣因子, 代表长期奖赏与立即奖赏之间的权衡.近年来, 随着深度学习(Deep learning, DL)技术的兴起及其在诸多领域取得的辉煌成就, 融合深度神经网络和RL的深度强化学习(Deep reinforcement learning, DRL)成为各方研究的热点. 同基本的强化学习方法相比, DRL将深度神经网络作为函数近似和策略梯度的回归函数. 虽然使用深度神经网络解决强化学习问题缺乏较好的理论保证, 但深度神经网络的强大表现力使得DRL的结果远超预期, 并在战略博弈[35-36]、无人机控制[37]、自主驾驶[38]和机器人合作[39]等领域取得了较大突破.
在非凸优化的情况下, 梯度可以用数值方法或抽样方法计算, 但很难确定适当的迭代学习率, 需要随时间变化以确保更好的性能. 早期的强化学习研究在使用基于梯度的优化技术时也遇到了这样的困境, 为规避瓶颈, Schulman等[40]提出一种处理随机策略的信任域策略优化(Trust region policy optimization, TRPO)算法. 该算法在目标函数中考虑了旧策略和更新策略之间的Kullback-Leibler(KL)发散, 并能对每个状态点的KL发散进行有界处理. 该方法跳出了对学习率的修正, 使策略改进过程更加稳定, 理论证明该方法单调地增加了累积奖赏. 考虑到TRPO中二阶Hessian矩阵计算的复杂性, Schulman等[34]进一步发展了一阶导数PPO算法.
图1描述PPO算法中神经网络的更新流程. 训练时从经验回放库(Replay buffer)中选择一批样本(Sample)供网络参数更新. PPO算法采用的是Actor-Critic (AC)框架, 包含两个网络. Actor网络更新部分, 同TRPO方法一样, 定义了surrogate目标:
$$\max {L^{{\rm{CPI}}}}(\theta ) = \max {\hat {\rm{E}}_t}[{r_t}(\theta ){\hat A_t}],\;\;\;{r_t}(\theta ) = \frac{{{\pi _\theta }({a_t}|{s_t})}}{{{\pi _{{\theta _{{\rm{old}}}}}}({a_t}|{s_t})}}$$ (1) 其中,
$\hat {\rm{E}}_t$ 表示对0 ~ t区间求均值,${\pi _\theta }$ 代表当前时刻的策略,${\pi _{{\theta _{{\rm{old}}}}}}$ 代表上一时刻的策略,${\hat A_t}$ 估计了动作${a_t}$ 在状态${s_t}$ 下的优势函数.在PPO中, 对上述代理目标进行了裁剪:
$${L^{{\rm{CLIP}}}}(\theta ) = {\hat {\rm{E}}_t}[\min ({r_t}(\theta ){\hat A_t},\;{{clip}}({r_t}(\theta ),1 - \varepsilon ,1 + \varepsilon ){\hat A_t}]$$ (2) $${{clip}}(x,\;{x_{{\rm{MIN}}}},\;{x_{{\rm{MAX}}}}) = \left\{ \begin{array}{l} x,\;\;\;\;\;\;\;{\rm{if }}\;{x_{{\rm{MIN}}}} \leq x \leq {x_{{\rm{MAX}}}} \\ {x_{{\rm{MIN}}}}, \;\;{\rm{if }}\;x < {x_{{\rm{MIN}}}} \\ {x_{{\rm{MAX}}}},\;{\rm{ if }}\;{x_{{\rm{MAX}}}} < x \end{array} \right.$$ (3) 该目标
${L^{{\rm{CLIP}}}}(\theta )$ 实现了一种与随机梯度下降兼容的信赖域修正方法, 并通过消除KL损失来简化算法以及减小适应性修正的需求.Critic网络部分, 采用传统TD-error更新网络参数
$\phi $ ,${V_\phi }({s_t})$ 估计了状态${s_t}$ 的状态价值函数.2. 多机协同空战决策流程设计
本节首先介绍多机协同空战决策流程的总体框架和“训练−执行”架构, 之后在PPO算法基础上, 设计4种算法增强机制, 用于提升算法和整体框架的性能.
2.1 总体框架设计
图2是基于深度强化学习的多机协同空战决策流程框架(Deep-reinforcement-learning-based multi-aircraft cooperative air combat decision framework, DRL-MACACDF). 整个框架共包括5个模块, 分别为态势信息处理模块、深度强化学习模块、策略解码模块、经验存储模块、神经网络训练模块.
框架的输入量是战场实时态势信息, 输出量是所控实体的动作决策方案. 原始战场态势信息输入框架后, 会首先经过态势信息处理模块进行加工, 数据经过提取、清洗、筛选、打包、归一化以及格式化表示后, 将传给深度强化学习模块; 深度强化学习模块接收态势信息数据, 输出动作决策; 策略解码模块接收深度强化学习模块的动作决策输出, 解码封装为平台环境可接受的操作指令, 对相应单元进行控制; 同时, 通过执行新动作获得的新的环境态势以及奖励值与本步决策的环境态势信息、动作决策方案一并被打包存储进经验存储模块; 待训练网络时, 再将这些样本数据从经验库中提取出来, 传入神经网络训练模块进行训练.
深度神经网络模块是整个框架的核心, 因为PPO算法收敛稳定、性能好, 并且其使用的一阶优化与剪切概率比率的方法操作简便, 适合在兵棋推演平台上进行多机协同对抗实验, 所以该模块选取PPO算法进行验证性实验. 本文重点在于对多机协同对抗问题进行抽象建模, 验证兵棋推演平台上使用强化学习算法解决该类问题的有效性, 所以文章没有对比众多算法的性能差异, 只是选取了其中较为先进的PPO算法举例.
2.2 集中式训练–分布式执行架构设计
在单智能体强化学习中, 环境的状态转移只与单智能体的动作有关, 而多智能体环境的状态转移依赖于所有智能体的动作; 并且, 在多智能体系统中, 每个智能体所获得的回报不只与自身的动作有关, 还与其他智能体有关. 通过学习改变其中一个智能体的策略将会影响其他智能体最优策略的选取, 且值函数的估计也将不准确, 这样将很难保证算法的收敛性. 因此, 我们采用集中式训练−分布式执行的架构, 如图3.
“集中式训练”是指在训练中使用联合状态−动作值函数
${V_\phi }(s,\;{a_1},\;{a_2}, \cdots ,\;{a_n})$ 对智能体进行训练. 与分布式训练(使用局部动作值函数${V_\phi }({s_i},\;{a_i})$ 训练, 输入单个智能体的局部状态${s_i}$ 和动作${a_i}$ )相比, 联合动作值函数输入的是全局态势信息$s$ 和所有实体的动作信息${a_1} \sim {a_n}$ , 是真正对于联合状态−策略的评估. 其优点在于所有实体共享一套网络参数, 在决策动作时能够考虑实体间的耦合关系, 因为整个系统的转移和回报函数的产生都与联合动作有关, 这样能有效防止一个实体的策略影响其他实体的策略, 解决算法较难收敛的问题.然而, 在真正执行的时候, 单个智能体只能观测到部分信息(包括部分的状态信息和动作信息), 无法获得其他智能体的动作, 甚至无法获得联合状态. 这种情况下, 输入决策网络的是单智能体的局部观测信息, 输出的是单智能体的决策动作, 这就是“分布式执行”. 这种决策方式可以弥补不同实体间的动作区分度不大、模型探索性不强的缺点.
2.3 嵌入式专家经验奖励机制
空战决策问题是专业要求高、系统性较强的研究领域, 用于空战的战法战术及策略复杂且丰富, 所以专家经验在解决该问题过程中往往具有十分关键的作用. 传统奖励函数通常根据实体间交战的输赢判定得分, 将战损分值
$scor{e_{{\rm{total}}}}$ 作为奖励值$r$ 用于网络训练.$$r = scor{e_{{\rm{total}}}}$$ (4) 但是, 这样设置的最大问题是奖励过于稀疏, 算法很难收敛. 为解决这一问题, 对奖励函数进行改进, 将专家经验嵌入奖励函数中. 考虑到战机靠近目标点时, 神经网络收到的奖励反馈应该变大, 所以在传统奖励函数基础上增加一个额外奖励项
$scor{e_{{\rm{encourage}}}}$ .$$scor{e_{{\rm{encourage}}}} = di{s_{{\rm{cur}}}} - di{s_{{\rm{next}}}}$$ (5) 其中,
$di{s_{{\rm{cur}}}}$ 表示当前时刻战机距离目标点的距离,$di{s_{{\rm{next}}}}$ 表示下一时刻战机距离目标点的距离. 经过改进后的奖励函数则变为:$$r = (1 - \tau ) \cdot scor{e_{{\rm{total}}}} + \tau \cdot scor{e_{{\rm{encourage}}}}$$ (6) $$\tau = \frac{\tau - {\tau _{{\rm{step}}}}}{{\tau _{{\rm{temp}}}}}$$ (7) 式中,
$\tau $ 是衰减系数, 随着训练的进行, 该值按照式(7)逐渐减小;${\tau _{{\rm{step}}}}$ 是递减步长;${\tau _{{\rm{temp}}}}$ 是衰减基数. 实验中的具体设置见附录表A1.嵌入专家经验的奖励函数, 在训练初期以额外奖励部分占主导, 引导战机飞往目标点. 随着训练迭代次数增加, 传统奖励渐渐占据主导, 侧重探索空战的战法战术.
使用强化学习解决问题, 很难设计一种放之四海而皆准的奖励函数, 需要具体问题具体分析. 本节提出的专家经验奖励机制的核心思想, 是在原有稀疏奖励的基础上, 人为添加一个稠密的奖励, 从而稠密化智能体获得的奖赏值, 加快智能体的训练速度. 上述专家经验奖励函数只是一种参考, 真正使用算法框架时, 还需要根据实际问题进行具体分析与设计.
2.4 自适应权重及优先采样机制
在经验回放库中采样时, 如果使用传统随机采样操作, 不仅无法有效利用高质量的样本, 还有可能导致模型陷入局部最优解. 另外, 回放库中的样本数量不断变化, 也不利于训练的收敛. 因此, 提出一种自适应权重以及优先采样的机制, 解决上述问题.
考虑到神经网络的损失函数受优势值影响, 在设计自适应权重过程中, 提高优势值对采样权重的影响. 将参与采样的每个智能体产生的样本分别按照优势值的绝对值, 由大至小、从1到
$N$ 进行排序. 考虑到全部样本的采样概率之和为1, 设计如下样本自适应权重计算公式:$${P_j} = \frac{{\frac{1 }{ j}}}{{\sum\limits_{j = 1}^N {\frac{1}{ j}} }}$$ (8) 其中,
$j$ 表示样本排序序号,${P_j}$ 表示第$j$ 号样本的采样概率,$N$ 表示一个智能体包含的样本数量. 提出的自适应权重计算公式, 既增加了优势值绝对值较大样本的采样概率, 使奖励值极大或极小的样本都能影响神经网络的训练, 加快算法收敛速度; 又能充分发挥探索与利用的关系, 平衡不同样本采样概率.采样时并非将经验回放库中的所有样本统一计算权重并采样, 而是不同智能体分别计算各自产生的样本的采样权重, 并按照该权重值分别采集预先设定数量的样本, 用于更新网络参数. 这种优先采样机制能够采集不同智能体产生的样本, 体现不同智能体间的合作关系, 促使不同智能体逐渐收敛到相同目标.
2.5 经验共享机制
由于多机空战场景的状态、动作空间庞大, 单个智能体能够探索的空间有限, 样本使用效率不高. 另外, 作为典型的多智能体系统, 多机协同空战问题中, 单个智能体的策略不只取决于自身的策略和环境的反馈, 同时还受到其他智能体的动作及与其合作关系的影响. 所以, 设计经验共享机制, 该机制包含共享样本经验库和共享网络参数两个方面.
所谓共享样本经验库, 是将全局环境态势信息
${s_t}$ 、智能体的动作决策信息${a_t}$ 、智能体执行新动作后的环境态势信息${s_{t + 1}}$ 和环境针对该动作反馈的奖励值${r_{t + 1}}$ 按照四元组$\left( {{s_t},\;{a_t},\;{s_{t + 1}},\;{r_{t + 1}}} \right)$ 的形式存储进经验回放库, 每一个智能体的信息均按照该格式存储进同一个经验回放库中.在更新网络参数时, 按照第2.4节所述机制从经验回放库中提取样本, 分别计算不同智能体产生的样本在Actor网络和Critic网络下的损失值, 进而求得两个神经网络的更新梯度
${J_i}$ . 将不同智能体的样本计算出的梯度值${J_i}$ 进行加权, 可以得到全局梯度公式为:$$J = \frac{1}{n}\sum\limits_{i\, =\, 0}^n {{w_i} \cdot {J_i}} $$ (9) 其中,
${J_i}$ 表示第$i$ 个智能体样本计算出的梯度,$n$ 表示样本总数,${w_i}$ 表示智能体$i$ 对全局梯度计算的影响权重. 这种不同智能体的样本共同更新同一套网络参数的机制称为“共享网络参数”.本文实验只涉及同构智能体, 可以使用所有实体的样本对共享策略网络进行训练. 当环境中存在异构实体时, 依然可以所有实体共享一套网络参数与经验池, 但需要在状态空间输入端、动作空间输出端、经验回放池采样方法上作出一些针对性处理. 例如, 定义总的状态空间维度, 囊括不同类别实体的所有状态, 每类实体只在其包含的状态维度上填充数据, 其余状态维度补零, 从而统一所有类别实体的网络输入维度; 同理, 输出端也定义总的动作空间维度, 囊括不同类别实体的所有动作, 每类实体进行决策时, 在输出端添加mask操作, 实体具有的动作维度正常输出, 不具有的动作维度补零, 再对非零维度的输出进行softmax操作, 按照其概率选择动作; 经验回放池中的样本则可以添加实体类别的标签, 在采样时, 均匀采集不同类别实体的样本. 理论上, 按照上述方法, 深度神经网络能够具备决策不同类别实体的能力. 由于篇幅有限, 本文不对其进行详细建模.
2.6 鼓励探索机制
多机交战的策略与战术战法构成丰富、种类多样、风格多变, 即便在有限动作空间下, 依旧具有涌现出丰富战法的潜力. 如果采用传统PPO算法的损失函数, 训练中后期智能体的探索能力会显著下降. 如何在算法收敛速度与智能体探索能力之间权衡是值得思考的问题.
为解决上述问题, 设计一种基于策略熵的鼓励探索机制, 增强智能体的探索能力, 并加快执行器网络的收敛速度.
不同智能体添加策略熵后的损失函数定义为:
$${L_i} = {L^{{\rm{CLIP}}}}({\theta _i}) + {H_{{\theta _i}}}(\pi ( \cdot |{s_t}))$$ (10) 其中, 下标
$i$ 表示第$i$ 个智能体;${\theta _i}$ 表示网络参数;${L^{{\rm{CLIP}}}}({\theta _i})$ 为传统PPO算法的损失函数, 计算方法如式(2)所示;${H_{{\theta _i}}}(\pi ( \cdot |{s_t}))$ 表示在参数${\theta _i}$ 下策略$\pi ( \cdot |{s_t})$ 的策略熵, 具体计算方法如式(11):$${H_{{\theta _i}}}(\pi ( \cdot |{s_t})) = - \sum\limits_{{a_t} \in A} {{\pi _{{\theta _i}}}} ({a_t}|{s_t})\ln {\pi _{{\theta _i}}}({a_t}|{s_t})$$ (11) 本文出现的策略熵权重默认为1, 因此没有在公式中另行标注.
本文针对的问题背景是多机协同空战决策, 主要强调不同实体间的配合协作. 所以在计算损失函数时, 不是直接计算全局损失, 而是结合优先采样机制和经验共享机制, 求解不同智能体各自产生的样本的损失值. 相应地, 其策略熵也单独计算, 最后计算均值
${\rm{E}}_i $ 作为全局损失函数值.包含鼓励探索机制的损失函数如式(12):
$$L = {{{\rm{E}}}_i}[{L_i}] = \frac{1}{M}\sum\limits_{i \;=\; 1}^M {{L_i}} $$ (12) 其中,
$M$ 是智能体总数.3. 仿真实验及结果
本文实验平台为“墨子•未来指挥官系统(个人版)1”, 该平台支持联合作战背景下的制空作战、反水面作战等多种作战样式的仿真推演, 适用于作战方案验证、武器装备效能评估、武器装备战法研究等. 实验台式机搭载的CPU为i9-10900K、显卡为NVIDIA GeForce RTX 3090、内存为64 GB.
3.1 实验想定
实验想定如图4所示, 该想定中红蓝兵力配置相等, 各自包含3架战斗机和一个可起降飞机的基地, 想定范围为长1400 km、宽1000 km的长方形公海区域.
想定推演的过程为飞机从基地起飞, 对己方基地进行护卫, 同时对敌方的战斗机和基地进行摧毁. 各个实体的具体型号和损失得分见附录表A2和表A3.
3.2 模型构建
使用PPO算法构建强化学习智能体, 按照第1节所述方法, 对强化学习的要素进行定义.
1)状态设计
状态包含己方和敌方两部分实体信息, 己方实体信息包含己方飞机和导弹的信息, 敌方实体信息包含敌方飞机和导弹的信息. 由于战场迷雾, 己方和敌方同类型实体的状态信息可能不一致, 其中缺失的信息补零处理, 数据全部按照去量纲的方式进行缩放. 具体见附录表A4.
2)动作设计
本文决策的实体控制包含航向、高度、速度、自动开火距离、导弹齐射数量5个类. 由于武器数量有限, 当弹药耗尽时, 自动开火距离以及导弹齐射数量的决策将失效. 为降低决策动作的维度, 本文对航向、高度、速度和自动开火距离进行了离散化处理, 具体见附录表A5. 动作空间维度为6 × 3 × 3 × 6 × 2共648维.
3)奖励设计
奖励包含两个部分, 一部分是稀疏的战损奖励, 另一部分是嵌入式专家经验奖励. 如第2.3节所述的额外奖励思想, 本文采用的嵌入式奖励是战斗机距离敌方基地的距离减少量. 本文将战损得分与嵌入式专家经验奖励进行归一化, 防止变量量纲对计算结果的影响.
4)网络设计
本文Actor网络与Critic网络结构大致相同. 其中, 全局态势信息以及实体个体态势信息分别经过多层归一化层、卷积层对特征进行压缩与提取, 将两部分获得的中间层信息进行拼接, 再经过全连接层后输出. Actor网络输出648维动作概率分布, Critic网络输出1维状态评价值. 神经网络示意图见附录图A1.
5)超参数设计
实验过程中涉及的各种超参数设置见附录表A1.
3.3 算法有效性检验
为验证本文所提出的算法框架的有效性, 根据上述设计方法进行对比实验, 分别记录DRL-MACACDF模型、传统PPO算法模型、人类高级水平的模型与传统规划方法对战的得分曲线, 如图5. 其中, 传统PPO算法也采用了“集中式训练−分布式执行”框架; 传统规划方法采用的是人工势场避障算法与0-1规划相结合的规则模型; 人类高级水平数据来源于第三届全国兵棋推演大赛决赛前三名选手的比赛模型的平均得分.
从图5可以看出, 随着训练次数的增多, DRL-MACACDF模型的得分曲线逐步上升, 经过大约1000轮训练后, 超越了传统规划算法水平. 模型大约在6000轮左右开始收敛, 得分达到最大值. 相比而言, 传统PPO算法效果较差, 得分始终为负, 远不及传统规划算法水平线. 表1是DRL-MACACDF和传统PPO算法的实验数据统计.
表 1 算法有效性实验数据统计Table 1 Experimental statistics of algorithm effectiveness算法 平均得分 得分标准差 平均胜率 (%) DRL-MACACDF 18.929 10.835 91.472 PPO −21.179 1.698 0 从表1可以看出, 在15 000轮训练中, 本文提出的DRL-MACACDF算法平均胜率高达91.472 %, 而传统PPO算法平均胜率仅为0, 性能结果对比十分鲜明. 虽然DRL-MACACDF模型的得分标准差偏高, 但模型在经过训练后, 对战能力迅速提升, 比赛得分快速变化, 所以造成了高标准差. 当经过6 000轮训练, DRL-MACACDF模型开始收敛后, 重新计算DRL-MACACDF模型的得分标准差则仅有1.313, 反映出该模型性能稳定, 波动较小. 实验结果证明, 未加改进且缺乏专家经验的传统PPO算法难以解决多机协同对抗决策问题, 算法效果比传统规划算法效果还差. 相较而言, 本文提出的DRL-MACACDF算法及决策框架, 实验效果超过了传统强化学习算法和传统规划算法, 性能良好且效果稳定, 验证了算法框架的有效性.
3.4 消融实验
本文提出的算法框架包含4种针对多机协同对抗对策问题背景的改进机制. 为研究不同机制对算法性能的影响, 设计消融实验, 通过在传统PPO算法上增减4种改进机制, 比较不同模型的效果. 经过简单试验发现, 在未使用嵌入式专家经验奖励机制的情况下, 不同模型的得分都很低, 其他机制对算法性能的影响效果难以观察. 因此, 消融实验改为在DRL-MACACDF模型基础上分别去除某一机制, 根据实验结果间接比较不同机制的作用. 4种对比算法的设置如表2所示.
表 2 消融实验设置Table 2 The setting of ablation experiment模型 嵌入式专家
经验奖励
机制经验共享
机制自适应权重及
优先采样机制鼓励
探索
机制DRL-MACACDF ● ● ● ● DRL-MACACDF-R ○ ● ● ● DRL-MACACDF-A ● ○ ● ● DRL-MACACDF-S ● ● ○ ● DRL-MACACDF-E ● ● ● ○ 注: ● 表示包含该机制, ○ 表示不包含 图6是消融实验算法性能对比曲线, 在传统PPO算法基础上增加任意三种增强机制对实验性能均有一定程度的提高, 由于作用机制不同, 其影响程度也存在差别. 具体来看, 未添加嵌入式专家经验奖励机制的DRL-MACACDF-R模型性能最差, 仅稍优于传统PPO算法, 所以说专家经验在强化学习中的指导意义巨大, 可以给实验性能带来显著提升; 未添加经验共享机制的DRL-MACACDF-A模型与DRL-MACACDF模型学习曲线大致相当, 但收敛速度相对较慢, 且最终收敛得分稍低. 无自适应权重及优先采样机制和无鼓励探索机制的模型性能依次降低, 其中未添加鼓励探索机制的DRL-MACACDF-E模型前期性能提升较快, 但大约在6 000轮左右就开始收敛并陷入局部最优, 最终落后于未添加自适应权重及优先采样机制的DRL-MACACDF-S曲线; DRL-MACACDF-S模型, 前期收敛速度很慢, 但模型性能一直在提高, 训练到10 000轮左右时, 反超DRL-MACACDF-E模型. 表3统计了4种对比算法相较于传统PPO算法平均得分提高的百分比.
表 3 消融实验数据统计Table 3 Statistics of ablation experimental results模型 平均得分 平均得分比传统 PPO
提高百分比 (%)平均胜率
(%)RL-MACACDF-R −19.297130 8.327 0 RL-MACACDF-A 13.629237 154.019 86.774 RL-MACACDF-S 5.021890 115.934 66.673 RL-MACACDF-E 8.973194 133.417 82.361 消融实验证明, 在解决本文设计的3V3多机协同空战背景的问题时, 本文提出的DRL-MACACDF算法框架中添加的4种创新增强机制均能提高算法性能, 适用于解决多机协同空战决策问题.
3.5 算法效率分析
算法效率的高低是评价算法优劣的重要指标, 模型训练过程中的累计胜率曲线, 反映了算法的学习效率. 其导数为正值时, 代表模型性能正在提高, 胜利次数不断增多; 曲线斜率越大, 则学习效率越高. 如图7可以看出, 实验开始时算法更新迅速, 模型性能提升较快, 经过2500轮左右的训练, 累计胜率就达到了50 %; 至6000轮左右时, 已经基本完成训练, 更新效率开始下降, 模型趋于收敛.
进一步, 分别抽取经过500轮、1000轮、2000轮、5000轮以及10000轮训练的模型进行交叉对抗, 统计100局对抗的平均胜率, 绘制胜率分布图(如图8所示).
从图8的渐变可以看出, 随着训练进行, 模型性能呈现明显的变化趋势. 以最左侧列为例, 从500轮训练增加到1000轮训练, 新模型就能以高达90.1 %的概率赢得胜利, 相较于传统强化学习算法, 本文模型能够以很快的速度提升决策能力, 随着训练次数增加, 模型基本上能以接近100 %的概率获胜. 由第4列可知, 当训练从5000轮增加到10000轮, 模型仅有53.6 %的概率获胜, 此时胜负基本上是按照相等概率随机分布的. 这说明当达到最优解时, 模型收敛稳定, 且性能不会有大幅度的波动.
3.6 行为分析
复盘实验数据, 总结交战过程中DRL-MACACDF模型涌现出的作战意图、策略、战术与战法.
1)双机与三机编队战术
智能体涌现出自主编队能力, 如图9、图10所示, 从基地起飞后, 智能体会随机采取双机编队或者三机编队前往作战区域. 当使用双机编队时, 通常智能体会选择从南北两路分别前往作战区域包围敌方飞机; 而采用三机编队时, 智能体更倾向于从中路挺进, 高速机动至交战区主动迎敌.
2)包夹战术
如图11所示, 在与敌方飞机对抗时, 智能体常常会使用包夹战术. 两架战斗机同时从两个方向对敌方飞机发起攻击, 充分发挥飞机数量优势, 与敌方战机进行缠斗. 这种包夹战术表明, 智能体已经具备控制多机、探索和实现复杂战法的能力.
3)充分发挥武器射程优势
如图12所示, 经过训练的智能体学会充分利用武器的有效射程, 在敌方飞机进入导弹射程后, 立即发射导弹进行攻击, 随后调头脱离敌方飞机攻击范围. 如果导弹未击落敌机, 则再次靠近敌方飞机, 重新组织进攻. 该战术动作既能有效节约弹药, 充分发挥导弹效能, 又能最大限度减少己方伤亡.
4)快速机动避弹动作
如图13所示, 经过仔细复盘战斗机空战中的机动动作, 发现智能体的行为涌现出一种明显的快速机动主动避弹的战术动作. 当敌方导弹临近己方战斗机时, 战斗机会迅速向垂直于导弹瞄准基线的方向机动, 之后再重新飞往目标点. 采用突然变向的战术动作, 大幅降低了战机被击落的概率, 经过统计, 初始模型中击落一架战机平均需要1 ~ 2枚弹, 使用经过训练的智能体进行避弹, 平均需要4 ~ 5枚弹.
5)诱骗敌方弹药战法
另一个明显的战法是诱骗敌方弹药, 如图14所示, 智能体控制多架战机在敌方火力范围边界试探, 引诱敌方进行攻击. 当探测到敌方发射导弹对己方飞机攻击后, 会机动至敌方攻击范围外, 超出敌方导弹射程; 待失去导弹攻击的威胁后, 会再次进入敌方火力覆盖范围. 该策略可以同时控制多架战机诱骗敌方弹药, 能够在短时间内大量消耗敌方导弹.
4. 结论
针对多机协同空战决策的问题背景, 本文提出一种“集中式训练–分布式执行”的多机协同空战决策框架. 该框架内置深度强化学习模块, 并针对多机空战场景的特点, 设计了4种PPO算法改进机制, 针对性提高了多机协同对抗场景下深度强化学习算法的效果, 有效解决了多机协同空中作战实体类型众多、状态和动作空间巨大、协同合作关系复杂程度高等问题. 实验结果证明, 本文方法相较于传统规划算法和PPO算法具有明显优势, 进一步, 消融实验验证4种性能提升机制都不同程度地增强了算法性能, 并且算法效率较高, 能在有限的训练次数下达到良好的效果. 模型在训练过程中涌现出的大量鲜明的战术战法表明, 本文决策流程框架具有良好的探索能力, 能充分挖掘、利用多机空战场景下不同实体间协同合作的机制以及合作与竞争的战术战法, 在战场辅助决策领域具有巨大的应用价值.
本文重心在于抽象多机协同对抗问题, 构建适合强化学习算法求解的模型, 验证技术路径的可行性, 所以并未对不同强化学习算法进行对比分析. 在未来的工作中, 可以进一步拓展框架下的算法种类, 包括连续控制任务或者离散控制任务算法.
另外, 实验规模局限在3V3飞机空战, 还未验证大规模复杂场景下的算法性能. 下一步的研究可以将想定设计的更加贴合实战、更加复杂, 比如增添实体种类、增加实体数量、丰富作战任务等.
致谢
特别感谢梁星星、马扬对本文实验及文章撰写工作的支持.
附录A
表 A1 实验超参数设置Table A1 Experimental hyperparameter setting参数名 参数值 参数名 参数值 网络优化器 Adam 经验库容量 3000 (个) 学习率 5 × 10−5 批大小 200 (个) 折扣率 0.9 $ \tau $初始值 1.0 裁剪率 0.2 ${\tau _{{\rm{step}}} }$ 1 × 10−4 训练开始样本数 1400 (个) ${\tau _{{\rm{temp}}} }$ 50000 表 A2 想定实体类型Table A2 Entity type of scenario单元类型 数量 主要作战武器 F/A-18 型战斗机 2 4 × AIM-120D 空空导弹
2 × AGM-154C 空地导弹F-35C 型战斗机 1 6 × AGM-154C 空地导弹 基地 1 2 × F/A-18 型战斗机
1 × F-35C 型战斗机表 A3 推演事件得分Table A3 The score of deduction events推演事件 得分 击毁一架飞机 139 损失一架飞机 −139 击毁基地 1843 损失基地 −1843 表 A4 状态空间信息Table A4 State space information实体 信息 己方飞机 经度、纬度、速度、朝向、海拔、目标点经度、目标点纬度等 7 维信息 己方导弹 经度、纬度、速度、朝向、海拔、打击目标的经度、打击目标的纬度等 7 维信息 敌方飞机 经度、纬度、速度、朝向、海拔等 5 维信息 敌方导弹 经度、纬度、速度、朝向、海拔等 5 维信息 表 A5 动作空间信息Table A5 Action space information类别 取值范围 飞行航向 0°、60°、120°、180°、240°、300° 飞行高度 7620 米、10973 米、15240 米 飞行速度 低速、巡航、加力 自动开火距离 35 海里、40 海里、45 海里、
50 海里、60 海里、70 海里导弹齐射数量 1 枚、2 枚
-
[1] Sutton R S, Barto A G. Reinforcement Learning: An Introduction. Cambridge, MA: MIT Press, 2018. [2] 刘乃军, 鲁涛, 蔡莹皓, 王硕. 机器人操作技能学习方法综述. 自动化学报, 2019, 45(3): 458−470Liu Nai-Jun, Lu Tao, Cai Ying-Hao, Wang Shuo. A review of robot manipulation skills learning methods. Acta Automatica Sinica, 2019, 45(3): 458−470 [3] Polydoros A S, Nalpantidis L. Survey of model-based reinforcement learning: applications on robotics. Journal of Intelligent & Robotic Systems, 2017, 86(2): 153−173 [4] 王鼎. 基于学习的鲁棒自适应评判控制研究进展. 自动化学报, 2019, 45(6): 1031−1043Wang Ding. Research progress on learning-based robust adaptive critic control. Acta Automatica Sinica, 2019, 45(6): 1031−1043 [5] Wang Fei-Yue, Zheng Nan-Ning, Cao Dong-Pu, Clara M M, Li Li, Liu Teng. Parallel driving in CPSS: A unified approach for transport automation and vehicle intelligence. IEEE/CAA Journal of Automatica Sinica, 2017, 4(4): 577−587 doi: 10.1109/JAS.2017.7510598 [6] Du S S, Chen Jian-Shu, Li Li-Hong, Xiao Lin, Zhou Deng-Yong. Stochastic variance reduction methods for policy evaluation. In: Proceedings of the 34th International Conference on Machine Learning-Volume 70. Sydney, NSW, Australia: PMLR, 2017. 1049–1058 [7] Lyu Dao-Ming, Liu Bo, Geist M, Dong Wen, Biaz S, Wang Qi. Stable and efficient policy evaluation. IEEE Transactions on Neural Networks and Learning Systems, 2019, 30(6): 1831−1840 doi: 10.1109/TNNLS.2018.2871361 [8] Dabney W C. Adaptive step-sizes for reinforcement learning [Ph. D. dissertation], University of Massachusetts Amherst, 2014 [9] Young K, Wang Bao-Xiang, Taylor M E. Metatrace actor-critic: Online step-size tuning by meta-gradient descent for reinforcement learning control. In: Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence. Macau, China: ijcai.org, 2019. 4185–4191 [10] Szepesvári C. Algorithms for reinforcement learning. Synthesis Lectures on Artificial Intelligence and Machine Learning, 2010, 4(1): 1−103 [11] Busoniu L, Babuska R, De Schutter B, Ernst D. Reinforcement Learning and Dynamic Programming Using Function Approximators. Florida: CRC Press, 2017. [12] Boyan J A. Least-squares temporal difference learning. In: Proceedings of the 16th International Conference on Machine Learning. Bled, Slovenia: Morgan Kaufmann, 1999. 49–56 [13] Sutton R S, Szepesvári C, Maei H R. A convergent O(n) algorithm for off-policy temporal-difference learning with linear function approximation. Advances in Neural Information Processing Systems, 2008, 21(21): 1609−1616 [14] Sutton R S, Maei H R, Precup D, Bhatnagar S, Silver D, Szepesvári C, et al. Fast gradient-descent methods for temporal-difference learning with linear function approximation. In: Proceedings of the 26th International Conference on Machine Learning. Montreal, Quebec, Canada: ACM, 2009. 993–1000 [15] Dann C, Neumann G, Peters J. Policy evaluation with temporal differences: A survey and comparison. The Journal of Machine Learning Research, 2014, 15(1): 809−883 [16] Van Seijen H, Sutton R S. True online TD (lambda). In: Proceedings of the 31st International Conference on Machine Learning. Beijing, China: JMLR.org, 2014. 692–700 [17] Precup D, Sutton R S, Dasgupta S. Off-policy temporal-difference learning with function approximation. In: Proceedings of the 18th International Conference on Machine Learning. Williams College, Williamstown, MA, USA: Morgan Kaufmann, 2001. 417–424 [18] Maei H R, Sutton R S. GQ(λ): A general gradient algorithm for temporal-difference prediction learning with eligibility traces. In: Proceedings of the 3rd Conference on Artficial General Intelligence. Lugano, Switzerland: Atlantis Press, 2010. 91–96 [19] Precup D, Sutton R S, Singh S. Eligibility traces for off-policy policy evaluation. In: Proceedings of the Seventeenth International Conference on Machine Learning. Stanford, CA, USA: Morgan Kaufmann, 2000. 759–766 [20] Sutton R S. Learning to predict by the method of temporal differences. Machine Learning, 1988, 3(1): 9−44 [21] Van Seijen H, Mahmood A R, Pilarski P M, Machado M C, Sutton R S. True online temporal-difference learning. The Journal of Machine Learning Research, 2016, 17(1): 5057−5096 [22] Maei H R. Gradient temporal-difference learning algorithms [Ph. D. dissertation], University of Alberta, 2014 [23] White A, White M. Investigating practical linear temporal difference learning. In: Proceedings of the 2016 International Conference on Autonomous Agents & Multiagent Systems. Singapore, Singapore: ACM, 2016. 494–502 [24] Sutton R S, Mahmood A R, White M. An emphatic approach to the problem of off-policy temporal-difference learning. The Journal of Machine Learning Research, 2016, 17(1): 2603−2631 [25] Yu H. Weak convergence properties of constrained emphatic temporal-difference learning with constant and slowly diminishing stepsize. The Journal of Machine Learning Research, 2016, 17(1): 7745−7802 [26] Rummery G A. Problem solving with reinforcement learning [Ph. D. dissertation], University of Cambridge, 1995 期刊类型引用(238)
1. 姜鑫,王春东. 基于区块链的医疗数据安全共享模型研究. 天津理工大学学报. 2025(01): 51-56 . 百度学术
2. 李昌辉,刘亚. 基于CL-LRSS的区块链电子病历方案. 智能计算机与应用. 2024(03): 1-9 . 百度学术
3. 邢汇笛,龚钢军,翟明岳,刘雪松,王浩淼,扬爽. 电力数据共享安全防护与隐私保护综述. 综合智慧能源. 2024(05): 30-40 . 百度学术
4. 谭婧颀,薛凌妍,黄海平,陈龙,李逸轩. 基于可编辑医疗联盟链的数据安全管理方案. 计算机科学. 2024(S1): 979-986 . 百度学术
5. 朱畅,甘昕艳,林柳云. 基层医疗单位电子病历系统问题与对策分析. 软件导刊. 2024(05): 95-100 . 百度学术
6. 黄启帆,俞博文. 数字化时代生鲜行业智慧供应链模式的创新发展研究——以辽宁大连紫海胆为例. 商展经济. 2024(12): 125-128 . 百度学术
7. 徐铣明,刘恩梅. 多中心儿童感染性疾病病原监测网络建设的思考与建议. 中国临床医生杂志. 2024(07): 762-764 . 百度学术
8. 杨雨浓,唐凌翔,王洪. 基于k-means的动态多组织PBFT算法. 重庆大学学报. 2024(07): 125-139 . 百度学术
9. 苏震,吕捷,赵文彦. 国内图书情报学领域区块链研究现状和进路. 科技情报研究. 2024(04): 25-36 . 百度学术
10. 罗妍,刘宇炀,李晓瑛,刘辉. 面向医学大模型的体系化人工智能框架构建与应用. 北京邮电大学学报. 2024(04): 98-104 . 百度学术
11. 陈嘉莉,马自强,兰亚杰,苗莉,杨震. 基于区块链技术的医疗信息共享研究综述. 计算机应用研究. 2024(09): 2573-2584 . 百度学术
12. 张汉成. 健康医疗数据共享的现实困境与合规因应. 医学与哲学. 2024(17): 52-57 . 百度学术
13. 高庆吉,孟令烨,邢志伟. 基于联盟区块链的航空里程积分结算方法. 计算机应用与软件. 2024(10): 71-76 . 百度学术
14. 段嘉俊,柳毅,陈家辉. 基于区块链的电子医疗数据安全共享方案. 计算机应用与软件. 2024(10): 116-121+226 . 百度学术
15. 徐仟,彭艳兵. 基于Link机制的DPoS的共识机制改进. 计算机与数字工程. 2024(11): 3398-3403 . 百度学术
16. 杨伟,连晗,王培培,李巧君. 基于区块链的电子医疗数据共享研究综述. 现代计算机. 2024(19): 1-6+18 . 百度学术
17. 陈嘉莉,马自强,苗莉,李冰雨,岳晓琳. 基于Hyperledger Fabric的电子病历共享方案. 通信学报. 2024(S1): 60-74 . 百度学术
18. 赵姣,赵则,范海龙. 基于区块链的评价机制存储模型. 电子设计工程. 2023(03): 33-37 . 百度学术
19. 王硕,付晓东,岳昆,刘骊,刘利军. 节点偏好一致性最大化的DPoS记账权分配. 小型微型计算机系统. 2023(03): 651-657 . 百度学术
20. 程泽川,沈苏彬. 一种基于区块链的电子病历可信管理方法. 科技资讯. 2023(01): 24-31+40 . 百度学术
21. 姜宇航,张新有. 基于以太坊的医疗健康数据共享系统. 计算机与现代化. 2023(02): 110-115 . 百度学术
22. 李晴. 基于区块链技术的医疗数据共享系统. 电脑编程技巧与维护. 2023(03): 3-7+11 . 百度学术
23. 常路,王冬. 疫情背景下基于区块链技术的基层公共卫生治理路径研究. 中国农村卫生事业管理. 2023(06): 382-390 . 百度学术
24. 张泽丹,王斌,陈婷,张雯,赵冉,唐旭东. 我国中医药临床数据存储与共享存在的问题及建议. 中国中医药图书情报杂志. 2023(04): 1-5 . 百度学术
25. 康海燕,张沙沙. 云链协同的工业互联网数据共享访问控制方法. 北京邮电大学学报. 2023(03): 56-61 . 百度学术
26. 刘朗,王卓. 基于区块链技术的双链数据共享系统研究. 信息技术与信息化. 2023(06): 125-128 . 百度学术
27. 刘世雄,熊旺平. 基于知识图谱的中成药用药监测系统设计与实现. 现代信息科技. 2023(13): 145-148+152 . 百度学术
28. 孙佩茹,陈子君. 基于PBFT算法的冷链物流运输系统. 物流科技. 2023(14): 143-145+149 . 百度学术
29. 徐小梅. 基于区块链的智慧校园数据共享模型研究. 信息技术与信息化. 2023(07): 188-191 . 百度学术
30. 陈卓,王国安,周川. 一种蒙特卡洛方法的区块链邻居节点优选策略. 重庆理工大学学报(自然科学). 2023(07): 227-234 . 百度学术
31. 王慧,王蕾,郭博建. 基于改进型PBFT共识算法的区块链高校精准资助认证模型. 智能计算机与应用. 2023(08): 175-179 . 百度学术
32. 杨广州,葛茂军,刘传丰,庄俊嵘,刘力,涂晓莉. 基于区块链的中药代煎配送服务监管平台的构建及应用. 中国数字医学. 2023(09): 54-60 . 百度学术
33. 郑荣,雷亚欣,张默涵,王晓宇,高志豪. 基于联盟区块链的多源个人健康信息协同共享模式研究. 图书情报工作. 2023(20): 79-92 . 百度学术
34. 谢晴晴,杨念民,冯霞. 基于区块链的噪声化数据分享控制协议. 通信学报. 2023(10): 198-212 . 百度学术
35. 华南,吴玉彬,朱彦霞. 基于JSON的医疗信息共享通用传输构架设计. 现代计算机. 2023(19): 65-71 . 百度学术
36. 覃锦端,王月兵,周杰,毛菲. 基于动态风险评估机制的零信任IAM架构设计. 信息安全研究. 2023(12): 1190-1196 . 百度学术
37. 王付宇,张影影,郑炜晨. 电商违规记录共享区块链模型及实现机理研究. 哈尔滨商业大学学报(自然科学版). 2023(06): 668-675 . 百度学术
38. 王瑞民,吴佳璇,张建辉. 基于秘密分割的区块链安全数据共享模型. 重庆邮电大学学报(自然科学版). 2023(06): 1145-1153 . 百度学术
39. 赵明宇. 基于区块链的安全通信方法研究. 黑龙江科学. 2023(24): 40-44 . 百度学术
40. 刘孝保,孙海彬,阴艳超,姚廷强,杨林. 面向制造业产业链图状区块链模型. 计算机集成制造系统. 2023(12): 4267-4281 . 百度学术
41. 张亚青,陆志宏,何小龙,范天建,李俊英,杨涛,向治平. 基于区块链的儿童生长发育数据追溯系统设计. 医疗卫生装备. 2023(10): 38-43 . 百度学术
42. 文瑞映. 云计算环境去中心化数据安全共享算法. 电脑与电信. 2023(11): 69-72+81 . 百度学术
43. 张利华,曹宇,张赣哲,黄阳,陈世宏. 基于区块链的微电网数据安全共享方案. 计算机工程. 2022(01): 43-50 . 百度学术
44. 王媛,彭爱群. 区块链助力医疗病历数据流通及治理变革探析. 通化师范学院学报. 2022(01): 50-54 . 百度学术
45. 姜鑫,王飞. 基于联盟区块链的网络威胁情报共享平台. 电脑与信息技术. 2022(01): 50-52 . 百度学术
46. 冯珊珊,李永梅. 区块链技术在供应链金融信用风险管理中的应用研究. 征信. 2022(02): 59-65 . 百度学术
47. 韩刚,吕英泽,罗维,王嘉乾. 重大疫情患者隐私数据保护方案研究. 计算机科学与探索. 2022(02): 359-371 . 百度学术
48. 刘杰,胡胜利,罗一,刘佳. 利用网闸实现病案首页数据的自动上报. 中国医疗设备. 2022(03): 100-102+122 . 百度学术
49. 范伊璠,范永茂. 社会交换理论视阈下的人工智能和服务业:颠覆还是突破?. 生产力研究. 2022(02): 122-127 . 百度学术
50. 王敏,景戈韬,姜心言,金荣华. 基于区块链技术的传染病领域大数据平台建设及应用. 北京医学. 2022(02): 194-196 . 百度学术
51. 温亮明,李洋,杨卓. 区块链技术在高校档案数据管理中的应用探析. 文献与数据学报. 2022(01): 62-71 . 百度学术
52. 李晓武,曲国华,张悦,韩江涛. 区块链研究现状、知识演进与趋势分析——基于WOS核心数据库文献的科学计量. 经济问题. 2022(05): 54-63 . 百度学术
53. 张歌,苏路明. 区块链技术多场景应用述评. 河南大学学报(自然科学版). 2022(03): 320-328 . 百度学术
54. 袁昊男,王瑞锦,郑博文,吴邦彦. 基于Fabric的电子病历跨链可信共享系统设计与实现. 计算机科学. 2022(S1): 490-495+638 . 百度学术
55. 唐晓华,王春佳,刘艳,任小强. 基于区块链的生鲜农产品冷链物流信息共享模型研究. 物流工程与管理. 2022(05): 79-81 . 百度学术
56. 王晶,张海明,温亮明,马卓然. 基于联盟链的科研云联邦计量系统研究设计. 数据与计算发展前沿. 2022(02): 109-120 . 百度学术
57. 王阳川. 基于区块链的中医治未病电子病历共享方案. 长江信息通信. 2022(05): 39-41 . 百度学术
58. 杨莹. 基于SSH架构的事业单位财务信息内部共享模型. 自动化技术与应用. 2022(06): 65-67+72 . 百度学术
59. 钟楠,杨波,张丽娜. 基于区块链的医疗服务群智网络系统. 密码学报. 2022(03): 511-523 . 百度学术
60. 王磊,王贵峰,戴子端. 基于区块链的亳州中药共享物流研究——以白芍共享物流为例. 九江学院学报(自然科学版). 2022(02): 106-110 . 百度学术
61. 汤深语. 应用先行 区块链技术在中国的兴起. 科学文化评论. 2022(02): 87-100 . 百度学术
62. 江涛,邢恩博,覃琼霞,添梦. 基于区块链技术的产品标准链架构研究. 科技管理研究. 2022(17): 181-187 . 百度学术
63. 孙雪冬,刘铭,王新民. 区块链发展应用综述. 吉林大学学报(信息科学版). 2022(05): 798-804 . 百度学术
64. 王灵. 城乡居民医保信息系统优化研究. 电脑知识与技术. 2022(27): 102-104 . 百度学术
65. 卢耀恩,石金铭,桑青原,陈亚军,翟运开. 区块链技术应用于互联网医疗的研究热点与趋势分析——基于CiteSpace软件的可视化计量分析. 中国医院管理. 2022(11): 18-22 . 百度学术
66. 翟运开,王鑫璞,石金铭,马倩倩,谭中科. 基于区块链的互联网医疗服务监管平台存储系统设计. 中国医院管理. 2022(11): 27-30 . 百度学术
67. 林超,何德彪,黄欣沂. 基于区块链的电子医疗记录安全共享. 计算机应用. 2022(11): 3465-3472 . 百度学术
68. 李敏,傅洁,李磊,王小丹,陈安蜀,王国明. 区块链视角下地学数据共享研究. 地质与资源. 2022(05): 700-706 . 百度学术
69. 焦瑞金,郑广海. 基于区块链的食品溯源多Agent系统架构的研究. 计算机应用与软件. 2022(11): 10-16+24 . 百度学术
70. 迟蕾,宿萌,张森. 5G在医疗行业的应用现状及思考. 中国医院管理. 2022(12): 64-68 . 百度学术
71. 初菁菁,董睿垠. 基于星际文件系统的医疗数据分布式存储方案研究. 中国数字医学. 2022(11): 52-57 . 百度学术
72. 王岩庆,周均,丛若晨,王力成,黄一诺,陈道炼. 区块链技术在电动汽车智能化管理中的研究现状与发展. 南方电网技术. 2022(11): 55-67 . 百度学术
73. 叶欣,韩蕾,徐着雨,岳远雷. 基于区块链技术构建重大传染病疫情预警机制的伦理分析. 中国医学伦理学. 2022(11): 1256-1261 . 百度学术
74. 赵利霞,叶春明. 区块链在突发公共事件人员追溯中的应用研究. 上海理工大学学报. 2022(06): 603-612 . 百度学术
75. 汤玲,张小号. 大数据时代高校英语数字化教学资源管理平台建设. 情报科学. 2022(10): 131-136 . 百度学术
76. 史雅妮,陈嘉曼,李晨瑜,朱庆华. 破解电子病历信息共享困境:区块链的转型干预作用. 图书情报知识. 2022(06): 20-34 . 百度学术
77. 梅傲,柯晨亮. 政企数据共享机制的构建、缺憾及完善. 法治论坛. 2022(04): 76-86 . 百度学术
78. 韩普,张嘉明. 考虑隐私保护的医疗数据共享意愿研究——基于演化博弈的视角. 现代情报. 2021(01): 111-120 . 百度学术
79. 林畅,姚剑敏,林志贤,严群. 基于区块链的汽车租赁方案设计. 计算机工程与设计. 2021(01): 270-278 . 百度学术
80. 翁晓泳. 基于区块链的云计算数据共享系统研究. 计算机工程与应用. 2021(03): 120-124 . 百度学术
81. 文必龙,陈友良. 基于区块链的企业数据共享模式研究. 计算机技术与发展. 2021(01): 175-181 . 百度学术
82. 赵剑,董文华,安天博,匡哲君,史丽娟,徐大伟. 面向医疗隐私保护的双区块链模型研究. 信息安全研究. 2021(02): 136-144 . 百度学术
83. 郭鑫鑫,王海燕,许蒙蒙. 医疗信息共享对患者转移数量和服务质量水平影响研究. 中国管理科学. 2021(01): 226-236 . 百度学术
84. 张冬冬. 基于区块链技术的反恐情报融合共享模型研究. 情报杂志. 2021(02): 69-76+62 . 百度学术
85. 张利华,黄阳,王欣怡,白甲义,曹宇,张赣哲. 基于区块链的精准扶贫数据保护方案. 应用科学学报. 2021(01): 135-150 . 百度学术
86. 周正强,陈玉玲,李涛,任晓军,卿欣艺. 基于联盟链的医疗数据安全共享方案. 应用科学学报. 2021(01): 123-134 . 百度学术
87. 张爱军,梁赛. 突发公共卫生事件的区块链路径:应用场景、伦理风险及平衡进路. 武汉理工大学学报(社会科学版). 2021(01): 8-14 . 百度学术
88. 李祥,李珠峰,彭柏麟. 跨机构情报信息共享模型研究. 情报探索. 2021(03): 55-60 . 百度学术
89. 张静. 基于总线架构的医疗电子病例数据库安全访问模型. 自动化技术与应用. 2021(02): 42-47 . 百度学术
90. 沈世勇,张莎,胡思洋. 区块链技术应用于医疗健康领域的研究进展. 社会政策研究. 2021(01): 93-104 . 百度学术
91. 刘振峰. 区块链在医疗领域应用探讨. 网络安全技术与应用. 2021(03): 107-108 . 百度学术
92. 屈艳玲,杨丹. 区块链+图书馆:读者服务生态重塑与优化策略. 图书馆理论与实践. 2021(02): 102-107 . 百度学术
93. 张乐君,刘智栋,谢国,薛霄. 基于集成信用度评估智能合约的安全数据共享模型. 自动化学报. 2021(03): 594-608 . 本站查看
94. 郭兴海,计明军,温都苏,张鑫,田爽. “最后一公里”配送的分布式多无人机的任务分配和路径规划. 系统工程理论与实践. 2021(04): 946-961 . 百度学术
95. 李洪晨,马捷,胡漠. 面向健康医疗大数据安全保护的医疗区块链模型构建. 图书情报工作. 2021(02): 37-44 . 百度学术
96. 沈蒙,张杰,祝烈煌,徐恪,张开翔,李辉忠,唐湘云. 面向征信数据安全共享的SVM训练机制. 计算机学报. 2021(04): 696-708 . 百度学术
97. 林鑫,许凤娟. 区块链在医院病案管理中的发展现状与展望. 牡丹江医学院学报. 2021(02): 148-150 . 百度学术
98. 张建标,张兆乾,徐万山,吴娜. 一种基于区块链的域间访问控制模型. 软件学报. 2021(05): 1547-1564 . 百度学术
99. 刘春燕,欧嵬. 面向社区公卫服务的区块链管控系统. 电脑知识与技术. 2021(11): 6-11+20 . 百度学术
100. 詹可强,潘哲林. 基于区块链的医疗数据共享模型分析与研究. 长春师范大学学报. 2021(04): 28-31 . 百度学术
101. 陈丽燕,吕光金,芮廷先. 基于区块链的商业数据共享模型. 计算机工程与设计. 2021(05): 1257-1263 . 百度学术
102. 冯银花,赵子菲. 区块链背景下数字档案资源共享策略研究. 大学图书情报学刊. 2021(03): 54-59 . 百度学术
103. 巫光福,余攀,陈颖,李江华. 基于联盟链的电子健康记录隐私保护和共享. 计算机应用研究. 2021(01): 33-38 . 百度学术
104. 刘炜,彭宇飞,田钊,盛朝阳,李阳,佘维. 基于区块链的医疗信息隐私保护研究综述. 郑州大学学报(理学版). 2021(02): 1-18 . 百度学术
105. 林勇,杨俊康,徐雨滴,徐青. 可信区块链数字货币基础架构中的共识与信任. 西南师范大学学报(自然科学版). 2021(05): 121-126 . 百度学术
106. 姜鑫,王飞. 区块链技术与应用综述. 电脑与电信. 2021(05): 25-29 . 百度学术
107. 吴梦,朱琳玲,刘海彬,王明元,陈丽韵. 基于PoA共识机制的无偿献血区块链系统原型设计. 中国数字医学. 2021(06): 22-27+37 . 百度学术
108. 赵明,董大治. 基于区块链技术的数据资产管理机制. 大数据. 2021(04): 49-60 . 百度学术
109. 黄茂汉. 基于区块链技术的疫情防控情报系统模型研究. 情报科学. 2021(08): 21-28 . 百度学术
110. 陈静,付玉敏. 基于云存储的电子健康记录隐私保护策略探讨. 医院管理论坛. 2021(05): 13-16 . 百度学术
111. 廖文杰,赵丽梅. 区块链技术在科学数据监管中的应用构想. 图书馆学刊. 2021(08): 77-84 . 百度学术
112. 周飞. 区块链产业发展的要素支撑体系与对策建议——以广西为例. 广西社会科学. 2021(06): 72-80 . 百度学术
113. 张利华,万源华,付东辉. 基于区块链的用电数据存储方案. 计算机应用与软件. 2021(09): 21-27+52 . 百度学术
114. 秦航宇,邓杨,周燕燕,刘洪红,李丽,周琪琪,梅娟,步宏,包骥. 基于无监督学习的数字病理切片自动分割方法. 四川大学学报(医学版). 2021(05): 813-818 . 百度学术
115. 周广猛,姚苏,李琳,刘昕,徐恪. 基于区块链的数字内容生态价值链构建. 中国科学:信息科学. 2021(09): 1559-1574 . 百度学术
116. 闫志强,杨翰宇,程冠杰,刘洪荣,邓水光,刘冠宇,杨明. 基于区块链的服务质量综合评估框架与算法. 计算机集成制造系统. 2021(09): 2708-2720 . 百度学术
117. 黄郑正,张晓蝶,赵金辉,邹惠. 基于区块链的知识共享机制的设计. 重庆理工大学学报(自然科学). 2021(09): 143-151 . 百度学术
118. 陈传坤,谷立祥,颜廷贵. 基于联盟链的指挥信息系统数据保护研究. 计算机技术与发展. 2021(10): 105-110 . 百度学术
119. 张俐,马敏象,杜军,谭鹏,普康晶,吴斌. 基于文献计量与标引统计的医疗领域区块链技术应用发展趋势研究. 情报学报. 2021(09): 962-973 . 百度学术
120. 张磊,郑志勇,袁勇. 基于区块链的电子医疗病历可控共享模型. 自动化学报. 2021(09): 2143-2153 . 本站查看
121. 何继新,孟依浩. 我国区块链嵌入城市治理:现状评述、逻辑进路与关键问题. 长白学刊. 2021(06): 80-87 . 百度学术
122. 许聿龙,陈涛. 基于区块链的光通信数据安全风险评估模型. 自动化与仪器仪表. 2021(11): 40-44 . 百度学术
123. 钱正浩,王珺,罗金喜. 基于Hyperledger的医疗保险与电子医疗事务联动系统的设计与实现. 计算机时代. 2021(12): 55-59 . 百度学术
124. 王建国,薄胜. 基于区块链的电子健康档案安全共享模型. 中国卫生信息管理杂志. 2021(06): 793-796+837 . 百度学术
125. 高振升,曹利峰,杜学绘. 基于区块链的访问控制技术研究进展. 网络与信息安全学报. 2021(06): 68-87 . 百度学术
126. Zhonghua Zhang,Jie Feng,Qingqi Pei,Le Wang,Lichuan Ma. Integration of Communication and Computing in Blockchain-Enabled Multi-Access Edge Computing Systems. China Communications. 2021(12): 297-314 . 必应学术
127. 余健,胡孔法,丁有伟. 一种面向中医药临床数据的区块链安全与隐私保护方案. 世界科学技术-中医药现代化. 2021(10): 3688-3695 . 百度学术
128. 鞠晨阳,冯文刚,何晓春. 基于区块链的民航安保信息共享模型研究. 中国民航大学学报. 2021(06): 43-48 . 百度学术
129. 冒海波,严竞雄. 医疗数据区块链的共识机制研究. 电脑知识与技术. 2021(36): 165-166+178 . 百度学术
130. 邱硕,丁润宇,柳亚男,阎浩,张正. 基于区块链技术的电子医疗数据共享研究综述. 电脑知识与技术. 2021(34): 7-9 . 百度学术
131. 郑一明,江有归,周军. 基于区块链技术的产业链数据共享与流通研究. 现代营销(信息版). 2020(01): 102-103 . 百度学术
132. 潘恒,潘磊,姚中原,斯雪明. 一种病人可控的电子病历安全访问方案. 应用科学学报. 2020(01): 127-138 . 百度学术
133. 丁宝根,赵玉,彭永樟. “区块链+跨境电商”变革的现实性、限度性与政策建议. 当代经济管理. 2020(01): 64-70 . 百度学术
134. 罗文俊,闻胜莲,程雨. 基于区块链的电子医疗病历共享方案. 计算机应用. 2020(01): 157-161 . 百度学术
135. 李嶒,徐济成. 一种去中心化的身份认证模型的设计与实现. 辽东学院学报(自然科学版). 2020(01): 62-72 . 百度学术
136. 钟力炜,陈诚,宋佳薇,郭书生. 基于区块链的异地分级诊疗应用研究. 中国数字医学. 2020(01): 4-7 . 百度学术
137. 张森,叶剑,李国刚. 面向冷链物流的区块链技术方案研究与实现. 计算机工程与应用. 2020(03): 19-27 . 百度学术
138. 陈希凯,马来宾,程志刚,孔颖. 基于联盟链的电子病历访问控制系统. 电子制作. 2020(Z1): 59-63+33 . 百度学术
139. 陈婷. 基于区块链技术的金融大数据认证模型研究. 现代电子技术. 2020(06): 171-174 . 百度学术
140. 苏剑. 区块链监管体系建设研究——基于日本与美国的经验借鉴. 财会通讯. 2020(04): 147-150+155 . 百度学术
141. 许重建,李险峰. 区块链交易数据隐私保护方法. 计算机科学. 2020(03): 281-286 . 百度学术
142. 王瑞丹,高孟绪,石蕾,王超,徐波. 对大数据背景下科学数据开放共享的研究与思考. 中国科技资源导刊. 2020(01): 1-5+26 . 百度学术
143. 王辉,刘玉祥,曹顺湘,周明明. 融入区块链技术的医疗数据存储机制. 计算机科学. 2020(04): 285-291 . 百度学术
144. 冯涛,焦滢,方君丽,田野. 基于联盟区块链的医疗健康数据安全模型. 计算机科学. 2020(04): 305-311 . 百度学术
145. 李麟,方芳,冶金明. 基于医院医疗区块链平台的EMR设计与实现. 生命科学仪器. 2020(02): 59-64 . 百度学术
146. 张利华,蒋腾飞,姜攀攀,李晶晶,张朋伟. 基于区块链的高速铁路监测数据安全存储方案. 计算机工程与设计. 2020(04): 933-938 . 百度学术
147. 李响. 云信任驱动的物联网信息资源分层共享仿真. 计算机仿真. 2020(02): 411-415 . 百度学术
148. 王刚,俞春强. 提高智能网络中地震数据集成与共享性能的研究. 地震工程学报. 2020(02): 416-421 . 百度学术
149. 陈圣杭,胡晶,包耿珲,张海波,郭文平. 健康医疗大数据资源开放对策研究. 福建电脑. 2020(04): 51-54 . 百度学术
150. 王瓴. 信息化医疗网络跨区域异构数据智能交换方法研究. 科技通报. 2020(04): 51-55 . 百度学术
151. 中国科学院大学数字经济与区块链研究中心课题组,李爱娅,赵欣欣,王中杰,王以戈,魏先华,尔西丁·买买提. 区块链技术在流行病防治中的应用研究——以新型冠状病毒肺炎COVID-19为例. 人民论坛·学术前沿. 2020(05): 39-47 . 百度学术
152. 庞继成. 区块链与大数据对大数据真实性的影响. 信息与电脑(理论版). 2020(06): 148-149 . 百度学术
153. 艾学瑛. 基于区块链和5G物联网的溯源及异常数据预警系统. 电子设计工程. 2020(10): 108-112 . 百度学术
154. 周坚,金瑜,何亨,李鹏. 基于区块链的云数据审计方案. 计算机应用研究. 2020(06): 1799-1803 . 百度学术
155. 林志达,吴石松. Dockers容器在人工智能研发平台中的关键技术研究. 自动化与仪器仪表. 2020(06): 192-196 . 百度学术
156. 秦秋莉,曹辉,李明岩,姜勇. 区块链在卒中电子病历共享中的应用. 中国卒中杂志. 2020(06): 606-610 . 百度学术
157. 田琛. 基于区块链的制造业产能共享模式创新研究. 科技管理研究. 2020(11): 9-14 . 百度学术
158. 王丹丹. 基于区块链和隐私保护的网络数据共享技术研究. 河南科技学院学报(自然科学版). 2020(03): 74-78 . 百度学术
159. 于佳,胡光宇,完颜绍鹏. 基于区块链的智慧医疗报销平台的研究. 信息通信技术. 2020(03): 51-56 . 百度学术
160. 褚孝鹏. 区块链技术在医疗数据存储方面的应用研究. 信息技术与信息化. 2020(06): 155-157 . 百度学术
161. 黄太进,刘三女牙,李卿. Educhain:基于区块链技术的终身教育记录跟踪方案. 现代教育技术. 2020(07): 5-12 . 百度学术
162. 陈丽燕,芮廷先,吕光金. 基于区块链智能合约的个人征信隐私保护方案. 计算机工程. 2020(07): 30-35 . 百度学术
163. 杨洵,王景中,付杨,王宝成. 基于国密算法的区块链架构. 计算机系统应用. 2020(08): 16-23 . 百度学术
164. 付杨,王景中,杨洵,王宝成. 基于区块链的视频版权存储架构. 计算机系统应用. 2020(08): 58-66 . 百度学术
165. 张磊,黄军峰. 区块链技术在二手交易平台中的研究. 科技风. 2020(26): 93-94 . 百度学术
166. 付瑶瑶,李盛恩. 授权股份证明共识机制的改进方案. 计算机工程与应用. 2020(19): 48-54 . 百度学术
167. 朱向南. 基于感知服务质量模型的医院互联网健康服务平台优化路径探讨. 江苏卫生事业管理. 2020(09): 1123-1126 . 百度学术
168. 薛真,王栋. 能源区块链发展现状与展望. 电力信息与通信技术. 2020(06): 10-15 . 百度学术
169. 任超然. 减税降费背景下区块链技术在社会保险中的应用方案设计. 兰州学刊. 2020(10): 153-163 . 百度学术
170. 周玉科. 利用区块链技术促进地球科学数据共享的思考:概念与方案. 测绘与空间地理信息. 2020(10): 13-16 . 百度学术
171. 李国,张洁慧,臧金梅. 面向解决民航虚占座位的改进PoA共识机制区块链系统研究. 计算机应用研究. 2020(11): 3368-3372+3377 . 百度学术
172. 翟社平,汪一景,陈思吉. 区块链技术在电子病历共享的应用研究. 西安电子科技大学学报. 2020(05): 103-112 . 百度学术
173. 张驰,王瑞,程骏超,何元安,甄君. 基于区块链技术的海洋数据资源共享应用设计. 科技导报. 2020(21): 69-74 . 百度学术
174. 杨绍禹,谭丛. 基于区块链技术的突发公共卫生事件数据发布与共享体系研究. 软件. 2020(10): 225-228 . 百度学术
175. 朱诗生,李朝清,黄仁俊,李维骏. 基于区块链的医疗数据安全共享模型与机制. 计算机技术与发展. 2020(10): 123-130 . 百度学术
176. 黄锐,陈维政,胡冬梅,陈玉玲,邱虹. 基于区块链技术的我国传染病监测预警系统的优化研究. 管理学报. 2020(12): 1848-1856 . 百度学术
177. 吴晓晖,黄昌军,吴梦蝶,陈石. 区块链技术在访问控制的研究进展. 科技风. 2020(35): 102-103 . 百度学术
178. 马虹博,龚余. 基于区块链供应商绩效数据共享模型研究. 能源科技. 2020(11): 88-91 . 百度学术
179. 佘佐超,李喆,刘浩宇. 基于区块链的电力数据共享研究初探. 四川电力技术. 2020(06): 31-38 . 百度学术
180. 孙知信,徐玉华,陈露,刘晨磊. 基于区块链大数据的新发重大传染疾病防控研究综述. 南京邮电大学学报(自然科学版). 2020(05): 196-203 . 百度学术
181. 吴定峰,王丽云,刘婷婷. 国际组织框架下的农业数据和技术共享模式探索与展望. 农业展望. 2020(10): 99-104 . 百度学术
182. 曹玉红,荆博. 基于区块链的工业互联网企业协同架构. 工业技术创新. 2020(06): 92-98 . 百度学术
183. 傅国强,吕利昌. 基于区块链的云数据共享方案研究. 信息与电脑(理论版). 2020(24): 139-142 . 百度学术
184. 屈宝强,彭洁,刘蔚,普丽娜. 科学数据共享及其发展趋势. 情报学进展. 2020(00): 381-420 . 百度学术
185. 刘震,王文桥. 基于区块链的医疗信息共享平台设计与实现. 医疗卫生装备. 2020(08): 36-39 . 百度学术
186. 杨立,左春,梁赓. 基于区块链的保险产品推荐模型. 计算机系统应用. 2019(01): 61-68 . 百度学术
187. 葛琳,季新生,江涛,江逸茗. 基于区块链技术的物联网信息共享安全机制. 计算机应用. 2019(02): 458-463 . 百度学术
188. 呼阳,陈干. 基于区块链的纺织机数据分析平台设计. 纺织科技进展. 2019(02): 25-29 . 百度学术
189. 温亮明,张丽丽,黎建辉. 大数据时代科学数据共享伦理问题研究. 情报资料工作. 2019(02): 38-44 . 百度学术
190. 刘志豪,马金刚,李逢天,生慧. 基于区块链的医疗数据安全存储研究. 医疗卫生装备. 2019(03): 31-33+37 . 百度学术
191. 陈静怡,许涛. 基于区块链技术的消防维保模型. 消防科学与技术. 2019(01): 48-52 . 百度学术
192. 连耿雄. 基于区块链的可信移动应用市场. 计算机与现代化. 2019(03): 58-61+67 . 百度学术
193. 杨敏,张仕斌,张航,刘宁,甘波. 异构联盟系统中基于二层区块链的用户信任协商模型. 应用科学学报. 2019(02): 244-252 . 百度学术
194. 李娜,陈福,毛国君,朱建明,黄勇峰. 基于区块链的防电话骚扰欺诈模型. 应用科学学报. 2019(02): 235-243 . 百度学术
195. 姚俊明,邢丹,李庆玲. 基于区块链的个人健康记录分布式框架研究. 医学信息学杂志. 2019(03): 31-35+43 . 百度学术
196. 符莹,张永帅,秦浩,李进. 区块链技术在供应链“牛鞭效应”弱化中的应用——基于信息不对称的视角. 全国流通经济. 2019(06): 15-16 . 百度学术
197. 沈凯旋,高胜,朱建明. LibRSM:基于联盟链的数字图书馆信息资源安全共享模型. 国家图书馆学刊. 2019(02): 77-86 . 百度学术
198. 孙凯俐,李晖,陈梅. 面向区块链节点负载预测的ARIMA组合预测方法. 电子技术与软件工程. 2019(08): 180-182 . 百度学术
199. 张夏恒. 我国区块链能量分布与前沿热点趋势——基于核心文献样本分析. 产业经济评论. 2019(02): 81-95 . 百度学术
200. 呼阳,陈亮. 基于区块链的生产线数据共享方案研究. 国外电子测量技术. 2019(05): 123-127 . 百度学术
201. 徐勤亚,李会. 区块链视角下基本医疗数据保护探析. 江苏科技信息. 2019(13): 26-28 . 百度学术
202. 王晓晨. 区块链技术及其在信息安全领域的研究. 信息技术与信息化. 2019(06): 197-198 . 百度学术
203. 封啸,孙天凯,郭旭,李巍,周晓凡. 区块链技术在药品溯源上的应用研究. 网络安全技术与应用. 2019(07): 101-102 . 百度学术
204. 丁宝根,杨树旺,赵玉. “区块链+高等教育”变革的现实性、问题及建议. 现代教育技术. 2019(07): 45-51 . 百度学术
205. 张静. 基于Struts2的医疗病案数据异地传输控制系统设计. 机械设计与制造工程. 2019(07): 52-55 . 百度学术
206. 李星霖,李兵. 基于区块链技术的医疗信息互联互通应用分析. 无线互联科技. 2019(12): 9-10 . 百度学术
207. 袁敏夫,李引,陈胜俭,郑翔蔚. 基于云平台的区块链组网方案及数据共享存储机制. 计算机与现代化. 2019(09): 46-52 . 百度学术
208. 张超,李强,陈子豪,黎祖睿,张震. Medical Chain:联盟式医疗区块链系统. 自动化学报. 2019(08): 1495-1510 . 本站查看
209. 郭乃网,倪玮栋. 基于区块链的隐私保护数据共享. 通信技术. 2019(08): 1982-1986 . 百度学术
210. 周辉,王丽丹,钟成跃. 区块链助力电子医疗数据共享. 解放军医院管理杂志. 2019(07): 645-647 . 百度学术
211. 谭海波,周桐,赵赫,赵哲,王卫东,张中贤,盛念祖,李晓风. 基于区块链的档案数据保护与共享方法. 软件学报. 2019(09): 2620-2635 . 百度学术
212. 黎祖睿,李强,张超,陈子豪. Virus Database Chain:联盟式传染病数据区块链系统. 计算机应用与软件. 2019(09): 21-32 . 百度学术
213. 张利华,蓝凡,姜攀攀,蒋腾飞. 基于双区块链的医疗记录安全存储与共享方案. 计算机工程与科学. 2019(09): 1581-1587 . 百度学术
214. 王君宇,吴清烈,曹卉宇. 国内区块链典型应用研究综述. 科技与经济. 2019(05): 1-6 . 百度学术
215. 张梦迪,高振记. 区块链技术在地质大数据知识产权保护中的应用探讨. 中国矿业. 2019(11): 9-14 . 百度学术
216. 金泳,曾智. 基于区块链的终身学习电子档案安全共享研究. 湖南安全与防灾. 2019(08): 49-53 . 百度学术
217. 梁向东,邓晓晴,贺子琪. 智能合约与全链监管:处方药跨境贸易体系性障碍消解策略. 长沙理工大学学报(社会科学版). 2019(06): 113-121 . 百度学术
218. 赵昕昱,操礼庆,刘明涛,葛书江,王涓. 基于区块链技术的医院住院预交金线上闭环管理研究. 卫生经济研究. 2019(12): 62-64 . 百度学术
219. 王辉,周明明. 基于区块链的医疗信息安全存储模型. 计算机科学. 2019(12): 174-179 . 百度学术
220. 石进,邵波,苗杰. 基于区块链的中小企业竞争情报共享平台研究. 图书情报工作. 2019(20): 112-120 . 百度学术
221. 生慧,周扬,马金刚,王振国. 一种基于联盟链的中医药海量异构数据安全共享解决方案. 世界科学技术-中医药现代化. 2019(08): 1662-1669 . 百度学术
222. 张俊,王飞跃. 基于区块链的电网大数据数字资产管理架构. 电力信息与通信技术. 2018(08): 1-7 . 百度学术
223. 靳涛,李超鹏. 基于区块链的智慧消防信息共享体系. 电子技术与软件工程. 2018(13): 172 . 百度学术
224. 罗诚,温丽君. 区块链技术在医疗领域的应用前景研究. 经贸实践. 2018(08): 235 . 百度学术
225. 翟社平,段宏宇,李兆兆,高山,李婧. 区块链技术:应用及问题. 西安邮电大学学报. 2018(01): 1-13 . 百度学术
226. 胡卫,吴邱涵,刘胜利,付伟. 基于国密算法和区块链的移动端安全eID及认证协议设计. 信息网络安全. 2018(07): 7-15 . 百度学术
227. 余辉,戴阿咪,王士泉,崔春舜,高东平. 区块链技术在卫生健康领域的应用及发展. 中华医学图书情报杂志. 2018(02): 69-74 . 百度学术
228. 张夏恒. 基于区块链的供应链管理模式优化. 中国流通经济. 2018(08): 42-50 . 百度学术
229. 徐文玉,吴磊,阎允雪. 基于区块链和同态加密的电子健康记录隐私保护方案. 计算机研究与发展. 2018(10): 2233-2243 . 百度学术
230. 刘庆悦. 基于区块链技术的电子档案管理模型探析. 浙江档案. 2018(10): 22-24 . 百度学术
231. 吕琦. 区块链技术在医疗领域中的应用研究——以健康档案数据保护为例. 网络空间安全. 2018(08): 18-24 . 百度学术
232. 张炜,董晓莉. 以区块链促进协作保存网络环境下信息资源的可信性. 国家图书馆学刊. 2018(05): 89-98 . 百度学术
233. 耿飙. 医疗领域区块链应用模式及面临挑战探讨. 才智. 2018(24): 234-235 . 百度学术
234. 张丽丽,温亮明,石蕾,郑晓欢,黎建辉. 国内外科学数据管理与开放共享的最新进展. 中国科学院院刊. 2018(08): 774-782 . 百度学术
235. 郝世博,徐文哲,唐正韵. 科学数据共享区块链模型及实现机理研究. 情报理论与实践. 2018(11): 57-62 . 百度学术
236. 刘敖迪,杜学绘,王娜,李少卓. 区块链技术及其在信息安全领域的研究进展. 软件学报. 2018(07): 2092-2115 . 百度学术
237. 周辉,杨阳,李卫东. 区块链在医疗信息化领域的应用展望. 中国数字医学. 2018(04): 110-111+120 . 百度学术
238. 高胜,朱建明. 基于区块链技术的新型分层数字图书馆体系架构. 图书情报工作. 2018(24): 57-64 . 百度学术
其他类型引用(290)
-