迁移蜂群优化算法及其在无功优化中的应用

徐茂鑫; 张孝顺; 余涛

doi:10.16383/j.aas.2017.c150791

迁移蜂群优化算法及其在无功优化中的应用

doi: 10.16383/j.aas.2017.c150791

华南理工大学电力学院广州 510640

基金项目:

国家自然科学基金 51177051, 51477055

国家重点基础研究发展计划（973计划） 2013CB228205

详细信息

作者简介:
徐茂鑫华南理工大学电力学院硕士研究生.主要研究方向为电力系统优化运行与控制.E-mail:shuifengderen@163.com

余涛华南理工大学电力学院教授.主要研究方向为非线性协同控制理论,人工智能技术在电力系统运行、规划的应用.E-mail:taoyu1@scut.edu.cn

通讯作者:
张孝顺华南理工大学电力学院博士研究生.主要研究方向为协同控制和优化理论,人工智能技术在电力系统运行的应用.本文通信作者. E-mail:xszhang1990@sina.cn.

计量
- 文章访问数: 2605
- HTML全文浏览量: 169
- PDF下载量: 1256
- 被引次数: 7
出版历程
- 收稿日期: 2015-11-24
- 录用日期: 2016-05-23
- 刊出日期: 2017-01-01

Transfer Bees Optimizer and Its Application on Reactive Power Optimization

School of Electric Power, South China University of Technology, Guangzhou 510640

Funds:

and National Natural Science Foundation of China 51177051, 51477055

Supported by National Key Basic Research Program of China (973 Program) 2013CB228205

More Information

Author Bio:
XU Mao-Xin Master student at the School of Electric Power, South China University of Technology. His re- search interest covers power system optimal operation and control.

YU Tao Professor at the the School of Electric Power, South China University of Technology. His research interest covers nonlinear and coordinated control theory, arti-cial intelligence techniques in planning and operation of power systems.

Corresponding author: ZHANG Xiao-Shun Ph. D. can-didate at the School of Electric Power, South China University of Technology. His research inter-est covers coordinated control and optimal theory, arti-cial intelligence techniques in operation of power systems. Cor-responding author of this paper. E-mail:xszhang1990@sina.cn.

摘要

摘要: 提出了一种全新的迁移蜂群优化算法，并应用到电力系统无功优化问题.利用Q学习的试错与奖励机制构造蜂群的学习模式，并采用强化学习的行为迁移技术实现蜂群的迁移学习.为解决算法求解多变量优化问题遇到的维数灾难，提出了状态-组合动作链的方式将状态-动作空间分解成若干低维空间，明显降低算法的计算难度.仿真结果表明：本文所提算法可以保证最优解质量的同时，寻优速度能提高到传统启发式智能算法的4～67倍左右，非常适用于大规模复杂系统非线性规划问题的快速求解.
- 迁移蜂群优化 /
- 强化学习 /
- 行为迁移 /
- 无功优化
Abstract: This paper proposes a novel transfer bees optimizer (TBO), which is implemented to solve the reactive power optimization of power systems. The trial-and-error and the reward mechanism of Q-learning is adopted to construct the learning mode of the bees, and the technology of behavior transfer from reinforcement learning is used for transfer learning. Moreover, a space-action chain is proposed to decompose the solution space into several lower-dimensional spaces, thus it can solve the curse of dimension resulted from the multiple variables optimization problem. Simulation results show that TBO can obtain a high-quality optimal solution, while its convergence speed can be accelerated as many as 4 to 67 times faster than that of the conventional heuristic artificial algorithm (AI) algorithm, which is very suitable for fast optimization of nonlinear programming in a large-scale complex system.
- Transfer bees optimizer (TBO) /
- reinforcement learning /
- behavior transfer /
- reactive power optimization

HTML全文

装箱问题按照目标函数的不同类型分为容器装载问题、箱柜装载问题和背包装载问题^[1].容器装载问题是将所有待装箱子装入一个不限尺寸的容器中, 在诸多方案中找到一个使容器体积最小的装载方案, 该类型问题一般规定容器的长和宽为常数, 高为变量; 箱柜装载问题是给定一些规格统一的方型容器和一些不同类型的方型箱子, 找到一个能把所有箱子装入最少容器中的装载方案; 背包装载问题是给定一个固定规格的容器和一些有一定价值的箱子, 然后将部分箱子装入容器中, 找到一个使得装入容器中箱子总价值最大的装载方案, 若将箱子的体积作为价值, 则背包装载问题就转换为找到一个如何使容器的填充率最大的装载方案.其中容器装载问题和箱柜装载问题具有一定的局限性, 限制了其工业领域的应用范围.因此本文从背包装载问题入手对三维装箱问题作初步研究.

装箱问题是传统的NP问题, 具有广泛的应用领域.随着当今世界信息技术、大数据、数据流、数据关系的分析处理的不断发展, 为装箱问题的应用拓展了新的领域, 例如信息网络、交通网和云存储等有限资源的最大利用率问题, 有限资金投资的收益率最大化问题, 以及大数据相对关系匹配度最大化问题等.如何提高容器的空间利用率, 是当代科学研究和实践中一个非常重要的课题.找到高利用率的装箱方案, 对节约天然资源, 降低企业成本, 提高企业利润, 有着十分积极的现实意义.

近年来, 国内外的学者们陆续提出了一些解决三维装箱问题的算法. Ngoi等^[2]采用独特的空间表征技术求解装箱问题. Bischoff等提出了一种启发式算法, 同时给出了三维装箱问题的一些测试实例^[3-4], 其中文献[3]根据层和条的选择策略, 提出了按层布局的贪婪算法. Sixt提出了基于元启发式的禁忌搜索和模拟退火算法^[5]. Gehring等提出并行化的遗传算法, 该方法先对箱子进行一定的预处理, 再用遗传算法对箱子进行优化组合来获得装载方案^[6]. Bortfeldt等提出了一种禁忌搜索算法, 但该种方法只适用于箱子种类较少的情况^[7].接着, Bortfeldt等针对层的策略, 又提出一种混合遗传算法^[8].同时期, 国内学者何大勇等提出了求解复杂集装箱装载问题的遗传算法^[9].随后, Eley提出了基于"块"的算法^[10], 在此基础上, Bortfeldt等也基于"块"的概念, 给出了并行禁忌搜索算法^[11]. Moura等基于"剩余空间的概念", 提出了一个贪心随机自适应搜索算法(Greedy randomized adaptive search procedures, GRASP)^[12].张德富等针对圆形的装箱问题提出了拟人退火算法^[13], 随后, 又提出了三维装箱问题的组合启发式算法^[14]. Parrenóo等在文献[12]的基础上往前发展了一步, 将GRASP做了改进, 取得了明显的装箱效果^[15]. Huang等针对单一类型的装箱问题提出了一个有效的拟人型穴度算法^[16].张德富等提出了混合模拟退火算法, 该方法首先将箱子生成复合块, 接着给出一个基于块装载的构造型启发式算法, 然后将该启发式算法和模拟退火算法相结合, 提出了一个有效求解三维装箱问题的混合模拟退火算法^[17]. Fanslau等也基于复合块的概念, 设计了一个有效的启发式树状搜索算法^[18].张德富等又在文献[17-18]的基础上设计了一个多层启发式搜索算法^[19], 该算法是采用深度和宽度同时搜索的思想, 提出的多层搜索算法, 该算法用多层搜索思想来选择一个近似最优块进行装载, 然后逐步构造直到获得一个装载序列, 较之前的算法取得了很好的装载效果, 但随着箱子规模的增大, 该算法需要较长的计算时间.刘胜等提出的求解三维装箱问题的启发式正交二叉树搜索算法^[20], 该装箱算法装箱效率较已有算法装箱效率有显著提高, 但是当箱子种类较少时, 该算法的优势不明显.当然, 还有一些学者也取得了很好的研究成果^[21-28].

在很多实际工业应用中, 待装箱子具有规格多样性和数量不确定性等特点.因此本文结合最优化原理, 用多元优化算法(Multi-variant optimization algorithm, MOA)实现三维装箱问题的求解, 该算法的基本思想是随机放置、局部调整和逐步逼近.通过对BR1 $\sim$ BR10共1 000组实例的仿真测试, 取得明显的装箱效果, 证明了本文算法的有效性和可行性.

1. 问题描述

给定一个长$L$、宽$W$、高$H$的矩形容器$C$和$n$个矩形箱子.每个箱子$b_i $的长为$l_i$, 宽为$w_i$, 高为$h_i $, 体积为$v_i=l_i \times w_i \times h_i $, 容器$C$的体积$V=L\times W\times H$.该问题的目标为:在箱子没有溢出容器, 且满足方向性约束和稳定性约束的条件下使容器的填充率最大, 即要尽可能多地将箱子装入容器中.问题的目标函数为

$ fitiness=\max \frac{\sum v _i }{V} $

(1)

在实际装箱问题中, 一般会遇到3个著名的约束条件^[18]:

约束1 (C1). 方向性约束.在许多应用场合下, 箱子的装载具有方向性约束.方向性约束即为箱子的长度边、宽度边和高度边是否可以与容器的高度边平行放置.若没有这个约束条件的问题, 在装箱过程中, 箱子的任意一条边都可以竖直放置.

约束2 (C2). 稳定性约束.在许多应用场合下, 像在物流和交通运输等领域中, 有时箱子在装载时必须满足稳定性约束.也就是说每个箱子在装载时要必须得到容器底部或是其他已经装载了的箱子的支撑.针对不同的应用情况, 稳定性约束有部分支撑约束和完全支撑约束.部分支撑约束是指被装载箱子的底部允许有部分悬空, 完全支撑约束是指被装载箱子的底部不允许有悬空的部分.

约束3 (C3). 完全切割约束.在切割时, 每一刀必须将材料完全分割成两个部分.例如在木材和石材等的切割应用中, 一般的切割机只能做到完全切割.

本文算法在装箱过程中, 箱子的放置方式只选择其中的几种, 即并不是箱子的每一条边都可以与容器的高度边平行放置, 这就保证了本文算法满足C1方向性约束, 箱子的放置方式见第2.3节述; 同时, 剩余空间的分割与合并方式保证了本文算法满足C2稳定性约束, 剩余空间的分割与合并方式见第2.2节和第2.4节.综上所述, 本文算法是基于C1和C2两个约束进行的.

2. 装箱准备

2.1 最优化原理

根据一类多阶段决策问题的特性, 由Bellman等提出了解决动态规划的"最优化原理", 作为整个过程的最优策略具有这样的性质:无论过去的状态和决策如何, 对当前决策形成的状态而言, 余下的所有状态必须构成最优策略.即若要解决某一个优化问题, 需要做出$n$个决策, 若这个决策序列是最优策略, 对于任何一个$i$, $1<i<n$, 不论前面的$i$个决策是如何, $i$决策以后的最优决策只取决于由前面决策所确定的当前的$i$状态, 即以后的决策也是最优的^[29].

2.2 空间的划分

箱子的装载是在容器的剩余空间中进行的, 剩余空间是指容器中未被填充的空间.箱子理论上可以放在容器的任意位置, 但不能超出容器的容纳范围, 也不能与其他货物交迭放置.为了满足装箱问题的稳定性约束和保证每一个箱子装进容器之前, 剩余空间都是立方体空间, 本文选择将箱子从容器的原点坐标处开始放置, 并且箱子摆放时必须与坐标轴平行或正交, 不能斜放, 也不能悬浮放置.当第一个箱子装进容器后, 将剩余空间分割成相对于刚刚装入的箱子的前空间、右空间和上空间三个立方体空间, 如图 1所示.对每一个箱子装入容器后产生的剩余空间都严格做同样的分割处理.为了装箱的有效进行, 每装进一个箱子, 更新记录一次容器的剩余空间.

图 1 空间的分割

Fig. 1 Space division

下载: 全尺寸图片幻灯片

2.3 箱子的放置

假设箱子的摆放没有方向性约束C1, 则在装箱过程中, 箱子的任意一条边都可以竖直放置, 此时可以将箱子的摆放方式细分为6种: 1) $l$平行于$L$, $w$平行于$W$, $h$平行于$H$; 2) $w$平行于$L$, $l$平行于$W$, $h$平行于$H$; 3) $l$平行于$L$, $h$平行于$W$, $w$平行于$H$; 4) $h$平行于$L$, $l$平行于$W$, $w$平行于$H$; 5) $h$平行于$L$, $w$平行于$W$, $l$平行于$H$; 6) $w$平行于$L$, $h$平行于$W$, $l$平行于$H$.如图 2(a) $\sim$ 图 2(f)所示.如果箱子的摆放有方向性约束C1, 则根据具体的方向性约束来选择箱子的摆放方式.箱子放入容器时, 本文算法先选择摆放方式后选择放置空间.

图 2 箱子的摆放方式

Fig. 2 The placement method of box

下载: 全尺寸图片幻灯片

2.4 剩余子空间的合并

随着装箱的不断进行, 剩余空间中可能会产生一些废弃空间, 废弃空间指的是装不下任何一个待装箱子的剩余子空间.要提高容器的利用率, 就要最大程度的使用废弃空间, 即要尽可能地将废弃空间变为可用空间, 唯一的办法就是将废弃空间与其他剩余子空间合并.空间合并需同时满足3个条件: 1)两个空间相邻; 2)两个空间底面同高; 3)两个空间合并后, 可用空间必须增大.在同时满足上述3个条件时, 根据两个相邻空间的相对位置, 将空间的合并方式分为左右合并和前后合并两种方式, 如图 3所示.

图 3 空间合并方式

Fig. 3 The merging method of residual space

下载: 全尺寸图片幻灯片

3. 多元优化算法

3.1 算法简述

多元优化算法(Multi-variant optimization algorithm, MOA)是基于全局和局部搜索交替进行的思想提出的一种全新的群智能算法, 该算法在问题的解空间中随机产生全局搜索元及相应的局部搜索元, 对解空间进行全面细致地搜索, 从而逐渐逼近全局最优解.算法基于计算机的数据结构, 构造多元化结构体, 结构体用于记忆并协调搜索信息、调动全局局部交替寻优、记忆寻优过程, 多次全局局部交叉搜索后, 获得全局最优解和多个次优解^[30].

结构体是搜索元全局和局部交替寻优信息交流的平台, 是寻优过程记忆的载体.搜索元和结构体构成了MOA的基本框架^[30].结构体是一种能够按照一定规则, 记忆协调搜索信息, 有固定结构的数据表, 如图 4所示.

图 4 MOA数据结构图

Fig. 4 The data structure diagram of MOA

下载: 全尺寸图片幻灯片

结构体是用指针实现的二维有序链表, 由全局链表和局部链表组成.结构体中, 第一行为全局链表, 用于保存全局搜索元并记忆和共享全局信息; 每一列叫做局部链表, 用于保存各个局部解空间内的局部搜索元和记忆局部信息.

全局链表和局部链表都是以搜索元的适应度值为关键字(Key)的有序链表.全局链表中前端搜索元优于后端搜索元, 局部链表中上部搜索元优于下部搜索元.搜索元是结构体的组织细胞, 用于存放和接收寻优信息.搜索元具有进行全局探索和局部调整的功能.

全局搜索元${\pmb G_a }$(Global atom)是全局解空间内随机生成的一个解.一个$d$维全局元描述如下:

$ {\pmb G_a } =\left[{unifrnd(l_1, u_1 ), \cdots, unifrnd(l_d, u_d )} \right] $

(2)

式中, $l_i $和$u_i $分别为第$i$维待优化参数$x_i $的下限和上限, $unifrnd\left({l_i, u_i } \right)$为返回$l_i $和之间的一个随机数.

局部搜索元${\pmb L_a }$ (Local atom)是以某个全局元为中心的局部邻域内随机生成的一个解.以全局元${\pmb G_a }$为中心的局部搜索元描述如下:

$ {\pmb L_a }\! =G_a +\!\left[{unifrnd\left( {-r, r} \right), \cdots , unifrnd\left( {-r, r}\right)} \right] $

(3)

式中$r$为局部邻域半径, 决定了局部搜索的范围.

将全局链表记忆较优的全局元作为具有搜索价值的局部解空间的中心, 根据其所在全局链表中的位置共享该局部解空间在所有已经发现的具有搜索价值局部解空间中的优越程度:位置越靠前, 其所在区域越优.当局部搜索元发现优于全局元的解时, 局部链表记忆较优的局部元将取代全局元作为新的具有搜索价值的局部解空间的中心, 以分享局部搜索获得的信息.

为了更好地说明MOA的实现过程, 给出测试函数

$ \begin{eqnarray*} F(x)=&\ \exp \left(-2\log (2)\times \left(\frac{x-0. 1}{0.8}\right)^2\right)\times\nonumber\\ &\ \sin ^6(5\pi x), \qquad \qquad0\le x\le 1 \end{eqnarray*} $

(4)

在给定的区间$0\le x\le1$内, 用MOA求$F(x)$取最大值时对应的解, 寻优过程如图 5所示, 多个全局搜索元和对应的局部搜索元对解空间进行全面细致地搜索, 逐渐逼近最优解$x=0.1$, 搜索结果如图 6所示.

图 5 测试寻优过程图

Fig. 5 The test optimization graph

下载: 全尺寸图片幻灯片

图 6 测试寻优结果图

Fig. 6 The result of test results

下载: 全尺寸图片幻灯片

3.2 问题的解

针对待装箱子在实际应用中的复杂性和不确定性, 本文采用多元优化算法实现三维装箱问题, 基本思想是:

1) 随机放置:装入容器的箱子以及箱子的摆放方式均随机选择;

2) 局部调整:对装入容器的局部箱子按目标函数值作局部调整;

3) 逐步逼近:递推的局部随机放置与调整优化, 使目标函数值逐步逼近最优值.

在用MOA实现三维装箱问题的求解之前进行预处理:

1) 箱子编号:按自然数序列对待装箱子进行编号, 若待装箱子总数为$d$, 则所有待装箱子的编号为$1$, $2, \cdots, i, \cdots, d$.若箱子数量很庞大或不确定, 则可以省略这一步, 直接分批次装即可.

2) 箱子摆放方式编号:若没有方向性约束C1, 则待装箱子的摆放方式编号为: 1, 2, 3, 4, 5, 6, 这6种摆放方式分别代表第2.3节中描述的6种摆放方式; 若有方向性约束C1, 则根据具体的方向约束, 待装箱子的摆放方式编号为第2.3节中的一种或几种.

多元优化算法实现背包装载问题的具体步骤如下:

步骤1. 编码.编码是应用多元优化算法首先要解决的问题.根据不同研究对象的不同性质, 把一个问题的可行解从其解空间转换到多元优化算法能处理的搜索空间中.假设总共有$d$个待装的箱子, 则MOA结构体里一个全局搜索元的编码方式为, $a_i$是$1\, \sim\, d$之间的随机的且互不重复的整数, 表示箱子的序号, $i$表示箱子$a_i$装入容器的次序. $d$维的搜索元$P$由全局搜索元式(2)产生, 装箱问题中, 需要全局搜索, 同时对局部进行调整.

步骤2. 分批随机放置箱子.在实际应用中, 待装箱子的种类多样且数量庞大, 因此将待装箱子分几批次装入容器.首先取出${\pmb P}$中的前$n$个待装箱子, 即第一批次的装箱个数为$n$, 然后将此批次的箱子依次装入容器中, $n$的大小根据箱子的数量设置.每一个箱子装入容器时, 采取一种拟人的方法, 先随机放置, 再做逐步调整.具体如下:

步骤2.1. 首先随机选取一个可用空间即剩余空间, 然后随机选取一种货物即箱子的摆放方式, 最后按该种摆放方式将箱子装入选取好的剩余空间.

步骤2.2. 若该箱子无法以该种摆放方式装入剩余空间, 则从箱子剩下的几种摆放方式中再随机选取一种, 并判断是否可以装入剩余空间.如果可以, 则将箱子放入所选的剩余空间并记录箱子的摆放方式; 反之, 继续选取摆放方式, 直到将箱子放入剩余空间或已遍历完该箱子的所有摆放方式为止.

步骤2.3. 重复步骤2.1和步骤2.2, 直到将箱子放入剩余空间或遍历完所有的剩余空间为止.每装一个箱子, 更新记录一次容器的剩余空间, 若有废弃空间且满足合并的条件, 则将废弃空间与其相邻的剩余空间合并.

步骤2.4. 重复步骤2.1 $\sim$ 2.3, 直到无剩余空间可装载或这一批次的$n$个箱子全部装入为止.

步骤3. 调整优化.利用最优化原理调整优化容器的填充率.已有的决策序${\pmb D}_1=\left[{a_1, a_2, \cdots, a_n }\right]$不一定是最优的决策序列, 要使该序列为最优决策序列, 利用最优化原理逐步调整该序列, 直到得到一个满意的结果, 具体步骤如下:

步骤3.1. 在容器外未装的箱子集中随机抽取一个箱子及其对应的摆放方式.

步骤3.2. 将抽取的箱子的体积与$a_1$的体积相比较, 若抽取的箱子体积大于$a_1$的体积, 同时抽取的箱子能够放入$a_1$放进容器之前对应的剩余空间(指$a_1$被放入容器之前算法记录的剩余空间), 则用随机抽取的箱子替换$a_1$.反之, 若抽取的箱子的体积小于或等于$a_1$的体积, 或者抽取的箱子不能放入$a_1$放进容器之前对应的剩余空间, 则$a_1$不用被随机抽取的箱子替换.用同样的方法依次优化该批次装进容器的箱子, 得到新的装箱序列${\pmb D}_{2}=[a_1, a_2 $, $\cdots $, $a_n]$, ${\pmb D}_{2} $是${\pmb D}_1 $的优化序列.

步骤3.3. 将下一批箱子装入容器后, 按步骤3.1和步骤3.2中的方法对新装进容器的几个箱子进行调整优化.重复上述步骤, 直到待装箱子已装完或剩余空间全为废弃空间时, 即可获得一个潜在的装箱方案.由于局部调整后的每一个局部序列都是最优序列, 因此整个全局序列同样也是最优序列, 符合最优化原理.

步骤3.3. 逐次逼近, 渐近收敛装箱过程, 直到满意为止.

算法的伪代码如下:

Begin

设置全局元个数$m$; 每个全局元内部的局部元个数即分的批次数$bn$; 每个局部元的维度即每批次装箱的个数$bn_i$ $(1\le i\le bn$); 全局解空间的下限$l=1$和上限$u\!=\!sum_{\rm box}$, $sum_{\rm box} $为箱子总数; 最大循环次数$I_{\max} $; 最大适应度值(即最大填充率) $fitiness_{\max }$; 初始化适应度值$fitiness_{best} =0$, $K=0$.

While $K<I_{\max}$ & &

For $i=1:m {\%}$生成$m$个全局元

$G_a^i\leftarrow$根据式(2)生成$m$个全局搜索元

(令$G_a^i$内某一维度的元素为$G_a^{i, j}$, 则满足$1\le G_a ^{i, j}\le sum_{\rm box}$且 $(1\le k\le sum_{\rm box} )$)

End For

For $i=1:m$

For $j=1:bn$

$L_a ^{i, j}\leftarrow $由$G_a ^i$和$bn_i$产生局部元

对$L_a ^{i, j}$做调整优化

End For

更新调整结构体信息, 适应度值越好的装箱方案越往结构体左边移

更新记录$fitiness_{\rm best} $

$K=K+1$

End While

End Begin

算法的时间复杂度分析.如算法的伪代码所示, 算法中最外层的While大循环内有两层并列的循环, 其中第一个For循环内的每一个全局元是一个随机生成的数组, 只需一个执行周期, 即生成每个全局元的时间复杂度为O$(1)$, 因此第一个For循环的时间复杂度为O$(m)$; 第二个循环内包含两层嵌套的For循环, 其中内层的For循环内的局部元生成的时间复杂度为O$(1)$, 由于对每一个局部元优化调整的次数即每批次装箱的个数与局部元的个数$bn$相互独立, 则内层For循环的时间复杂度为O, 因此第二个循环的时间复杂度为O$( m(sum_{\rm box}+ bn) )$; 再综合最外层While大循环的时间复杂度O$(K)$, 因此算法的时间复杂度的通式为O$(K(m+m(sum_{\rm box}+bn)))$.

由于算法中$fitiness_{\rm best}$的更新具有随机性, 在最好的情况下, 在$K=1$时, $fitiness_{\rm best}=fitiness_{\max } $, 此时算法的时间复杂度为${\rm O}(m$ $+$ $m(sum_{\rm box}+bn))$, 但发生这种情况的概率极小.在一般情况中, 只会不断趋近于$fitiness_{\max }$, 因此算法在一般情况下的时间复杂度为.

4. 实验测试

4.1 测试准备

为了证明本文算法的有效性和可行性, 用具体的三维装箱测试数据对算法做了大量测试.采用的测试数据来自文献[9], 测试了其中的BR1 $\sim$ BR10共1 000个实例, 这些数据可以从OR-Library网站下载.在BR1 $\sim$ BR10中, 每种类型有100组测试实例, 同时每种类型中箱子的类型数分别为3, 5, 8, 10, 12, 15, 20, 30, 40, 50, 箱子的多样性从弱到强, 从而能够更好地反映算法在不同多样性装箱问题中的应用情况.本文算法用Matlab实现, 实验程序运行在Intel Core (TM) i3-3240 CPU @ 3.40 GHz处理器上, 运行环境为Windows 7专业版.

4.2 测试过程

以BR1中第1组实例为例具体描述测试过程, 将该实例取名为BR1-1. 表 1为BR1-1的待装箱子的三维值及数量.

表 1 BR1-1待装箱子的三维值及数量

Table 1 The specification and quantity of BR1-1

长(cm)	宽(cm)	高(cm)	数量
108	76	30	40
110	43	25	33
92	81	55	39

下载: 导出CSV

| 显示表格

1) 在测试之前的预处理

预处理1. 读取表 1数据.通过程序将表 1转换为具体的数据矩阵, 数据矩阵的每一行代表一种类型的箱子, 每一行的前三列分别代表箱子的长、宽、高的值, 最后一列代表该种类型箱子的数量.

预处理2. 对所有箱子按顺序编号.由表 1可知, BR1-1中共有112个箱子, 其中, 第1种类型有40个, 第2种类型有33个, 第3种类型有39个.因此第1种类型的箱子的编号为1 $\sim$ 40, 第2种类型的箱子的编号为41 $\sim$ 73, 第3种类型的箱子的编号为74 $\sim$ 112.

2) 以BR1-1为例的测试过程

步骤1. 编码.随机产生112个1 $\sim$ 112之间不重复的整数串, 如[91, 63, 3, 36, 18, 39, $\cdots, $ 52, 74, 10, 97, 2], 此整数串中的每一个整数与预处理2中的箱子的编号对应, 例如91代表 91号箱子.相当于把所有待装箱子打乱.

步骤2. 分批次装载箱子.根据待装箱子的总数设置装箱过程分几批次装载, 同时设定每一批次装多少个箱子.例如BR1-1有112个待装箱子, 装箱过程即可设置为分5批次装载, 第1批次装32个, 第2批次装27个, 第3批次装22个, 第4批次装17个, 第5批次装14个, 这些具体的数据只是某一次实验设置的结果, 并不是固定不变的.接着进行装箱过程, 先将在步骤1产生的箱子序列串中从91号开始的前32个箱子依次装入容器中, 每一个箱子装入容器之前更新记录一次当前的剩余空间, 若中间有装不下的箱子, 则取该箱子后面的箱子继续装, 直到已装入容器的个数达到设定的32个或者是剩余空间已装不下任何一个未被装的箱子为止, 此时将箱子分为已装箱子和未装箱子两部分.

步骤3. 调整优化.从未被装入容器的箱子中随机抽取一个如编号为10的箱子, 比较10号箱子与91号箱子的体积大小, 若10号箱子的体积小于91号箱子的体积, 则装入容器的箱子保持不动, 同时将10号箱子放回未被装入容器的箱子集中, 此时默认91号箱子作为第一个装入容器的最优态; 接着从剩下的未被装入容器的箱子中随机抽取一个如编号为97的箱子, 比较63号箱子与97号箱子的体积大小, 若97号箱子的体积大于63号箱子, 则此时判断若97号箱子是否能被63号箱子装入容器之前的剩余空间装下, 若能装下, 则将63号箱子替换成97号箱子作为第二装入容器的最优态, 63号箱子则放到未装的箱子集中.替换后及时更新剩余空间, 以便于下一个箱子正确地装入容器中.如上所述, 依次将第1批的32个箱子优化完后, 继续将第2批次的箱子装入容器中, 对第2批次装入的箱子也做同样的优化处理, 第3批、第4批和第5批亦然.

步骤4. 逐次逼近.经过5次的装载调整优化之后, 容器的填充率逐渐逼近上限100%. 表 2是某一次实验时容器填充率逐渐变化逼近的过程.整个装箱过程满足最不利原则.最不利原则是指:若最不利的情况也能满足问题的要求, 则其他情况必然满足问题的要求.

表 2 某次实验得到的填充率的变化关系表

Table 2 The change table of filling rate obtained from an experiment

批次	1/(调整优化后)	2/(调整优化后)	3/(调整优化后)	4/(调整优化后)	5/(调整优化后)
容器填充率	0.2749/(0.3591)	0.5495/(0.5968)	0.7324/(0.7936)	0.8926/(0.9065)	0.9625/(0.9625)

下载: 导出CSV

| 显示表格

4.3 实验结果与分析

许多国内外的研究者对文献[3]中的测试数据做了一些测试, 本文对文献[18]提出的启发式树状搜索算法、文献[3]提出的按层布局的贪婪算法、文献[6]提出的并行遗传算法、文献[7]提出的禁忌搜索算法、文献[12]提出的贪心随机自适应搜索算法、文献[15]提出的改进的GRASP、文献[17]提出的混合模拟退火算法、文献[19]提出的多层启发式搜索算法、文献[24]提出的VNS算法和文献[25]提出的FDA算法等比较典型的算法得到的装箱效果进行比较分析, 这些算法的计算结果与用多元优化算法实现装箱问题的计算结果如表 3和表 4所示. 表 3是前500组实例的测试结果, 表 4是后500组实例的测试结果. 表 4中最后一列是每个算法针对装箱实例BR1 $\sim$ BR10取得的平均填充率.

表 3 各种算法的装箱效果比较(1 ~ 500组)

Table 3 Comparison of packing effects of various (groups 1 ~ 500) algorithms

测试实例	约束	填充率(%)
测试实例	约束	BR1	BR2	BR3	BR4	BR5
箱子的种类数		3	5	8	10	12
H_BR^[3]	C1 and C2	83.79	84.44	83.94	83.71	83.80
GA_GB^[6]	C1 and C2	85.80	87.26	88.10	88.04	87.86
TS_BG^[7]	C1 and C2	87.81	89.40	90.48	90.63	90.73
GRASP^[12]	C1	93.52	93.77	93.58	93.05	92.34
Maximal-space^[15]	C1	93.85	94.22	94.25	94.09	93.87
HSA^[17]	C1 and C2	93.81	93.94	93.86	93.57	93.22
CLTRS^[18]	C1	95.05	95.43	95.47	95.18	95.00
CLTRS^[18]	C1 and C2	94.51	94.73	94.73	94.41	94.13
MLHS^[19]	C1	94.92	95.48	95.69	95.53	95.44
MLHS^[19]	C1 and C2	94.49	94.89	95.20	94.94	94.78
VNS^[24]	C1	94.93	95.19	94.99	94.71	94.33
FDA^[25]	C1	92.92	93.93	93.71	93.68	93.73
MOA	C1 and C2	95.62	94.68	94.41	94.23	94.03

下载: 导出CSV

| 显示表格

表 4 各种算法的装箱效果比较(501 ~ 1 000)

Table 4 Comparison of packing effects of various (groups 501 ~ 1 000) algorithms

测试实例	约束	填充率(%)
测试实例	约束	BR6	BR7	BR8	BR9	BR10	平均
箱子的种类数		15	20	30	40	50
H_BR^[3]	C1 and C2	82.44	82.01	80.10	78.03	76.53	81.88
GA_GB^[6]	C1 and C2	87.85	87.68	87.52	86.46	85.53	87.21
TS_BG^[7]	C1 and C2	92.72	90.65	87.11	85.76	84.73	89.00
GRASP^[12]	C1	91.72	90.55	86.13	85.08	84.21	90.40
Maximal-space^[15]	C1	93.52	92.94	91.02	90.46	89.87	92.81
HSA^[17]	C1 and C2	92.72	91.99	90.56	89.70	89.06	92.24
CLTRS^[18]	C1	94.79	94.24	93.70	93.44	93.09	94.54
CLTRS^[18]	C1 and C2	93.85	93.20	92.26	91.48	90.86	93.42
MLHS^[19]	C1	95.38	94.95	94.54	94.14	93.95	95.00
MLHS^[19]	C1 and C2	94.55	93.95	93.12	92.48	91.83	94.02
VNS^[24]	C1	94.04	93.53	92.78	92.19	91.92	93.86
FDA^[25]	C1	93.63	93.14	92.92	92.49	92.24	93.23
MOA	C1 and C2	94.56	93.27	93.09	91.52	91.00	93.64

下载: 导出CSV

| 显示表格

从表 3和表 4中可以看出: 1)从横向数据来看, 针对每一种算法, 表 3的装箱效果明显优于表 4中的装箱效果, 且从相邻算例之间填充率的变化量来看, 表 3要小于表 4.不难看出是箱子种类数的不同造成这一现象. 表 3中箱子的种类数、相邻算例之间箱子种类数的变化量都小于表 4.箱子种类数很多即同类箱子的数量很少时, 装箱过程中立方体对齐的难度大大增加, 箱子与箱子中间产生的废弃空间就随之增多, 从而问题求解结果的优度呈单调递减的趋势, 这在一定程度上体现了三维装箱问题存在的一个难题:箱子的种类数越多, 即箱子的多样性越强, 问题的求解就越困难. 2)从具体的平均填充率数据来看, 在同时满足方向性约束C1和稳定性约束C2的情况下, 填充率最高的是由张德富等提出的多层启发式搜索算法MLHS的94.02 %, 第2是本文算法MOA的93.64 %, 第3是Fanslau等提出的启发式搜索算法CLTRS的93.42 %, 第4是由张德富等提出的混合模拟退火算法HAS的92.24 %, 第5为Bortfeldt等提出的禁忌搜索算法TS_BG的89.00 %, 第6为Gehring等提出的并行化遗传算法GA_GB的87.20 %, 第7是Bischoff等提出的按层布局的贪婪算法H_BR的81.88 %.因此从数据分析结果来看, 本文算法具有有效性和可行性.

表 5给出了本文算法对BR1 $\sim$ BR10测试时的具体细节. 表 5中从左起的第三列Minimum到最后一列Average分别表示本文算法在同一类型的100个测试实例的运行中记录下的最短运行时间、最长运行时间、平均运行时间、最小填充率、最大填充率和平均填充率, 这里的运行时间指程序的实际运行时间.

表 5 元优化算法实现三维装箱问题时的一些测试细节

Table 5 Some test details of MOA for 3D packing problem

测试实例	约束	运行时间(s)			填充率(%)
测试实例	约束	Minimum	Maximum	Average	Minimum	Maximum	Average
BR1	3	1.83	114.66	28.84	91.04	98.31	95.62
BR2	5	2.41	57.89	26.78	89.18	97.23	94.68
BR3	8	3.42	191.23	86.35	90.60	96.97	94.41
BR4	10	1.26	274.91	105.67	88.82	96.04	94.23
BR5	12	7.50	219.01	110.63	89.17	97.45	94.03
BR6	15	5.83	495.02	265.74	87.36	96.56	94.56
BR7	20	14.61	811.50	384.38	5.82	95.44	93.27
BR8	30	30.82	1 312.80	560.21	84.61	95.17	93.09
BR9	40	33.40	1 798.75	866.08	84.69	94.07	91.52
BR10	50	54.52	2 401.94	1 380.62	82.27	93.84	91.00
Mean	19.30	15.56	767.77	381.53	87.36	96.11	93.64

下载: 导出CSV

| 显示表格

从表 5可以看出, 1)算法最短运行时间与最长运行时间相差很大, 原因是本文算法具有较强的随机性; 2)随着箱子种类数的增加, 算法的运行时间近似呈单调递增的趋势, 这是由于箱子种类数越多, 在求解问题时, 箱子的组合情况越复杂, 要取得好的装箱效果就需付出较大的时间代价.

用多元优化算法实现三维装箱问题时, 经多批次随机放置和局部调整优化, 装箱结果逐步逼近全局最优解的过程如图 7所示.在实验过程中, 装箱的批次数和每批次的装箱个数等这些参数的设置与每一个算例的箱子总数紧密相关.针对1 000个算例, 经过测试, 得出装箱的批次数的取值范围为比较适中, 每批次的装箱个数呈缓慢递减的趋势.

图 7 MOA实现装箱问题过程中填充率变化图

Fig. 7 The filling rate variation diagram of packing problem with MOA

下载: 全尺寸图片幻灯片

本文主要验证MOA算法实现三维装箱问题的有效性和可行性, 进一步工作将对算法参数的设置做自适应讨论研究.

5. 结束语

三维装箱问题属于典型的NP难题, 本文采用多元优化算法求解, 具有随机放置、局部调整和逐步逼近三大特性.经过多次实验测试, 取得理想的装箱效果, 证明了多元优化算法实现三维装箱问题的有效性和可行性.由于本文采用的是分批次随机放置, 因此针对实际装箱问题中的复杂性和不确定性具有很好的优势.但是算法若要得到更高的装箱效果, 就要增大试验次数, 随之计算时间也会增大.同时, 分多少批次装载和每批次装多少个等这些参数的设置与对象紧紧相关, 不具有一般性.

图 1 人工蜂群寻优模式

Fig. 1 Searching mode of ABC

下载: 全尺寸图片幻灯片

图 2 TBO 学习模式

Fig. 2 Learning mode of TBO

下载: 全尺寸图片幻灯片

图 3 状态-动作空间分解过程

Fig. 3 Decomposition of state-action space

下载: 全尺寸图片幻灯片

图 4 强化学习的两种迁移方式

Fig. 4 Two transfer approaches of reinforcement learning

下载: 全尺寸图片幻灯片

图 5 TBO 算法流程图

Fig. 5 Flow diagram of TBO

下载: 全尺寸图片幻灯片

图 6 日负荷曲线

Fig. 6 Daily load curves

下载: 全尺寸图片幻灯片

图 7 IEEE 118 节点样本7 学习过程

Fig. 7 Learning process of sample 7 on IEEE 118-bus case

下载: 全尺寸图片幻灯片

图 8 IEEE 300 节点样本8 学习过程

Fig. 8 Learning process of sample 8 on IEEE 300-bus case

下载: 全尺寸图片幻灯片

图 9 96 个负荷断面优化结果

Fig. 9 Optimization results of 96 load scenarios

下载: 全尺寸图片幻灯片

图 10 IEEE 118 节点算例优化结果对比

Fig. 10 Comparison results on IEEE 118-bus case

下载: 全尺寸图片幻灯片

图 11 IEEE 300 节点算例优化结果对比

Fig. 11 Comparison results on IEEE 300-bus case

下载: 全尺寸图片幻灯片

表 1 算例控制变量规模

Table 1 Control variable scale of the simulation case

仿真系统	控制变量个数			总计
仿真系统	无功补偿	变压器分接头	发电机端电压	总计
IEEE 118 节点	3	5	17	25
IEEE 300 节点	11	44	56	111

下载: 导出CSV

表 2 TBO 算法参数设置

Table 2 TBO parameter setting

参数	取值范围	IEEE 118 节点		IEEE 300 节点
参数	取值范围	样本学习	迁移学习	样本学习	迁移学习
$n$	-	14	6	30	10
$\alpha $	0＜$\alpha$＜1	0.99	0.99	0.99	0.99
$\gamma $	0＜$\gamma$＜1	0.9	0.9	0.9	0.9
$\varepsilon $	0＜$\varepsilon$ ＜1	0.9	0.98	0.95	0.98
$\beta $	0＜$\beta$＜1	0.99	0.99	0.99	0.99

下载: 导出CSV

表 3 对比算法主要参数设置

Table 3 Parameter setting of comparative algorithms

算法	参数	取值
算法	参数	IEEE 118 节点	IEEE 300 节点
ABC	蜂群总数	14	40
	采蜜蜂	7	20
	侦查蜂	2	5
	观察蜂	5	15
	限制次数	5	5
GSO	群体规模	100	500
	游荡者比例	20%	20%
	最大搜索角	$\pi/4$	$\pi/4$
	最大搜索转角	$\pi/8$	$\pi/8$
ACO	蚁群总数	50	100
	信息素挥发系数	0.8	0.8
	启发式值权重	1	1
	搜索权重	0.8	0.8
PSO	粒子群总数	50	100
	最小旋转速度	-5	-5
	最大旋转速度	5	5
	加速系数~$c1$/$c2$	0.5/0.5	1/1
	最小惯性系数	0.4	0.4
	最大惯性系数	0.9	0.9
GA	种群规模	50	100
	变异概率	0.05	0.10
	交叉概率	0.80	0.80
	遗传代沟	0.8	0.8
	进化代数	50	100
CCGA	种群个体数	5	5
	种群数	3	10
	变异概率	0.90	0.90
	交叉概率	0.95	0.95
	最大进化代数	80	80
QGA	种群规模	50	100
	量子旋转门	0.01$\pi $	0.01$\pi $
	进化代数	50	100
Ant-Q	蚁群总数	50	80
	折扣系数	0.05	0.1
	学习因子	0.5	0.1
	搜索权重因子	0.8	0.8

下载: 导出CSV

表 4 典型日96 个断面各算法运行10次平均结果统计表

Table 4 Average results of 96 load sections by each algorithm in 10 runs

算法	IEEE 118 节点算例					IEEE 300 节点算例
算法	计算时间(s)	收敛时间(s)	$P_{\rm loss}$ (MW)	$U_{\rm d}$ (%)	目标函数值	计算时间(s)	收敛时间(s)	$P_{\rm loss}$ (MW)	$U_{\rm d}$ (%)	目标函数值
ABC	1440	15.00	11105.12	1507.13	6306.13	6941.98	72.31	38182.69	8340.91	23261.80
ACO	2968.27	30.92	11062.35	1437.88	6250.12	21896.02	228.08	38265.31	7359.69	22812.50
Ant-Q	399.61	4.16	11110.67	1501.25	6305.96	11055.19	115.16	37427.55	7143.07	22285.31
GSO	3404.48	35.46	11121.77	1486.45	6304.11	6087.55	63.41	38644.40	8867.76	23756.08
PSO	2792.88	29.09	11103.69	1477.86	6290.77	9822.03	102.31	38098.85	8074.54	23086.70
GA	1032.95	10.76	11120.38	1504.56	6312.47	4631.66	48.25	37735.38	7779.54	22757.46
QGA	301.91	3.99	11093.48	1505.05	6299.27	4588.92	47.80	37631.03	7557.90	22594.46
CCGA	559.20	5.83	11011.74	1482.24	6246.99	2939.77	30.62	37474.88	7507.44	22491.16
TBO	89.91	0.94	11007.69	1482.84	6245.27	323.35	3.37	37513.53	6942.86	22228.19

下载: 导出CSV

表 5 典型日96个断面各算法运行10次目标函数值收敛性能统计表

Table 5 Convergence performance of 96 load sections by each algorithm in 10 runs

算法	IEEE 118 节点算例					IEEE 300 节点算例
算法	最小值	最大值	方差	标准差	相对标准偏差	最小值	最大值	方差	标准差	相对标准偏差
ABC	6308.20	6302.70	3.62	1.90	3.02E-04	23286.90	23230.48	380.55	19.51	8.39E-04
ACO	6253.35	6244.85	5.79	2.41	3.85E-04	22824.96	22784.28	227.72	15.09	6.61E-04
Ant-Q	6310.36	6301.19	7.71	2.78	4.40E-04	22310.62	22263.10	220.97	14.86	6.67E-04
GSO	6312.36	6298.30	17.35	4.17	6.61E-04	23810.08	23711.90	1293.47	35.96	1.51E-03
PSO	6296.83	6284.23	14.64	3.83	6.08E-04	23193.06	23020.09	2371.10	48.69	2.11E-03
GA	6318.80	6308.79	10.80	3.29	5.21E-04	22777.53	22742.54	178.17	13.35	5.87E-04
QGA	6303.66	6295.88	5.73	2.39	3.80E-04	22613.61	22575.91	193.87	13.92	6.16E-04
CCGA	6242.94	6254.14	9.56	3.09	4.95E-04	22460.90	22509.55	286.29	16.92	7.52E-04
TBO	6241.93	6247.39	3.15	1.77	2.84E-04	22217.39	22244.14	84.56	9.20	4.06E-04

下载: 导出CSV

参考文献(25)

[1]	Pozo D, Contreras J, Sauma E E. Unit commitment with ideal and generic energy storage units. IEEE Transactions on Power Systems, 2014, 29(6):2974-2984 doi: 10.1109/TPWRS.2014.2313513
[2]	Shaw B, Mukherjee V, Ghoshal S P. Solution of reactive power dispatch of power systems by an opposition-based gravitational search algorithm. International Journal of Electrical Power and Energy Systems, 2014, 55(2):29-40 http://cn.bing.com/academic/profile?id=a00193bf967a199c20b3d4769a5bf89f&encoded=0&v=paper_preview&mkt=zh-cn
[3]	Flueck A J, Chiang H D. Solving the nonlinear power flow equations with an inexact Newton method using GMRES. IEEE Transactions on Power Systems, 1998, 13(2):267-273 doi: 10.1109/59.667330
[4]	Graville S. Optimal reactive dispatch through interior point methods. IEEE Transactions on Power Systems, 1994, 9(1):136-146 doi: 10.1109/59.317548
[5]	Secui D C. A new modified artificial bee colony algorithm for the economic dispatch problem. Energy Conversion and Management, 2015, 89(1):43-62 http://cn.bing.com/academic/profile?id=4d908f8af9eefc08ac53edc655528ab3&encoded=0&v=paper_preview&mkt=zh-cn
[6]	Mohandas N, Balamurugan R, Lakshminarasimman L. Optimal location and sizing of real power DG units to improve the voltage stability in the distribution system using ABC algorithm united with chaos. International Journal of Electrical Power and Energy Systems, 2015, 66:41-52 doi: 10.1016/j.ijepes.2014.10.033
[7]	Iba K. Reactive power optimization by genetic algorithm. IEEE Transactions on Power Systems, 1994, 9(2):685-692 doi: 10.1109/59.317674
[8]	Gómez J F, Khodr H M, De Oliveira P M, Ocque L, Yusta J M, Villasana R, Urdaneta A J. Ant colony system algorithm for the planning of primary distribution circuits. IEEE Transactions on Power Systems, 2004, 19(2):996-1004 doi: 10.1109/TPWRS.2004.825867
[9]	Basu M. Modified particle swarm optimization for nonconvex economic dispatch problems. International Journal of Electrical Power Energy Systems, 2015, 69:304-312 doi: 10.1016/j.ijepes.2015.01.015
[10]	Karaboga D. An Idea Based on Honey Bee Swarm for Numerical Optimization, Technical Report-TRO6, Erciyes University, Kasyeri, 2005.
[11]	Karaboga D, Basturk B. On the performance of artificial bee colony (ABC) algorithm. Applied Soft Computing, 2008, 8(1):687-697 doi: 10.1016/j.asoc.2007.05.007
[12]	Dorigo M, Gambardella L M. A study of some properties of Ant-Q. In:Proceedings of the 4th International Conference on Parallel Problem Solving from Nature. Berlin, Germany:Springer, 1996. 656-665
[13]	He S, Wu Q H, Saunders J R. Group search optimizer:an optimization algorithm inspired by animal searching behavior. IEEE Transactions on Evolutionary Computation, 2009, 13(5):973-990 doi: 10.1109/TEVC.2009.2011992
[14]	Pan S J, Yang Q. A survey on transfer learning. IEEE Transactions on Knowledge and Data Engineering, 2010, 22(10):1345-1359 doi: 10.1109/TKDE.2009.191
[15]	张景祥, 王士同, 邓赵红, 蒋亦樟, 李奕. 融合异构特征的子空间迁移学习算法. 自动化学报, 2014, 40(2):236-246 http://www.cnki.com.cn/Article/CJFDTOTAL-MOTO201402008.htm Zhang Jing-Xiang, Wang Shi-Tong, Deng Zhao-Hong, Jiang Yi-Zhang, Li Yi. A subspace transfer learning algorithm integrating heterogeneous features. Acta Automatica Sinica, 2014, 40(2):236-246 http://www.cnki.com.cn/Article/CJFDTOTAL-MOTO201402008.htm
[16]	王皓, 高阳, 陈兴国. 强化学习中的迁移:方法和进展. 电子学报, 2008, 36(12A):39-43 http://www.cnki.com.cn/Article/CJFDTOTAL-DZXU2008S1006.htm Wang Hao, Gao Yang, Chen Xing-Guo. Transfer of reinforcement learning:the state of the art. Acta Electronica Sinica, 2008, 36(12A):39-43 http://www.cnki.com.cn/Article/CJFDTOTAL-DZXU2008S1006.htm
[17]	张倩, 李明, 王雪松, 程玉虎, 朱美强. 一种面向多源领域的实例迁移学习. 自动化学报, 2014, 40(6):1176-1183 http://www.cnki.com.cn/Article/CJFDTOTAL-MOTO201406015.htm Zhang Qian, Li Ming, Wang Xue-Song, Cheng Yu-Hu, Zhu Mei-Qiang. Instance-based transfer learning for multi-source domains. Acta Automatica Sinica, 2014, 40(6):1176-1183 http://www.cnki.com.cn/Article/CJFDTOTAL-MOTO201406015.htm
[18]	Watkins C J C H, Dayan P. Q-learning. Machine Learning, 1992, 8(3-4):279-292 doi: 10.1007/BF00992698
[19]	张孝顺, 郑理民, 余涛. 基于多步回溯Q(λ)学习的电网多目标最优碳流算法. 电力系统自动化, 2014, 38(17):118-123 http://www.cnki.com.cn/Article/CJFDTOTAL-DLXT201417022.htm Zhang Xiao-Shun, Zheng Li-Min, Yu Tao. Multi-objective optimal carbon emission flow calculation of power grid based on multi-step Q(λ) learning algorithm. Automation of Electric Power Systems, 2014, 38(17):118-123 http://www.cnki.com.cn/Article/CJFDTOTAL-DLXT201417022.htm
[20]	Malossini A, Blanzieri E, Calarco T. Quantum genetic optimization. IEEE Transactions on Evolutionary Computation, 2008, 12(2):231-241 doi: 10.1109/TEVC.2007.905006
[21]	王建学, 王锡凡, 陈皓勇, 王秀丽. 基于协同进化法的电力系统无功优化. 中国电机工程学报, 2004, 24(9):124-129 http://www.cnki.com.cn/Article/CJFDTOTAL-ZGDC200409021.htm Wang Jian-Xue, Wang Xi-Fan, Chen Hao-Yong, Wang Xiu-Li. Reactive power optimization based on cooperative coevolutionary approach. Proceedings of the CSEE, 2004, 24(9):124-129 http://www.cnki.com.cn/Article/CJFDTOTAL-ZGDC200409021.htm
[22]	Sutton R S, Precup D, Singh S. Between MDPs and semi-MDPs:a framework for temporal abstraction in reinforcement learning. Artificial Intelligence, 1999, 112(1-2):181-211 doi: 10.1016/S0004-3702(99)00052-1
[23]	张孝顺, 余涛, 唐捷. 基于分层相关均衡强化学习的CPS指令优化分配算法. 电力系统自动化, 2015, 39(8):80-86 http://www.cnki.com.cn/Article/CJFDTOTAL-DLXT201508013.htm Zhang Xiao-Shun, Yu Tao, Tang Jie. Optimal CPS command dispatch based on hierarchically correlated equilibrium reinforcement learning. Automation of Electric Power Systems, 2015, 39(8):80-86 http://www.cnki.com.cn/Article/CJFDTOTAL-DLXT201508013.htm
[24]	Sutton R S, Barto A G. Reinforcement Learning:an Introduction. Cambridge:MIT Press, 1998. 87-160
[25]	李宝磊, 施心陵, 苟常兴, 吕丹桔, 安镇宙, 张榆锋. 多元优化算法及其收敛性分析. 自动化学报, 2015, 41(5):949-959 Li Bao-Lei, Shi Xin-Ling, Gou Chang-Xing, Lv Dan-Ju, An Zhen-Zhou, Zhang Yu-Feng. Multivariant optimization algorithm and its convergence analysis. Acta Automatica Sinica, 2015, 41(5):949-959

施引文献

期刊类型引用(1)
1. 张博，裴宇驰，黄慧敏. 基于多模板匹配的双模型自适应相关滤波跟踪算法. 太赫兹科学与电子信息学报. 2022(06): 618-625 . 百度学术
其他类型引用(6)

资源附件(0)

访问统计

图(11) / 表(5)

计量

文章访问数: 2605
HTML全文浏览量: 169
PDF下载量: 1256
被引次数: 7

1. 问题描述
2. 装箱准备
2.1 最优化原理
2.2 空间的划分
2.3 箱子的放置
2.4 剩余子空间的合并
3. 多元优化算法
3.1 算法简述
3.2 问题的解
4. 实验测试
4.1 测试准备
4.2 测试过程
4.3 实验结果与分析
5. 结束语

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

迁移蜂群优化算法及其在无功优化中的应用

doi: 10.16383/j.aas.2017.c150791

通讯作者:
张孝顺华南理工大学电力学院博士研究生.主要研究方向为协同控制和优化理论,人工智能技术在电力系统运行的应用.本文通信作者. E-mail:xszhang1990@sina.cn.

计量

Transfer Bees Optimizer and Its Application on Reactive Power Optimization

1. 问题描述

2. 装箱准备

2.1 最优化原理

2.2 空间的划分

2.3 箱子的放置

2.4 剩余子空间的合并

3. 多元优化算法

3.1 算法简述

3.2 问题的解

4. 实验测试

4.1 测试准备

4.2 测试过程

4.3 实验结果与分析

5. 结束语

期刊类型引用(1)

其他类型引用(6)

计量

目录

1. 问题描述

2. 装箱准备

2.1 最优化原理

2.2 空间的划分

2.3 箱子的放置

2.4 剩余子空间的合并

3. 多元优化算法

3.1 算法简述

3.2 问题的解

4. 实验测试

4.1 测试准备

4.2 测试过程

4.3 实验结果与分析

5. 结束语

留言板

迁移蜂群优化算法及其在无功优化中的应用

doi: 10.16383/j.aas.2017.c150791

通讯作者: 张孝顺 华南理工大学电力学院博士研究生.主要研究方向为协同控制和优化理论,人工智能技术在电力系统运行的应用.本文通信作者. E-mail:xszhang1990@sina.cn.

计量

出版历程

Transfer Bees Optimizer and Its Application on Reactive Power Optimization

1. 问题描述

2. 装箱准备

2.1 最优化原理

2.2 空间的划分

2.3 箱子的放置

2.4 剩余子空间的合并

3. 多元优化算法

3.1 算法简述

3.2 问题的解

4. 实验测试

4.1 测试准备

4.2 测试过程

4.3 实验结果与分析

5. 结束语

期刊类型引用(1)

其他类型引用(6)

计量

出版历程

目录

1. 问题描述

2. 装箱准备

2.1 最优化原理

2.2 空间的划分

2.3 箱子的放置

2.4 剩余子空间的合并

3. 多元优化算法

3.1 算法简述

3.2 问题的解

4. 实验测试

4.1 测试准备

4.2 测试过程

4.3 实验结果与分析

5. 结束语

通讯作者:
张孝顺华南理工大学电力学院博士研究生.主要研究方向为协同控制和优化理论,人工智能技术在电力系统运行的应用.本文通信作者. E-mail:xszhang1990@sina.cn.