-
摘要:
针对移动机器人环境认知问题, 受老鼠海马体位置细胞在特定位置放电的启发, 构建动态增减位置细胞认知地图模型(Dynamic growing and pruning place cells-based cognitive map model, DGP-PCCMM), 使机器人在与环境交互的过程中自组织构建认知地图, 进行环境认知. 初始时刻, 认知地图由初始点处激活的位置细胞构成; 随着与环境的交互, 逐渐得到不同位置点处激活的位置细胞, 并建立其之间的连接关系, 实现认知地图的动态增长; 如果机器人在已访问区域发现新的障碍物, 利用动态缩减机制对认知地图进行更新. 此外, 提出一种位置细胞序列规划算法, 该算法以所构建的认知地图作为输入, 进行位置细胞序列规划, 实现机器人导航. 为验证模型的正确性和有效性, 对Tolman的经典老鼠绕道实验进行再现. 实验结果表明, 本文模型能使机器人在与环境交互的过程中动态构建并更新认知地图, 能初步完成对Tolman老鼠绕道实验的再现. 此外, 进行了与四叉树栅格地图、动态窗口法的对比实验和与其他认知地图模型的讨论分析. 结果表明了本文方法在所构建地图的简洁性、完整性和对动态障碍适应性方面的优势.
-
关键词:
- 移动机器人 /
- 环境认知 /
- 海马体位置细胞 /
- 导航 /
- Tolman老鼠绕道实验
Abstract:Aiming at environmental cognition problem of mobile robot, inspired by the activation of hippocampal place cells in particular regions, a dynamic growing and pruning place cells-based cognitive map model (DGP-PCCMM) is established, which enables robot to construct the cognitive map self-organizingly by interacting with the environment and to implement environmental cognition. In the beginning, cognitive map consists of the activated place cell responding to current region; With the interaction with the environment, the responding activated place cells at different regions are gradually obtained, and the relationship among them is established, thus realizing the dynamic growing of the cognitive map; If new obstacles are discovered in the visited area, the cognitive map is updated using dynamic pruning mechanism. Besides, a sequence planning algorithm of place cells is proposed to realize robot navigation, which uses the constructed cognitive map as input. To verify the correctness and validity of the model, the classical Tolman detour task was reproduced. Results show that the model can enable robot to construct and update the cognitive map dynamically in the process of interacting with the environment, and to complete the reproduction of the Tolman detour task substantially. In addition, comparative experiments with occupancy grids, dynamic window approach and discussion about other cognitive map models are carried out, and results show the advantages of the proposed methods in the aspects of simplicity, completeness of the constructed cognitive maps and adaptability to dynamic obstacles.
-
Key words:
- Mobile robot /
- environmental cognition /
- hippocampal place cells /
- navigation /
- Tolman detour task
-
环境认知和导航是智能移动机器人必备的技能[1-2]. 人和动物可以在复杂环境中进行环境认知和导航, 如觅食、归巢等[3], 而目前移动机器人的认知和导航能力不足以达到动物的水平, 因此, 模拟动物的神经结构和认知机制, 使机器人更加智能地进行环境认知和导航得到了越来越多的关注[4-7]. 一方面, 用数学模型或人工智能算法辅助传统神经科学研究来验证大脑运作的多种假设理论, 可以促进我们对动物环境认知心理和导航行为的理解; 另一方面, 动物的环境认知和导航机制为开发机器人的类脑空间认知模型提供了一个很好的视角, 可以帮助我们设计和构造像动物一样进行自主环境认知的智能移动机器人[8-10].
啮齿类动物出色的导航能力, 其原因长期以来假设为是内部神经空间的类地图的表达, 也就是环境认知地图. 美国行为心理学家Tolman[11]发现老鼠能在没有强化因素的情况下自由探索并学会迷宫的布局, 初次提出认知地图(Cognitive map) 的概念, 认为老鼠能利用对空间环境的内在表达进行环境的认知与记忆. 之后, O'keefe等[12]发现, 当老鼠处于某一特定位置时, 大脑海马体中有若干个神经细胞会一直处于活跃状态; 而当其从这一位置离开, 其他神经细胞则会变得活跃, 这些细胞称为位置细胞(Place cells). 位置细胞实时编码老鼠在环境中的位置信息, 从而在老鼠大脑内部产生一个对其所在空间环境的拓扑表达, 提供了以非自我为中心的认知地图(Allocentric cognitive map)[13]. 研究表明, 在海马CA3区域的位置细胞能形成对环境的独立表征[14]. 此外, 海马体能够存储大量的场景, 并在相同场景出现的时候进行场景复现, 从而指导人或动物的导航行为.
从老鼠环境认知的机制中获得启发, 研究人员通过对老鼠大脑认知机理进行建模, 进一步探究动物的环境认知机理, 并用于指导机器人环境认知与导航[15-16]. Tolman经典迷宫实验, 包括T巷迷宫实验(T-alley maze)、T高架迷宫实验(T-elevated maze)、放射迷宫实验(Radial maze)、老鼠绕道实验(Tolman detour task)等,是对老鼠环境认知行为的探讨. 其中, 绕道实验(Detour task)用于研究不同的认知技能, 如洞察力(Insight)、抑制控制(Inhibitory control)、路径规划(Route planning)等[17], 其特点在于, 更近的目标会产生更强的吸引力, 使动物在遇到障碍物时很难摆脱认为的最短路径而进行绕道. 构建老鼠大脑的数学模型或神经网络模型, 用机器人对老鼠绕道实验进行再现得到了各国研究者们的关注[18]. Schmajuk等[19]提出可以存储空间位置和时间事件连接的递归联结网络(Recurrent associative networks)来构建空间和时间认知地图, 能在Tolman绕道实验中通过选择正确的子目标最终到达目标点, 但其没有给出认知地图的形成过程与形象展示. Martinet等[20]建立了一个可以为空间学习和行动规划提供分布式信息的前额皮质网络模型, 展示了前额皮质柱能够从冗余的海马输入中学习到稀疏的拓扑−度量表示, 再现Tolman绕道实验并说明老鼠的认知洞察能力得益于老鼠大脑神经机制. Gao等[21]提出了一种基于基底神经节的运动学习模型, 从基底神经节中强化学习的动作-评价机制着手再现了Tolman迷宫绕道实验, 但并未涉及认知地图的形成机制.
2011年, Alvernhe等[22]用电生理学方式对Tolman绕道实验中的局部重映射进行研究, 认为位置细胞的局部重映射反映了迷宫局部结构的更新, 使得老鼠在遇到熟悉的道路被阻断或被阻断的道路重新连通等情况时可以选择最优路径. 此外, 自组织图被认为是最接近人脑或生物神经系统的模型, 其表现出了神经细胞群的拓扑特征映射关系, 这与海马体位置细胞放电的机理非常相似. 动态增长的自组织图可以在不需要预先指定其大小的情况下进行拓扑映射, 具有较好的环境映射效果[23-24].
基于此, 本文结合位置细胞和自组织图的特性, 建立动态增减位置细胞认知地图模型 (Dynamic growing and pruning place cells-based cognitive map model, DGP-PCCMM), 该模型使机器人通过与环境的交互激活可达点的位置细胞, 构建并更新位置细胞认知地图; 以构建的认知地图作为输入, 运用位置细胞序列规划算法, 进行机器人实时导航. 本文的认知地图构建方法具有以下优点: 1) 具有类脑仿生特性与一定的生物合理性; 2) 能够适应动态环境(如门的开闭); 3) 能够降低建图的复杂性. 实验结果表明, DGP-PCCMM能动态构建和更新认知地图, 能初步完成对Tolman老鼠绕道实验的再现, 体现了其自组织与自学习特性. 此外, 本文进行了与栅格地图、动态窗口法的对比实验和与其他认知地图模型的讨论分析. 结果表明, 本文方法在所构建地图的简洁性、完整性和对环境中动态障碍适应性方面更有优势.
1. 位置细胞认知地图模型
1.1 DGP-PCCMM的“感知 — 响应” 结构
DGP-PCCMM具有如图1所示类似自组织图的“感知—响应”结构, 由感知层和响应层组成, 或称由感知输入层和海马体位置细胞认知地图形成层组成. 感知输入层
$ V_{\rm I} $ 中的点如同机体感受器, 从外部环境中获得机器人的位置信息、场景图像、障碍物信息等; 海马体位置细胞认知地图形成层$ V_{\rm O} $ , 如同老鼠大脑皮质中海马记忆区, 用来形成位置细胞认知地图.$ V_{\rm O} $ 层中的每个节点对应不同位置点处激活的位置细胞, 节点之间的连线对应于位置细胞之间的连接关系. 机器人在环境中的某个特定位置处, 都有对应的获胜位置细胞激活, 同时, 该获胜位置细胞还记忆了场景图像信息, 以便在下次经过时进行有效识别.在图1中, 感知输入层
$ V_{\rm I} = \{v_1^{({\rm I})},v_2^{({\rm I})}\} $ ,$ v_1^{({\rm I})} $ 和$ v_2^{({\rm I})} $ 为输入节点, 无信息变换功能, 接收和传递输入信号$ {{\mathit{\boldsymbol{x}}}} $ ,$ {{\mathit{\boldsymbol{x}}}} $ 为机器人漫游环境时由传感器估计得到的位置信息.认知地图形成层
$V_{\rm O}=\{v_j^{({\rm O})}|j=1,2,\cdots,N\},v_j^{({\rm O})}$ 是$ V_{\rm O} $ 中的神经元, 可简写为$ v_j $ , 其输出为$ o_j $ ,${{\mathit{\boldsymbol{o}}}} =(o_1, $ $ o_2,\cdots,o_N)^{\rm T}$ 为$ V_{\rm O} $ 的输出向量.前馈联结关系表示为
$ W = \{{{\mathit{\boldsymbol{w}}}}_j\}_{j = 1}^N, $ 令${{\mathit{\boldsymbol{w}}}}_j = $ $ (w_{1j},w_{2j})^{\rm T} $ 为$ V_{\rm I}\rightarrow {v_j}^{(\rm{O})} $ 的联结强度向量,$ w_{ij} $ 为$ v_i^{({\rm I})}\rightarrow v_j^{(\rm{O})} $ 的联结强度系数, 其中,$ i = 1,2; j = 1,$ $2,\cdots,N. $ 定义前馈联结强度向量$ {{\mathit{\boldsymbol{w}}}}_j $ 的初始值为当前机器人的位置信息$ {{\mathit{\boldsymbol{x}}}} $ .位置细胞认知地图形成过程中会涉及到一些相关概念, 在此提前进行说明如下, 并绘制其之间连接关系图如图2所示.
1) 认知地图形成层中的神经元不同于位置细胞. 机器人每经过一个位置
$ {{\mathit{\boldsymbol{x}}}}, $ 都会对应一个能使认知层神经元$ v_j^{({\rm O})} $ 输出最大的神经元$ v_{i({{\mathit{\boldsymbol{x}}}})} , v_{i({{\mathit{\boldsymbol{x}}}})} $ 便是感知层输入$ {{\mathit{\boldsymbol{x}}}} $ 的获胜神经元; 获胜神经元会对应一个前馈联结权值$ {{\mathit{\boldsymbol{w}}}}_j ,{{\mathit{\boldsymbol{w}}}}_j $ 即为对应输入$ {{\mathit{\boldsymbol{x}}}} $ 的激活的位置细胞.2) 前馈联结关系矩阵等价于位置细胞矩阵, 都用
$ W $ 表示, 记录$ N $ 个激活的位置细胞的位置信息.3) 连接关系矩阵
$ E $ 记录各位置细胞之间的连通性, 在位置细胞增长过程中形成, 并能通过动态缩减机制更新.4) 位置细胞矩阵
$ W $ 和连接关系矩阵$ E $ 共同组成位置细胞认知地图$ G .$ 1.2 构建动态增长的认知地图
为体现机器人与环境交互过程中位置细胞动态增长的特性, 基于上述“感知—响应”框架, 首先构建以位置细胞为顶点, 以位置细胞之间连接关系为边的动态增长认知地图, 其构建步骤如下.
步骤 1. 初始化. 设置
$t = 0 ,$ 机器人初始位置在起点处. 定义机器人经过的位置个数为$n,$ 初始时刻$n = 1;$ 所形成的位置细胞个数为$N,$ 初始时刻$N = 1;$ 随机初始化DGP-PCCMM的前馈联结关系$ W = \{{{\mathit{\boldsymbol{w}}}}_j\}_{j = 1}^N $ .步骤 2. 采样. 将机器人漫游环境得到的坐标
$ {{\mathit{\boldsymbol{x}}}} $ 作为感知层输入, 输入到大脑海马体位置细胞层.步骤 3. 竞争获得获胜神经元. 该环节是从感知层到响应层的一个过程, 其基本规则是: 如果
$o_{i({{\mathit{\boldsymbol{x}}}})}({{\mathit{\boldsymbol{x}}}}) = \mathop{\rm{max}}\nolimits_{1\le j\le N} \{o_j({{\mathit{\boldsymbol{x}}}})\} ,$ 则$ v_{i({{\mathit{\boldsymbol{x}}}})} $ 便成为感知层输入$ {{\mathit{\boldsymbol{x}}}} $ 的获胜神经元, 其中$ i({{\mathit{\boldsymbol{x}}}}) $ 为获胜神经元的索引.$ o_j $ 是神经元$ v_j $ 的输出,$o_j = {{\mathit{\boldsymbol{w}}}}_j^{\rm T}{{\mathit{\boldsymbol{x}}}}\;(j = 1,2,\cdots,N).$ 根据最佳匹配规则, 当两个向量为归一化向量时, 其内积的极大化等价于其欧几里得距离的极小化.根据式(1)计算
$i({{\mathit{\boldsymbol{x}}}}),$ 从而得到获胜神经元$ v_{i({{\mathit{\boldsymbol{x}}}})} .$ $$ i({{\mathit{\boldsymbol{x}}}}) = \arg\min\limits_{1\le j\le N}\lVert {{\mathit{\boldsymbol{x}}}}-{{\mathit{\boldsymbol{w}}}}_j^{\rm T}\rVert $$ (1) 其中,
$ {{\mathit{\boldsymbol{w}}}}_j =(w_{1j},w_{2j})^{\rm T} $ 为$ V_{\rm I}\rightarrow $ $ {v_j}^{(\rm{O})} $ 的联结强度向量, 定义其初始值为当前机器人的位置信息$ {{\mathit{\boldsymbol{x}}}} $ .步骤 4. 神经元增长判断. 当机器人到达一个新位置时, 需要判断已构建的认知地图中是否存在对应该位置的位置细胞, 判断依据如下. 依据式(2)计算感知输入
$ {{\mathit{\boldsymbol{x}}}} $ 与前馈突触权值$ {{\mathit{\boldsymbol{w}}}}_{i({{\mathit{\boldsymbol{x}}}})} $ 的欧氏距离$ d_{i({{\mathit{\boldsymbol{x}}}})} $ .$$ d_{i({{\mathit{\boldsymbol{x}}}})} = \lVert {{\mathit{\boldsymbol{x}}}}-{{\mathit{\boldsymbol{w}}}}_{i({{\mathit{\boldsymbol{x}}}})}^{\rm T}\rVert $$ (2) 用
$ V_{\rm{GT}} $ 表示增长阈值. 如果$d_{i({{\mathit{\boldsymbol{x}}}})} > V_{\rm{GT}},$ 认为目前的认知地图规模不足以描述环境采样点的特征, 则增加一个位置细胞, 转向步骤5; 反之, 如果$d_{i({{\mathit{\boldsymbol{x}}}})} \leq V_{\rm{GT}},$ 则转向步骤6.步骤 5. 位置细胞增长过程. 模型中, 感知输入层在空间上是连续的, 响应层可以是获胜神经元的集合, 也可以是前馈突触权重向量构成的映像输出集合, 因为其都能映射特定的输入空间. 本文选择后者作为认知地图形成层, 由位置细胞及其之间的连接关系组成, 其中, 位置细胞由前馈联结强度向量
$ {{\mathit{\boldsymbol{w}}}}_q $ 定义. 随着神经元$ v_q $ 的增长, 位置细胞$ {{\mathit{\boldsymbol{w}}}}_q $ 同步增长, 并且其个数相同.步骤 5.1. 增加一个位置细胞
$ {{\mathit{\boldsymbol{w}}}}_q $ :$N = N+1,$ 相应要增加一个神经元, 初始化新增神经元的前馈联结权值为$ {{\mathit{\boldsymbol{w}}}}_q = {{\mathit{\boldsymbol{x}}}}(t)^{\rm T} $ .步骤 5.2. 搜索新增位置细胞
$ {{\mathit{\boldsymbol{w}}}}_q $ 的邻接位置细胞:a) 计算
$ {{\mathit{\boldsymbol{w}}}}_q $ 与其他所有位置细胞之间的距离$ d_{q} ;$ b) 寻找
$ d_{q}<n_1 \times V_{\rm{GT}} $ 的所有神经元集合$ N_1 ;$ c) 寻找
$ d_{q}<n_2 \times V_{\rm{GT}} $ 的所有神经元集合$ N_2 ,$ 其中$ n_1 < n_2. $ 步骤 5.3. 与邻接位置细胞建立连接关系. 判断新增位置细胞与集合
$ N_1 $ 中各个位置细胞的连接关系, 是否会与集合$ N_2 $ 中某两个已建立连接关系的位置细胞相交, 如果相交, 则不建立邻接关系; 如果不相交, 则新增位置细胞与其建立连接关系.连接关系矩阵
$ E $ 代表了两个位置细胞之间的连通性,$e_{ij}\;(0 < i \leq N,0 < j \leq N)$ 是矩阵$ E $ 的元素. 机器人在漫游环境和导航的过程中, 如果两个激活的位置细胞$ {{\mathit{\boldsymbol{w}}}}_i $ 和$ {{\mathit{\boldsymbol{w}}}}_j $ 之间相邻且能够连通, 则其之间的连通性$e_{ij} = 1 ;$ 反之, 如果两个激活的位置细胞$ {{\mathit{\boldsymbol{w}}}}_i $ 和$ {{\mathit{\boldsymbol{w}}}}_j $ 之间不相邻或相邻但不连通, 则其之间的连通性$e_{ij} = 0 .$ 步骤 6. 自组织学习过程.
步骤 6.1. 根据步骤3, 竞争得到获胜神经元.
步骤 6.2. 计算协同联结. 生物神经系统拓扑映射关系的一个共同的和基本的性质是:相近的神经细胞或细胞群反应相近的刺激. 在竞争中获胜的神经元
$ v_{i({{\mathit{\boldsymbol{x}}}})} $ 并不孤立地承担有序特征图的建设任务, 而是在其成为获胜神经元后, 会建立一个以自己为中心的拓扑邻域, 使其和自己一起兴奋. 依据式(3)计算获胜神经元$ v_{i({{\mathit{\boldsymbol{x}}}})} $ 与其他神经元$ v_j $ 的反馈联结强度值$ \omega_{i({{\mathit{\boldsymbol{x}}}})j}(t) $ .$$ \omega_{i({{\mathit{\boldsymbol{x}}}})j}(t) = \exp{\left\{-\dfrac{d_{i({{\mathit{\boldsymbol{x}}}})j}^2}{2\sigma^2}\right\}} $$ (3) 其中,
$ d_{i({{\mathit{\boldsymbol{x}}}})j} $ 为位置细胞$ {{\mathit{\boldsymbol{w}}}}_j $ 到$ {{\mathit{\boldsymbol{w}}}}_{i({{\mathit{\boldsymbol{x}}}})} $ 的侧向距离, 定义为两位置细胞之间的欧氏距离;$ \sigma\in(0,1) $ 是协同因子, 也是高斯邻域的有效半径, 随着时间$ t $ 指数衰减.$$ \sigma(t) = \sigma_0 \exp(-k_\sigma t) $$ (4) 其中,
$ \sigma_0 = \sigma(0) $ 为初始时刻$ t = 0 $ 时的有效半径, 协同参数$k_\sigma = {\rm{ln}}(r_{\rm{SOF}}/T_{\rm{RP}}),$ $ r_{\rm{SOF}} $ 是认知地图网格半径,$ T_{\rm{RP}} $ 为排序迭代次数.步骤 6.3. 突触自适应机制调节突触联系效率. 依据式(5)计算前馈联结强度
$ {{\mathit{\boldsymbol{w}}}}_j(t+1) ,$ 其中$ j = $ $ 1,2,\cdots,N .$ $$ \left\{ \begin{array}{ll} \Delta {{\mathit{\boldsymbol{w}}}}_j(t) = \alpha(t)\omega_{i({{\mathit{\boldsymbol{x}}}})j}(t)({{\mathit{\boldsymbol{x}}}}(t)-{{\mathit{\boldsymbol{w}}}}_j(t)) & \\ {{\mathit{\boldsymbol{w}}}}_j(t+1) = {{\mathit{\boldsymbol{w}}}}_j(t) + \Delta {{\mathit{\boldsymbol{w}}}}_j(t) \end{array} \right. $$ (5) 其中,
$ \alpha\in(0,1) $ 是学习率, 且随着时间$ t $ 指数衰减.$$ \alpha(t) = \alpha_0 \exp(-k_\alpha t) $$ (6) 其中,
$ \alpha_0 = \alpha(0) $ 为初始时刻$ t = 0 $ 时的学习率, 自适应参数$k_\alpha= T_{\rm{RP}}, T_{\rm{RP}}$ 为排序迭代次数. 如果$ t>T_{\rm{RP}}, $ 继续步骤7; 否则, 置$ t = t+1, $ 转向步骤6.由于协同联结采用的是高斯邻域函数, 因此对于给定的感知输入, 任意神经元都具有修饰其前馈突触的机会, 距离获胜神经元越近机会越大; 而获胜神经元的机会最大.
步骤 7. 如果
$ n>n_m ,$ 结束; 否则, 置$ n = n+1, $ 重复执行步骤2 ~ 7. 其中$ n_m $ 是最大采样点数.动态增长认知地图构建流程如图3所示.
认知地图与人工神经网络类似, 是一个由输入空间到输出空间的映射, 即由环境感知到认知地图的映射. 模型中, 由前馈突触权重向量构成的集合
$ W = \{{{\mathit{\boldsymbol{w}}}}_{i({{\mathit{\boldsymbol{x}}}})}\}_{i = 1}^N $ 构成映像输出空间的节点, 即获得位置细胞矩阵$ W $ ; 并能在此过程中获得位置细胞邻接矩阵$ E $ ; 从而获得认知地图$ G = \{W,E\} .$ 1.3 认知地图的动态缩减机制
为使认知地图模型能够适应动态环境, 即在遇到动态障碍物时能动态更新认知地图, 我们设计了认知地图的动态缩减机制. 此处的动态障碍物是指, 在初次访问某位置时不存在, 而在第2次访问相同位置时出现的障碍物. 认知地图动态缩减机制的基本原则是: 机器人在导航过程中检测到动态障碍物时, 将当前位置细胞与即将到达的位置细胞之间的连接关系变为 0, 认为两者之间的距离变为无穷大, 并对认知地图的连接关系矩阵
$ E $ 进行实时缩减与更新. 之后调整机器人位姿至可行方向, 应用第2节介绍的位置细胞序列规划算法重新进行序列规划, 并指导机器人导航. 值得一提的是, 由于机器人探测到障碍物时只能观察到距离障碍物表面的距离, 并不能得知障碍物的厚度信息, 故不能删除即将到达的位置细胞, 而只是将其之间的连接关系变为0.2. 基于认知地图的导航
基于位置细胞认知地图的移动机器人路径规划与导航, 可分为三大部分内容: 定位、构图和决策. 当给定一个导航任务后, 首先对机器人当前位置进行定位; 其次, 将感知输入层得到的机器人位置信息输入到认知地图形成层, 根据DGP-PCCMM进行认知地图的构建和更新; 接着, 利用位置细胞序列规划算法进行行为决策, 指导机器人导航. 机器人每行进一步, 判断是否到达目标场景, 如果到达目标, 则机器人对认知地图及场景信息进行记忆, 导航结束; 如果没到达目标, 则重新对当前位置和目标位置进行定位, 根据认知地图进行行为决策, 直至到达目标点, 结束导航. 机器人导航框图如图4所示, 本文主要研究获得精确定位信息后的认知地图构建和行为决策部分的内容, 用粗虚线框表示.
为实现基于认知地图的路径规划与导航, 提出位置细胞序列规划算法. 从动物导航有目标取向性获得启发, 定义导航中的负取向函数为当前位置细胞经相邻位置细胞到目标点位置细胞的能量消耗. 所经过的路径越长, 能量消耗越多, 负取向函数值越大. 因此在导航时, 选择负取向函数值最小的相邻位置细胞作为下一步的运动方向. 机器人每到达一个位置, 对应一个位置细胞激活, 计算一次负取向函数, 获得机器人下一步的运动方向, 行进一个步长后更新当前位置细胞并将其加入导航路径, 如此迭代直到到达目标点位置细胞, 最终可以获得从起始点位置细胞到目标点位置细胞的位置细胞序列
$ P $ , 从而实现导航. 算法流程图如图5所示.3. 仿真实验
检验机器人是否具有智能的一个方法是令其完成与动物相类似的任务, 例如用机器人再现老鼠实验. 老鼠的绕道取食行为使其能适应环境的变化, 提高其存活的几率, 且这种绕道取食行为是由后天学习获得. 认知模型结果与动物实验结果的契合度对比是评价、判断和比较认知模型的最广泛的方法[25]. 本文研究了能动态增减的位置细胞认知地图模型 DGP-PCCMM. 为验证该学习模型的正确性, 本文对Tolman老鼠迷宫中的绕道实验进行再现, 首先对绕道实验进行介绍, 之后介绍机器人再现绕道实验仿真环境的设计, 最后给出实验结果.
3.1 Tolman老鼠绕道实验
1930年, Tolman设计了三迷宫实验用于研究老鼠的绕道行为智能; 1964年, Maier团队将Tolman实验进行简化, 本文采用简化后的Tolman迷宫环境[26], 如图6所示. Tolman老鼠绕道实验分为两个阶段, 环境探索阶段和觅食导航阶段. 在环境探索阶段, 通过分别在离三叉路口不远的地方设置障碍来迫使老鼠从三条不同路径中选择一条来达到目标, 最短路径和中间路径共享一个在最长路径中没有的公共路径. 在觅食导航阶段, 老鼠会首先选择通往目标点的最短路径Route 1; 当发现A处障碍后, 老鼠会选择中间路径Route 2; 当发现在最短和中间路径的公共部分有障碍即障碍B时, 它们会选择最长的路径Route 3, 而不是选择中间路径, 从而证明它们知道被阻塞的部分同时属于最短路径和中间路径.
Tolman认为在老鼠大脑中存在认知地图, 当在迷宫中寻找目标时, 即使在迷宫中的任意点看不到全局环境, 但能根据认知地图进行行为决策, 选择最优路径进行导航.
3.2 实验设计与结果
本文实验对象是轮式圆形机器人, 半径为2.5 cm, 运动线速度
$ v = 2.5\; {\rm{cm/s}} $ , 机器人通过左右两轮${W}_{\rm{L}}$ 和${{W}}_{\rm{R}}$ 的差动驱动行走, 通过改变方向轮${{W}}_{\rm{D}}$ 朝向可以实现任意角度的转向, 其俯视示意图如图7所示. 从老鼠感知系统获得启发, 本文假设可以获得机器人精确的位置信息, 作为认知地图形成层$ V_{\rm O} $ 的输入; 配备8个测距传感器均匀分布在圆形机身用于探测与障碍物之间的距离, 测距范围为 1 ~ 10 cm. 本文仿真环境尺寸参考文献[22]中的Tolman迷宫环境, 尺寸为 130 cm×130 cm, 其中灰色代表障碍物, 白色代表通路, 通路宽度为 10 cm, 如图8所示.实验 1. 认知地图构建过程
首先让机器人漫游环境, 以(35, 5)为起点, 每经过一个步长都采集位置信息、场景信息和障碍信息, 边漫游边构建认知地图. 考虑到机器人自身尺寸, 在仿真实验采集样本点的过程中, 首先将墙边界进行膨胀化处理, 机器人所处的位置中心离边界的距离一定大于机器人的半径, 此处设置为3 cm. 设置机器人随机搜索的行进步长
$ d_{\rm{step}} $ 为 5 cm. 初始实验参数设置见表1.表 1 DGP-PCCMM初始参数设置Table 1 Initial simulation parameters for DGP-PCCMM参数 值 参数 值 参数 值 $ t $ 0 $ n_2 $ 3.2 $ T_{\rm{RP}} $ 3 $ N $ 0 $ n_{m} $ 1 000 $ n_{\rm{init}} $ 1 $ V_{\rm{GT}} $ 4.5 $ \sigma_0 $ 0.01 $ r $ 0.025 m $ n_1 $ 1.8 $ \alpha_0 $ 0.01 $ d_{\rm{step}} $ 0.05 m 分别采集1 000和2 000个能遍历整个迷宫环境的位置点及相应的场景记忆信息, 每有25个位置细胞激活就记录一次认知地图, 可以得到以下的认知地图的构建过程,分别展示于图9和图10. 图中圆点为机器人所经过的位置记录, 星号表示生成的位置细胞. 机器人刚开始只有一个位置细胞激活, 随着机器人探索环境获得可达位置点的增多, 所激活的位置细胞也逐渐增多, 最终只用了少量的位置细胞就可以映射整个迷宫环境. 如图9和图10所示, 当有1 000个可达位置点时, 共有90个位置细胞激活过; 当有2 000个可达位置点时, 共有93个位置细胞激活过. 机器人在随机探索环境的过程中, 所激活的位置细胞个数不断增多, 表明其对环境的认知程度逐渐增强, 最终能自组织地形成整体环境的认知地图.
图11展示了位置细胞个数
$ N $ 随学习次数$ n $ 的变化情况, 图例中$ n_m $ 表示最大学习次数. 实线和点划线表示学习次数分别为1 000和2 000时, 位置细胞个数的变化. 由图11可知, 在初始阶段只有一个位置细胞激活; 随着与环境交互次数的增多, 激活过的位置细胞个数不断增加; 当机器人基本遍历环境后, 认知地图中的激活过的位置细胞个数大体一致; 之后继续遍历环境, 位置细胞的个数变化不大. 值得一提的是, 由于老鼠在迷宫中属于探索式运动, 经常出现折返现象, 故对环境的认知也是渐进的.实验 2. 再现Tolman老鼠绕道实验
上述实验阐明基于位置细胞的认知地图是如何自组织构建出来的. 在这个实验中, 我们使用已构建好的认知地图进行Tolman绕道实验的再现, 所用迷宫环境如图8. 起始点设置在(35,5), 目标点设置在(35,125). 实验分为三部分, 首先进行门A和B都打开情况下的导航, 其次是门A关闭门B打开情况下的导航, 最后是门A打开而门B关闭情况下的绕道行为再现.
首先在起始点根据位置细胞序列规划算法得到一条初始全局最优位置细胞序列, 机器人根据所规划的位置细胞序列向目标点位置细胞行进; 在行进过程中, 当环境感知模块检测到当前场景与记忆中的场景信息不匹配时, 启动认知地图动态缩减机制, 更新位置细胞之间的连接关系, 得到更新后的认知地图; 调整机器人位姿, 重新进行位置细胞序列规划选择行进方向, 最终到达目标点.
图12 ~ 14为再现Tolman绕道实验结果图, 其中, 星号表示激活的位置细胞, 星号及其之间的细线表示得到的认知地图, 方块表示起点, 五角星表示目标点, 粗线表示根据位置细胞规划算法得到的导航路径. 图12为门A和B都打开的情况, 此时机器人选取最短路径Route1作为导航路径. 图13为门A关闭而门B打开的情况, 开始时机器人在起始点继续沿着Route 1前进, 当检测到A处障碍物, 启动认知地图动态缩减机制, 将当前位置细胞与下一位置细胞之间的连接关系设为0; 机器人位姿调转180°方向, 重新进行位置细胞序列规划, 可以看到机器人选择中间路径到达目标点; 在下次导航时, 由于认知地图已经更新, 机器人直接选择Route 2到达目标点. 同理, 当门A打开而门B关闭时, 最终机器人将学习到选择Route 3进行导航, 如图14所示.
仿真结果表明, 移动机器人能够在与环境交互的过程中感知环境并在遇到动态障碍物时动态更新认知地图; 同时基于所构建的位置细胞认知地图, 利用位置细胞序列规划可以获得最优导航路径, 从而实现对Tolman绕道实验的再现.
4. 讨论
机器人建图一直是机器人和人工智能领域的一个非常活跃的研究领域, 主要解决通过移动机器人获取物理环境空间模型的问题. 在20世纪80年代到90年代早期, 机器人建图主要分为栅格地图和拓扑地图两种方法. 栅格地图采集环境的几何特性, 而拓扑地图侧重描述不同位置之间的连接[27]. 同步定位与地图构建(Simultaneous localization and mapping, SLAM)问题从1986年提出后逐渐兴起[28], 侧重于工程实践研究. 之后, 随着位置细胞、网格细胞、头朝向细胞等与环境认知和导航相关细胞的发现, 仿生建图研究逐渐成为新的研究潮流, 主要以探索动物环境认知机理和构建更智能的移动机器人为目的[15, 29], 侧重于仿生理论研究. 本文属于仿生建图研究的范畴. 下面将本文的认知地图与几种经典的建图方法进行对比讨论分析.
4.1 与栅格地图对比讨论
栅格地图是常用的地图表示方法, 其优点在于建模简单、易于更新和处理, 但随着地图范围扩大, 所需要的存储空间将会大大提升. 近年来, 自适应栅格地图表示方法被提出, 能根据环境自适应调整栅格大小, 从而有效节省存储空间, 如基于四叉树的自适应栅格地图创建方法. 然而, 自适应栅格地图仅适用于静态环境, 在障碍物密度差异大的环境中效果明显; 在障碍密度差异小且障碍物较多的环境中, 其优势不突出[30]. 本文模型不仅具有类脑仿生特性和生物合理性, 而且经实验验证, 在所构建地图的简洁性和对环境中动态障碍的适应性方面更有优势.
1) 在所构建地图简洁性方面的对比
为进行对比分析, 本文分别采用四叉树自适应栅格建图法和本文方法对Hairpin迷宫进行建图. Hairpin迷宫为如图15 所示的 70 cm×70 cm的静态室内环境. 在标准的四叉树栅格建图中, 环境地图分割方法是将整个未知环境切分成4个节点树, 确定子栅格中哪些状态是空置或被占据的, 哪些状态是未知的, 然后将未知栅格进一步划分为4个小节点树, 指导整个地图搜索完毕并满足精度要求, 则建图完成. 基于四叉树的栅格地图在一定程度上解决了传统栅格占用海量存储空间的问题, 但该方法对应用环境有要求, 在障碍密度差异小且障碍物较多的环境中, 优势不突出[30]. 本文认为, Tolman迷宫属于障碍密度差异大且障碍物较多的环境, Hairpin迷宫属于障碍密度差异小且障碍物较多的环境.
图16是构建的四叉树栅格地图, 图16(a)和图16(b)分别为采用四叉树栅格建图法对Tolman迷宫和Hairpin迷宫进行建图的结果. 图17是本文方法构建的认知地图, 图17(a)和图17(b)分别为采用本文方法对Tolman迷宫和Hairpin迷宫进行建图的结果. 从仿真结果图可以定性地看出, 本文认知地图构建整个环境所需要的位置细胞数比四叉树栅格地图所需要的栅格数要少. 对实验结果做定量分析, 以四叉树栅格建图法形成的大栅格计数, 构建Tolman迷宫地图需要的栅格数大于196, 构建Hairpin迷宫地图需要的栅格数大于256. 而以本文认知地图建图法构建Tolman迷宫仅需要90个位置细胞, 构建Hairpin迷宫地图仅需要65个位置细胞, 比四叉树栅格地图更简洁. 四叉树栅格地图和本文认知地图的性能指标对比如表2所示. 此处需要说明的是, Tolman迷宫地图的尺寸为
$130\,{\rm cm}$ $\times 130\, {\rm cm}$ , 而Hairpin迷宫地图的尺寸是$70\,{\rm cm} $ $\times $ $70\,{\rm cm} $ , 所以构建Tolman迷宫所形成的位置细胞个数比构建Hairpin迷宫多. 此外, 本文建图过程与海马体的一次学习或快速学习机制[31]相吻合, 本文地图生成过程更符合动物对环境的认知过程.表 2 本文与四叉树栅格对比Table 2 Comparison between occupancy grids based on quadtree and DGP-PCCMM性能指标 占用栅格或位置
细胞个数有无仿生性 对动态变化
的适应性四叉树栅格 > 256 (Hairpin);
> 196 (Tolman)无 较弱 本文认知地图 65 (Hairpin);
90 (Tolman)有 较好 2) 在对动态障碍适应性方面的对比
对动态障碍的适应性是机器人环境认知的重要内容. 文献[30]表明, 四叉树栅格地图法较适合于对静态环境的建图, 如果环境发生变化, 则需要重新进行四叉树栅格建图, 对动态变化的适应性较弱. 人工势场法、遗传算法、蚁群算法、动态窗口法等都有一定的局部避障能力[32-33]. 其中, 动态窗口法是近年来较常用的一种局部路径规划方法, 对动态变化有良好的适应性, 能够实时避障, 但其不能有效利用学习到的先验信息, 导致耗时较长, 且其无法考虑路径的全局最优性, 时常会陷入局部最优[33-34]. 本文方法能在与环境的交互中学习到环境的地图信息, 并在之后的导航中能利用学习到的认知地图指导导航, 耗时短且能实现全局最优. 为对比动态窗口法和本文方法对动态障碍的适应性, 将这两种方法分别用于在Tolman迷宫的导航实验, 并在图18中展示两者的导航结果, 其中实线和虚线分别表示动态窗口法和本文方法得到的路线. 在18(c)门A打开而门B关闭的情况下, 动态窗口法会由于避障而出现绕远路或陷入局部最优的现象, 并且在多次导航后并不会学习到环境的地图信息, 导致每次导航都会绕远路. 而在本文方法中, 机器人在第一次发现临时障碍后, 会及时更新认知地图, 从而在之后的导航中能采用规划出的全局最优路径. 两种方法的性能指标对比表如表3所示, 其中, T1、T2和T3分别表示图18(a)、18(b)和18(c)的情况. 由表3可知, 在T1和T2情况下, 两种方法都能近似最优地进行导航, 本文由于根据认知地图进行导航, 运行时间相对较短. 在T3情况下, 采用动态窗口法由于绕远路和陷入局部最优, 运行时间相对很长, T3的运行时间比T1增长了约5倍, 而采用本文方法运行时间只比T1时增长了约2.5倍. 本文认知地图构建方法的一大优点在于在遇到动态障碍时可以利用已有的认知地图, 从而在下次导航时直接使用学习后的认知地图进行导航, 避免了重新学习环境信息的时间浪费.
表 3 本文与动态窗口法对比Table 3 Comparison between dynamic window approach and our method性能指标环境 运行时间 (s) 导航路线长度 (cm) T1 T2 T3 T1 T2 T3 动态窗口法 141.4 188.6 717.9 121.3 171.2 418.6 本文认知地图 24.5 35.7 60.2 122.6 178.6 301.2 4.2 与其他认知地图对比讨论
Martinet等[20]提出了前额皮质柱神经网络模型, 通过构建位置细胞和皮质柱的分层网络再现Tolman绕道实验. 文献[20]和本文都能对绕道实验进行再现, 文献[20]展示了皮质柱网络结构从海马输入中学习稀疏的拓扑度量表示, 而本文侧重基于海马体位置细胞进行认知地图的构建与更新, 属于对老鼠空间导航机制的不同研究方向的探索.
Erdem等[35]提出了基于前向轨迹探针的目标导向的空间导航模型. 通过随机探索, 可以创建由位置细胞和前额皮质细胞组成的地图, 实现目标导向的行为. 然而, 正如文献[35]的讨论中所说, 何时引入位置细胞来表达空间环境的位置信息是一个重要的问题, 文献[35]中的位置细胞是通过特定的伪随机方法来产生的, 存在不能很好表达环境的问题. 本文采用类似自组织图的“感知—响应”结构, 通过竞争与动态增长获得位置细胞, 可以实现对环境的良好表达, 两种方法获得的认知地图如图19所示, 图19(a)为文献[35]得到的认知地图, 其中圆圈表示位置细胞, 虚线表示得到的导航路径; 图19(b)为本文方法得到的认知地图, 其中星号表示位置细胞, 星号及其之间的连线表示得到的认知地图. 通过图19可知, 文献[35]得到的认知地图在某些位置处没有位置细胞表示, 如最左边一列, 而在某些位置处有多余的位置细胞表示, 如从左边数第三列可行通路, 不能生成对整个环境的完整表达; 相比较而言, 本文方法可以获得对整个环境的一个均匀完整的表达, 很好地解决了文献[35]提出的如何引入位置细胞来表达空间环境这一重要问题.
概括来说, 本文认知地图构建方法有以下优点: 1) 具有类脑仿生特性与一定的生物合理性. 与栅格地图和一般的拓扑地图相比, 本文认知地图的构建和更新过程与海马体的一次学习或快速学习机制相一致, 更符合动物对环境的认知过程. 2) 能够适应动态环境(如门的开闭). 与动态窗口法相比, 在遇到动态障碍后, 本文方法能动态更新认知地图, 并利用学习到的认知地图指导导航, 耗时短且能实现全局最优. 3) 能够降低建图的复杂性, 并通过构建Tolman迷宫、Hairpin迷宫地图进行验证. 与四叉树栅格地图相比, 本文方法不仅适用于障碍密度差异大的环境, 而且在障碍分布差异小且障碍物较多的环境中也表现出较好的性能.
5. 结论
本文用机器人再现动物绕道实验, 是通过仿生使机器人更加智能化的一个初步探索. 本文受海马体位置细胞在特定位置放电的启发, 通过构建动态增减的位置细胞认知地图, 再现了Tolman老鼠绕道实验. 目前研究的重点集中在对认知地图的构建上, 所提出的构建方法具有以下优点: 1) 具有类脑仿生特性与一定的生物合理性; 2) 能够适应动态环境(如门的开闭); 3) 能够降低建图的复杂性. 实验结果表明, 机器人漫游和导航的过程中能动态形成和更新认知地图, 能像Tolman老鼠那样, 利用认知地图进行自主环境探索、认知与导航, 完成绕道取食.
本文属于对动物导航过程中大脑运作机制的一个探索, 对海马体位置细胞的建模是后续研究动物导航过程中可能涉及到的内嗅皮层、丘脑、纹状体等之间联合建模的基础. 本文简单表明了海马体位置细胞的场景记忆功能, 对机器人场景记忆的仿生建模有待进一步的研究. 将来期望进一步完善机器人对Tolman绕道实验的再现, 使机器人实现更仿生(如将障碍物撤除后机器人重新发现捷径等)的环境认知.
-
表 1 DGP-PCCMM初始参数设置
Table 1 Initial simulation parameters for DGP-PCCMM
参数 值 参数 值 参数 值 $ t $ 0 $ n_2 $ 3.2 $ T_{\rm{RP}} $ 3 $ N $ 0 $ n_{m} $ 1 000 $ n_{\rm{init}} $ 1 $ V_{\rm{GT}} $ 4.5 $ \sigma_0 $ 0.01 $ r $ 0.025 m $ n_1 $ 1.8 $ \alpha_0 $ 0.01 $ d_{\rm{step}} $ 0.05 m 表 2 本文与四叉树栅格对比
Table 2 Comparison between occupancy grids based on quadtree and DGP-PCCMM
性能指标 占用栅格或位置
细胞个数有无仿生性 对动态变化
的适应性四叉树栅格 > 256 (Hairpin);
> 196 (Tolman)无 较弱 本文认知地图 65 (Hairpin);
90 (Tolman)有 较好 表 3 本文与动态窗口法对比
Table 3 Comparison between dynamic window approach and our method
性能指标环境 运行时间 (s) 导航路线长度 (cm) T1 T2 T3 T1 T2 T3 动态窗口法 141.4 188.6 717.9 121.3 171.2 418.6 本文认知地图 24.5 35.7 60.2 122.6 178.6 301.2 -
[1] 曹风魁, 庄严, 闫飞, 杨奇峰, 王伟. 移动机器人长期自主环境适应研究进展和展望. 自动化学报, 2020, 46(2): 205−221Cao Feng-Kui, Zhuang Yan, Yan Fei, Yang Qi-Feng, Wang Wei. Long-term autonomous environment adaptation of mobile robots: state-of-the-art methods and prospects. Acta Automatica Sinica, 2020, 46(2): 205−221 [2] 朱博, 高翔, 赵燕喃. 机器人室内语义建图中的场所感知方法综述. 自动化学报, 2017, 43(4): 493−508Zhu Bo, Gao Xiang, Zhao Yan-Nan. Place perception for robot indoor semantic mapping: A survey. Acta Automatica Sinica, 2017, 43(4): 493−508 [3] Collett M, Chittka L, Collett T S. Spatial memory in insect navigation. Current Biology, 2013, 23(17): R789−R800 doi: 10.1016/j.cub.2013.07.020 [4] Ruan X, Wu X. The skinner automaton: A psychological model formalizing the theory of operant conditioning. Science China-Technological Sciences, 2013, 56(11): 2745−2761 doi: 10.1007/s11431-013-5369-0 [5] Milford M, Schulz R. Principles of goal-directed spatial robot navigation in biomimetic models. Philosophical Transactions of Royal Society B, 2014, 369: 1−13 [6] Frohnwieser A, Murray J C, Pike T W, Wilkinson A. Using robots to understand animal cognition. Journal of the Experimental Analysis of Behavior, 2016, 105(1): 14−22 doi: 10.1002/jeab.193 [7] 秦方博, 徐德. 机器人操作技能模型综述. 自动化学报, 2019, 45(8): 1401−1418Qin Fang-Bo, Xu De. Review of robot manipulation skill models. Acta Automatica Sinica, 2019, 45(8): 1401−1418 [8] Tang H J, Huang W W, Narayanamoorthy A, Yan R. Cognitive memory and mapping in a brain-like system for robotic navigation. Neural Networks, 2017, 87: 27−37 doi: 10.1016/j.neunet.2016.08.015 [9] Gianelli S, Harland B, Fellous J. A new rat-compatible robotic framework for spatial navigation behavioral experiments. Journal of Neuroscience Methods, 2018, 294: 40−50 doi: 10.1016/j.jneumeth.2017.10.021 [10] 黄秉宪. 关于人工智能中的脑模型研究. 自动化学报, 1979, 5(2): 157−166Huang Bing-xian. On brain model in artificial intelligence. Acta Automatica Sinica, 1979, 5(2): 157−166 [11] Tolman E C. Cognitive maps in rats and men. Psychological Review, 1948, 55(4): 189−208 doi: 10.1037/h0061626 [12] O'Keefe J, Dostrovsky J. The hippocampus as a spatial map. Preliminary evidence from unit activity in the freely-moving rat. Brain Research, 1971, 34(1): 171−175 doi: 10.1016/0006-8993(71)90358-1 [13] Mehta M R. From synaptic plasticity to spatial maps and sequence learning. Hippocampus, 2015, 25(6): 756−762 doi: 10.1002/hipo.22472 [14] Alme C B, Miao C, Jezek K, Treves A, Moser E, Moser M B. Place cells in the hippocampus: eleven maps for eleven rooms. Proceedings of the National Academy of Sciences, 2014, 111(52): 18428−18435 doi: 10.1073/pnas.1421056111 [15] 于乃功, 苑云鹤, 李倜, 蒋晓军, 罗子维. 一种基于海马认知机理的仿生机器人认知地图构建方法. 自动化学报, 2018, 44(1): 52−73Yu Nai-Gong, Yuan Yun-He, Li Ti, Jiang Xiao-Jun, Luo Zi-Wei. A cognitive map building algorithm by means of cognitive mechanism of hippocampus. Acta Automatica Sinica, 2018, 44(1): 52−73 [16] 邹强, 丛明, 刘冬, 杜宇, 崔瑛雪. 基于生物认知的移动机器人路径规划方法. 机器人, 2018, 40(6): 894−902Zou Qiang, Cong Ming, Liu Dong, Du Yu, Cui Ying-Xue. Path planning of mobile robots based on biological cognition. Robot, 2018, 40(6): 894−902 [17] Kabadayi C, Bobrowicz K, Osvath M. The detour paradigm in animal cognition. Animal Cognition, 2018, 21(1): 21−35 doi: 10.1007/s10071-017-1152-0 [18] Fakhari P, Khodadadi A, Busemeyer J R. The detour problem in a stochastic environment: Tolman revisited. Cognitive Psychology, 2018, 101: 29−49 doi: 10.1016/j.cogpsych.2017.12.002 [19] Schmajuk N A, Buhusi C V. Spatial and temporal cognitive mapping: a neural network approach. Trends in Cognitive Sciences, 1997, 1(3): 109−114 doi: 10.1016/S1364-6613(97)89057-2 [20] Martinet L E, Sheynikhovich D, Benchenane K, Arleo A. Spatial learning and action planning in a prefrontal cortical network model. Plos Computational Biology, 2011, 7(5): e1002045 doi: 10.1371/journal.pcbi.1002045 [21] Gao Y, Song H. A motor learning model based on the basal ganglia in operant conditioning. In: Proceedings of the 26th Chinese Control and Decision Conference. Changsha, China: IEEE, 2014. 5236−5241 [22] Alvernhe A, Save E, Poucet B. Local remapping of place cell firing in the Tolman detour task. European Journal of Neuroscience, 2011, 33(9): 1696−1705 doi: 10.1111/j.1460-9568.2011.07653.x [23] Ruan X G, Gao Y Y, Song H J, Chen J. A new dynamic self-organizing method for mobile robot environment mapping. Journal of Intelligent Learning Systems and Applications, 2011, 3: 249−256 doi: 10.4236/jilsa.2011.34028 [24] Vasighi M, Amini H. A directed batch growing approach to enhance the topology preservation of self-organizing map. Applied Soft Computing, 2017, 55: 424−435 doi: 10.1016/j.asoc.2017.02.015 [25] Madl T, Chen K, Montaldi D, Trappl R. Computational cognitive models of spatial memory in navigation space: A review. Neural Networks, 2015, 65: 18−43 doi: 10.1016/j.neunet.2015.01.002 [26] Ciancia F. Tolman and Honzik (1930) revisited or the mazes of psychology (1930−1980). The Psychological Record, 1991, 41: 461−472 [27] Thrun S. Robotic mapping: A survey. Exploring Artificial Intelligence in the New Millennium, 2002, 1: 1−35 [28] 周彦, 李雅芳, 王冬丽, 裴廷睿. 视觉同时定位与地图创建综述. 智能系统学报, 2018, 13(1): 97−106Zhou Yan, Li Ya-Fang, Wang Dong-Li, Pei Ting-Rui. A survey of VSLAM. CAAI Transactions on Intelligent Systems, 2018, 13(1): 97−106 [29] Barrera A, Cáceres A, Weitzenfeld A, Amaya V R. Comparative experimental studies on spatial memory and learning in rats and robots. Journal of Intelligent and Robotic Systems, 2011, 63: 361−397 doi: 10.1007/s10846-010-9467-y [30] 郭利进, 师五喜, 李颖, 李福祥. 基于四叉树的自适应栅格地图创建算法. 控制与决策, 2011, 26(11): 1690−1694Guo Li-Jin, Shi Wu-Xi, Li Ying, Li Fu-Yang. Mapping algorithm using adaptive size of occupancy grids based on quadtree. Control and Decision, 2011, 26(11): 1690−1694 [31] Chersi F, Burgess N. The cognitive architecture of spatial navigation: hippocampal and striatal contributions. Neuron, 2015, 88(1): 64−77 doi: 10.1016/j.neuron.2015.09.021 [32] 许凯波, 鲁海燕, 黄洋, 胡士娟. 基于双层蚁群算法和动态环境的机器人路径规划方法. 电子学报, 2019, 47(10): 2166−2176 doi: 10.3969/j.issn.0372-2112.2019.10.019Xu Kai-Bo, Lu Hai-Yan, Huang Yang, Hu Shi-Juan. Robot path planning based on double-layer ant colony optimization algorithm and dynamic environment. Acta Electronica Sinica, 2019, 47(10): 2166−2176 doi: 10.3969/j.issn.0372-2112.2019.10.019 [33] 王永雄, 田永永, 李璇, 李梁华. 穿越稠密障碍物的自适应动态窗口法. 控制与决策, 2019, 34(5): 927−936Wang Yong-Xiong, Tian Yong-Yong, Li Xuan, Li Liang-Hua. Self-adaptive dynamic window approach in dense obstacles. Control and Decision, 2019, 34(5): 927−936 [34] Fox D, Burgard W, Thrun S. The dynamic window approach to collision avoidance. Robotics and Automation Magazine, 1997, 4(1): 23−33 doi: 10.1109/100.580977 [35] Erdem U M, Hasselmo M. A goal directed spatial navigation model using forward trajectory planning based on grid cells. European Journal of Neuroscience, 2012, 35(6): 916−931 doi: 10.1111/j.1460-9568.2012.08015.x 期刊类型引用(4)
1. 王典,周阳,宋毅,代传金. 基于Q学习的生物启发式目标导向导航路径规划模型. 电子测量与仪器学报. 2023(06): 68-76 . 百度学术
2. 吴文雅,王亮. 认知地图及其内在机制. 心理科学进展. 2023(10): 1856-1872 . 百度学术
3. 洪涛,史涛,任红格. 一种改进型RatSLAM算法构建认知地图的研究. 现代计算机. 2021(21): 47-52 . 百度学术
4. 张晓峰. 认知科学视域下的电影空间建构. 电影艺术. 2021(06): 126-134 . 百度学术
其他类型引用(8)
-