2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种基于海马认知机理的仿生机器人认知地图构建方法

于乃功 苑云鹤 李倜 蒋晓军 罗子维

于乃功, 苑云鹤, 李倜, 蒋晓军, 罗子维. 一种基于海马认知机理的仿生机器人认知地图构建方法. 自动化学报, 2018, 44(1): 52-73. doi: 10.16383/j.aas.2018.c160467
引用本文: 于乃功, 苑云鹤, 李倜, 蒋晓军, 罗子维. 一种基于海马认知机理的仿生机器人认知地图构建方法. 自动化学报, 2018, 44(1): 52-73. doi: 10.16383/j.aas.2018.c160467
YU Nai-Gong, YUAN Yun-He, LI Ti, JIANG Xiao-Jun, LUO Zi-Wei. A Cognitive Map Building Algorithm by Means of Cognitive Mechanism of Hippocampus. ACTA AUTOMATICA SINICA, 2018, 44(1): 52-73. doi: 10.16383/j.aas.2018.c160467
Citation: YU Nai-Gong, YUAN Yun-He, LI Ti, JIANG Xiao-Jun, LUO Zi-Wei. A Cognitive Map Building Algorithm by Means of Cognitive Mechanism of Hippocampus. ACTA AUTOMATICA SINICA, 2018, 44(1): 52-73. doi: 10.16383/j.aas.2018.c160467

一种基于海马认知机理的仿生机器人认知地图构建方法

doi: 10.16383/j.aas.2018.c160467
基金项目: 

国家自然科学基金 61573029

北京市自然科学基金 4162012

详细信息
    作者简介:

    苑云鹤  北京工业大学硕士研究生.2015年获河北工程大学学士学位.主要研究方向为模式识别与智能系统, 仿生机器人导航.E-mail:yyh_bjut@163.com

    李倜  2013年获吉林农业大学学士学位, 2016年获北京工业大学硕士学位.主要研究方向为模式识别与智能系统.E-mail:bgdliti@163.com

    蒋晓军  北京工业大学硕士研究生.2014年获鲁东大学学士学位.主要研究方向为模式识别与智能系统, 仿生机器人导航.E-mail:jxj_bjut@163.com

    罗子维  北京工业大学硕士研究生.2015年获济南大学学士学位.主要研究方向为模式识别与智能系统, 仿生机器人导航.E-mail:luoziwei888@126.com

    通讯作者:

    于乃功  北京工业大学教授.1989年获哈尔滨工业大学学士学位, 1996年获上海交通大学硕士学位, 2005年获北京工业大学博士学位.主要研究方向为计算智能与智能系统, 机器人学与机器人技术, 机器视觉.本文通信作者.E-mail:yunaigong@bjut.edu.cn

A Cognitive Map Building Algorithm by Means of Cognitive Mechanism of Hippocampus

Funds: 

National Natural Science Foundation of China 61573029

Beijing Natural Science Foundation 4162012

More Information
    Author Bio:

     Master student at Beijing University of Technology. He received his bachelor degree from Hebei University of Engineering in 2015. His research interest covers pattern recognition, intelligent system, and bionic robot navigation

     Received his bachelor degree from Jilin Agricultural University in 2013, and his master degree from Beijing University of Technology in 2016, respectively. His research interest covers pattern recognition and intelligent system

     Master student at Beijing University of Technology. He received his bachelor degree from Ludong University in 2014. His research interest covers pattern recognition, intelligent system, and bionic robot navigation

     Master student at Beijing University of Technology. She received her bachelor degree from University of Jinan in 2015. Her research interest covers pattern recognition, intelligent system, and bionic robot navigation

    Corresponding author: LUO Zi-Wei  Master student at Beijing University of Technology. She received her bachelor degree from University of Jinan in 2015. Her research interest covers pattern recognition, intelligent system, and bionic robot navigation
  • 摘要: 海马结构空间细胞的放电活动被认为能够形成对环境内在地图的表达,即所谓的认知地图.先前的仿生环境认知地图构建方法(例如RatSLAM)以及传统的SLAM方法均缺乏足够的生理学依据,不能准确地体现出生物在导航中的生理学现象和认知功能实现过程.本文模仿海马结构空间细胞的认知机理提出了一种构建精确的环境认知地图的方法,其特点在于通过构建统一的空间细胞吸引子计算模型对自运动线索进行路径积分;网格细胞和位置细胞对环境的表达来源于条纹细胞的前向驱动作用;通过环境的颜色深度图像进行闭环检测,对空间细胞路径积分进行误差修正,最终生成精确的环境认知地图.该认知地图是一种拓扑度量地图,包含了环境特征点坐标、视觉线索以及特定位点的拓扑关系.本文通过仿真实验和机器人平台物理实验验证了方法的有效性,研究成果为仿海马认知机理的机器人导航方法研究奠定了基础.
  • 对空间环境进行有效的认知是动物赖以生存的重要能力. Tolman的三迷宫导航实验揭示动物的导航行为依靠被称为认知地图的内在环境表达, 这种表达反映了环境中显著路标之间的相互联系[1].

    损毁实验研究表明, 海马结构是环境认知和情节性记忆产生的关键脑区[2], 损毁了海马体[3]、内嗅皮层[4]或后下托[5]的老鼠均不能完成Morris水迷宫导航任务.对海马结构不同区域的细胞进行放电记录表明海马结构中存在着一系列与空间环境认知相关的细胞.存在于CA区(海马角, 海马区的一部分)的位置细胞只在空间特定位置放电, 是构成认知地图的基础机制[6-8]; 后下托中的头朝向细胞只在以我为中心特定的头方向上放电, 是对动物头朝向的表征, 而位于丘脑核背侧的头朝向细胞的放电率还受到当前头部的瞬时转速的影响[9-10].

    先前的研究模型[11]仅采用头朝向细胞和位置细胞构建任意尺度空间关系的认知地图, 这种对单个头朝向细胞和位置细胞活动的离散表达, 不足以支持从一个位置到另一个位置的导航行为.行为学研究表明, 动物能够利用自运动线索保持相对于环境重要位置(例如巢穴)的矢量关系, 并将空间中的各个位点的信息进行计算和整合, 使这种矢量关系不断得到更新, 这一过程被称为路径积分[12].内嗅皮层浅皮层中的网格细胞[13-14]被认为是大脑内部的路径积分器[2].

    网格细胞在空间六边形区域周期性放电, 其放电野随着动物探索环境而覆盖整个环境.无外源性输入、移除或者替换主要路标点后网格野也能够持续存在[13].自运动线索是网格细胞的主要输入, 用于保持或更新网格野.网格细胞通过对自运动信号进行路径积分更新位置细胞的放电野[2].因此, 网格细胞为认知地图的形成提供了空间度量[15].

    几乎所有解释内嗅皮层网格细胞形成机制的模型都是利用速度调节的输入信号的路径积分表征周期性的网格野, 现阶段网格细胞的主要计算模型有振荡干涉模型[16-19]和吸引子模型[20-21]. 2012年O'Keefe和Burgess在Science上发表文章说明, 在傍下托和内嗅皮层的浅皮层发现了在平面上有周期性条纹状放电野的细胞族, 不同的细胞族有着不同的放电朝向和波长, 这些细胞被称为条纹细胞(Band cell).

    作为位置细胞的主要输入信号, 内嗅皮层网格细胞对空间的表达是对海马位置细胞空间地图的补充, 网格细胞族是对空间环境度量信息的表达, 与环境中的路标信息无关, 而位置细胞地图则是对空间特定位置点的表达, 内嗅海马回路对环境的表达构成了环境的认知地图[15].周期性放电的网格细胞如何生成空间特异性放电的位置细胞仍然是一个开放性的问题.现阶段存在两种计算方式, 1)采用在特定频率范围具有相同相位和不同空间尺度的网格细胞子集线性相加产生位置细胞[2, 14, 20]; 2)采用具有多个空间尺度和朝向的网格细胞竞争学习实现[22-24].外源性信息, 例如视觉和嗅觉信号同样能够使位置细胞放电, 老鼠在发现空间显著路标时, 能够以此作为参考纠正路径积分误差.

    已有多个模型利用海马空间细胞的路径积分实现了智能体在环境中的定位, 虽然采用强化学习和外界视觉信号能够实现面向目标导航和强化定位功能的目的, 但这些模型并未构建出环境的认知地图[19, 25-28], 多数利用振荡干涉的计算模型还只停留在仿真阶段, 并未实现在真实环境中有效的地图构建.澳大利亚昆士兰理工大学的Milford利用神经行为学研究成果, 对老鼠大脑假设的“位姿细胞”进行数学建模, 利用视觉驱动的导航系统, 建立了一个可以实时定位与地图构建的RatSLAM仿生导航算法[29-32], 在大规模的室外导航实验中, 取得了较好的效果.但RatSLAM算法是一种纯视觉的导航算法, 其核心传感信息来源于视觉里程计, 受外界环境的影响较大, 存在可靠性低、环境适应性较差的问题[33].

    本文利用吸引子模型构建与海马认知机理有关的空间细胞计算模型.利用网格细胞对自运动线索进行路径积分, 通过竞争性Hebb学习选择相应网格子集生成位置细胞族活动, 位置细胞之间的竞争学习产生单峰型放电野, 以二维环状吸引子模型表达空间环境的实际位置, 位置细胞的路径积分由条纹细胞驱动, 实现在仿真和真实环境中的精确路径积分.与此同时, 利用RGB-D传感器(3D摄像机可采集颜色深度图)采集视觉线索进行环境的闭环检测, 最终生成的认知地图是拓扑度量地图, 包含环境特征点坐标、视觉线索以及特定位点的拓扑关系.

    本文在以下两个方面取得了进步:

    1) 利用统一的计算机制模拟了海马结构中四种空间细胞的计算模型, 在已知的研究中, 本文是第一个采用条纹细胞驱动实现真实环境路径积分功能的模型.网格细胞模型的路径积分能够在持续260 m的空间范围中, 误差不超过15 cm, 体现了模型的精确度.

    2) 利用实际物理平台实现了环境认知地图构建, 相比于传统的SLAM导航方法, 对硬件和传感器要求低, 使用仿生的方式使整个模型有良好的扩展性和适应性, 适用于不同室内环境的导航[34-37].

    本节对构建认知地图模型的整体结构(如图 1所示)和所用方法(如图 2所示)进行详细说明. 1)对四种空间细胞, 即头朝向细胞、条纹细胞、网格细胞和位置细胞的生理学特征、功能以及计算模型进行说明. 2)详细阐述基于空间细胞认知机理的位置细胞地图的构建方法和基于颜色深度图像进行闭环检测的方法. 3)展示如何基于视觉线索、自运动信号以及空间细胞认知机理构建精确的环境认知地图.

    图 1  模型的整体结构示意图
    Fig. 1  The overall structure of the model
    图 2  空间细胞路径积分信息传递图
    Fig. 2  Space cell path integral information transfer route
    1.1.1   头朝向细胞的生理学研究基础

    动物如何对它的运动方向进行编码?这个问题随着Ranck等于1984年在老鼠前下托发现了头朝向细胞而得到解决[38-39].头朝向细胞对于指导动物的运动有重要作用, 当老鼠头部面向一个特定方向时, 头朝向细胞发生最大放电, 当头偏离这个方向时, 细胞放电会逐渐减弱, 其放电情况如图 3所示, 该头朝向细胞的优先方向是150°, 那么以水平角为起点, 其放电强度随着老鼠头朝向角度的增大而增大, 当老鼠的头朝向到达该头朝向细胞的最优方向(Preferred direction) 150°时, 电信号强度达到峰值, 之后其放电强度随着头朝向角度的增大逐渐偏离最优方向而逐渐减小, 这个过程可由一个高斯函数近似表达.位于后下托的头朝向细胞只受当前瞬时头朝向的影响, 而位于丘脑核背侧的头朝向细胞还受到当前头部的瞬时转速的影响.

    图 3  头朝向细胞的放电情况
    Fig. 3  The firing of head direction cells

    后下托中的头朝向细胞的最优方向是固定的, 而且有且只有一个最优方向, 不受环境、老鼠身体方向等因素的影响, 只与当前的头朝向有关, 而丘脑核背侧的头朝向细胞随着头部的转动, 其最优方向也有所改变, 与老鼠未来的头朝向有关, 其放电活动可能是根据头转动方向(顺时针+逆时针)以及当时的转动速度计算出未来的头朝向, 这对于指导老鼠的运动有重要作用[40].不论老鼠是静止的或者运动的, 头朝向细胞始终是激活的.与位置细胞类似, 头朝向细胞的联合响应完成了老鼠对水平方向的编码, 当所有头朝向细胞的信息整合到一起时就产生了一个连续的老鼠头朝向信号.先前的实验结果表明, 所有的头朝向细胞的整合方向倾向于锁定于一个特定的主要朝向[41-42].

    1.1.2   头朝向细胞计算模型

    基于以上的生理学研究事实, 本文使用头朝向细胞产生一个角速度调节信号, 即放电率与当前头朝向和老鼠运动的速度成比例.第$i$个头朝向细胞的优先方向可以表示为一个相对于主要朝向$\theta_0$的角偏移量$\theta_i$, 那么给定头朝向细胞的调整内核:

    $ \left[ \begin{array}{l} \cos ({\theta _1} + {\theta _0})\; \cdots \;\cos ({\theta _m} + {\theta _0})\\ \sin ({\theta _1} + {\theta _0})\; \cdots \;\sin ({\theta _m} + {\theta _0}) \end{array} \right] $

    (1)

    通过编码器获取机器人的瞬时角速度, 那么头朝向信号为

    $ \vec{ d} (t)=\vec{v} (t)\times \vec{D} = [{ d}_1 (t), \cdots, { d}_m (t)] $

    (2)

    其中, $m$为头朝向细胞的个数, ${\rm d}_i (t)$是头朝向细胞族中优先朝向为$\theta_i$的第$i$个细胞在$t$时刻的头朝向信号.

    1.2.1   条纹向细胞的生理学研究基础

    从发现网格细胞以来, 其形成机理一直是研究热点.先前的研究模型中, 速度信息被直接用于驱动网格细胞吸引子在神经板上的运动. 2012年在傍下托和内嗅皮层浅皮层的细胞放电采样显示, 存在着周期性条纹状放电野细胞, 被称为条纹细胞, 条纹细胞作为网格细胞上游皮层的细胞, 被认为是形成网格细胞的基础神经元[22].傅里叶分析表明, 多个条纹细胞族相互作用能形成周期性的网格细胞族放电野, 被认为是形成网格细胞的基础机制[22].

    Grossberg等以条纹细胞放电率作为输入信息, 通过SOM网络生成网格细胞和位置细胞的放电野[25-26, 43], 这种计算机制本质上属于振荡干涉模型, 而振荡干涉模型在最近的研究中被认为缺乏生理学依据, 而且在大范围空间环境表达中存在着累积误差大和鲁棒性不足的缺点[15].而采用连续吸引子模型生成网格细胞放电野的模型, 并未考虑条纹细胞对网格细胞的影响, 本文利用条纹细胞驱动网格细胞进行精确路径积分.

    1.2.2   条纹细胞计算模型

    在本文提出的模型中, 条纹细胞编码了特定方向上的位移, 是对动物在特定方向上相对位移的表征, 其放电活动可由四个指标确定, 如图 4所示, 分别是条纹间距$L$、条纹野宽度$r$、条纹相位$(\Delta x, \Delta y)$和优先朝向$\theta$.沿一个方向上的线速度可以通过运动速度信号与头朝向方向的信号联合编码.对于有限数量的神经网络, 对速度的积分不能无限期地持续, 必须进行周期性的重置, 并重新开始编码, 条纹细胞必须被编码成一个周期性的放电细胞, 负责对线速度进行路径积分操作.

    图 4  条纹细胞的基础特征
    Fig. 4  Basic characteristics of stripe cells

    本文使用一维环状吸引子模型对条纹细胞进行建模研究, 如图 5 (a)所示, 一个环状吸引子模型中的条纹细胞有着相同的优先朝向与周期, 不同的位置选择性, 如图 5 (b)所示.动物的运动速度在优先方向上的投影驱动吸引子运动, 当这个投影为零时, 吸引子位置保持不变, 因此在这个时间间隔内, 相同的细胞一直处于激活状态.环状吸引子模型有着长度的限制, 当活动包返回到圆环的相同位置时, 意味着动物在优先朝向上移动了特定的距离, 将会使相同的条纹细胞再次激活.具有不同空间相位的条纹细胞沿着优先方向在不同的位置被周期性地最大程度地激活, 如图 5 (b)所示, 其放电野朝着相同的方向形成平行的条纹状覆盖动物经过的位置.条纹细胞环状吸引子的活动包在优先朝向完成一次移动的放电率与条纹间距成反比.

    图 5  条纹细胞的一维环状吸引子模型
    Fig. 5  The model of one dimensional ring attractor of stripe cell

    定义优先朝向在以我为中心方向$\theta $, 相位为$\alpha $, 放电周期为$l$的条纹细胞的放电率为$x_{\theta \alpha}$, 那么该条纹细胞族在$nl+\alpha$的相位处有最大的放电率.在$t$时刻动物沿着$\varphi(t)$方向上的移动速度为$v(t)$, 那么沿着$\theta $方向的速度为

    $ v_\theta (t)=\cos(\theta -\varphi(t))v(t) $

    (3)

    沿上述动物运动方向的位移可以由速度的积分得到

    $ {d}_\theta (t)=\int_0^tv_\theta (\tau) {\rm d}\tau $

    (4)

    条纹细胞周期性放电重置的距离为

    $ s_{\theta \alpha} (t)=({\rm d}_\theta(t)-\alpha)\mod l $

    (5)

    将条纹细胞的放电率建模成高斯模型, 其放电率可以表示为

    $ x_{\theta\alpha} (t)=\exp\left({\dfrac{-(s_{\theta \alpha}(t)-\frac{l}{2})^2}{b}}\right) $

    (6)

    条纹细胞作为网格细胞吸引子的前向输入, 是对输入信号的耦合, 确定了细胞吸引子的移动方向.

    1.3.1   网格细胞计算模型

    网格细胞在动物探索环境的过程中周期性放电形成六边形的放电野覆盖整个环境, 其放电活动具有高度的稳定性, 在累计100米持续超过10分钟的运动后, 仍然能持续放电; 网格细胞的放电与外源性信息无关, 只与自身的运动状态有关[44].网格细胞之间的连接是抑制性的[45], 放电活动受来自于头朝向细胞和内嗅皮层中条纹细胞的信号调节.网格细胞的放电活动被认为能够形成空间环境的度量地图.网格细胞被认为是动物进行环境认知的路径积分器, 是动物内在的位置预测的基础机制.

    1.3.2   网格细胞精确路径积分计算模型

    Burak等提出了一种网格细胞路径积分模型, 能够在周期和非周期网络中实现精确路径积分[21], 本文在此模型的基础上, 加入了条纹细胞与网格细胞的前向连接, 驱动网格细胞吸引子对环境的编码, 这种结构更符合生理学研究事实.

    网格细胞吸引子的形成受周围网格细胞递归连接权值和来自于条纹细胞的前向连接权值调节, 使用二维连续吸引子模型对网格细胞进行建模.如图 6 (a)所示的神经板, 包含有$N_x\times N_y$个神经元, 吸引子可由相应的神经元表示, 随着探索路径的增大, 表示空间相对位置的神经元不可能无限制的增加, 这不可避免的涉及到吸引子网络的边界问题, 为了解决边界问题, 将该平面左右边界的神经元与上下边界的神经元相互连接, 形成二维环状吸引子模型, 如图 6 (b)所示.

    图 6  二维环状吸引子模型的示意图
    Fig. 6  The model of two dimensional ring attractor

    由于内嗅皮层第二层的网格细胞之间的相互连接是抑制性的, 在本文的模型中, 每个网格细胞神经元从周围环状的局部神经元接收抑制性输入, 整个网络接收来自上游皮层的前向兴奋性投射.在二维神经板中基于率编码的网格细胞神经元动力学等式为

    $ \tau \frac{{\rm d}s_i}{{\rm d}t} + s_i = f\left[\sum\limits_j w_{ij}^gs_j + x_{\theta\alpha} (t) \right] $

    (7)

    其中, $\tau$是神经元相应的时间常量, 神经元传递函数$f[\cdot]$是一个简单的非线性整流函数, 当$x>0$时, $f(x) = x$, 当$x\leq 0$时, $f(x)=0$.当前位置神经元$i$的状态为$s_i$, $w_{ij}^g$是在该神经板中神经元$j$到神经元$i$的连接权值, $\sum_j w_{ij}^g s_j$是投射到神经元$i$的抑制性递归输入, $x_{\theta \alpha}(t)$是来自于条纹细胞的前向性兴奋性输入.如果神经板的长度为$N$, 那么整个神经网络有$N^2$个神经元, 每个神经元$i$都有着一个优先方向, 这个优先方向信息由条纹细胞的投射确定.

    网格细胞接收来自于条纹细胞的前向投射, 前向投射中的优先朝向信息, 被用于确定输出权值的改变方向, 并确定其接收到老鼠的速度输入信息.网格细胞的递归连接权值为

    $ w_{ij}^g = w_0 (\overrightarrow{x_i} - \overrightarrow{x_j} - s_{\theta\alpha}(t)) $

    (8)

    其中, $w_0=a\exp({-\gamma |\vec{x}|^2})-\exp({-\beta |\vec{x}|^2})$, 权值矩阵形成一个中间高两边低的墨西哥帽形状分布, 其中间位置为$\vec{x}$ $-$ $s_{\theta \alpha }(t)$, 在所有的仿真设定中, $\gamma =1.05\times \beta $, $\beta =$ $3/\lambda _{\rm net}^2$, 其中$\lambda _{\rm net}$是神经片上形成网格的周期, 由条纹细胞的周期l确定.所有的连接都是抑制性的, 局部周围抑制性连接足够产生网格细胞响应.

    1.4.1   位置细胞的生理学研究基础

    位置细胞能够对空间相对位置进行特征性的编码是脑内认知地图形成的基本单元, 其放电活动提供了一个连续和动态的空间位置表达.大量位置细胞的联合响应(Combined activity)产生了一个对环境空间的离散表达, 这说明位置细胞地图本质上属于路标地图[15].群放电活动在以我为中心的参考系下编码了动物的当前位置[6-7], 建立了脑区和外界物理世界稳定的一一映射关系[2].位置细胞的放电特性如图 7所示, 实线段表示老鼠的运动轨迹, 圆点表示位置细胞的激发点.

    图 7  位置细胞的放电情况
    Fig. 7  The firing of place cells

    网格细胞作为位置细胞的主要输入信息来源, 位置细胞的放电活动是路径积分系统的输出.为了产生位置细胞族的单峰型放电野, 需要学习网格细胞族到位置细胞的突触权值分布, 确定在单个位置具有重叠活动包的网格细胞族的激活比例[46].这个过程可以通过具有确定的空间放电频率的网格细胞子集线性相加或者使用Hebb学习的方式和线性相加的方式.

    课题组在先前的研究中构建了网格细胞到位置细胞的竞争性网络, 采用竞争性网络进行自组织编码, 成功模拟了齿状回中具有多个峰值的位置细胞位置野的特性.然后进一步经过Hebb学习产生了具有单个峰值的位置细胞位置野, 模拟了CA3区(海马角的一部分)内的位置细胞特性[47].

    1.4.2   网格细胞到位置细胞的竞争型网络模型

    本文使用竞争性的Hebb学习寻找网格细胞族活动的子集, 计算位置细胞族活动.

    $ \frac{{\rm d}w_{ij}^{eh}}{{\rm d}t} = kp_i (s_j-C_{inhg}) $

    (9)

    其中, $k$为学习率, $p_i$为位置细胞的放电率, $s_j$为网格细胞的放电率, $C_{inhg}$为网格细胞的抑制水平, 由网格细胞平均放电率确定.式(9)的右边确定权重变化的方向:如果当前网格细胞激活率大于网格细胞的抑制性水平, 突触连接增强; 否则, 突触连接发生抑制.

    在一个神经板上的网格细胞群活动不足以完成路径积分, 因为这会导致局部空间表达的歧义性.位置细胞对给定位置的空间选择性来源于对该位置联合编码的具有多个空间相位和空间间距的网格细胞活动的选择性结合.因此, 需要多个空间间距和朝向的网格细胞, 同样需要有多个空间间距和朝向的条纹细胞.每个神经板代表了一个网格细胞族活动, 本文对$a$和$\lambda_{\rm net}$进行均匀采样产生多个不同尺度的网格细胞族.式(9)可以从多层神经板的空间重合检测网格细胞群体活动.

    位置细胞的族活动来源于网格细胞的投射信息

    $ p_i (r)=A \times f\left[\sum\limits_{j=1}^M w_{ij}^{eh} s_j (r)-C_{inhp}\right] $

    (10)

    其中, $A$和$C_{inh}$分别为位置细胞网络的增益和抑制常量, $M$是网格细胞神经板的层数, $w_{ij}^{eh}$是网格细胞族$j$到位置细胞族$i$的突触连接权值, $r$是当前动物的位置. $C_{inhp}$用来控制位置细胞放电野的个数, 由$B\times\max(p_i (r))$确定.通过上述的竞争性算法, 确保了只有少量的网格细胞族的子集被选择形成位置细胞.

    位置细胞之间同样存在着相互作用, 在局部的连接中, 位置细胞通过抑制突触分支对周围的神经细胞产生抑制作用, 网格细胞激活率大的子集生成的位置细胞的兴奋程度相对较强, 通过侧抑制现象, 对周围神经细胞的抑制作用也越强, 最后的结果是兴奋作用最强的神经细胞在竞争中获胜, 形成单一型的放电野.

    为了实现位置细胞放电率在实际物理空间中的量化, 采用二维的吸引子模型构建了对于实际外界环境相对位置的度量模型.二维连续吸引子模型由局部兴奋性、抑制连接和全局抑制性连接在一个神经板上形成一个随机的活动包(Activity bump), 这个吸引子由空间细胞路径积分系统驱动, 由来自于当前位置的图像信息进行重置.活动包如图 8中灰色神经元所示, 如果整个位置细胞网络有边界, 那么当机器人离开位置细胞网络覆盖的区域时, 整个网络将不能表示当前机器人的位置信息, 所以, 类似于网格细胞的环状吸引子模型, 网络边界的位置细胞与另一边界的位置细胞相连接, 形成环状.

    图 8  位置细胞的连续吸引子模型表达
    Fig. 8  The expression of the continuous attractor model of place cells

    一个二维的高斯分布被用于创建位置细胞的兴奋性权值连接矩阵$\varepsilon_{m, n}$, 其中下标$m$和$n$代表在坐标系$X$和$Y$中所属单元横纵坐标之间的距离.权值分布可表示为

    $ \varepsilon_{m, n} = \exp\left({-\frac{m^2+n^2}{k_p}}\right) $

    (11)

    其中, $k_p$为位置分布的宽度常量.

    由于局部兴奋性连接导致的位置细胞活动的变化量为

    $ \Delta P_{EX, EY} = \sum\limits_{i = 0}^{(n_X-1)}\sum\limits_{j = 0}^{(n_Y-1)}p_{X, Y}\varepsilon_{m, n} $

    (12)

    其中, $n_X$和$n_Y$是在$(X, Y)$空间中位置细胞二维矩阵的大小, 代表吸引子模型在神经板上活动的范围.因为网络中位置细胞的无边界性, 如图 8所示, 处于神经板边界的位置细胞会与相对边界的位置细胞产生兴奋性连接, 而进行位置细胞迭代和视觉模板匹配的前提是查找位置细胞吸引子在神经板中的相对位置, 这个相对位置坐标由权值矩阵的下标表示, 可由下式计算得到

    $ m =(X-i)\mod n_X $

    (13a)

    $ n =(Y-j)\mod n_Y $

    (13b)

    每个位置细胞同样接收着整个网络的全局性抑制信号.与网格细胞所形成的墨西哥帽吸引子模型不同, 位置细胞的抑制信号发生在局部性兴奋连接之后, 而不是同时起作用.兴奋性和抑制性连接矩阵的对称性保证了合适的神经网络动力学, 确保空间中的吸引子不会无限制地兴奋.位置细胞由抑制性连接权值引起的活动变化量为

    $ \Delta p_{IX, IY}=\sum\limits_{i = 0}^{n_X}\sum\limits_{j = 0}^{n_Y}p_{i, j} \psi_{m, n}-\varphi $

    (14)

    其中, $\psi_{m, n}$是抑制性连接权值, $\varphi$控制全局性的抑制水平.所有位置细胞的活动都是非零的并且进行归一化.

    为确保所有时刻的所有位置细胞的活动都是不小于零的, 将位置细胞的激活率与0进行比较

    $ p_{X, Y}^{t+1}=\max\{p_{X, Y}^t+\Delta p_{EX, EY}+\Delta p_{IX, IY}, 0\} $

    (15)

    随后将位置细胞的活动率进行归一化

    $ p_{X, Y}^{t+1} = \dfrac{p_{X, Y}^t}{\sum\limits_{i =0}^{n_X}\sum\limits_{j =0}^{n_Y}p_{ij}^t} $

    (16)

    在本文模型中, 位置细胞吸引子的移动来自于空间细胞对自运动线索的路径积分, 条纹细胞编码了特定方向上的位移, 驱动网格细胞吸引子的移动, 网格吸引子对特定方向上的二维空间进行编码, 使得不同的网格细胞族激活.不同的网格细胞族活动的子集确定了位置吸引子的移动.这一过程的示意图如图 9所示.

    图 9  位置细胞路径积分示意图
    Fig. 9  Place cell path integral

    路径积分后位置细胞的放电率$p_{X, Y}^{t+1}$可表示为

    $ p_{X, Y}^{t+1}=\sum\limits_{m = \delta X_0}^{\delta X_0 + 1}\sum\limits_{n = \delta Y_0}^{\delta Y_0 + 1} \alpha_{mn} p_{(m+X)(n+Y)}^t $

    (17)

    其中, $\delta X_0$, $\delta Y_0$是$X$-$Y$坐标系中向下取整的偏置量, 这一偏置量由速度和方向信息确定.

    $ \left[{\begin{array}{*{20}{c}} {\delta {X_0}}\\ {\delta {Y_0}} \end{array}} \right] = \left[{\begin{array}{*{20}{c}} {\left\lfloor {{k_m}{{\vec e}_{{\theta _i}}}v \times \cos \theta } \right\rfloor }\\ {\left\lfloor {{k_m}{{\vec e}_{{\theta _i}}}v \times \sin \theta } \right\rfloor } \end{array}} \right] $

    (18)

    其中, $\lfloor\cdot \rfloor$表示向下取整, $k_m$和$k_n$是路径积分常量, $\vec{e}_{\theta_i}$是指向$\theta_i$的单位向量, $\theta$为当前头朝向, 下一时刻位置细胞的活动率是当前时刻位置细胞的活动率与残差量$\alpha_{mn}$的乘积, 残差量是位置细胞活动包的扩散作用的量化, 这个扩散作用可由残差偏置量表示, 源于网格细胞的路径积分作用, 而网格细胞的路径积分来源于条纹细胞的前向驱动作用.所以残差偏置量为

    $ \left[{\begin{array}{*{20}{c}} {\delta {X_f}}\\ {\delta {Y_f}} \end{array}} \right] = \left[{\begin{array}{*{20}{c}} {{k_m}{{\vec e}_{{\theta _i}}}v \times \cos \theta-\delta {X_0}}\\ {{k_m}{{\vec e}_{{\theta _i}}}v \times \sin \theta-\delta {Y_0}} \end{array}} \right] $

    (19)

    残差量是残差偏置量的分段函数:

    $ \alpha_{mn}=Q(\delta X_f, m-\delta X_0 )Q(\delta Y_f, n-\delta Y_0 ) $

    (20)

    $ Q(p, q) = \left\{ {\begin{array}{*{20}{l}} {1-p, }&{q = 0}\\ {p, }&{q = 1} \end{array}} \right. $

    (21)

    使用自运动线索进行路径积分在大范围的空间表达中, 不可避免地会存在误差累积.研究表明, 老鼠在遇到显著路标点时会对路径积分误差进行纠正[47], 本文引入颜色深度图像构建环境视图模板进行闭环检测, 纠正路径积分误差.

    本文采用视图模板匹配算法实现闭环检测, 利用颜色和深度图像中的扫描线强度分布(Scanline intensity profile) [32]进行视图模板匹配.扫描线强度分布是一维向量, 它是对灰度图片所有像素列强度求和并归一化的结果. 图 10 (a)图 10 (b)是一幅图像的颜色图和深度图.

    图 10  图像与扫描线强度分布图
    Fig. 10  Image and scanning line intensity distribution

    两个图像扫描线强度分布间的平均绝对强度差称为强度偏移量, 用$g(c)$表示.

    $ g(c, I^j, I^k )=\\ \qquad \frac{1}{b-|c|} \left(\sum\limits_{i=1}^{b-|c|}\left|I_{i+\max(c, 0)}^j-I_{i-\min(c, 0)}^j \right| \right) $

    (22)

    其中, $I^j$和$I^k$是被比较图像的扫描线强度分布, $c$是分布偏移(Profile shift)量, $b$是图像的宽度.

    由于图像匹配受光照影响较大, 为了减弱光照条件的影响, 提高在不同环境下的图像匹配精度, 本文采用颜色图和深度图两种图像同时匹配来确定绝对位置的方法.由于实际空间环境在不同时间段光照强度有所不同, 对颜色图和深度图的偏移量之差赋予不同的权值, 可以得到图像的匹配度度量$G$.

    $ G=\mu _R |g_{iR} (c)-g(c)|+\mu _D |g_{iD} (c)-g(c)| $

    (23)

    其中, $\mu _R$和$\mu _D$分别为颜色图和深度图的权值, 且$\mu _R$ $+$ $\mu _D=1$.

    在连续的图像中$I^j$和$I^k$像素的最小偏移量$c_m$是对两幅图像的匹配度度量$G$取最小值.

    $ c_m=\min\limits_{c \in [\rho-b, b-\rho]} (G) $

    (24)

    其中, 偏置$\rho$确保了两幅图像有一个重叠量.设定图像的比较阈值为$c_t$, 当$c_m < c_t$时, 当前视图为新的视图, 保存到视觉模板集$\{V^i \}$中, 当$c_m\geq c_t$时, 认为回到了一个重复的场景.

    本文模型构建的认知地图属于半拓扑地图, 同样建立位置细胞放电活动位置之间的拓扑关系, 由具有拓扑关系的认知点$e$组成, 认知点之间的拓扑联系由$t_{ij}$表示.每个认知点包含当前位点位置细胞放电活动$p^i$、视觉模板$V^i$以及位置间的拓扑关系.单个认知点定义为

    $ e_i=\{p^i, V^i, d^i \} $

    (25)

    1) 认知地图的构建

    设定认知阈值为$S_{th}$, 当前位置与存在的认知点中的位置比较,能够得到一个位置度量$S$.

    $ S=|p^i-p| $

    (26)

    当前认知点的位置度量超过认知阈值或者当发现新的视觉模板时, 新的认知点被创建.转换量$t_{ij}$存储由路径积分计算的位置改变量, 即

    $ t_{ij}=\{\Delta d^{ij} \} $

    (27)

    其中, $t_{ij}$形成了先前经验与新的经验点的连接关系, 新的认知点$j$可表示为

    $ e_j=\{p^j, V^j, d^i+\Delta d^{ij} \} $

    (28)

    2) 闭环处的认知地图更新

    当视图模板检测到实际的闭环点时, 认为机器人回到了相同的位置, 然而位置变量的累加量在闭环处所形成的新的经验与这个相同位置是不相匹配的, 为了达到两者的匹配, 需要在闭环处对所有的经验进行更新.

    $ \Delta d^i= \vartheta\left[\sum\limits_{j=1}^{N_f} \left(d^j-d^i-\Delta d^{ij} \right) +\right.\\ \left.\sum\limits_{k=1}^{N_t}\left(d^k-d^i-\Delta d^{ki}\right)\right] $

    (29)

    其中, $\vartheta $是一个纠正率常量, $N_f$是从认知点$e_i$到其他认知点的转移个数, $N_t$是从其他认知点到当前认知点$e_i$的转移个数.在实际的实验中取$\vartheta =0.5$, 更大取值将会导致整个地图的不稳定.整个地图的更新过程是连续的, 但在闭环处最为明显.为了保证构建地图的准确性, 只有在连续两帧图像检测到闭环时, 才对整体的认知地图进行调整.

    利用仿真和物理实验对构建的模型进行实验验证.为验证构建的细胞模型的有效性, 采用实际机器人采集的数据、真实的生理学数据和仿真实验数据进行实验验证, 生理学数据来源于Hafting等在Nature上发表的“Microstructure of a spatial map in the entorhinal cortex”中公布的老鼠在直径为1 m的圆形环境中运行的真实轨迹信息, 截取了部分轨迹用于仿真实验.仿真实验数据是让智能体(Agent)在自定义的环境中, 以0.5 m/s的速度, 朝着任意方向在直径为4 m圆形的环境中运行的速度和方向信息.真实的实验数据是利用先锋3-DX机器人与Kinect组合采集的速度、方向以及环境的颜色深度信息.

    实验采用的平台主体是先锋3-DX机器人, 移动装置是两个前轮和一个后轮, 后轮是一个小型的万向轮, 方便机器人的稳定支撑和变相.前轮配备有光电编码器, 能采集和记录机器人的移动距离.

    Kinect置于平台面板上方, 使用逆变器供电, 在机器人移动的时候, 进行RGB-D图像的采集. Kinect直接与电脑连接, 以2帧/s的速率采集RGB和DEPTH图像各一张.

    整个平台通过USB口与机器人进行通讯, 数据采集时, 使用电脑控制机器人在环境中移动, 采集速度、方向以及该位置点的图像信息.采样周期是500 ms.移动机器人平台最大移动速度设定为0.5 m/s.

    先锋机器人主要使用其自带的Aria系统框架, 上位机主要调用其通信SDK来实现对先锋机器人的控制与数据采集. Kinect主要使用开源的OpenNI2开源3D视觉框架, 进行颜色与深度图像采集.

    头朝向细胞的个数设定为360个, $\lambda_{\rm net}$是对从12 $\sim$ 52之间间隔为1的均匀分布采样. $w_0$的调节向量$a=1.1$, 学习率$k$为0.0005, 抑制性系数$B=$ $0.5$.位置细胞与视图模板比较的相关参数设定如表 1所示.

    表 1  参数设置
    参数
    $n_X=n_Y$ 32
    $k_p$ 7
    $\varphi$ 0.00002
    $\rho$ 20
    $c_t$ 1
    $S_{th}$ 1
    $\vartheta$ 0.5
    $\mu_R$ 0.65
    $\mu_D$ 0.35
    下载: 导出CSV 
    | 显示表格

    条纹间距决定网格节点的间距, 条纹朝向决定网格细胞输出权值的改变方向和速度信号的调节方向[48-49].调节条纹间距可以得到不同朝向的条纹细胞放电野, 在直径为4 m的圆形平面中, 智能体速度大小设置为0.5 m/s, 移动的时间为100 s.条纹间距为10 cm, 35 cm和50 cm, 优先朝向分别为0°, 60°和90°的条纹细胞放电率图如图 11所示.从第1行到第3行分别是10 cm, 35 cm和50 cm条纹间距放电率图, 从第1列到第3列分别对应了条纹的优先朝向.结果表明, 条纹细胞的放电野能够形成对空间特定方向位移的表达, 本文提出的计算模型能够在不同的空间尺度上对条纹细胞的放电特征进行描述, 说明了计算模型的有效性.

    图 11  不同朝向的条纹细胞的放电率图
    Fig. 11  Firing rate of stripe cells with different orientation

    条纹间距决定网格间距, 采用不同的条纹间距.将条纹细胞的条纹朝向设置为网格细胞族的放电活动能够覆盖整个平面, 记录单个网格细胞的在一个周期内的放电情况以及单个神经元在直径4 m的圆环型平面上移动的轨迹和放电情况, 可以看到, 以0.2 m/s的速度移动1 200 s后, 不同间距的单个网格细胞都可以生成六边形的放电野覆盖整个空间, 如图 12所示, 在运动轨迹上有许多放电脉冲的位置.随着变大, 网格野间距变大, 这与生理学研究中, 网格野沿着背腹侧轴网格野间距递增的生理学事实一致.单个网格细胞能够以不同的尺度周期性的表达环境, 在长时间的路径积分中, 其放电野保持六边形覆盖整个空间, 这说明了网格细胞路径积分过程中的误差累积小于半个周期的相位误差, 不足以破坏网格细胞的放电特性, 说明了计算模型的有效性与准确性.

    图 12  网格细胞的精确路径积分
    Fig. 12  Exact path integration of grid cells

    利用Hafting采集的真实老鼠数据进行位置细胞计算模型有效性检测, 截取2 s的轨迹进行仿真实验如图 13所示, 第1行分别是原始轨迹图、位置细胞放电率图和网格细胞到位置细胞权值连接图; 第2行是不同朝向和尺度的网格细胞放电率图.可以看到在平面的相应位置, 位置细胞产生了单一型的位置野, 网格细胞与位置细胞之间的权值连接, 使用放电率图表示, 特定范围内的网格细胞通过竞争学习, 选择了相应的网格子集确定了位置细胞.

    图 13  老鼠移动轨迹上网格细胞和位置细胞放电率图
    Fig. 13  The firing rate of place cells and grid cells based on mouse trajectory

    利用机器人平台对实验室10 m $\times$ 3 m的范围持续探索170秒, 实际的运动轨迹如图 14中画线部分所示.认知地图构建算法如图 15所示.

    图 14  实际物理环境扫描图
    Fig. 14  Actual physical environment scanning
    图 15  算法流程图
    Fig. 15  Algorithm flow chart

    根据表 1的相关参数设定, 构建地图的过程如图 16所示.第1行是机器人采集的里程计地图, 第2行是根据图 15所示的算法构建认知地图的过程.可以看到, 当没有检测到闭环点时, 里程计地图和认知地图并无差别, 在89 s时检测到了环境的闭环点, 认知地图在第89.5 s进行调整, 随着时间的推移, 里程计地图误差越来越大, 而认知地图因为进行了闭环检测, 越来越符合实际的活动轨迹.

    图 16  地图的构建过程
    Fig. 16  The map building process

    闭环检测与空间细胞放电重置的过程如图 17所示, 图 17 (a)为7.5 s时的认知地图和位置细胞放电率, 在89 s时, 检测到环境的闭环点(图 17 (b)), 在89.5 s时模型进行认知地图的调整(图 17 (c)), 并进行放电率重置, 值得注意的是图 17的位置细胞族放电活动与认知地图点(图中第1列画圈部分所示)并不完全一致, 这是因为位置细胞族活动表达的是机器人在环境中的相对位置.

    图 17  闭环检测与空间细胞放电重置过程
    Fig. 17  Closed loop detection and space cell discharge reset process

    本文使用条纹细胞前向驱动网格细胞吸引子进行周期性的位置表达, 使网格细胞权值调节在优先方向上不仅仅局限于四个方向, 更加具有生理学依据, 通过网格细胞的子集产生位置细胞族活动, 并通过位置细胞之间的相互作用形成了单一型的放电野, 对环境进行表达.

    先前的位置细胞计算方法中, 仅通过网格细胞子集产生的位置细胞放电野总是存在多峰值放电现象[24] (如图 18 (a)图 18 (b)图 18 (c)右图).在本文的模型中, 通过位置细胞之间的相互竞争作用产生单峰型的放电野(如图 18 (a)图 18 (b)图 18 (c)左图), 更加符合生理学研究事实.

    图 18  位置细胞相互竞争前后的放电率图
    Fig. 18  The firing rate before and after the place cell competition
    3.2.1   与RATSLAM进行实验对比

    与RATSLAM对比实验, 采用文献[50]中的数据集进行实验验证, 与文献[50]构图效果进行对比.文献[50]是第一次采用RGB-D图像作为外部信息用于RATSLAM认知地图构建, 此前昆士兰大学的Milford等多采用单彩色摄像头和全景摄像头进行数据采集.通过与文献[50]的认知地图构建结果(图 19所示)进行对比, 验证本文算法.该数据集包含了机器人在半径为35 m办公楼探索1 050 s的里程计和RGB-D图信息, 实验结果如图 20所示.

    图 19  文献[50]实验结果
    Fig. 19  Experimental results in [50]
    图 20  本文算法运行实验结果
    Fig. 20  The results of running the algorithm

    图 1920对比可以看出, 与RATSLAM相比, 本文算法同样可以精确构建出地图, 虽然数据含有严重累计误差.空间细胞的路径积分在大规模的环境表达中, 不可避免地存在累积误差, 本文通过外界的视觉线索进行闭环检测, 纠正累积误差, 生成环境精确的认知地图.与RatSLAM算法相比, 采用条纹细胞驱动网格细胞对速度和方向信号进行路径积分, 采用颜色深度图进行闭环检测, 更加符合生理学研究事实[51].

    3.2.2   与传统SLAM进行实验对比

    对比实验平台, 采用开源硬件Turtlebot2的ROS系统中自带的Navigation SLAM模块进行传统SLAM导航与本文算法作对比.实验环境16.8 m $\times$ 8.46 m的矩形走廊, 对比机器人平台Turtlebot2 (编码器、陀螺仪), Kinect传感器.设定最大速度为0.5 m/s, 围绕走廊运行2圈, 构建2D认知地图.本文算法运行平台参数设定如上文所述, 由于光照变弱, $\mu_R$设为0.55, $\mu_D$设为0.45.实验结果如图 21所示.

    图 21  第1次对比实验结果
    Fig. 21  The first comparative experimental results

    图 21所示, 两种方法构建地图并不能完全正确构建出矩形走廊地图.但本文算法效果明显优于ROS系统自带Navigation SLAM算法.根据环境分析, 可能是因为走廊环境相似度太高, 不利于算法进行闭环检测, 导致两种算法都无法正确构建环境地图.本文采用的闭环点检测的的方法是基于图像的强度分布线进行检测, 比较简单, 后期会考虑g2o闭环检测方法, 进一步研究提高其性能.

    在第二次对比实验中, 在走廊中设置了一些特定的路标(如图 22 (a)放置箱子、椅子等障碍物), 提高构建地图的准确性, 如图 22 (b)图 22 (c)所示.在加入一些特定的路标之后, 两种方法都能消除累计误差, 精确地构建出走廊的认知地图.与传统的SLAM方法相比, 在没有明显路标的环境中, 明显比ROS自带的传统SLAM方法构建的地图更加精确.

    图 22  第2次对比实验结果
    Fig. 22  The second comparative experimental results

    在计算成本方面, 虽然有些是离线数据集实验, 但是从程序完成的时间上来看, 基本可以达到实时构建的程度.考虑到目前计算环境主要是Matlab环境, 代码的运行效率较低.计算速度和成本还有很大的改进空间.

    3.3.1   仿真理论分析

    条纹细胞驱动网格细胞对速度和方向信号进行路径积分, 产生网格细胞六边形放电野覆盖机器人经过的空间环境, 对环境进行特征性表达.仿真环境下机器人的位姿信息是随机产生的速度信息和当前头朝向信息.该仿真位姿信息经过一些微分算法处理, 去除不真实的情况(例如速度、头朝向突变), 确保随机轨迹符合生物运动规律.为了评估模型对环境表达的精确性, 以网格野节点的歧义性作为衡量指标, 当网格节点偏差超过网格间距的一半时, 网格节点之间的环境表达产生歧义, 此时, 网格细胞无法对环境进行精确的表达.改变$\lambda_{\rm net}$的大小, 控制网格间距的大小, 使智能体在直径4 m的圆形环境中连续运动1 200 s, 其移动速度为0.2 m/s.

    图 23是网格间距为4 cm时单个神经元的响应图, 当设置条纹间距为4 cm时, 单个网格细胞的响应已经崩溃.其结果与图 12对比, 可以看到当网格间距大于9 cm时, 网格细胞都能够生成六边形放电野覆盖整个环境, 在运动距离达到240 m时, 仿真结果表明, 累计误差最多不超过9 cm, 体现了路径积分的精确性.

    图 23  网格间距为4 cm时单个神经元的响应图
    Fig. 23  The response of a single neuron when the grid space is 4 cm
    3.3.2   真实环境路径积分结果分析

    为了证明条纹细胞驱动网格细胞对速度和方向信号进行路径积分在实际应用中的准确性.本文设计实验在长16.8 m的走廊中, 采集实验机器人编码器以及陀螺仪数据获取真实位姿信息, 进行纯路径积分实验与利用该细胞的模型的路径积分的比较实验.为了增加实验难度, 机器人速度不设为匀速, 手动随机控制, 机器人的运行速度最大为0.5 m/s.实验如图 24所示.

    图 24  真实环境路径积分精度结果
    Fig. 24  Real environment path integral precision result

    由实验结果可得, 普通纯路径积分方法结果为$x$ $=$ $16.57$, $y=0.5642$, 基于细胞模型路径积分结果为$x=16.88$, $y=0.5835$.实际走廊长度为16.8 m, 很明显在相同数据的条件下, 基于细胞模型的路径积分精度要比普通纯路径积分高.这主要是因为在条纹细胞驱动网格细胞对速度和方向信号进行路径积分的过程中, 对于不合法或者突变的数据有一定的滤波整合效果, 在一定程度上弥补传感器以及路面不平带来的影响, 从而提高路径积分精度.但此方法也不能去除累计误差和积分漂移对路径积分带来的影响.

    本文依照海马空间细胞的环境认知机理, 采用吸引子模型对4种空间细胞进行了建模研究, 通过空间细胞的路径积分对环境的特征位点进行了表达, 利用颜色深度图进行了环境的闭环检测, 提出的方法能够构建实际物理空间的精确认知地图.通过与传统SLAM和RATSLAM对比, 本文算法在性能结果方面都不输于前者.而且本文提出的认知地图构建方法完全依据海马空间细胞的生理学研究机理, 为进一步研究机器人仿生导航方法奠定了基础.


  • 本文责任编委 徐德
  • 图  1  模型的整体结构示意图

    Fig.  1  The overall structure of the model

    图  2  空间细胞路径积分信息传递图

    Fig.  2  Space cell path integral information transfer route

    图  3  头朝向细胞的放电情况

    Fig.  3  The firing of head direction cells

    图  4  条纹细胞的基础特征

    Fig.  4  Basic characteristics of stripe cells

    图  5  条纹细胞的一维环状吸引子模型

    Fig.  5  The model of one dimensional ring attractor of stripe cell

    图  6  二维环状吸引子模型的示意图

    Fig.  6  The model of two dimensional ring attractor

    图  7  位置细胞的放电情况

    Fig.  7  The firing of place cells

    图  8  位置细胞的连续吸引子模型表达

    Fig.  8  The expression of the continuous attractor model of place cells

    图  9  位置细胞路径积分示意图

    Fig.  9  Place cell path integral

    图  10  图像与扫描线强度分布图

    Fig.  10  Image and scanning line intensity distribution

    图  11  不同朝向的条纹细胞的放电率图

    Fig.  11  Firing rate of stripe cells with different orientation

    图  12  网格细胞的精确路径积分

    Fig.  12  Exact path integration of grid cells

    图  13  老鼠移动轨迹上网格细胞和位置细胞放电率图

    Fig.  13  The firing rate of place cells and grid cells based on mouse trajectory

    图  14  实际物理环境扫描图

    Fig.  14  Actual physical environment scanning

    图  15  算法流程图

    Fig.  15  Algorithm flow chart

    图  16  地图的构建过程

    Fig.  16  The map building process

    图  17  闭环检测与空间细胞放电重置过程

    Fig.  17  Closed loop detection and space cell discharge reset process

    图  18  位置细胞相互竞争前后的放电率图

    Fig.  18  The firing rate before and after the place cell competition

    图  19  文献[50]实验结果

    Fig.  19  Experimental results in [50]

    图  20  本文算法运行实验结果

    Fig.  20  The results of running the algorithm

    图  21  第1次对比实验结果

    Fig.  21  The first comparative experimental results

    图  22  第2次对比实验结果

    Fig.  22  The second comparative experimental results

    图  23  网格间距为4 cm时单个神经元的响应图

    Fig.  23  The response of a single neuron when the grid space is 4 cm

    图  24  真实环境路径积分精度结果

    Fig.  24  Real environment path integral precision result

    表  1  参数设置

    参数
    $n_X=n_Y$ 32
    $k_p$ 7
    $\varphi$ 0.00002
    $\rho$ 20
    $c_t$ 1
    $S_{th}$ 1
    $\vartheta$ 0.5
    $\mu_R$ 0.65
    $\mu_D$ 0.35
    下载: 导出CSV
  • [1] Tolman E C. Purposive Behavior in Animals and Men. New York, USA:University of California Press, 1932.
    [2] McNaughton B L, Battaglia F P, Jensen O, Moser E I, Moser M B. Path integration and the neural basis of the "cognitive map". Nature Reviews Neuroscience, 2006, 7(8):663-678 doi: 10.1038/nrn1932
    [3] Steele R J, Morris R G. Delay-dependent impairment of a matching-to-place task with chronic and intrahippocampal infusion of the NMDA-antagonist D-AP5. Hippocampus, 1999, 9(2):118-136 doi: 10.1002/(ISSN)1098-1063
    [4] Steffenach H A, Witter M, Moser M B, Moser E I. Spatial memory in the rat requires the dorsolateral band of the entorhinal cortex. Neuron, 2005, 45(2):301-313 doi: 10.1016/j.neuron.2004.12.044
    [5] Taube J S, Kesslak J P, Cotman C W. Lesions of the rat postsubiculum impair performance on spatial tasks. Behavioral and Neural Biology, 1992, 57(2):131-143 doi: 10.1016/0163-1047(92)90629-I
    [6] O'Keefe J, Dostrovsky J. The hippocampus as a spatial map. Preliminary evidence from unit activity in the freely-moving rat. Brain Research, 1971, 34(1):171-175 doi: 10.1016/0006-8993(71)90358-1
    [7] O'Keefe J. Place units in the hippocampus of the freely moving rat. Experimental Neurology, 1976, 51(1):78-109 doi: 10.1016/0014-4886(76)90055-8
    [8] Tsao A, Moser M B, Moser E I. Traces of experience in the lateral entorhinal cortex. Current Biology, 2013, 23(5):399-405 doi: 10.1016/j.cub.2013.01.036
    [9] Taube J S, Muller R U, Ranck Jr J B. Head-direction cells recorded from the postsubiculum in freely moving rats. Ⅱ. Effects of environmental manipulations. The Journal of Neuroscience, 1990, 10(2):436-447 http://www.jneurosci.org/content/jneuro/10/2/436.full.pdf
    [10] Sharp P E. Multiple spatial/behavioral correlates for cells in the rat postsubiculum:multiple regression analysis and comparison to other hippocampal areas. Cerebral Cortex, 1996, 6(2):238-259 doi: 10.1093/cercor/6.2.238
    [11] O'Keefe J, Burgess N. Geometric determinants of the place fields of hippocampal neurons. Nature, 1996, 381(6581):425-428 doi: 10.1038/381425a0
    [12] Mittelstaedt M L, Mittelstaedt H. Homing by path integration in a mammal. Naturwissenschaften, 1980, 67(11):566-567(in German) doi: 10.1007/BF00450672
    [13] Hafting T, Fyhn M, Molden S, Moser M B, Moser E I. Microstructure of a spatial map in the entorhinal cortex. Nature, 2005, 436(7052):801-806 doi: 10.1038/nature03721
    [14] Solstad T, Moser E I, Einevoll G T. From grid cells to place cells:a mathematical model. Hippocampus, 2006, 16(12):1026-1031 doi: 10.1002/hipo.v16:12
    [15] Moser E I, Roudi Y, Witter M P, Kentros C, Bonhoeffer T, Moser M B. Grid cells and cortical representation. Nature Reviews Neuroscience, 2014, 15(7):466-481 doi: 10.1038/nrn3766
    [16] Burgess N, Barry C, O'Keefe J. An oscillatory interference model of grid cell firing. Hippocampus, 2007, 17(9):801-812 doi: 10.1002/(ISSN)1098-1063
    [17] Hasselmo M E, Giocomo L M, Zilli E A. Grid cell firing may arise from interference of theta frequency membrane potential oscillations in single neurons. Hippocampus, 2007, 17(12):1252-1271 doi: 10.1002/(ISSN)1098-1063
    [18] Si B, Romani S, Tsodyks M. Continuous attractor network model for conjunctive position-by-velocity tuning of grid cells. PLoS Computational Biology, 2014, 10(4):e1003558 doi: 10.1371/journal.pcbi.1003558
    [19] Erdem U M, Hasselmo M. A goal-directed spatial navigation model using forward trajectory planning based on grid cells. European Journal of Neuroscience, 2012, 35(6):916-931 doi: 10.1111/ejn.2012.35.issue-6
    [20] Fuhs M C, Touretzky D S. A spin glass model of path integration in rat medial entorhinal cortex. The Journal of Neuroscience, 2006, 26(16):4266-4276 doi: 10.1523/JNEUROSCI.4353-05.2006
    [21] Burak Y, Fiete I R. Accurate path integration in continuous attractor network models of grid cells. PLoS Computational Biology, 2009, 5(2):e1000291 doi: 10.1371/journal.pcbi.1000291
    [22] Krupic J, Burgess N, O'Keefe J. Neural representations of location composed of spatially periodic bands. Science, 2012, 337(6096):853-857 doi: 10.1126/science.1222403
    [23] Raudies F, Hasselmo M E. Differences in visual-spatial input may underlie different compression properties of firing fields for grid cell modules in medial entorhinal cortex. PLoS Computational Biology, 2015, 11(11):e1004596 doi: 10.1371/journal.pcbi.1004596
    [24] Yuan M L, Tian B, Shim V A, Tang H, Li H. An entorhinal-hippocampal model for simultaneous cognitive map building. In:Proceedings of the 29th AAAI Conference on Artificial Intelligence. Austin, TX:AAAI, 2015.
    [25] Grossberg S, Pilly P K. How entorhinal grid cells may learn multiple spatial scales from a dorsoventral gradient of cell response rates in a self-organizing map. PLoS Computational Biology, 2012, 8(10):e1002648 doi: 10.1371/journal.pcbi.1002648
    [26] Pilly P K, Grossberg S. Spiking neurons in a hierarchical self-organizing map model can learn to develop spatial and temporal properties of entorhinal grid cells and hippocampal place cells. PLoS One, 2013, 8(4):e60599 doi: 10.1371/journal.pone.0060599
    [27] Cuperlier N, Quoy M, Gaussier P. Neurobiologically inspired mobile robot navigation and planning. Frontiers in Neurorobotics, 2007, 1:Article No. 3
    [28] Jauffret A, Cuperlier N, Gaussier P. Multimodal integration of visual place cells and grid cells for robots navigation. In:Proceedings of the 2nd Symposium on Biology of Decision Making. Paris, France:BDM, 2012. 136-145
    [29] Milford M J, Wyeth G F, Prasser D. RatSLAM:a hippocampal model for simultaneous localization and mapping. In:Proceedings of the 2004 IEEE International Conference on Robotics and Automation. New Orleans, LA, USA:IEEE, 2004. 403-408
    [30] Milford M, Wyeth G, Prasser D. RatSLAM on the edge:revealing a coherent representation from an overloaded rat brain. In:Proceedings of the 2006 IEEE/RSJ International Conference on Intelligent Robots and Systems. Beijing, China:IEEE, 2006. 4060-4065
    [31] Milford M J, Wyeth G F. Mapping a suburb with a single camera using a biologically inspired SLAM system. IEEE Transactions on Robotics, 2008, 24(5):1038-1053 doi: 10.1109/TRO.2008.2004520
    [32] Milford M J, Wyeth G F. Single camera vision-only SLAM on a suburban road network. In:Proceedings of the 2008 IEEE International Conference on Robotics and Automation. Pasadena, CA, USA:IEEE, 2008. 3684-3689
    [33] Erdem U M, Hasselmo M E. A biologically inspired hierarchical goal directed navigation model. Journal of Physiology, Paris, 2014, 108(1):28-37 doi: 10.1016/j.jphysparis.2013.07.002
    [34] 王楠, 马书根, 李斌, 王明辉, 赵明扬.震后建筑内部层次化SLAM的地图模型转换方法.自动化学报, 2015, 41(10):1723-1733 http://www.aas.net.cn/CN/Y2015/V41/I10/1723

    Wang Nan, Ma Shu-Gen, Li Bin, Wang Ming-Hui, Zhao Ming-Yang. A model transformation of map representation for hierarchical SLAM that can be used for after-earthquake buildings. Acta Automatica Sinica, 2015, 41(10):1723-1733 http://www.aas.net.cn/CN/Y2015/V41/I10/1723
    [35] 肖云涛, 欧林林, 俞立.基于线性时序逻辑的最优巡回路径规划.自动化学报, 2014, 40(10):2126-2133 http://www.aas.net.cn/CN/Y2014/V40/I10/2126

    Xiao Yun-Tao, Ou Lin-Lin, Yu Li. Optimal patrolling path planning via linear temporal logic. Acta Automatica Sinica, 2014, 40(10):2126-2133 http://www.aas.net.cn/CN/Y2014/V40/I10/2126
    [36] 徐博, 白金磊, 郝燕玲, 高伟, 刘亚龙.多AUV协同导航问题的研究现状与进展.自动化学报, 2015, 41(3):445-461 http://www.aas.net.cn/CN/Y2015/V41/I3/445

    Xu Bo, Bai Jin-Lei, Hao Yan-Ling, Gao Wei, Liu Ya-Long. The research status and progress of cooperative navigation for multiple AUVs. Acta Automatica Sinica, 2015, 41(3):445-461 http://www.aas.net.cn/CN/Y2015/V41/I3/445
    [37] 陈成, 何玉庆, 卜春光, 韩建达.基于四阶贝塞尔曲线的无人车可行轨迹规划.自动化学报, 2015, 41(3):486-496 doi: 10.16383/j.aas.2015.c140295

    Chen Cheng, He Yu-Qing, Bu Chun-Guang, Han Jian-Da. Feasible trajectory generation for autonomous vehicles based on quartic bézier curve. Acta Automatica Sinica, 2015, 41(3):486-496 doi: 10.16383/j.aas.2015.c140295
    [38] Ranck J B. Head direction cells in the deep cell layer of dorsolateral presubiculum in freely moving rats. Electrical Activity of the Archicortex, Budapest:Akadémiai Kiadó, 1984.
    [39] Raudies F, Chapman W, Brandon P, Hasselmo M E. Head direction is coded more strongly than movement direction in a population of entorhinal neurons. Brain Research, 2015, 1621:355-367 doi: 10.1016/j.brainres.2014.10.053
    [40] Mizumori S J, Williams J D. Directionally selective mnemonic properties of neurons in the lateral dorsal nucleus of the thalamus of rats. The Journal of Neuroscience, 1993, 13(9):4015-4028 http://citeseerx.ist.psu.edu/showciting?cid=3849877
    [41] Taube J S, Muller R U, Ranck Jr J B. Head-direction cells recorded from the postsubiculum in freely moving rats. I. Description and quantitative analysis. The Journal of Neuroscience, 1990, 10(2):420-435 http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.328.9864
    [42] Knierim J J, Kudrimoti H S, McNaughton B L. Place cells, head direction cells, and the learning of landmark stability. The Journal of Neuroscience, 1995, 15(3 Pt 1):1648-1659 https://jhu.pure.elsevier.com/en/publications/place-cells-head-direction-cells-and-the-learning-of-landmark-sta-4
    [43] Kropff E, Carmichael J E, Moser M B, Moser E I. Speed cells in the medial entorhinal cortex. Nature, 2015, 523(7561):419-424 doi: 10.1038/nature14622
    [44] Juavinett A L, Callaway E M. Pattern and component motion responses in mouse visual cortical areas. Current Biology, 2015, 25(13):1759-1764 doi: 10.1016/j.cub.2015.05.028
    [45] Couey J J, Witoelar A, Zhang S J, Zheng K, Ye J, Dunn B, Czajkowski R, Moser M B, Moser E, Roudi Y, Witter M P. Recurrent inhibitory circuitry as a mechanism for grid formation. Nature Neuroscience, 2013, 16:318-324 doi: 10.1038/nn.3310
    [46] Si B L, Treves A. The role of competitive learning in the generation of dg fields from ec inputs. Cognitive Neurodynamics, 2009, 3(2):177-187 doi: 10.1007/s11571-009-9079-z
    [47] 于乃功, 王琳, 李倜, 陈焕朝.网格细胞到位置细胞的竞争型神经网络模型.控制与决策, 2015, 30(8):1372-1378 http://www.intsci.ac.cn/ai/nn.html

    Yu Nai-Gong, Wang Lin, Li Ti, Chen Huan-Zhao. Competitive neural network model from grid cells to place cells. Control and Decision, 2015, 30(8):1372-1378 http://www.intsci.ac.cn/ai/nn.html
    [48] Bonnevie T, Dunn B, Fyhn M, Hafting T, Derdikman D, Kubie J L, Roudi Y, Moser E I, Moser M B. Grid cells require excitatory drive from the hippocampus. Nature Neuroscience, 2013, 16(3):309-317 doi: 10.1038/nn.3311
    [49] Winter S S, Mehlman M L, Clark B J, Taube J S. Passive transport disrupts grid signals in the parahippocampal cortex. Current Biology, 2015, 25(19):2493-2502 doi: 10.1016/j.cub.2015.08.034
    [50] Tian B, Shim V A, Yuan M L, Srinivasan C, Tang H J, Li H Z. RGB-D based cognitive map building and navigation. In:Proceedings of the 2013 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). Tokyo, Japan:IEEE, 2013. 1562-1567
    [51] 潘超, 刘建国, 李峻林.昆虫视觉启发的光流复合导航方法.自动化学报, 2015, 41(6):1102-1112 http://www.aas.net.cn/CN/Y2015/V41/I6/1102

    Pan Chao, Liu Jian-Guo, Li Jun-Lin. An optical flow-based composite navigation method inspired by insect vision. Acta Automatica Sinica, 2015, 41(6):1102-1112 http://www.aas.net.cn/CN/Y2015/V41/I6/1102
  • 期刊类型引用(29)

    1. 李倩,聂简,黄鸿殿,孔庆宇,奔粤阳. 基于大脑海马认知机理的主从式AUV协同定位方法. 中国惯性技术学报. 2024(01): 27-33 . 百度学术
    2. 游雄,李科,田江鹏,杨剑,余岸竹,贾奋励. 机器地图信息加工模型. 武汉大学学报(信息科学版). 2024(04): 516-526 . 百度学术
    3. 高昊,王仁茂. 基于类脑仿生的环境感知技术. 舰船电子对抗. 2024(05): 42-46+55 . 百度学术
    4. 陈荟慧,钟委钊. 基于人机协作的高质量城市图像采集方法. 应用科学学报. 2023(05): 801-814 . 百度学术
    5. 朱祥维,沈丹,肖凯,马岳鑫,廖祥,古富强,余芳文,高柯夫,刘经南. 类脑导航的机理、算法、实现与展望. 航空学报. 2023(19): 6-38 . 百度学术
    6. 于乃功,廖诣深. 基于鼠脑内嗅—海马认知机制的移动机器人空间定位模型. 生物医学工程学杂志. 2022(02): 217-227 . 百度学术
    7. 刘溢,阳加远,张驰. 一种基于RTX的移动机器人实时控制平台. 电子技术与软件工程. 2022(08): 169-172 . 百度学术
    8. 于子航,王改云. 基于路径积分强化的机器人目标导向运动控制. 计算机仿真. 2022(07): 412-415+516 . 百度学术
    9. 董卫华,刘毅龙,黑巧松,杨天宇. 泛地图空间认知理论与方法研究框架. 武汉大学学报(信息科学版). 2022(12): 2007-2014 . 百度学术
    10. 阮晓钢,李鹏,朱晓庆,刘鹏飞. 基于目标导向行为和空间拓扑记忆的视觉导航方法. 计算机学报. 2021(03): 594-608 . 百度学术
    11. 赵辰豪,吴德伟,韩昆,代传金. 无环境信息下多尺度网格细胞群空间表征模型. 系统工程与电子技术. 2021(03): 814-822 . 百度学术
    12. 阮晓钢,柴洁,武悦,张晓平,黄静. 基于海马体位置细胞的认知地图构建与导航. 自动化学报. 2021(03): 666-677 . 本站查看
    13. 冀俊忠,刘金铎,邹爱笑,杨翠翠. 一种融合多源信息的脑效应连接网络蚁群学习算法. 自动化学报. 2021(04): 864-881 . 本站查看
    14. 万刚,武易天. 地图空间认知的数学基础. 测绘学报. 2021(06): 726-738 . 百度学术
    15. 洪涛,史涛,任红格. 一种改进型RatSLAM算法构建认知地图的研究. 现代计算机. 2021(21): 47-52 . 百度学术
    16. 韩昆,吴德伟,来磊. 类脑导航中基于差分Hebbian学习的网格细胞构建模型. 系统工程与电子技术. 2020(03): 674-679 . 百度学术
    17. 黄宜庆,王正刚,王徽,葛愿. 基于边缘梯度算法的多移动机器人协作地图构建. 信息与控制. 2020(01): 62-68 . 百度学术
    18. 于乃功,廖诣深,郑相国. 一种基于海马位置细胞选择机制的空间认知模型. 生物医学工程学杂志. 2020(01): 27-37 . 百度学术
    19. 胡小平,毛军,范晨,张礼廉,何晓峰,韩国良,范颖. 仿生导航技术综述. 导航定位与授时. 2020(04): 1-10 . 百度学术
    20. 于乃功,冯慧,廖诣深,郑相国. 一种基于感知速度与感知角度的网格野计算模型. 生物医学工程学杂志. 2020(05): 863-874 . 百度学术
    21. 晁丽君,熊智,杨闯,华冰,王雅婷,刘建业. 无人飞行器三维类脑SLAM自主导航方法. 飞控与探测. 2020(05): 35-43 . 百度学术
    22. 张孝伍. 图上的概率分布及位置方向信息的表征方法. 青岛理工大学学报. 2019(01): 113-121 . 百度学术
    23. 方略,何洪军. 基于鼠脑海马位置细胞与Q学习面向目标导航. 生物信息学. 2019(01): 31-38 . 百度学术
    24. 王均,凌有铸,王静. 基于特征融合的仿生SLAM算法研究. 安徽工程大学学报. 2019(02): 26-33 . 百度学术
    25. 刘建业,杨闯,熊智,赖际舟,熊骏. 无人机类脑吸引子神经网络导航技术. 导航定位与授时. 2019(05): 52-60 . 百度学术
    26. 韩昆,吴德伟,来磊,杨林. 自主导航条件下网格细胞放电模型. 电子科技大学学报. 2019(05): 711-716 . 百度学术
    27. 丛明,邹强,刘冬,杜宇. 定位细胞认知机理启发的机器人导航研究综述. 机械工程学报. 2019(23): 1-12 . 百度学术
    28. 邹强,丛明,刘冬,杜宇. 仿鼠脑海马的机器人地图构建与路径规划方法. 华中科技大学学报(自然科学版). 2018(12): 83-88 . 百度学术
    29. 吴德伟,何晶,韩昆,李卉. 无人作战平台认知导航及其类脑实现思想. 空军工程大学学报(自然科学版). 2018(06): 33-38 . 百度学术

    其他类型引用(28)

  • 加载中
  • 图(24) / 表(1)
    计量
    • 文章访问数:  2545
    • HTML全文浏览量:  561
    • PDF下载量:  792
    • 被引次数: 57
    出版历程
    • 收稿日期:  2016-06-14
    • 录用日期:  2016-11-03
    • 刊出日期:  2018-01-20

    目录

    /

    返回文章
    返回