从鸟类跨越大陆的迁徙到伦敦出租车司机穿梭于两万六千条街道,在世界中找到方向的能力是自然界最非凡的壮举之一。在哺乳动物的空间导航核心中,存在一组位于海马体的特殊神经元,被称为位置细胞。这些神经元就像一个内建的“您在此处”标记,只在动物处于环境中的特定位置时才会放电。
然而,大脑的导航系统远比任何普通地图都复杂。它是动态的、可适应的,并且高度感知情境。当你走进一间熟悉却被重新布置过的房间时,你会短暂感到迷失,直到大脑更新其内部地图。位置细胞也执行类似的过程——称为重映射——当面对新环境或不同颜色、气味、几何形状等情境线索时,它们的放电模式会发生显著变化。
这引出了神经科学中的两个基本问题:
- 位置细胞最初如何学会在哪个位置放电?
- 是什么机制使它们能够为不同情境创建新的地图——即“重映射”?
最近的一篇 NeurIPS 2024 论文《学习位置细胞表征与情境依赖的重映射》提出了一个优雅的回答。作者指出,这些复杂行为可以从一个简单规则中涌现: 神经表征应反映世界的结构。换句话说,物理空间中彼此接近的事物应激发相似的神经活动模式。
本文将探讨这一被形式化为基于相似性的目标的思想,如何让人工神经网络自行发展出位置细胞,表现出情境依赖的重映射,并揭示出一种惊人高效的机制,可即时生成新的心理地图。
大脑的内部世界: 简要背景
在分析该模型之前,让我们回顾两个关键概念。
- 位置细胞在一个称为位置野的小空间区域中变得活跃。它们的联合活动形成了环境的神经地图。
- 重映射指的是当环境或情境改变时,这些位置野的变化。在全局重映射中,整个地图重新组织——在房间A中活跃的神经元可能在房间B中静默,而其他神经元则在新的位置放电。
几十年来,神经科学家提出了不同的机制——从网格细胞或边界细胞继承模式,到复杂的吸引子网络动力学。近来,规范模型重新定义了这一问题: 与其复制生物回路,不如定义一个代表系统目标的目标函数,训练网络满足该目标,并观察是否会出现类脑行为。
这项新工作延续了这一传统,采用了一个极简但具有生物学合理性的目标。
核心思想: 通过比较相似性来学习
作者提出,空间表征应保留相对距离: 现实世界中相近的点在神经空间中也应相近,远离的点则应相距甚远。这一思想被编码在一个基于相似性的目标函数中。
图1: 外部世界 (空间与情境) 的相似性与神经表征的相似性相匹配,可在人工网络中形成类似位置细胞的单元。
设想一个神经网络,其对位置 \( \mathbf{x} \) 的输出是一个发放率向量,即群体向量 \( \mathbf{p}(\mathbf{x}) \)。损失函数 \( \mathcal{L} \) 鼓励两种关系:
目标相似性:
\( \beta + (1 - \beta) e^{ -\frac{1}{2\sigma^2}|\mathbf{x}_t - \mathbf{x}_{t'}|^2 } \)
该高斯项定义了两个物理位置应当有多相似。邻近点具有高相似度;远处点趋向于基线相似度 \( \beta \)。尺度参数 \( \sigma \) 决定“邻近”的范围。非零 \( \beta \) 防止远点完全正交,增加了表征灵活性,类似高维随机向量。学习到的相似性:
\( e^{ -|\mathbf{p}(\mathbf{z}_t) - \mathbf{p}(\mathbf{z}_{t'})|^2 } \)
衡量网络对两个位置活动模式的相似程度。网络通过对数千对点对齐学习到的相似性与目标相似性来最小化 \( \mathcal{L} \)。
一个正则项 \( \lambda|\mathbf{p}(\mathbf{z}_t)|^2 \) 防止过度放电,确保编码高效。
扩展到情境
位置细胞不仅编码几何信息,也对环境情境产生响应。作者将目标扩展为包含一个标量情境变量 \( c \),要求在空间和情境上同时保持相似性。只有两个点在位置和情境上都相近时,才认为它们相似。利用这一联合目标训练网络,可以让它为不同情境学习不同的地图——这正是重映射的核心。
从简单规则到复杂类脑行为
研究人员基于此原则训练了两种神经网络架构:
- 一个前馈 (FF) 网络,直接接收笛卡尔坐标输入;
- 一个循环 (RNN) 网络,通过随时间积分速度信号来推断位置 (类似生物路径整合过程) 。
学习位置细胞
当前馈网络在纯空间目标上训练时,它很快最小化了损失并产生在特定空间位置放电的单元——人工位置细胞。
图2: 前馈网络学习到类似位置细胞的发放野,并形成精确的空间内部地图。
通过调整 \( \sigma \) 和 \( \beta \),研究人员可控制位置野大小和多位置行为。重要的是,解码测试表明网络活动能准确重建空间位置,证明其形成了功能性内部地图。
全局重映射的出现
引入情境信号后,神经元的放电模式发生显著变化,表现出与海马体中全局重映射相同的特征。
图3: 加入情境信号后,产生了各自独立的空间地图。每个情境都唤起一个新的“世界”,类似于海马体的全局重映射。
部分单元出现多个位置野,部分则完全静默,不同情境间的空间相关性降至近零——这一现象与生物实验观察高度一致。
循环网络与路径整合
为进一步验证生物学合理性,作者训练了一个仅接收速度输入并须通过累积运动来推断位置的循环神经网络。
图4: 循环网络学习到类似位置细胞与带状细胞的单元,实现路径整合,并将表征组织成结构化的认知地图。
循环网络与前馈模型一样成功地完成任务,生成局域化的位置细胞与细长的带状细胞——另一种海马体中的已知模式。它能够准确执行路径整合,在长时间轨迹中保持稳定的位置估计。采用 UMAP 进行降维后,发现网络在不同情境下形成结构化的流形,即直接被神经活动编码的认知地图。
新角度: 将重映射视为高维旋转
最后的洞见或许最为引人注目。由于相似性目标仅依赖群体向量之间的距离,因此它对正交变换保持不变。意味着学习到的表征可以在高维空间中进行旋转、反射或置换,而不破坏目标约束。
图5: 将重映射解释为正交变换。旋转或置换已学习的地图可产生新的、有效但不相关的地图——为自适应重用提供机制。
作者将随机正交变换应用于已训练的表征。新地图保留相似性结构但与原图不相关——有效地实现了全局重映射。此外,当他们计算一个最佳拟合正交变换以对齐两个情境的表征时,结果与学习到的地图几乎完全重合。
这暗示生物学上的重映射可能并非重新学习,而是通过在神经空间中旋转已有地图实现的——一种高效的表征重用机制。同样的原则甚至可以将已学地图扩展到未探索的区域,而无需额外训练。
结论: 一个简单原则造就复杂大脑
本研究为海马体空间系统的关键特征提供了统一而简约的解释。通过使神经相似性反映环境相似性,该模型自然地学会了:
- 发展出具有局域放电野的位置细胞;
- 展现出跨情境的全局重映射;
- 实现利用循环动力学的路径整合;
- 组织认知为结构化的低维地图。
更令人惊讶的是,模型揭示重映射可能通过正交变换实现——这是一种计算上高效的方式,用以重用已有知识并生成新表征。尽管该框架简化且基于发放率,但它展示了一个极小约束如何能够产生丰富而适应性的类脑行为。
大脑的GPS或许并非依赖复杂的层级规则,而是基于一个优雅的理念:** 相似性塑造我们的心理地图。**