引言: 隐形世界与铁三角

人类的视觉是三色视觉;我们通过混合红、绿、蓝来感知世界。然而,物理世界要丰富得多。每种材料都会在连续的波长光谱上与光发生相互作用,产生一种肉眼看不见的独特“指纹”。 高光谱成像 (Hyperspectral Imaging, HSI) 正是让我们能够看到这些指纹的技术。通过捕获数百个光谱波段而不仅仅是三个,HSI 可以实时区分真假植物、检测组织病变或对矿物进行分类。

然而,传统的高光谱成像面临着一个根本性的瓶颈,通常被称为权衡取舍的“铁三角”:

  1. 光谱分辨率 (Spectral Resolution): 颜色波段有多精细?
  2. 时间分辨率 (Temporal Resolution): 捕获图像的速度有多快?
  3. 数据带宽 (Data Bandwidth): 我们需要处理和存储多少数据?

传统上,你只能三选其二,很少能兼得。扫描系统提供高细节但速度慢 (不适合移动物体) 。快照系统速度快但分辨率低。两者都会产生大量冗余数据。

一篇名为 《Active Hyperspectral Imaging Using an Event Camera》 (基于事件相机的主动高光谱成像) 的新论文提出了一种激进的解决方案来打破这种僵局。通过结合主动照明 (受控光源) 与事件相机 (一种受生物学启发的传感器) ,研究人员开发出了一种系统,能够以视频速率 (高达 30 FPS) 捕获高质量的高光谱数据,而所需带宽仅为传统方法的一小部分。

在这篇深度文章中,我们将探讨该系统的工作原理、将“事件”转化为“光谱”背后的数学原理,以及它所取得的惊人成果。

图 1: 提出的基于事件的主动高光谱成像系统。(a) 物理原型。(b) 展示“扫掠彩虹”的工作原理。(c) 重建结果。(d) 光谱精度验证。(e) 重建的高光谱切片。

背景: 从帧到事件的转变

要理解这篇论文的重要性,我们首先需要了解其核心传感器: 事件相机 (Event Camera)

帧的问题

传统相机是“基于帧”的。它们打开快门,记录传感器上每个像素的强度,通常每秒记录 30 或 60 次。如果你拍摄的是静态场景,相机就会浪费地一遍又一遍记录完全相同的数据。这种冗余是效率的大敌,尤其是在数据量本就庞大的高光谱成像中 (3D 数据立方体: \(Height \times Width \times Wavelength\)) 。

事件相机解决方案

事件相机 (也称为动态视觉传感器) 的工作方式不同。每个像素都是独立且异步运行的。只有当像素检测到亮度的显著变化 (对数强度) 时,它才会发送数据 (一个“事件”) 。如果没有变化,像素就保持静默。

这带来了以下优势:

  • 微秒级时间分辨率: 变化发生的瞬间即被报告。
  • 低带宽: 静态背景产生零数据。
  • 高动态范围: 它们可以同时处理非常暗和非常亮的场景。

然而,挑战在于事件相机只报告亮度的变化,而不是绝对颜色 (波长) 。研究人员必须想办法将颜色信息编码进亮度变化中。

核心方法: “扫掠彩虹”

研究人员的关键见解非常巧妙: 如果我们控制照射到场景的光线,我们可以强制颜色表现为随时间变化的亮度。

光学架构

该系统不再使用被动相机来观察静态场景,而是使用主动照明 。 他们构建了一个定制的光学装置,充当“光谱扫描仪”。

图 2: 系统光路示意图。光线穿过狭缝和光栅分散成光谱,然后照射到旋转镜阵列上扫过场景。

图 2 展示了光路的分步过程:

  1. 光源: 一个白点光源通过透镜准直 (变为平行光) 。
  2. 色散: 光线穿过狭缝和闪耀光栅 (Blazed Grating) 。 这就像棱镜一样,将白光分解成其组成的波长 (一道彩虹) 。
  3. 扫描: 分散的光线照射到旋转镜阵列上。随着镜子旋转,它们引导“彩虹”光束扫过场景。
  4. 捕获: 光线从物体反射回来并被事件相机捕获。

时空-光谱编码

想象一下相机上的一个像素正对着花朵上的某一点。当镜子旋转时,“彩虹”扫过该点。

  • 首先,该像素被 400nm (紫) 光照射。
  • 几毫秒后,它被 500nm (绿) 光照射。
  • 然后是 600nm (红) ,依此类推。

由于不同材料对不同波长的反射效率不同,随着照明颜色的变化,反射回相机的光线强度也会发生变化。

  • 如果是红花,当彩虹的紫色部分照射到它时,它反射的光很少 (低强度) 。
  • 当彩虹的红色部分照射到它时,它反射大量的光 (高强度) 。

这种从暗到亮的快速变化会触发事件相机。 事件的时间戳告诉我们那一刻照亮像素的是哪种波长。 通过知道镜子的速度,系统将时间直接映射到波长

图 4: 照明的时间演变。随着时间的推移,不同的窄带照明扫过场景的不同位置。

如图 4 所示,“扫掠彩虹”建立了时间 (\(\tau\)) 和波长 (\(\lambda\)) 之间的确定性关系。

数学框架: 解开光谱谜题

硬件提供了事件流。目标是将这些事件转化为高光谱图像 (HSI)。这需要一个稳健的数学模型。

1. 成像模型

首先,我们定义特定像素 \((x, y)\) 在时间 \(\tau\) 的强度 \(I\)。这个强度取决于三件事:

  1. 相机传感器的光谱响应,\(D(\lambda)\)。
  2. 物体的未知反射率 (我们要寻找的) ,\(R(\lambda)\)。
  3. 照明模式,\(L(\lambda, \tau)\)。

这种关系表示为所有波长的积分:

公式 5: 强度方程定义为传感器响应、场景反射率和照明的积分。

这里,\(S(\lambda)\) 代表我们想要重建的真实高光谱图像。为了让计算机能够求解,我们将连续光谱离散化为 \(M\) 个不同的波段 (例如,从 400nm 到 760nm 的 72 个通道) 。这变成了求和:

公式 6: 对 M 个光谱波段求和的离散化强度方程。

我们可以通过将已知量 (照明和传感器响应) 分组为系数向量 \(\boldsymbol{a}_\tau\) 并将未知光谱值分组为向量 \(\boldsymbol{x}\) 来简化这一点。

公式 9: 强度的简化向量表示法。

2. 事件约束

现在我们引入事件相机物理学。当对数强度变化达到阈值 \(C\) 时,就会触发事件。如果在时间 \(\tau_k\) 发生事件,它与 \(\tau_{k-1}\) 的前一个事件的关系如下:

公式 10: 当前事件时间和前一个事件时间的强度之间的关系。

该方程表明,新强度等于旧强度乘以由阈值 \(C\) 和极性 \(\sigma\) (亮度是上升还是下降) 决定的因子。

3. 零光谱向量

通过重新排列事件方程中的项,研究人员推导出了一个强大的概念,称为零光谱向量 (Null Spectrum Vector) , 表示为 \(\boldsymbol{n}_k\)。

公式 11: 零光谱向量的定义。

由于 \(\boldsymbol{n}_k\) 与未知光谱 \(\boldsymbol{x}\) 的点积必须等于零:

公式 12: 零向量与光谱向量之间的正交约束。

这个方程是重建的核心引擎。相机产生的每一个事件都提供了一个垂直于真实光谱的新向量 \(\boldsymbol{n}_k\)。如果我们收集到足够多的事件 (足够多的向量) ,我们就可以从数学上精确地缩小 \(\boldsymbol{x}\) (光谱) 的范围。

4. 克服模糊和噪声

仅使用零光谱向量求解 \(\boldsymbol{x}\) 有一个问题: 它只给出相对强度,而不是绝对值。为了解决这个问题,研究人员在装置中添加了一个恒定的“偏置”光 \(c\)。这增强了向量并锚定了解决方案。

他们将重建公式化为最小二乘最小化问题:

公式 16: 求解 x 的最小化问题。

然而,原始数据是有噪声的。直接使用奇异值分解 (SVD) 等技术求解可能会导致物理上不可能的结果 (如负光强) 或“幻觉”,即算法在事件之间的间隙中进行疯狂猜测。

为了确保高质量的重建,作者引入了三个关键约束:

  1. 非负约束 (Non-negative Constraint): 光强不能小于零。 公式 17: 非负约束。
  2. 抗漂移正则化 (Anti-Drift Regularization, \(R_{int}\)): 确保强度在事件之间平滑变化,不会漫无目的地漂移。 公式 18: 抗漂移正则化项。
  3. 光谱平滑度 (Spectral Smoothness, \(R_{spec}\)): 自然光谱 (如花朵上的颜色) 倾向于在波长上平滑变化,而不是不规则地出现尖峰。该项惩罚光谱域中的高频噪声。 公式 20: 光谱平滑度正则化项。

最终算法求解一个受约束的优化问题,该问题平衡了来自事件的数据与这些物理现实。

公式 22: 结合数据保真度和正则化项的最终总优化函数。

下面的消融实验生动地说明了这些约束的重要性。没有它们,重建就会遭受伪影、噪声或不稳定的影响。

图 3: 显示不同约束影响的消融研究。(a) 无非负约束。(b) 无平滑度。(c) 无抗漂移。(d) 提出的完整方法。

实验与结果

研究人员构建了一个原型,并将其与几种最先进的方法进行了对比,包括基于帧的系统和“快照”压缩成像系统 (CASSI)。

1. 高频光谱精度

最难捕获的东西之一是具有尖锐峰值 (高频) 的光谱。研究人员投射了一个彩虹图案来测试这一点。

图 5: 高频彩虹图案的重建。(b) 提出的方法捕获了基于基的方法 (c) 所平滑掉的锐利光谱过渡。

如图 5 所示,传统的基于基的方法 (c) 倾向于模糊彩虹的清晰线条,因为它们假设光谱总是平滑的。提出的基于事件的方法 (b) 几乎像全带宽帧相机一样好地捕获了锐利的过渡,但数据量要少得多。

2. 色彩保真度 (ColorChecker)

使用标准的 X-Rite ColorChecker 色卡,该系统展示了很高的定量精度。RMS (均方根) 误差在各种色块上都很低,证明“扫掠彩虹”技术能够正确识别标准颜色。

图 6: 在 ColorChecker 上的定量评估。图表显示重建的光谱 (实线) 与地面实况 (虚线) 紧密匹配。

3. 同色异谱: 雏菊测试

同色异谱 (Metamerism) 是指两种颜色在人眼 (或 RGB 相机) 看来完全相同,但具有完全不同的光谱组成。研究人员将一朵真雏菊放在一朵假雏菊旁边。肉眼看去,它们非常相似。

图 7: 对同色异谱样本 (真假雏菊) 的评估。(b) 光谱图显示假花 (左) 与真花 (右) 具有不同的曲线,系统成功检测到了这一点。

在图 7 中,系统成功区分了两者。“Ours”线 (黑色实线) 紧跟真花和假花的地面实况 (红色虚线) ,揭示了标准相机会遗漏的反射率上的细微生物学差异。

4. “杀手级特性”: 动态场景

使用事件相机的主要动机是速度。传统的高光谱扫描需要几秒钟,这使得捕获移动物体成为不可能。

该系统以 10-30 FPS 的速度捕获高光谱数据。图 8 展示了一张移动的珠光纸 (变色纸) 。纸上的颜色随视角而变化。随着纸张移动,光谱特性迅速变化。

图 8: 移动珠光贴纸的实时高光谱成像。系统在快速移动的物体上捕获了有效的光谱数据。

系统实时重建了变化的光谱,没有出现会困扰传统扫描狭缝相机的运动模糊或“果冻效应” (倾斜) 。

结论与未来展望

这项研究标志着计算成像领域向前迈出的重要一步。通过重新思考数据采集流程——从改变传感器 (扫描) 转变为改变光线 (主动照明) ,并使用检测变化而非绝对值的传感器——作者打破了“铁三角”。

主要收获:

  • 效率: 与基于帧的方法相比,该系统实现了 59.53% 的带宽减少
  • 速度: 它实现了实时 HSI 捕获 (高达 30 FPS) ,为 HSI 在机器人技术、自动驾驶和工业分拣中的应用打开了大门。
  • 灵活性: 光谱分辨率由数学和光学定义,而非传感器像素布局,从而允许高分辨率的光谱重建。

虽然该系统目前需要黑暗环境 (以控制主动光) 并且尚未考虑复杂的光线相互作用 (如相互反射) ,但它证明了事件相机不仅仅用于运动追踪——它们是多维科学成像的强大工具。这种光子学与神经形态传感的融合很可能会激发新一代相机的诞生,它们不仅看世界更快,而且能看到我们只能想象的“色彩”。