打破色彩的速度限制——事件相机如何彻底改变高光谱成像

引言: 隐形世界与铁三角

人类的视觉是三色视觉；我们通过混合红、绿、蓝来感知世界。然而，物理世界要丰富得多。每种材料都会在连续的波长光谱上与光发生相互作用，产生一种肉眼看不见的独特“指纹”。 高光谱成像 (Hyperspectral Imaging, HSI) 正是让我们能够看到这些指纹的技术。通过捕获数百个光谱波段而不仅仅是三个，HSI 可以实时区分真假植物、检测组织病变或对矿物进行分类。

然而，传统的高光谱成像面临着一个根本性的瓶颈，通常被称为权衡取舍的“铁三角”:

光谱分辨率 (Spectral Resolution): 颜色波段有多精细？
时间分辨率 (Temporal Resolution): 捕获图像的速度有多快？
数据带宽 (Data Bandwidth): 我们需要处理和存储多少数据？

传统上，你只能三选其二，很少能兼得。扫描系统提供高细节但速度慢 (不适合移动物体) 。快照系统速度快但分辨率低。两者都会产生大量冗余数据。

一篇名为 《Active Hyperspectral Imaging Using an Event Camera》 (基于事件相机的主动高光谱成像) 的新论文提出了一种激进的解决方案来打破这种僵局。通过结合主动照明 (受控光源) 与事件相机 (一种受生物学启发的传感器) ，研究人员开发出了一种系统，能够以视频速率 (高达 30 FPS) 捕获高质量的高光谱数据，而所需带宽仅为传统方法的一小部分。

在这篇深度文章中，我们将探讨该系统的工作原理、将“事件”转化为“光谱”背后的数学原理，以及它所取得的惊人成果。

图 1: 提出的基于事件的主动高光谱成像系统。(a) 物理原型。(b) 展示“扫掠彩虹”的工作原理。(c) 重建结果。(d) 光谱精度验证。(e) 重建的高光谱切片。

背景: 从帧到事件的转变

要理解这篇论文的重要性，我们首先需要了解其核心传感器: 事件相机 (Event Camera) 。

帧的问题

传统相机是“基于帧”的。它们打开快门，记录传感器上每个像素的强度，通常每秒记录 30 或 60 次。如果你拍摄的是静态场景，相机就会浪费地一遍又一遍记录完全相同的数据。这种冗余是效率的大敌，尤其是在数据量本就庞大的高光谱成像中 (3D 数据立方体: \(Height \times Width \times Wavelength\)) 。

事件相机解决方案

事件相机 (也称为动态视觉传感器) 的工作方式不同。每个像素都是独立且异步运行的。只有当像素检测到亮度的显著变化 (对数强度) 时，它才会发送数据 (一个“事件”) 。如果没有变化，像素就保持静默。

这带来了以下优势:

微秒级时间分辨率: 变化发生的瞬间即被报告。
低带宽: 静态背景产生零数据。
高动态范围: 它们可以同时处理非常暗和非常亮的场景。

然而，挑战在于事件相机只报告亮度的变化，而不是绝对颜色 (波长) 。研究人员必须想办法将颜色信息编码进亮度变化中。

核心方法: “扫掠彩虹”

研究人员的关键见解非常巧妙: 如果我们控制照射到场景的光线，我们可以强制颜色表现为随时间变化的亮度。

光学架构

该系统不再使用被动相机来观察静态场景，而是使用主动照明 。他们构建了一个定制的光学装置，充当“光谱扫描仪”。

图 2: 系统光路示意图。光线穿过狭缝和光栅分散成光谱，然后照射到旋转镜阵列上扫过场景。

图 2 展示了光路的分步过程:

光源: 一个白点光源通过透镜准直 (变为平行光) 。
色散: 光线穿过狭缝和闪耀光栅 (Blazed Grating) 。这就像棱镜一样，将白光分解成其组成的波长 (一道彩虹) 。
扫描: 分散的光线照射到旋转镜阵列上。随着镜子旋转，它们引导“彩虹”光束扫过场景。
捕获: 光线从物体反射回来并被事件相机捕获。

时空-光谱编码

想象一下相机上的一个像素正对着花朵上的某一点。当镜子旋转时，“彩虹”扫过该点。

首先，该像素被 400nm (紫) 光照射。
几毫秒后，它被 500nm (绿) 光照射。
然后是 600nm (红) ，依此类推。

由于不同材料对不同波长的反射效率不同，随着照明颜色的变化，反射回相机的光线强度也会发生变化。

如果是红花，当彩虹的紫色部分照射到它时，它反射的光很少 (低强度) 。
当彩虹的红色部分照射到它时，它反射大量的光 (高强度) 。

这种从暗到亮的快速变化会触发事件相机。 事件的时间戳告诉我们那一刻照亮像素的是哪种波长。 通过知道镜子的速度，系统将时间直接映射到波长。

图 4: 照明的时间演变。随着时间的推移，不同的窄带照明扫过场景的不同位置。

如图 4 所示，“扫掠彩虹”建立了时间 (\(\tau\)) 和波长 (\(\lambda\)) 之间的确定性关系。

数学框架: 解开光谱谜题

硬件提供了事件流。目标是将这些事件转化为高光谱图像 (HSI)。这需要一个稳健的数学模型。

1. 成像模型

首先，我们定义特定像素 \((x, y)\) 在时间 \(\tau\) 的强度 \(I\)。这个强度取决于三件事:

相机传感器的光谱响应，\(D(\lambda)\)。
物体的未知反射率 (我们要寻找的) ，\(R(\lambda)\)。
照明模式，\(L(\lambda, \tau)\)。

这种关系表示为所有波长的积分:

公式 5: 强度方程定义为传感器响应、场景反射率和照明的积分。

这里，\(S(\lambda)\) 代表我们想要重建的真实高光谱图像。为了让计算机能够求解，我们将连续光谱离散化为 \(M\) 个不同的波段 (例如，从 400nm 到 760nm 的 72 个通道) 。这变成了求和:

公式 6: 对 M 个光谱波段求和的离散化强度方程。

我们可以通过将已知量 (照明和传感器响应) 分组为系数向量 \(\boldsymbol{a}_\tau\) 并将未知光谱值分组为向量 \(\boldsymbol{x}\) 来简化这一点。

公式 9: 强度的简化向量表示法。

2. 事件约束

现在我们引入事件相机物理学。当对数强度变化达到阈值 \(C\) 时，就会触发事件。如果在时间 \(\tau_k\) 发生事件，它与 \(\tau_{k-1}\) 的前一个事件的关系如下:

公式 10: 当前事件时间和前一个事件时间的强度之间的关系。

该方程表明，新强度等于旧强度乘以由阈值 \(C\) 和极性 \(\sigma\) (亮度是上升还是下降) 决定的因子。

3. 零光谱向量

通过重新排列事件方程中的项，研究人员推导出了一个强大的概念，称为零光谱向量 (Null Spectrum Vector) , 表示为 \(\boldsymbol{n}_k\)。

公式 11: 零光谱向量的定义。

由于 \(\boldsymbol{n}_k\) 与未知光谱 \(\boldsymbol{x}\) 的点积必须等于零:

公式 12: 零向量与光谱向量之间的正交约束。

这个方程是重建的核心引擎。相机产生的每一个事件都提供了一个垂直于真实光谱的新向量 \(\boldsymbol{n}_k\)。如果我们收集到足够多的事件 (足够多的向量) ，我们就可以从数学上精确地缩小 \(\boldsymbol{x}\) (光谱) 的范围。

4. 克服模糊和噪声

仅使用零光谱向量求解 \(\boldsymbol{x}\) 有一个问题: 它只给出相对强度，而不是绝对值。为了解决这个问题，研究人员在装置中添加了一个恒定的“偏置”光 \(c\)。这增强了向量并锚定了解决方案。

他们将重建公式化为最小二乘最小化问题:

公式 16: 求解 x 的最小化问题。

然而，原始数据是有噪声的。直接使用奇异值分解 (SVD) 等技术求解可能会导致物理上不可能的结果 (如负光强) 或“幻觉”，即算法在事件之间的间隙中进行疯狂猜测。

为了确保高质量的重建，作者引入了三个关键约束:

非负约束 (Non-negative Constraint): 光强不能小于零。
抗漂移正则化 (Anti-Drift Regularization, \(R_{int}\)): 确保强度在事件之间平滑变化，不会漫无目的地漂移。
光谱平滑度 (Spectral Smoothness, \(R_{spec}\)): 自然光谱 (如花朵上的颜色) 倾向于在波长上平滑变化，而不是不规则地出现尖峰。该项惩罚光谱域中的高频噪声。

最终算法求解一个受约束的优化问题，该问题平衡了来自事件的数据与这些物理现实。

公式 22: 结合数据保真度和正则化项的最终总优化函数。

下面的消融实验生动地说明了这些约束的重要性。没有它们，重建就会遭受伪影、噪声或不稳定的影响。

图 3: 显示不同约束影响的消融研究。(a) 无非负约束。(b) 无平滑度。(c) 无抗漂移。(d) 提出的完整方法。

实验与结果

研究人员构建了一个原型，并将其与几种最先进的方法进行了对比，包括基于帧的系统和“快照”压缩成像系统 (CASSI)。

1. 高频光谱精度

最难捕获的东西之一是具有尖锐峰值 (高频) 的光谱。研究人员投射了一个彩虹图案来测试这一点。

图 5: 高频彩虹图案的重建。(b) 提出的方法捕获了基于基的方法 (c) 所平滑掉的锐利光谱过渡。

如图 5 所示，传统的基于基的方法 (c) 倾向于模糊彩虹的清晰线条，因为它们假设光谱总是平滑的。提出的基于事件的方法 (b) 几乎像全带宽帧相机一样好地捕获了锐利的过渡，但数据量要少得多。

2. 色彩保真度 (ColorChecker)

使用标准的 X-Rite ColorChecker 色卡，该系统展示了很高的定量精度。RMS (均方根) 误差在各种色块上都很低，证明“扫掠彩虹”技术能够正确识别标准颜色。

图 6: 在 ColorChecker 上的定量评估。图表显示重建的光谱 (实线) 与地面实况 (虚线) 紧密匹配。

3. 同色异谱: 雏菊测试

同色异谱 (Metamerism) 是指两种颜色在人眼 (或 RGB 相机) 看来完全相同，但具有完全不同的光谱组成。研究人员将一朵真雏菊放在一朵假雏菊旁边。肉眼看去，它们非常相似。

图 7: 对同色异谱样本 (真假雏菊) 的评估。(b) 光谱图显示假花 (左) 与真花 (右) 具有不同的曲线，系统成功检测到了这一点。

在图 7 中，系统成功区分了两者。“Ours”线 (黑色实线) 紧跟真花和假花的地面实况 (红色虚线) ，揭示了标准相机会遗漏的反射率上的细微生物学差异。

4. “杀手级特性”: 动态场景

使用事件相机的主要动机是速度。传统的高光谱扫描需要几秒钟，这使得捕获移动物体成为不可能。

该系统以 10-30 FPS 的速度捕获高光谱数据。图 8 展示了一张移动的珠光纸 (变色纸) 。纸上的颜色随视角而变化。随着纸张移动，光谱特性迅速变化。

图 8: 移动珠光贴纸的实时高光谱成像。系统在快速移动的物体上捕获了有效的光谱数据。

系统实时重建了变化的光谱，没有出现会困扰传统扫描狭缝相机的运动模糊或“果冻效应” (倾斜) 。

结论与未来展望

这项研究标志着计算成像领域向前迈出的重要一步。通过重新思考数据采集流程——从改变传感器 (扫描) 转变为改变光线 (主动照明) ，并使用检测变化而非绝对值的传感器——作者打破了“铁三角”。

主要收获:

效率: 与基于帧的方法相比，该系统实现了 59.53% 的带宽减少 。
速度: 它实现了实时 HSI 捕获 (高达 30 FPS) ，为 HSI 在机器人技术、自动驾驶和工业分拣中的应用打开了大门。
灵活性: 光谱分辨率由数学和光学定义，而非传感器像素布局，从而允许高分辨率的光谱重建。

虽然该系统目前需要黑暗环境 (以控制主动光) 并且尚未考虑复杂的光线相互作用 (如相互反射) ，但它证明了事件相机不仅仅用于运动追踪——它们是多维科学成像的强大工具。这种光子学与神经形态传感的融合很可能会激发新一代相机的诞生，它们不仅看世界更快，而且能看到我们只能想象的“色彩”。

引言: 隐形世界与铁三角#

背景: 从帧到事件的转变#

帧的问题#

事件相机解决方案#

核心方法: “扫掠彩虹”#

光学架构#

时空-光谱编码#

数学框架: 解开光谱谜题#

1. 成像模型#

2. 事件约束#

3. 零光谱向量#

4. 克服模糊和噪声#

实验与结果#

1. 高频光谱精度#

2. 色彩保真度 (ColorChecker)#

3. 同色异谱: 雏菊测试#

4. “杀手级特性”: 动态场景#

结论与未来展望#