解决鬼影问题: 如何从复用单光子探测器中重建图像
想象一下在几乎全黑的环境中拍照,光线极其稀缺,以至于你需要计算撞击传感器的单个粒子——光子。这就是单光子探测器的领域。这些设备正在彻底改变从生物成像、激光雷达到量子光学等各个领域。
在这些设备中,超导纳米线单光子探测器 (SNSPD) 是黄金标准。它们提供令人难以置信的效率和精度。然而,它们面临一个主要的扩展问题: 它们需要被冷却到低温环境。如果你想要一个百万像素的相机,你不可能在不引入过多热量的情况下,从深冷恒温器中引出一百万根导线。
为了解决这个问题,工程师们使用了一种叫做读出复用 (readout multiplexing) 的巧妙布线方案,这减少了所需的线缆数量。但这种硬件修正引入了一个新的软件问题: 模糊性 (ambiguity) 。当多个光子同时击中传感器时,布线会产生“鬼影”信号,使得无法确切知道光子落在了哪里。
在波士顿大学的一篇题为 Image Reconstruction from Readout-Multiplexed Single-Photon Detector Arrays 的精彩论文中,研究人员提出了一种复杂的计算方法来解决这一难题。通过将图像形成视为一个概率逆问题,他们开发了一种“多光子估计器” (Multiphoton Estimator) ,可以解开这些幽灵般的信号,生成比传统方法更清晰、更快速的图像。
在这篇文章中,我们将剖析读出复用的问题,解释新估计器背后的数学原理,并探讨这种方法如何推动低光成像的边界。
硬件瓶颈: 为什么要复用?
要理解解决方案,我们首先需要理解硬件限制。在标准的数码相机中,每个像素都可以单独读取。在超导阵列中,对于大型阵列来说,为每个像素运行一根专用导线在热学上是不可能的。
一个常见的解决方案是行列复用 (Row-Column Multiplexing) 。与其读取每个像素 (\(n^2\) 根线) ,不如只读取行和列 (\(2n\) 根线) 。
- 如果一个光子击中像素 \((2, 3)\),读出信号会显示“第 2 行触发”和“第 3 列触发”。
- 通过交叉这些线,我们知道光子击中了 \((2, 3)\)。
只要光子一个接一个地到达,这就完美运作。
模糊性问题
当光线变强时麻烦就开始了。如果两个光子同时到达不同的位置,读出结果就会变得模糊。
考虑一个简单的 \(2 \times 2\) 像素阵列。

如上图 Figure 2 所示,请看红框中的事件 (事件 \(E_9\) 到 \(E_{15}\)) 。 如果读出显示 第 1 和 2 行触发 并且 第 1 和 2 列触发 , 我们就有问题了。这种读出可能是由以下原因引起的:
- 光子在 \((1,1)\) 和 \((2,2)\)。
- 光子在 \((1,2)\) 和 \((2,1)\)。
- 光子在三个角落。
- 光子在所有四个角落。
硬件对所有这些不同的物理事件给出了相同的信号。这就是适定性不佳的逆问题 (ill-posed inverse problem) 。
传统解决方案及其缺陷
历史上,研究人员主要使用两种策略来处理这个问题,这两种策略都不是最理想的:
- 朴素估计器 (Naive Estimator) : 这种方法假设触发的行和列的每一个交叉点都有光子。如果行 1/2 和列 1/2 触发,它就假设 4 个光子击中了。这会产生 “鬼影图像” ——即从未存在过的幽灵光子——导致高偏差 (bias) 。
- 单光子估计器 (Single-Photon Estimator, SPE) : 这种方法是保守的。它简单地丢弃任何触发了多行或多列的帧。它只信任无歧义的数据。虽然这消除了鬼影 (偏差) ,但它丢弃了大量数据,导致高噪声 (方差) , 尤其是在光源较亮时。

Figure 1 展示了这种权衡。“Naive” (朴素) 图像很平滑但有伪影 (鬼影) 。“Single” (单光子) 图像很准确但颗粒感极强,因为大部分光线被丢弃了。“Proposed” (提议) 的方法旨在兼得二者之长。
核心方法: 多光子估计器
研究人员的贡献在于多光子估计器 (Multiphoton Estimator, ME) 。 ME 不是丢弃模糊帧或盲目猜测,而是使用概率框架来解析光子入射的空间位置。
1. 建模通量
首先,对系统进行数学建模。到达像素 \((i,j)\) 的光子数量服从基于光强 (通量) \(\Lambda_{ij}\) 的泊松分布:

然而,单光子探测器实际上在一个光子时就饱和了 (它们是二进制的) 。所以,我们要看像素检测到至少一个光子的概率 \(q_{ij}\):

我们的目标是估计每个像素的这个 \(q_{ij}\) 以重建图像 \(\Lambda\)。
2. 读出逻辑
行 (\(R\)) 和列 (\(C\)) 的读出是二进制向量。如果某行中的任何像素检测到光子,则该行 \(R_i\) 返回 1。

3. 求解逆问题
研究人员制定了观察特定读出集合的似然函数。对于无歧义的帧,这很简单。对于有歧义的帧,似然函数涉及导致该读出的所有可能事件的概率总和。
朴素估计器通过平均行和列的交集来计算概率:

这个数学公式证实了为什么朴素方法会失败: 它盲目地关联了行和列。
提议的多光子估计器采用了一种更聪明的方法。它使用近似最大似然方法。它分两个阶段工作:
- 初始猜测: 它首先计算单光子估计器 (SPE) 。由于 SPE 是无偏的 (它从不撒谎,只是说话不多) ,它提供了图像结构实际所在的粗略、嘈杂的地图。
- 重新分配: 它使用该初始地图为模糊帧分配概率。
如果一个模糊帧说“角落触发了”,而初始地图说“左上角和右下角很亮,但其他地方很暗”,算法就会将模糊的光子归因于亮像素。
观测的似然函数被分为两部分: \(U(q)\) 用于无歧义帧,\(A(q)\) 用于有歧义帧。

项 \(A(q)\) 很复杂,因为它将许多可能的事件 (如 Figure 2 中的 \(E_9\) 到 \(E_{15}\)) 混合在一起。

为了解决这个问题,研究人员计算了每个事件的条件概率 (\(g\)) 。例如,\(g_9\) 是在我们要观察到一个模糊读出的情况下,事件 \(E_9\) 发生的概率。他们使用“安全的”单光子数据 (\(\hat{q}^s\)) 来估计这些 \(g\) 值。

最后,他们结合这些加权概率来更新每个像素的计数。估计概率 (\(\hat{q}^a\)) 的公式涉及获取无歧义计数 (\(M_1, M_5...\)) 并加上模糊计数 (\(M_9\)) 的加权部分。

简单来说: 算法不会扔掉模糊数据。它查看“干净”的数据以了解场景的形状,然后统计性地将“混乱”的数据分配到该形状中,以提高信噪比。
虽然上面的数学公式是针对 \(2 \times 2\) 的情况,但论文将此逻辑扩展到处理多达 4 个光子 同时发生的情况。
实验与结果
研究人员通过对 \(32 \times 32\) 图像 (与当前原型 SNSPD 阵列的大小相匹配) 进行蒙特卡洛模拟验证了他们的方法。
1. 视觉重建质量
视觉上的改进是惊人的。

在 Figure 3 中,比较各列:
- Naive (朴素) : 注意花朵 (行 a) 和月亮 (行 b) 中的水平和垂直条纹。这些是错误归因的光子。
- Single-Photon (单光子) : 条纹消失了,但图像颗粒感很强,微弱的特征丢失了。
- Multiphoton (Proposed) (多光子/提议) : 花瓣和月亮的形状清晰流畅。峰值信噪比 (PSNR) 比朴素方法提高了 6 到 11 dB , 比单光子方法提高了 4 到 6 dB 。
2. 处理更亮的光线 (最佳通量)
多光子估计器的最大优势之一是它允许探测器在更高的光强 (通量) 下工作。
在单光子成像中,通常必须保持光线非常暗,以避免“堆积”或模糊。但暗光意味着成像慢。

Figure 4 显示了均方误差 (MSE) 随亮度 (每帧平均光子数) 增加的变化。
- Naive 估计器 (红色) 由于偏差总是具有高误差。
- Single-photon 估计器 (紫色) 在低光下效果良好,但随着光线增强迅速失效 (因为它开始丢弃几乎所有的帧) 。
- Multiphoton 估计器 (橙色/黄色) 实现了最低的误差,并且在几乎是传统方法两倍的通量下有效工作 (最佳点约为每帧 1.4 个光子,而传统方法为 0.8) 。
3. 偏差与方差分析
为了理解为什么误差更低,我们可以看偏差和方差分解。

Figure 9 证实了这一理论:
- 图 (a) 偏差: 朴素方法 (蓝色) 有正偏差 (鬼影) 。多光子方法 (黄色) 保持偏差接近零。
- 图 (b) 方差: 单光子方法 (橙色) 在较高通量下具有巨大的方差。多光子方法通过利用其他方法丢弃的数据来保持低方差。
4. 速度 (积分时间)
因为多光子估计器使用了更多的入射光,它能更快地收敛到一幅好图像。

Figure 6 显示,要达到特定的图像质量 (MSE = 0.01) ,单光子方法需要 100,000 帧。多光子方法只需要大约 25,000 帧。这种 4倍加速 对于激光雷达或视频等对延迟敏感的应用至关重要。
5. 理论极限 (克拉美-罗下界)
最后,研究人员将他们的方法与克拉美-罗下界 (CRB) 进行了比较,CRB 代表了任何无偏估计器的理论精度极限。

如 Figure 7 所示,4-光子估计器在广泛的光强范围内几乎完美地贴合了理论极限。这表明在特定的硬件设置下,性能已经没有多少提升空间了——该算法几乎是最优的。
扩展与未来启示
虽然演示集中在 \(32 \times 32\) 阵列上,但研究人员分析了该方法如何扩展。

Figure 8 显示,随着阵列变大 (高达 512 行) ,多光子估计器相比朴素方法的优势变得更有价值。这对开发商业级规模的超导相机来说是非常有前景的。
结论
布线超导探测器的“硬件问题”引出了一个“软件机遇”。通过拒绝将模糊数据视为垃圾,研究人员证明了我们可以从复用阵列中恢复高质量的图像。
这项工作将劣势转变为优势。它允许:
- 更高的光子计数: 你不需要把光线调得那么暗。
- 更快的成像: 你可以用少 4 倍的帧数捕捉场景。
- 可扩展的硬件: 我们可以构建更大的阵列而不会融化恒温器。
对于光学成像领域的学生和工程师来说,这篇论文堪称典范,展示了概率建模如何克服物理限制,证明了有时改进相机的最佳方式是升级数学算法,而不仅仅是传感器。
](https://deep-paper.org/en/paper/2312.02971/images/cover.png)