](https://deep-paper.org/en/papers/2025-10/2402.04672/images/cover.png)
超越晴天:G-NAS 如何让目标检测器在黑暗中也能看清
想象一辆自动驾驶汽车,其人工智能系统在数千小时明亮、晴朗的加州日间视频中接受训练。它能以惊人的准确度识别行人、汽车和骑行者。现在,把这辆车开到伦敦雾气弥漫的清晨、西雅图细雨蒙蒙的傍晚,或东京午夜灯光昏暗的街道。它还能依然表现得完美无缺吗? 这正是现代计算机视觉领域最大挑战之一的核心:** 域泛化 (domain generalization)** 。模型在某个特定环境 (一个“域”) 中训练后,部署到新的、未见过的环境时,往往会表现不佳。而当你只能从单一源域的数据中学习时,这个问题会更加棘手。这个具体、现实且艰难的挑战被称为单域泛化目标检测 (Single Domain Generalization Object Detection, S-DGOD) 。 图 1: S-DGOD 的设定旨在从单一源域学习并泛化到多个未见过的目标域。这需要从源域中提取因果特征,以实现域外 (Out-of-Domain, OoD) 泛化。 最近的一篇论文 G-NAS: Generalizable Neural Architecture Search for Single Domain Generalization Object Detection 直击这一问题。研究人员提出了一种方法,不仅仅是训练一个模型,而是设计出一种全新的神经网络架构,专门针对泛化能力进行优化。他们将神经架构搜索 (NAS) 的强大能力与一个巧妙的新损失函数结合起来,引导网络避免过拟合。 结果令人印象深刻。这种名为 G-NAS 的方法,即使在其他最先进模型束手无策的极端挑战场景下,也能准确检测物体。 图 2: G-NAS 在 S-DGOD 任务中的预测结果 (类别: 置信度) 。框的颜色表示物体类别。G-NAS 在极具挑战性的环境中也能稳定检测。 在本文中,我们将深入探讨: 伪相关性的核心问题,以及为什么它们是泛化的敌人。 可微分神经架构搜索 (NAS) 的工作原理。 作者的关键创新:** 可泛化损失 (G-loss)** 。 令人瞩目的实验结果,展示了 G-NAS 在 S-DGOD 领域创造了新的 SOTA (最先进水平) 。 过拟合陷阱: 为什么泛化如此困难 深度神经网络是极其强大的模式识别器——但有时它们会抓错“重点”。在单一域上训练时,它们往往会学到一些“容易”的特征,这些特征在训练数据中与标签相关,但在其他环境下却毫无意义。这些就是伪相关性 (spurious correlations) 。 ...