CoRL 2025

[Wheeled Lab: Modern Sim2Real for Low-cost, Open-source Wheeled Robotics 🔗](https://arxiv.org/abs/2502.07380)

机器人学习的民主化：Wheeled Lab 如何将现代 Sim2Real 带给低成本机器人

引言想象一下，看着一台价值 50,000 美元的四足机器人在山间小道上徒步，或者一架特制的无人机以冠军级的速度在复杂的赛道上飞驰。这些壮举令人惊叹，代表了机器人技术的最前沿。它们都有一个共同的秘诀: Sim2Real (仿真到现实) ——即在高保真模拟环境中训练策略，然后将其部署到现实世界中。 ...

[FlashBack: Consistency Model-Accelerated Shared Autonomy 🔗](https://arxiv.org/abs/2505.16892)

共享自治的快车道：一致性模型如何让机器人变身实时副驾驶

想象一下，试着把航天器降落在月球上，或者用机械臂将一个易碎的插头插入插座。这些任务需要极高的精度。现在，再想象一下你是通过一个有轻微延迟或手感“绵软”的操纵杆来完成这些操作的。这就是遥操作 (teleoperation) 所面临的挑战。 ...

[CLAMP: Crowdsourcing a LArge-scale in-the-wild haptic dataset with an open-source device for Multimodal robot Perception 🔗](https://arxiv.org/abs/2505.21495)

赋予机器人触觉：CLAMP 如何通过众包获取触觉感知

引言想象一下，你伸手到一个杂乱的包里找家里的钥匙。即使看不见，当你的手指触碰到冰冷的金属时，你立刻就知道找到了。或者考虑一下检查香蕉是否成熟；看颜色会有所帮助，但轻轻捏一下就能告诉你它是软烂还是紧实。 ...

[DEQ-MPC: Deep Equilibrium Model Predictive Control 🔗](https://openreview.net/pdf?id=zQXurgHUVX)

闭环控制：利用深度均衡模型融合神经网络与控制求解器

引言在机器人领域, 灵活性与安全性之间始终存在着一种张力。一方面，我们希望机器人利用神经网络 (NNs) 来学习复杂的行为，适应新环境，并处理高维传感器数据。另一方面，神经网络通常是“黑盒”——我们很难轻易保证它们不会指挥无人机撞墙。 ...

[Merging and Disentangling Views in Visual Reinforcement Learning for Robotic Manipulation 🔗](https://arxiv.org/abs/2505.04619)

MAD 技能：如何教会机器人用一只眼或多只眼看世界

视觉强化学习 (RL) 不仅突破了机器人的能力边界，从在 Atari 游戏中获胜，还实现了复杂的灵巧操作。然而，在受控仿真环境中有良好表现的机器人与足以应对现实世界的机器人之间，仍存在显著差距。这一挑战的主要部分在于视觉。 ...

[GraspVLA: a Grasping Foundation Model Pre-trained on Billion-scale Synthetic Action Data 🔗](https://arxiv.org/abs/2505.03233)

机器人能仅靠合成数据学会抓取吗？深入解析 GraspVLA

引言: 机器人领域的数据瓶颈我们正见证着人工智能的黄金时代，这一时代在很大程度上是由基础模型 (Foundation Models) 推动的。在自然语言处理 (NLP) 和计算机视觉 (CV) 领域，像 GPT-4 和 Gemini 这样的模型已经实现了令人惊叹的能力。它们的秘密武器是什么？互联网。这些模型是在从网络上抓取的数万亿个文本 token 和数十亿张图像上进行预训练的。 ...

[Multi-Loco: Unifying Multi-Embodiment Legged Locomotion via Reinforcement Learning Augmented Diffusion 🔗](https://arxiv.org/abs/2506.11470)

一个大脑，多副躯体：Multi-Loco 如何利用扩散模型与强化学习统一机器人控制

引言想象一下，如果学会骑自行车能让你立刻更擅长踩高跷或滑冰，那会怎样？在生物界，这种技能迁移不断发生；动物会根据不同的地形和身体变化调整它们的运动控制策略。然而，在机器人领域，这仍然是一个遥不可及的梦想。通常情况下，如果你想训练一个四足机器人 (机器狗) 和一个双足人形机器人，你需要两条完全独立的训练流水线。它们的身体不同，电机不同，支配它们运动的物理规律也截然不同。 ...

[Ensuring Force Safety in Vision-Guided Robotic Manipulation via Implicit Tactile Calibration 🔗](https://arxiv.org/abs/2412.10349)

为什么机器人会弄坏门（以及“SafeDiff”如何通过触觉扩散模型解决这一问题）

开门似乎是世界上最简单的任务。对于人类来说，这毫不费力: 你伸出手，握住把手，然后拉开。如果门很重或者铰链很生涩，你的手会自动调整力量和轨迹以顺应门的自然弧度。你甚至根本不需要思考。 ...

[Learning Long-Horizon Robot Manipulation Skills via Privileged Action 🔗](https://arxiv.org/abs/2502.15442)

"作弊"制胜：特权动作如何教会机器人复杂技能

强化学习 (RL) 已经取得了非凡的成就，从在围棋中击败大师到教会机器人如何奔跑。但是，如果你要求机器人执行一项看似简单的任务——比如捡起平放在桌子上的信用卡——它往往会手足无措。 ...

[Estimating Value of Assistance for Online POMDP Robotic Agents 🔗](https://openreview.net/pdf?id=xzR8rBRgPp)

机器人如何决定伸出援手：在不确定世界中计算协助价值

引言想象一个仓库中的协作机器人场景。一个配备机械臂的机器人正试图从杂乱的架子上抓取一罐特定的苏打水。然而，它的传感器存在噪声，且一个大箱子挡住了它的视线。它知道罐子就在那里，但无法以足够的确定性来安全地精确定位它。在附近，第二个配备真空吸盘抓手的机器人正处于空闲状态。这第二个机器人可以移动箱子，露出罐子，从而显著降低第一个机器人的工作难度。 ...

[COMBO-Grasp: Learning Constraint-Based Manipulation for Bimanual Occluded Grasping 🔗](https://arxiv.org/abs/2502.08054)

双手胜过单手：利用 COMBO-Grasp 攻克受遮挡抓取难题

想象一个平放在桌上的薄型电脑键盘。你想把它拿起来。如果你只是尝试从上方直接抓取，你的手指很可能会在抓稳之前就撞到桌子。桌子“遮挡” (block) 了抓取位置。那么，你会本能地怎么做？你可能会用非惯用手将键盘倾斜或顶住，同时用惯用手稳稳地抓住它。 ...

[SocialNav-SUB: Benchmarking VLMs for Scene Understanding in Social Robot Navigation 🔗](https://openreview.net/pdf?id=xVDj9uq6K3)

视觉语言模型能在人群中导航吗？深入解读 SocialNav-SUB 基准测试

引言想象一下，你正走在课间繁忙的大学走廊上。你看到左边有一群学生在聊天，右边有一位教授匆匆向你走来，前面还有一位清洁工在拖地。在没有意识思考的情况下，你调整了自己的路线。你稍微向右闪避给学生群留出空间，你减速让教授先过，并且你避开了湿滑的地面。这种“社交导航 (social navigation) ”的舞蹈对人类来说是第二天性。我们可以毫不费力地解读意图、社会规范和空间动态。 ...

[AT-Drone: Benchmarking Adaptive Teaming in Multi-Drone Pursuit 🔗](https://arxiv.org/abs/2502.09762)

机器人能与陌生人协作吗？深入解析 AT-Drone 基准测试

引言设想在一个茂密的森林中进行一次高风险的搜救任务。一支无人机编队正在扫描下方的地面。突然，其中一架无人机电池故障，必须返回基地。一架备用无人机立即升空接替它的位置。 ...

[Robot Operating Home Appliances by Reading User Manuals 🔗](https://openreview.net/pdf?id=wZUQq0JaL6)

机器人能通过阅读说明书学会做饭吗？认识一下 ApBot

引言想象一下你刚拆开一个全新高科技电饭煲的包装。它有十几个按钮、一个数字显示屏，而且设计得一点也不直观。作为人类，你可能会拿起用户手册，翻到“煮糙米”那一节，然后弄清楚该按什么顺序操作按钮。 ...

[KDPE: A Kernel Density Estimation Strategy for Diffusion Policy Trajectory Selection 🔗](https://arxiv.org/abs/2508.10511)

驯服随机的机器人：利用核密度估计增强扩散策略

生成式人工智能 (Generative AI) 与机器人的融合引发了一场革命。特别是扩散策略 (Diffusion Policy, DP) 已成为“行为克隆”——即教机器人通过模仿人类演示来执行任务——的最先进方法。与试图将人类动作平均化为单一平均轨迹的旧方法不同，扩散策略接受了人类解决任务方式多样化的事实。它对可能的动作分布进行建模，使机器人能够处理多模态行为 (例如，从左侧或右侧抓取杯子) 。 ...

[ActLoc: Learning to Localize on the Move via Active Viewpoint Selection 🔗](https://arxiv.org/abs/2508.20981)

别只是看，要学会观察：ActLoc 如何教会机器人寻找最佳视角以提升导航能力

引言想象一下，你在黑暗中摸索着穿过一个熟悉的房间，手里拿着手电筒。为了弄清楚自己在哪里，你不会把光束指向一片空白的墙壁；因为那给不了你任何信息。相反，你会本能地把光束照向明显的特征物体——门框、书架或一件独特的家具。通过主动选择“看哪里”，你最大化了在这个空间中定位自己的能力。 ...

[BEHAVIOR ROBOT SUITE: Streamlining Real-World Whole-Body Manipulation for Everyday Household Activities 🔗](https://arxiv.org/abs/2503.05652)

掌控家庭：BRS 如何解决家用机器人的全身控制问题

简介我们经常梦想着“罗茜机器人 (Rosie the Robot) ”般的未来——一个能够整理客厅、打扫浴室和整理食品储藏室的通用助手。虽然我们在实验室环境下的机器人操作方面已经看到了惊人的进步，但将这些能力带入现实世界的家庭仍然是一个巨大的挑战。 ...

[TopoCut: Learning Multi-Step Cutting with Spectral Rewards and Discrete Diffusion Policies 🔗](https://arxiv.org/abs/2509.19712)

TopoCut：机器人如何通过谱奖励和离散扩散学习切片与切丁

简介想象一下教机器人做饭。让它拿起一个苹果在许多实验室里已经是一个解决的问题。然而，让它把那个苹果切成完美均匀的楔形，却是物理和控制层面的噩梦。 ...

[SPIN: distilling Skill-RRT for long-horizon prehensile and non-prehensile manipulation 🔗](https://arxiv.org/abs/2502.18015)

从缓慢规划到快速反应：SPIN 如何掌握复杂的机器人操作

想象一下，你正试图拿起一张平放在桌子上的扑克牌。你不能直接抓起它，因为你的手指——或者机器人的抓手——无法伸到牌的下面。你会怎么做？你会本能地用一根手指将牌滑到桌边 (非抓取操作) ，一旦它悬在边缘，你就会捏住它 (抓取操作) 。 ...

[FFHFlow: Diverse and Uncertainty-Aware Dexterous Grasp Generation via Flow Variational Inference 🔗](https://arxiv.org/abs/2407.15161)

掌握未知：FFHFlow 如何赋予机器人类似人类的灵巧性与自我感知能力

想象一下，你正伸手去昏暗的橱柜里拿一个咖啡杯。虽然看不见把手，但你的大脑会对它的位置做出合理的猜测。如果你碰到了意想不到的东西，你会立刻调整。你不仅仅是在盲目抓取；你拥有一种内在的对不确定性的感知。 ...