](https://deep-paper.org/en/paper/2502.07380/images/cover.png)
机器人学习的民主化:Wheeled Lab 如何将现代 Sim2Real 带给低成本机器人
引言 想象一下,看着一台价值 50,000 美元的四足机器人在山间小道上徒步,或者一架特制的无人机以冠军级的速度在复杂的赛道上飞驰。这些壮举令人惊叹,代表了机器人技术的最前沿。它们都有一个共同的秘诀: Sim2Real (仿真到现实) ——即在高保真模拟环境中训练策略,然后将其部署到现实世界中。 ...
](https://deep-paper.org/en/paper/2502.07380/images/cover.png)
引言 想象一下,看着一台价值 50,000 美元的四足机器人在山间小道上徒步,或者一架特制的无人机以冠军级的速度在复杂的赛道上飞驰。这些壮举令人惊叹,代表了机器人技术的最前沿。它们都有一个共同的秘诀: Sim2Real (仿真到现实) ——即在高保真模拟环境中训练策略,然后将其部署到现实世界中。 ...
](https://deep-paper.org/en/paper/2505.16892/images/cover.png)
想象一下,试着把航天器降落在月球上,或者用机械臂将一个易碎的插头插入插座。这些任务需要极高的精度。现在,再想象一下你是通过一个有轻微延迟或手感“绵软”的操纵杆来完成这些操作的。这就是遥操作 (teleoperation) 所面临的挑战。 ...
](https://deep-paper.org/en/paper/2505.21495/images/cover.png)
引言 想象一下,你伸手到一个杂乱的包里找家里的钥匙。即使看不见,当你的手指触碰到冰冷的金属时,你立刻就知道找到了。或者考虑一下检查香蕉是否成熟;看颜色会有所帮助,但轻轻捏一下就能告诉你它是软烂还是紧实。 ...
](https://deep-paper.org/en/paper/918_deq_mpc_deep_equilibrium_m-2660/images/cover.png)
引言 在机器人领域, 灵活性与安全性之间始终存在着一种张力。一方面,我们希望机器人利用神经网络 (NNs) 来学习复杂的行为,适应新环境,并处理高维传感器数据。另一方面,神经网络通常是“黑盒”——我们很难轻易保证它们不会指挥无人机撞墙。 ...
](https://deep-paper.org/en/paper/2505.04619/images/cover.png)
视觉强化学习 (RL) 不仅突破了机器人的能力边界,从在 Atari 游戏中获胜,还实现了复杂的灵巧操作。然而,在受控仿真环境中有良好表现的机器人与足以应对现实世界的机器人之间,仍存在显著差距。这一挑战的主要部分在于视觉 。 ...
](https://deep-paper.org/en/paper/2505.03233/images/cover.png)
引言: 机器人领域的数据瓶颈 我们正见证着人工智能的黄金时代,这一时代在很大程度上是由基础模型 (Foundation Models) 推动的。在自然语言处理 (NLP) 和计算机视觉 (CV) 领域,像 GPT-4 和 Gemini 这样的模型已经实现了令人惊叹的能力。它们的秘密武器是什么?互联网。这些模型是在从网络上抓取的数万亿个文本 token 和数十亿张图像上进行预训练的。 ...
](https://deep-paper.org/en/paper/2506.11470/images/cover.png)
引言 想象一下,如果学会骑自行车能让你立刻更擅长踩高跷或滑冰,那会怎样?在生物界,这种技能迁移不断发生;动物会根据不同的地形和身体变化调整它们的运动控制策略。然而,在机器人领域,这仍然是一个遥不可及的梦想。通常情况下,如果你想训练一个四足机器人 (机器狗) 和一个双足人形机器人,你需要两条完全独立的训练流水线。它们的身体不同,电机不同,支配它们运动的物理规律也截然不同。 ...
](https://deep-paper.org/en/paper/2412.10349/images/cover.png)
开门似乎是世界上最简单的任务。对于人类来说,这毫不费力: 你伸出手,握住把手,然后拉开。如果门很重或者铰链很生涩,你的手会自动调整力量和轨迹以顺应门的自然弧度。你甚至根本不需要思考。 ...
](https://deep-paper.org/en/paper/2502.15442/images/cover.png)
强化学习 (RL) 已经取得了非凡的成就,从在围棋中击败大师到教会机器人如何奔跑。但是,如果你要求机器人执行一项看似简单的任务——比如捡起平放在桌子上的信用卡——它往往会手足无措。 ...
](https://deep-paper.org/en/paper/181_estimating_value_of_assist-2654/images/cover.png)
引言 想象一个仓库中的协作机器人场景。一个配备机械臂的机器人正试图从杂乱的架子上抓取一罐特定的苏打水。然而,它的传感器存在噪声,且一个大箱子挡住了它的视线。它知道罐子就在那里,但无法以足够的确定性来安全地精确定位它。在附近,第二个配备真空吸盘抓手的机器人正处于空闲状态。这第二个机器人可以移动箱子,露出罐子,从而显著降低第一个机器人的工作难度。 ...
](https://deep-paper.org/en/paper/2502.08054/images/cover.png)
想象一个平放在桌上的薄型电脑键盘。你想把它拿起来。如果你只是尝试从上方直接抓取,你的手指很可能会在抓稳之前就撞到桌子。桌子“遮挡” (block) 了抓取位置。那么,你会本能地怎么做?你可能会用非惯用手将键盘倾斜或顶住,同时用惯用手稳稳地抓住它。 ...
](https://deep-paper.org/en/paper/664_socialnav_sub_benchmarking-2652/images/cover.png)
引言 想象一下,你正走在课间繁忙的大学走廊上。你看到左边有一群学生在聊天,右边有一位教授匆匆向你走来,前面还有一位清洁工在拖地。在没有意识思考的情况下,你调整了自己的路线。你稍微向右闪避给学生群留出空间,你减速让教授先过,并且你避开了湿滑的地面。这种“社交导航 (social navigation) ”的舞蹈对人类来说是第二天性。我们可以毫不费力地解读意图、社会规范和空间动态。 ...
](https://deep-paper.org/en/paper/2502.09762/images/cover.png)
引言 设想在一个茂密的森林中进行一次高风险的搜救任务。一支无人机编队正在扫描下方的地面。突然,其中一架无人机电池故障,必须返回基地。一架备用无人机立即升空接替它的位置。 ...
](https://deep-paper.org/en/paper/570_robot_operating_home_appli-2650/images/cover.png)
引言 想象一下你刚拆开一个全新高科技电饭煲的包装。它有十几个按钮、一个数字显示屏,而且设计得一点也不直观。作为人类,你可能会拿起用户手册,翻到“煮糙米”那一节,然后弄清楚该按什么顺序操作按钮。 ...
](https://deep-paper.org/en/paper/2508.10511/images/cover.png)
生成式人工智能 (Generative AI) 与机器人的融合引发了一场革命。特别是 扩散策略 (Diffusion Policy, DP) 已成为“行为克隆”——即教机器人通过模仿人类演示来执行任务——的最先进方法。与试图将人类动作平均化为单一平均轨迹的旧方法不同,扩散策略接受了人类解决任务方式多样化的事实。它对可能的动作分布进行建模,使机器人能够处理多模态行为 (例如,从左侧或右侧抓取杯子) 。 ...
](https://deep-paper.org/en/paper/2508.20981/images/cover.png)
引言 想象一下,你在黑暗中摸索着穿过一个熟悉的房间,手里拿着手电筒。为了弄清楚自己在哪里,你不会把光束指向一片空白的墙壁;因为那给不了你任何信息。相反,你会本能地把光束照向明显的特征物体——门框、书架或一件独特的家具。通过主动选择“看哪里”,你最大化了在这个空间中定位自己的能力。 ...
](https://deep-paper.org/en/paper/2503.05652/images/cover.png)
简介 我们经常梦想着“罗茜机器人 (Rosie the Robot) ”般的未来——一个能够整理客厅、打扫浴室和整理食品储藏室的通用助手。虽然我们在实验室环境下的机器人操作方面已经看到了惊人的进步,但将这些能力带入现实世界的家庭仍然是一个巨大的挑战。 ...
](https://deep-paper.org/en/paper/2509.19712/images/cover.png)
简介 想象一下教机器人做饭。让它拿起一个苹果在许多实验室里已经是一个解决的问题。然而,让它把那个苹果切成完美均匀的楔形,却是物理和控制层面的噩梦。 ...
](https://deep-paper.org/en/paper/2502.18015/images/cover.png)
想象一下,你正试图拿起一张平放在桌子上的扑克牌。你不能直接抓起它,因为你的手指——或者机器人的抓手——无法伸到牌的下面。你会怎么做?你会本能地用一根手指将牌滑到桌边 (非抓取操作) ,一旦它悬在边缘,你就会捏住它 (抓取操作) 。 ...
](https://deep-paper.org/en/paper/2407.15161/images/cover.png)
想象一下,你正伸手去昏暗的橱柜里拿一个咖啡杯。虽然看不见把手,但你的大脑会对它的位置做出合理的猜测。如果你碰到了意想不到的东西,你会立刻调整。你不仅仅是在盲目抓取;你拥有一种内在的对不确定性的感知。 ...