1.解决的问题
Knowing how to grasp is generally more challenging than what to grasp for a robot. 从单视角点云规划抓取的挑战性在于模型需要对RGB-D感知的不精确和不完整进行补偿。
GPD方法在物体CAD模型未知的情况下直接从RGB-D传感信息中检测3DoF或6DoF抓取位姿&…
Abstract 在人类空间中运作的具身智能体(embodied agents)必须能够了解其身处的环境是如何工作的:该智能体可以使用哪些对象,以及如何使用它们?FAIR(Facebook AI Research)引入了一种增强学习方法来进行交互探索&a…
Learning to Move with Affordance Maps
Abstract 自主探索和导航物理空间的能力几乎是任何移动自主agent的基本要求,从家用机器人吸尘器到自动驾驶车辆。传统的基于SLAM的探索和导航方法主要集中在利用场景几何,但没有对动态对象(如其他agents)或语义约…
更多内容关注公众号:AIRoobt
InstructPart: Affordance-based Part Segmentation from Language Instruction
InstructPart:基于语言指令的功能性部分分割
摘要:最近在视觉-语言模型(VLMs)方面的进展导致了它们在机…
22年8月来自谷歌和Everday Robots的论文“Do As I Can, Not As I Say: Grounding Language in Robotic Affordances”。
大语言模型可以编码大量有关世界的语义知识。这些知识对于旨在按照自然语言表达的高级、时间扩展指令采取行动的机器人非常有用。然而,语言模型…