当世界模型被用于sim2real:机器人通过视觉想象和交互尝试来学习
当世界模型被用于sim2real:机器人通过视觉想象和交互尝试来学习
具备学习技能的机器人必须能在不同的环境中执行不同的任务。当机器人遇到新的环境或物体时,它可能需要微调一些先前的技能以适应这种变化。但至关重要的是,以前学习的行为和模型应该仍适用于这种新学习。
编译 | 杏花
编辑 | 青暮
人类是如何掌握这么多技能的呢?好吧,最初我们并非如此,但从婴儿时期开始,我们通过自监督发觉并练习越来越复杂的技能。但这种自监督并不是随机的——儿童发展文献表明,婴儿利用他们先前的经验,通过互动和感官反馈,对移动性、吸吮性、抓握性和消化性等 可供性(affordance,也译作功能可供性、承担特质、直观功能、预设用途、可操作暗示、示能性等,指事物能够提示其可以帮助人们做什么的一种属性或特征)进行定向探索。这种类型的定向探索允许婴儿在既定环境中学习可以做什么以及如何做。那么,在机器人学习系统中,我们是否也可以实例一个类似于可供性定向探索的策略?
如下图所示。在左侧,我们先收集了由机器人完成各种任务的视频,比如打开和关闭抽屉、抓取和移动物体。在右侧,我们放置了一个机器人从未见过的盖子。机器人被给予一小段时间来熟悉这个新物体,之后它将获得一个目标图像,并负责使场景匹配这个图像。机器人如何在没有任何外部监督的情况下迅速学会操控环境并抓住盖子?
当世界模型被用于sim2real:机器人通过视觉想象和交互尝试来学习
具备学习技能的机器人必须能在不同的环境中执行不同的任务。当机器人遇到新的环境或物体时,它可能需要微调一些先前的技能以适应这种变化。但至关重要的是,以前学习的行为和模型应该仍适用于这种新学习。
编译 | 杏花
编辑 | 青暮
人类是如何掌握这么多技能的呢?好吧,最初我们并非如此,但从婴儿时期开始,我们通过自监督发觉并练习越来越复杂的技能。但这种自监督并不是随机的——儿童发展文献表明,婴儿利用他们先前的经验,通过互动和感官反馈,对移动性、吸吮性、抓握性和消化性等 可供性(affordance,也译作功能可供性、承担特质、直观功能、预设用途、可操作暗示、示能性等,指事物能够提示其可以帮助人们做什么的一种属性或特征)进行定向探索。这种类型的定向探索允许婴儿在既定环境中学习可以做什么以及如何做。那么,在机器人学习系统中,我们是否也可以实例一个类似于可供性定向探索的策略?
如下图所示。在左侧,我们先收集了由机器人完成各种任务的视频,比如打开和关闭抽屉、抓取和移动物体。在右侧,我们放置了一个机器人从未见过的盖子。机器人被给予一小段时间来熟悉这个新物体,之后它将获得一个目标图像,并负责使场景匹配这个图像。机器人如何在没有任何外部监督的情况下迅速学会操控环境并抓住盖子?
哥也要色 http://www.cityruyi.com/lm-4/lm-1/1184.html- 标签:乐的笔顺
- 编辑:王智
- 相关文章