DeepSocNav通过模仿人类行为的社交导航

可以合理地期望机器人的行为不会妨碍环境中的人类。以前解决社交导航问题的尝试要么缺乏灵活性,要么需要大量数据。最近的一篇论文建议解决当前的局限性。

研究人员提出了一个虚拟环境,可以将丰富的鸟瞰图数据转换为给定场景中所有代理的第一人称视角。一种新颖的监督学习模型使用第一人称深度视图模仿真实人类在拥挤环境中的社交行为。

为了模仿真实人类的社会行为,它学习复制数据中存在的代理的导航模式。结果表明,建议的模型可以学习并推断出有关其他路人的意图和潜在轨迹的丰富信息,因此优于基线。

当前用于训练社交行为的数据集通常是从监控应用程序中借用的,这些应用程序从鸟瞰的角度捕获视觉数据。这留下了可以通过场景的第一人称视角捕获的宝贵关系和视觉线索。在这项工作中,我们提出了一种利用当前游戏引擎(例如 Unity)的强大功能的策略,将预先存在的鸟瞰图数据集转换为第一人称视角,尤其是深度视图。使用这种策略,我们能够生成大量可用于预训练社交导航模型的合成数据。为了测试我们的想法,我们提出了 DeepSocNav,这是一种基于深度学习的模型,它利用所提出的方法来生成合成数据。此外,DeepSocNav 包括作为辅助任务的自监督策略。这包括预测代理将面临的下一个深度帧。我们的实验显示了所提出模型的好处,该模型能够在社交导航分数方面优于相关基线。

(0)
上一篇 2022年3月28日
下一篇 2022年3月28日

相关推荐