[前研究小组李政宇]
长期以来,游戏(围棋、国际象棋、雅达利游戏等)被用来验证强化学习算法的性能。随着算法的发展,在强化学习领域,和其他图像、自然语言领域一样,有很多人想要解决现实中的各种问题,创造服务。
在本文中,我们将看看最近发布的三个强化学习环境涵盖了哪些领域。
1. DeepMind – AndroidEnv
AndroidEnv 是 DeepMind 发布的 Android 强化学习环境。您可以访问可以在 Android 环境中运行的基本应用程序,并且您可以尝试看看是否可以学习如何像现代人一样使用智能手机的方式使用智能手机。示例任务还提供了一些游戏,因此您可以学习如何使用触摸和拖动手势像人类一样玩耍和行动。
由于环境的重要性,强化学习被应用到当今最常用的平台设备上,可以研究哪些实际问题可以解决和应用。另外,如果从服务的角度来开发算法,预计在Android平台上会出现各种强化学习应用。
2. Facebook 研究 – CompilerGym
CompilerGym 是一种前所未有的新型强化学习环境。如前所述,在游戏或模拟情况下,机器人控制有很多环境。 Facebook 研究团队似乎希望强化学习找到最优策略的能力可以很好地应用于计算机领域需要优化的领域。 Compiler 是一种语言翻译程序,负责将高级编写的编程语言转换为适合计算机系统的低级语言。这个编译器也有使用几个API进行优化的过程,强化学习在Compiler优化的项目中寻找减少编译时间的策略。
如果通过 CompilerGym 证明强化学习是有帮助的,那么它有望用于提高多种计算机系统的效率。
3. Facebook 研究 – 栖息地实验室
Habitat Lab 是一个在嵌入式 AI 领域进行实验的环境。 Embodied AI 与虚拟世界和其他虚拟机器人交互,是解决虚拟机器人中人工智能问题的领域。 Habitat 1.0 之前发布过,但这次更新到了 Habitat 2.0。除了简单地移动机器人之外,它还会以自然语言传递问题和命令来执行命令,或者直接寻找可以作为正确答案基础的位置来寻找答案。
我们希望 Habitat Lab 环境能够创建一个机器人 AI,它可以很好地交流并帮助现实世界中的人们。
在本文中,我们介绍了三个最近发布的强化学习环境。很高兴看到使用开放环境的强化学习的发展将如何直接影响我们的生活。
- 参考
- https://github.com/deepmind/android_env
- https://github.com/facebookresearch/CompilerGym
- https://github.com/facebookresearch/habitat-lab