Difference between revisions of "VT2017 OpenAI Gym"

From air
Jump to navigation Jump to search
Line 1: Line 1:
   
{| class="wikitable"
 
|
 
 
* Sujet : OpenAI Gym
 
 
* Auteur : ROCHER Lambert
 
|}
 
   
 
=Résumé=
 
=Résumé=

Revision as of 11:12, 27 October 2017


Résumé

OpenAI Gym est un boîte à outils qui permet d'entraîner et de tester la performance d'algorithmes d'apprentissage par renforcement. OpenAI fournit un grand nombre d'environnements qui sont tous accessibles au travers d'une interface standard. Le site web compagnon permet de comparer son algorithme avec ceux écrits par la communauté.

  • Mots clés :

apprentissage par renforcement, entrainement, standard

Abstract

OpenAI Gym is a toolkit for training and testing the performance of reinforcement learning algorithms. OpenAI provides a large number of environments that are all accessible through a standard interface. The companion website makes peer review easy.

  • Keywords :

Mots clés : reinforcement learning, training, standard

OpenAI Gym

Motivations

Les intelligences artificielles basées sur des algorithmes d'apprentissage par renforcement comment à obtenir de très bon résultats dans des environnements complexes.

Toutefois, avant l’existence de Gym, les environnements existants pour entraîner de telles IA étaient peu variés et parfois difficile à utiliser.

Les publications de recherche sur l'apprentissage par renforcement s'appuyaient sur des environnements qui n'étaient pas standards et rendaient la comparaison des différent algorithmes difficiles.

OpenAI Gym résout ces deux problèmes et facilite la collaboration entre chercheur en RL pour faire progresser le domaine.

Environnements

Gym fournit des environnements variés classés dans différents catégories :

  • problèmes classiques de la littérature RL
  • jeux Atari
  • jeux de plateaux (Go)
  • simulation de robots 2D et 3D

OpenAI a ensuite créé un outils appelé Universe qui permet de créer une interface gym pour n'importe quel jeu/simulation physique. Le nombre environnements disponibles devient potentiellement infini.

Points forts et points faibles

+ simple d'utilisation

+ variété des environnements

+ encourage le partage et la collaboration


- site web plus maintenu

- seulement disponible en python pour l'instant

Références

https://github.com/openai/gym

https://blog.openai.com/openai-gym-beta/

https://gym.openai.com/docs/

https://gym.openai.com/envs/