VT2020-OpenAI Microscope-Fiche: Difference between revisions
Line 44: | Line 44: | ||
=== Places365 === |
=== Places365 === |
||
Places365 est une banque d'images 200x200px toutes labelisées. Places365 compte 1000 classes d'images différentes et est souvent utilisé pour l'apprentissage de réseaux de neurones de reconnaissance d'images. Places365 contient donc un très gros volume de données (environ 100000 images). Les classes d'images sont principalement des lieux remarquables, la nature (montagnes, mer, jungle...), de l'architecture. |
|||
== Modèles compatibles == |
== Modèles compatibles == |
Revision as of 08:22, 4 January 2021
OpenAI
OpenAi est une association fondée en 2015 par Elon Musk et Sam Altman. Cette association est devenue en 2019 une entreprise à but lucratif non plafonné pour obtenir plus de moyens. L'entreprise a pour but de faire avancer la recherche sur l'intelligence artificielle afin que les machines puissent analyser et comprendre au mieux l'environnement qui les entoure. À terme, l'association aimerait créer une intelligence artificielle à visage humain. Plusieurs entreprises financent ce projet comme par exemple LinkedIn, Microsoft et Amazon Web Services.
Projets
Depuis la création de l'association, de nombreux projets ont vu le jour. En voici quelques uns notables:
- GYM : Développer et comparer des algorithmes d'apprentissage par renforcement (voir site internet pour en savoir plus).
- ROBOSUMO : IA en forme d'homme bâton qui apprend seule à marcher, jouer au foot, faire du sumo, etc... Voici une vidéo YouTube qui illustre le projet ROBOSUMO.
- DACTYL : Main artificielle pilotée par une IA. Elle est aujourd'hui capable de réaliser des Rubik's Cube (voir vidéo).
- JUKEBOX : IA pour créer de la musique.
- GPT-3 : Voir la fiche sur le sujet.
- OPEN FIVE et GYM RETRO : IA permettant de jouer aux jeux vidéos. OPEN FIVE joue à des jeux récents tandis que GYM RETRO est spécialisée dans le retrogaming.
- DEBATE GAME : Jeu de débat en ligne où il faut deviner quelle IA dit la vérité lors d'un débat.
Beaucoup d'autres projets ont bien évidemment vu le jour, dont notamment Microscope présenté ci-dessous.
Microscope
OpenAI Microscope est un outil sorti au printemps 2020 qui permet de visualiser graphiquement chaque couche significative et chaque neurone de chaque couche d'un réseau de neurones. Grâce à cet outil, on peut explorer un réseau de neurone facilement afin de mieux comprendre son fonctionnement.
Définitions
Quelques définitions sont nécessaires avant de comprendre plus en détail le fonctionnement de Microscope.
Réseau de neurones
Un réseau de neurones est un système informatique qui s'inspire du cerveau humain pour apprendre.
Voici l'architecture d'un réseau de neurones qui peut être représentée comme un graphe orienté:
Ici, sur l'image ci-contre, notre réseau est simple et ne comporte que 4 couches : une couche d'entrées en rouge, deux couches cachées en bleu, et une couche de sortie en vert. Le principe d'un réseau de neurones est le même qu'il y ait 4 couches ou 200 couches.
Les noeuds du graphe représentent les neurones. On constate que chaque neurone de chaque couche est relié à tous les neurones de la couche suivante.
Dans le cerveau humain, une information arrive à un neurone, le neurone est stimulé ou non par cette information. Il interprète cette information et transmet ou non un résultat au neurone suivant. Dans les réseaux de neurones, c'est la même chose! Une information arrive à un neurone. Ce neurone calcule son "interêt" pour cette information en fonction de sa stimulation. Ensuite chaque arête du graphe possède un poids qui va permettre grâce à un sytème probabiliste de determiner quel est le neurone suivant à recevoir l'information. Ce système de graphe pondéré et orienté est utilisé afin de représenter au mieux le cerveau animal. En effet grâce à ce système, seulement certains neurones sont stimulés (les plus utiles au traitement de l'information) et non tous à la fois à l'instar du cerveau humain.
ImageNet
ImageNet est une banque d'images 200x200px toutes labelisées. ImageNet compte 1000 classes d'images différentes et est souvent utilisé pour l'apprentissage de réseaux de neurones de reconnaissance d'images. ImageNet contient donc un très gros volume de données (environ 100000 images). Les classes d'images sont tous types d'objets, d'animaux, de véhicules, etc.
Places365
Places365 est une banque d'images 200x200px toutes labelisées. Places365 compte 1000 classes d'images différentes et est souvent utilisé pour l'apprentissage de réseaux de neurones de reconnaissance d'images. Places365 contient donc un très gros volume de données (environ 100000 images). Les classes d'images sont principalement des lieux remarquables, la nature (montagnes, mer, jungle...), de l'architecture.
Modèles compatibles
Microscope fonctionne sur 8 réseaux de neurones différents, tous basés sur la reconnaissance d'images:
- Inception v1 : apprentissage basé sur ImageNet, en 22 couches, sorti en 2014.
- Inception v1 (Places) : apprentissage basé sur Places365, même architecture que Inception v1 mais spécialisé dans la reconnaissance de lieux, sorti en 2014.
- Inception v3 : apprentissage basé sur ImageNet, plus performant et efficace qu'Inception v1, sorti en 2015.
- Inception v4 : appretissage basé sur ImageNet, encore plus performant et efficace qu'Inception v3, sorti en 2016.
- VGG 19 : Réseau assez simple basé sur Inception en version simplifiée.
- ResNet v2 50
- AlexNet : Modèle le plus connu et le plus étudié basé sur ImageNet.
- AlexNet (Places) : Même architecture que le réseau AlexNet mais avec un apprentissage basé sur Places365
Ces modèles de reconnaissance d'images se différencient grâce à leurs caractéristiques d'apprentissage (différentes tailles de couches de convolution, différentes fonctions utilisées, différents poids ...) mais font partis des modèles les plus performants à l'heure actuelle. Microscope s'intéresse donc au fonctionnement de ses réseaux de neuronnes en essayant de comprendre ce qu'apprend concrètement un modèle.
Définitions
Réseau de neuronnes
ImageNet
Places365
Fonctionnement
Visualisations
Architecture en couches
Car Detector
Utilité
Sources
Site officiel : http://www.flogo.io/
Github : https://github.com/tibcosoftware/flogo