L’intelligence artificielle créative : tout savoir sur la technologie GAN

Les intelligences artificielles savent actuellement classer des images, des documents, prédire des événements ou encore jouer à des jeux. Mais on sait moins qu’elles sont, aujourd’hui, en passe de devenir créatives à travers la technologie GAN. Découvrez tout ce qu’il faut savoir sur ces nouvelles technos avec transiteo !

 

Qu’est ce qu’un GAN ?

Un GAN (Generative Adversarial Networks ou Réseaux Antagonistes Génératifs en français) est un type d’intelligence artificielle inventé par un chercheur américain, Ian Goodfellow en 2014. Un GAN permet de générer des nouvelles données, souvent des images, avec un fort degré de réalisme à partir d’exemples préalablement appris.

 

D’un point de vue technique, le concept des GAN se base une architecture simple mais efficace, constituée de deux réseaux de neurones antagonistes :

  • Un réseau de neurones nommé “Générateur”, qui génère des images et les donne au discriminateur.
  • Un réseau de neurones nommé “Discriminateur”, qui détermine si l’image qu’il reçoit est réelle ou synthétisée par le générateur.

A la fin de chaque étape, le discriminateur obtient l’information si il a été trompé ou non et le générateur reçoit l’information si il a trompé le discriminateur ou non.

 

Ces 2 réseaux antagonistes se livrent à un jeu : le générateur va s’améliorer continuellement pour essayer de tromper le discriminateur qui, lui aussi, devient de plus en plus difficile à tromper. Cette boucle permet alors au générateur de générer des images de plus en plus réalistes.

 

 

Des exemples d’utilisations (futures) dans l’industrie

Si les GAN sont encore à un stade embryonnaire, les applications orientées business des GAN ont un potentiel presque infini.


Dans les applications de GAN déjà fonctionnelles et commercialisées, on retrouve A.I Gigapixel de l’entreprise Topaz. Cet outil permet d’augmenter la résolution d’une photo (ou d’une vidéo) grâce à un GAN pré-entraîné à cette tâche.

 

GAN qu'est ce que c'est ?

À gauche l’image d’origine et à droite l’image après passage dans le GAN de A.I Gigapixel. (source : https://topazlabs.com/gigapixel-ai/)

 

Toujours dans la production d’image, un outil de Nvidia nommé GauGAN, permettant la conception d’images photoréalistes en temps réel et à partir d’un simple dessin, a connu un certain succès récemment. Malgré le fait que l’outil soit encore au stade de prototype, les résultats ne sont pas moins probants.

Si certains outils basés sur la technologie GAN sont déjà fonctionnels et commercialisés, nous sommes très loin d’avoir exploré tout le champs des possibles que cette technologie va apporter ces prochaines années. Ainsi Yann LeCun, directeur de la recherche en I.A chez Facebook, déclarait que les GAN étaient “l’idée la plus intéressante de ces 10 dernières années”. Nous pourrions alors imaginer nombre de domaines où les GAN pourraient apporter une valeur ajoutée voir même disrupter totalement le domaine :

 

  • Augmentation ou même création de nouvelles banques d’images
  • Génération de nouveaux décors de film, de jeux vidéos…
  • Amélioration de la qualité des images et des vidéos
  • Création de contenu divertissant comme la de musique, de la littérature, des articles, …
  • Génération de nouveaux dessins techniques pour l’industrie automobile, aéronautique, …

Ces personnes ne sont pas réelles : elles ont été générées par un GAN ! (source : https://github.com/NVlabs/stylegan)

 

Si certains GAN ont réussi à obtenir des résultats impressionnants, les GAN sont encore loins d’être parfaits et notamment à cause des nombreux prérequis à la construction d’un GAN (grandes bases de données qualitatives, connaissances pointues, puissance de calcul nécessaire…).

 

Néanmoins, il y a, actuellement, une forte dynamique autour du développement des GAN car les potentielles futures applications orientées business sont très nombreuses et pourraient révolutionner un grand nombre de secteurs.