CASABLANCA : Au titre des prouesses possiblement réalisables grâce à l’intelligence artificielle, OpenAI est assurément l’une des technologies les plus citées parmi les innovations les plus étonnantes de cette année.
L'entreprise vient de mettre au point un réseau neuronal capable de générer des images qualifiées de «photoréalistes». Au simple énoncé d’une phrase, l’IA peut créer n'importe quel assemblage imaginable d’image. Vous demandez un sécateur surréaliste, ou une photographie animée d'une courgette parlante déambulant à Paris, le logiciel créera une image correspondant à la description que vous aurez formulé.
L’entreprise américaine a récemment publié une nouvelle version de son intelligence artificielle baptisée « DALL-E 2», en hommage au peintre Dali. Plus encore que la première version, celle-ci est capable de transformer un texte en visuel haute définition. La première version ne pouvait prétendre à imager qu’un dessin sur un fond uni. Cette dernière technologie réalise des conceptions bien plus complexes que la précédente et en meilleure qualité d’image rendue.
En bref
La référence est identique : En raison des premières illustrations la dénomination de l’IA est un clin d’œil à l'artiste surréaliste Salvador Dali ainsi qu’au robot de Pixar, Wall-E, le prédécesseur du modèle, DALL-E, lancé l'année dernière.
OpenAI a reçu les financements d’Elon Musk et de Microsoft et concurrence directement DeepMind de Google.
Variantes d’images existantes
Contrairement à ce que propose la concurrence, DALL-E 2 ne se contente pas de créer des paysages à partir de références textuelles. L'IA est, aussi et surtout, capable de créer une image réaliste qui associe, en fonction de la description soumise au logiciel, différents éléments combinés «un coléoptère animé survolant en faisant des grimaces».
Pour y parvenir, le logiciel s’appuie sur un réseau neuronal entraîné sur un nombre considérable d'images avec description, à l’instar de celles proposées sur le site des grandes agences de presse. L’IA a été, en ce sens, conçue pour cheminer à l’inverse et proposer, d’elle-même, une description aux images. Une deuxième étape permet de décoder le résultat de la première, aidant à figurer une image cohérente par rapport à la première description formulée.
Cette méthodologie en deux temps a également d’autres horizons d’application possibles en matière de manipulation d’images. Le logiciel est capable de prendre une illustration et d’en remplacer un élément pour en créer éventuellement des variantes inspirées de l'original, pouvant, à la fois, modifier l’angle de vue, ma forme du sujet, ainsi que la pose qu’il prend dans l’image.
Le risque d’abus n’étant jamais à exclure, d’après la volonté des concepteurs, cette IA ne peut pas générer d'images photoréalistes de visages humains.
Entre quelles mains ?
DALL-E-2 n’est utilisable que dans sa version béta par des partenaires agréés par l’entreprise dans le cadre d’interdictions énoncées avant tout usage du logiciel. L’IA ne permet aucune utilisation pornographique, haineuse et sur des thématiques sujettes à polémiques.
Le champ des limitations à l’utilisation est encore plus large, mais circonscrit dans le temps. Pour l’heure, les testeurs agréés ne peuvent pas, non plus, exporter les conceptions de DALL-E-2 vers d’autres plateformes, y compris du même groupe. Des interdictions qui seront levées d’après OpenAI afin qu’elles puissent être alimentées ultérieurement par les fonctionnalités de DALL-E 2.
Les possibles utilisateurs espérant pouvoir recourir à cette technologie doivent, en premier lieu, s’inscrire sur une longue liste d’attente sur le site même d’OpenAI.
Source (OpenAI)