OpenAI lâche une bombe avec son modèle générateur d'images 4o disponible dans ChatGPT

Coup d'éclat pour le domaine de la génération d'images. OpenAI a intégré la génération d'images dans ChatGPT, déployée dans un premier temps auprès des utilisateurs ChatGPT Plus, Pro, Team et Gratuit directement dans l'interface de conversation, en tant qu'outil par défaut pour la génération d'images dans le modèle 4o. Le rendu est à la hauteur des attentes : réaliste. Presque trop.

Interface 4o génération d'images - OpenAI
Un exemple de ce qu'il est possible de faire avec 4o, le modèle de génération d'images signé OpenAI.

OpenAI a fait sensation forte ces dernières 48 heures. La star de l'IA a annoncé l'intégration de la génération d'images dans ChatGPT, déployée dans un premier temps auprès des utilisateurs ChatGPT Plus, Pro, Team et Gratuit directement dans l'interface de conversation, en tant qu'outil par défaut pour la génération d'images dans le modèle 4o. A terme, cette fonctionnalité sera également disponible dans Sora. Les offres ChatGPT Enterprise et Edu y auront accès très prochainement.

L'intérêt de l'outil ? Il est capable de générer des images de haute qualité à partir de prompts, conversations et fichiers téléchargés par les utilisateurs. Il peut, au choix, créer de nouvelles images ou transformer des images existantes, avec des améliorations significatives dans l'affichage du texte, le respect des consignes et la compréhension contextuelle.

Adieu aux métiers de la création graphique ?

GPT-4o utilise une approche autorégressive ainsi que ses connaissances pour fournir des résultats de qualité de manière plus intuitive et pratique. OpenAI le met en avant pour des usages comme les diagrammes, les infographies, les visuels promotionnels pour réseaux sociaux avec codes hexadécimaux, logos et instructions complexes. Ainsi, le modèle pourrait servir pour des posters, des cartes de visite, des photos personnalisées avec fond transparent destinées à des présentations, ou des images photoréalistes dignes de celles que l'on retrouve sur des banques d'images, etc.

Il est également possible de prendre pour base une image existante afin de créer une version plus créative comme une peinture de votre chien à partir d'une photo, la retouche de votre portrait, ou encore une inspiration décoration d'intérieur basée sur une photo de votre salon. La grande mode en ce moment est la transformation de photos en "style Ghibli", basé sur les films d'animation du studio japonais à l'origine d'œuvres comme Princesse Mononoke ou Porco Rosso. L'une des demandes que nous avons faites au modèle dans les tests était de "Créer une image de Sam Altman qui roule dans une Tesla avec des lunettes Ray-Ban Meta". Et le résultat est assez bluffant :

sam altman généré par ia d'OpenAI

Peu de garde-fous

Un tel outil ouvre toutefois la voie au meilleur comme au pire : créer des deepfakes et propager de fausses images et informations devient un jeu d'enfant. Surtout quand les barrières de sécurité sont levées. Preuve en est avec la suite du test effectué qui donne ce type d'images après plusieurs tentatives, comme montré ci-dessous.

Test IA OpenAI

La question du respect du droit d'auteur pour l'entraînement du modèle est aussi toujours d'actualité. Etre capable de reproduire le style graphique caractéristique d'un studio d'animation signifie que le modèle a été entraîné sur les films, et ce sans autorisation.

Newsletter L'Usine Digitale
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.