OpenAI a fait sensation forte ces dernières 48 heures. La star de l'IA a annoncé l'intégration de la génération d'images dans ChatGPT, déployée dans un premier temps auprès des utilisateurs ChatGPT Plus, Pro, Team et Gratuit directement dans l'interface de conversation, en tant qu'outil par défaut pour la génération d'images dans le modèle 4o. A terme, cette fonctionnalité sera également disponible dans Sora. Les offres ChatGPT Enterprise et Edu y auront accès très prochainement.
L'intérêt de l'outil ? Il est capable de générer des images de haute qualité à partir de prompts, conversations et fichiers téléchargés par les utilisateurs. Il peut, au choix, créer de nouvelles images ou transformer des images existantes, avec des améliorations significatives dans l'affichage du texte, le respect des consignes et la compréhension contextuelle.
Adieu aux métiers de la création graphique ?
GPT-4o utilise une approche autorégressive ainsi que ses connaissances pour fournir des résultats de qualité de manière plus intuitive et pratique. OpenAI le met en avant pour des usages comme les diagrammes, les infographies, les visuels promotionnels pour réseaux sociaux avec codes hexadécimaux, logos et instructions complexes. Ainsi, le modèle pourrait servir pour des posters, des cartes de visite, des photos personnalisées avec fond transparent destinées à des présentations, ou des images photoréalistes dignes de celles que l'on retrouve sur des banques d'images, etc.
Il est également possible de prendre pour base une image existante afin de créer une version plus créative comme une peinture de votre chien à partir d'une photo, la retouche de votre portrait, ou encore une inspiration décoration d'intérieur basée sur une photo de votre salon. La grande mode en ce moment est la transformation de photos en "style Ghibli", basé sur les films d'animation du studio japonais à l'origine d'œuvres comme Princesse Mononoke ou Porco Rosso. L'une des demandes que nous avons faites au modèle dans les tests était de "Créer une image de Sam Altman qui roule dans une Tesla avec des lunettes Ray-Ban Meta". Et le résultat est assez bluffant :

Peu de garde-fous
Un tel outil ouvre toutefois la voie au meilleur comme au pire : créer des deepfakes et propager de fausses images et informations devient un jeu d'enfant. Surtout quand les barrières de sécurité sont levées. Preuve en est avec la suite du test effectué qui donne ce type d'images après plusieurs tentatives, comme montré ci-dessous.

La question du respect du droit d'auteur pour l'entraînement du modèle est aussi toujours d'actualité. Etre capable de reproduire le style graphique caractéristique d'un studio d'animation signifie que le modèle a été entraîné sur les films, et ce sans autorisation.


![[ÉNERGIES] Déployez vos projets IA à l’échelle, inspirez-vous du cas ENGIE Entreprises et Collectivités](https://cdn.webikeo.com/webinar_logo/2025-10-24-ac93013fcd6c2ea907b5a091f0e74c90.png)
