OpenAI a publié GPT-5 le 7 août. Cette nouvelle famille de modèles est disponible pour tous les développeurs, mais aussi pour tous les utilisateurs de ChatGPT, même dans sa version gratuite. GPT-5 combine les capacités de raisonnement des modèles "o" avec la rapidité de réponse des modèles GPT, et remplace tous ses anciens modèles. Il utilise pour ce faire un système d'évaluation de la complexité des requêtes, qui passe automatiquement à un mode "avec raisonnement" en cas de besoin ou si l'utilisateur le lui demande.
Il existe trois versions du modèle : GPT-5, GPT-5 mini et GPT-5 nano. Les utilisateurs non-payants de ChatGPT auront droit à un nombre limité de prompts avant que le modèle ne bascule sur la variante "mini" pour faire des économies. Les abonnés à ChatGPT Plus auront droit à beaucoup plus de prompts avant cette réduction, tandis que ChatGPT Pro permettra un usage illimité. Ils auront aussi accès à un mode GPT-5 Pro qui utilisera plus de ressources pour fournir de meilleures réponses.
Pour les développeurs y accédant via l'API, les prix sont de 1,25 dollar par million de tokens en entrée et 10 dollars par million en sortie pour GPT-5, de 0,25 dollar (entrée) et 2 dollars (sortie) pour GPT-5 mini, et de 0,05 dollar (entrée) et 0,40 dollar (sortie) pour GPT-5 nano. Ils auront la possibilité de régler la verbosité du modèle, c'est-à-dire la longueur de ses réponses. Par ailleurs, GPT-5 deviendra le modèle par défaut dès la semaine prochaine pour les contrats d'entreprise.
Plus de 700 millions d'utilisateurs quotidiens, 5 millions d'entreprises clientes
Plus de 700 millions de personnes utilisent ChatGPT chaque jour, d'après Sam Altman, le CEO d'OpenAI, et 5 millions d'entreprises se servent de ses produits. Le dirigeant décrit GPT-5 comme étant le meilleur modèle pour le développement informatique au monde, et semble clairement vouloir le positionner comme un rival de Claude (conçu par Anthropic), qui gagne beaucoup de marchés dans le monde professionnel.
OpenAI a déployé une multitude de benchmarks lors de sa présentation à la presse (dont plusieurs avaient des graphes faussés, ce qui a fait jaser) pour souligner les gains de performances par rapport à ses modèles o3 et GPT-4o. Il bat des records sur SWE-bench Verified (74,9% pour le Python) et Aider Polyglot (88%). Plusieurs démonstrations de création d'applications ont été effectuées pendant la présentation, sans intervention manuelle.

OpenAI s'attaque à Anthropic et Claude
GPT-5 a d'abord répondu à une question sur le théorème de Bernoulli (principe utilisé pour faire voler les avions), puis a créé une représentation visuelle dynamique (en SVG) du différentiel de pression entre le dessus et le dessous d'une aile. Il a ensuite produit une web app pour aider le conjoint d'un des présentations à apprendre le français (plusieurs des chercheurs sur scène étaient Français). Si cette dernière ne nous a pas semblé bien utile, force est de reconnaître qu'elle était complète et relativement complexe, impliquant même un petit jeu type "snake".
Enfin, il lui a été demandé de produire un tableau de bord dynamique à partir d'un ensemble de données (le tout avec un prompt très simple, voir ci-dessous) et le résultat était évidemment très propre. Il peut même produire de la 3D, les présentateurs lui ayant demandé de créer un jeu impliquant un château fort avec des ballons à percer. Aucun intérêt ludique, mais le message est passé : GPT-5 peut générer plusieurs centaines de lignes de code à partir d'un prompt simple, sans qu'il soit nécessaire de les retoucher derrière. "Il crée le projet, puis s'envoie les erreurs à lui-même pour améliorer le code qu'il génère", a souligné l'un des présentateurs sur scène.

OpenAI a particulièrement insisté sur ses capacités en matière de frontend, qui impliquent du design graphique, et le fait qu'il peut suivre des instructions précises à la lettre, mais peut aussi essayer de deviner l'intention si elles sont vagues. Il est ainsi capable d'ajuster de lui-même les prompts, ce qui fait qu'il est moins nécessaire que ces derniers soient hyper spécifiques. Il est aussi particulièrement doué pour l'utilisation d'outils en mode agent, d'après ses développeurs.
GPT-5, modèle par défaut dans Cursor
Pour enfoncer le clou, OpenAI a invité Michael Truell, CEO d'Anysphere, la start-up derrière Cursor, l'éditeur de code par l'IA le plus populaire du marché. Il n'a pas tari d'éloges sur GPT-5, qui a une faculté "incroyable" à comprendre une base de code et est à la fois "très rapide" et peut travailler sur de longues sessions (sa fenêtre contextuelle est de 400 000, soit le double de celle d'o3). Il détaille aussi son raisonnement et peut revenir en arrière s'il s'est trompé. GPT-5 est désormais le modèle proposé par défaut aux utilisateurs de Cursor (en lieu et place de Claude).
Parmi les premières entreprises à adopter GPT-5, OpenAI a aussi cité AmGen (recherche pharmaceutique), BBVA (analyse financière), et Oscar (assurance santé). Et puis il y a bien sûr le gouvernement américain, qui va pouvoir utiliser ChatGPT quasi-gratuitement.
Plus pertinent pour les questions liées à la santé
Au sujet de ChatGPT, OpenAI s'est concentré sur certains gains spécifiques de GPT-5, notamment en matière de santé. Les questions de santé sont apparemment parmi les plus fréquentes pour le chatbot. Sam Altman a carrément fait venir sur scène une femme qui a été atteinte de cancer pour partager son expérience. ChatGPT l'avait aidée à comprendre les résultats de sa biopsie avant de s'entretenir avec le médecin, puis l'avait aidée à décider si elle devait ou non faire des rayons car ses médecins n'étaient pas d'accord sur le sujet. GPT-5 serait "encore plus pertinent" sur le sujet, avec un score record sur Healthbench, un benchmark créé par OpenAI avec 250 médecins.

De manière générale, sa fiabilité a augmenté et son taux d'hallucination a été fortement réduit (de 4 à 12 fois). Il est aussi bien meilleur sur les contextes longs, avec des scores de 95% contre 55% pour o3 dans certains benchmarks. Enfin, OpenAI le présente comme un meilleur "partenaire d'écriture", et s'est fendu d'une démonstration assez peu convaincante pour montrer qu'il génère des histoires mieux écrites. "Cela ressemble moins à une réponse suivant un modèle pré-écrit, ça a l'air plus authentique", a déclaré une employée sur scène. La différence ne nous est pas apparue évidente.
ChatGPT passe en mode agent
Malgré cela, nul doute que le chatbot saura trouver de nouveaux usages. OpenAI a fait la démonstration de sa faculté à parler coréen à haute voix, et force est de reconnaître qu'il le fait de façon naturelle. Grâce à son utilisation d'outils, il est aussi capable d'agir comme un assistant personnel, produisant des récapitulatifs de choses à faire qui incluent même des emails auxquels on a oublié de répondre ou recommande des choses à ne pas oublier pour un déplacement professionnel. ChatGPT dispose aussi désormais de quatre "personnalités" pour personnaliser la façon dont il répond de façon simplifiée : Cynic, Robot, Listener, Nerd.
Pour terminer, OpenAI a souligné ses efforts en matière de sécurité avec ces nouveaux modèles. Outre le nombre réduit d'hallucinations, GPT-5 aura moins tendance à dire qu'il a effectué une action alors qu'il ne l'a pas fait, l'un des objectifs principaux des chercheurs ayant été d'éviter qu'il ne mente aux utilisateurs. Il saura par exemple dire clairement lorsqu'il n'est pas capable de faire quelque chose.
Ils ont aussi mis en place plusieurs stratégies pour qu'il donne les meilleures réponses possibles aux questions potentielles dangereuses, tout en omettant les informations critiques. Par exemple lorsqu'on lui demande quelle énergie est nécessaire pour qu'un matériau donné prenne feu. L'idée est de pouvoir aider un étudiant sur une question de chimie tout en évitant d'expliquer à un criminel comment fabriquer une bombe.


![[ÉNERGIES] Déployez vos projets IA à l’échelle, inspirez-vous du cas ENGIE Entreprises et Collectivités](https://cdn.webikeo.com/webinar_logo/2025-10-24-ac93013fcd6c2ea907b5a091f0e74c90.png)
