OpenAI publie son modèle GPT-4.5 auprès de ses utilisateurs Pro et des développeurs

La coqueluche de l'IA dévoile son tout dernier modèle "géant et coûteux". Gourmand en GPU, il sera d'abord déployé auprès des utilisateurs Pro et des développeurs, suivis des utilisateurs Plus et Team. Le modèle, plus polyvalent que ses prédécesseurs, a été développé à partir de GPT-4o et semble convenir pour des tâches d'écriture et de résolution de problèmes pratiques.

GPT 4.5 OpenAI
GPT-4.5 s'avère plus précise que les précédents modèles d'OpenAI, incluant GPT-4o, o1 et o3-mini.

Attendu comme le messie, le dernier modèle d'OpenAI est désormais disponible en "research preview", mais seulement auprès d'un petit groupe d'utilisateurs : les abonnés Pro et les développeurs. A en croire la coqueluche de l'IA, "GPT-4.5 est un pas en avant dans la mise à l'échelle du pré-entraînement et de la phase post-entraînement. En augmentant l'apprentissage non supervisé, GPT-4.5 améliore sa capacité à reconnaître des modèles, à établir des connexions et à générer des idées créatives sans raisonnement".

Les premiers tests réalisés par OpenAI montrent que l'interaction avec GPT-4.5 semble plus naturelle, notamment en raison de sa base de connaissances plus large et de sa capacité accrue à suivre l'intention de l'utilisateur. Des atouts pour des tâches telles que l'amélioration de l'écriture, la programmation et la résolution de problèmes pratiques. En outre, cela devrait réduire sa capacité à halluciner, assure la start-up : avec 37,1%, le taux d'hallucinations de GPT-4.5 est le plus bas, par rapport aux 61,8% affichés par GPT-4o et aux 44% affichés par o1.

Développé à partir de GPT-4o

On apprend par ailleurs que cet ultime modèle s'appuie sur GPT-4o et a été conçu pour être plus polyvalent que les autres modèles de raisonnement axés sur les STEM proposés par OpenAI. Plusieurs techniques ont été utilisées : le fine-tuning supervisé (SFT) et l'apprentissage par renforcement à partir du retour d'information humain (RLHF), similaires à celles utilisées pour GPT-4o.

Grâce à l'ensemble de ces techniques, GPT-4.5 prend en charge le téléchargement de fichiers et d'images et peut également travailler sur des projets d'écriture et de codage. Toutefois, il ne prend pas en charge d'autres fonctions avancées telles que la voix et la vidéo.

Un modèle "géant et coûteux"

Si Microsoft et OpenAI ne filent plus le parfait amour depuis plusieurs mois, il n'en reste pas moins que l'un a besoin de l'autre et vice-versa.  OpenAI s'est ainsi appuyé sur les supercalculateurs Azure AI pour entraîner son modèle. Sam Altman fait par ailleurs comprendre que la start-up a dû faire appel à beaucoup de GPU pour ce modèle : "Bonne nouvelle : c'est le premier modèle qui me donne l'impression de parler à une personne réfléchie. Mauvaise nouvelle : c'est un modèle géant et coûteux".

Cherchant à diffuser rapidement son modèle au plus grand nombre, la start-up semble avoir écoulé son stock de GPU nécessaires pour faire tourner le modèle. "Nous ajouterons des dizaines de milliers de GPU la semaine prochaine et le déploierons ensuite au niveau plus. (Des centaines de milliers arrivent bientôt, et je suis presque sûr que vous utiliserez tous ceux que nous pourrons accumuler.) Ce n'est pas comme ça que nous voulons fonctionner, mais il est difficile de prédire parfaitement les poussées de croissance qui conduisent à des pénuries de GPU", a-t-il affirmé sur X.

La firme prévoit donc d'ouvrir son modèle à un plus large public d'ici les semaines à venir, avec en priorité les utilisateurs de ChatGPT Plus et Team la semaine prochaine, puis pour les utilisateurs de Enterprise et Edu la semaine suivante.

Sora débarque au Royaume-Uni et en Europe

Si la star de l'IA compte ses ressources de calcul, c'est aussi parce qu'elle vient d'annoncer le lancement officiel de Sora, son modèle de génération vidéo, au Royaume-Uni et en Europe. "Cet outil de narration avancé sera mis à la disposition d’un plus large public de créateurs", s'engage OpenAI. Pour mémoire, Sora est disponible sur ChatGPT Pro ou Plus. En sus, les utilisateurs en Europe ont désormais accès à l’éditeur Sora sur Sora.com pour générer, éditer et affiner des vidéos à partir de textes, de photos et de vidéos.

Newsletter L'Usine Digitale
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.