Google annonce la disponibilité de Gemini Pro et Imagen 2 dans Vertex AI

Gemini Pro, le grande modèle de langage sur lequel compte Google pour faire face à GPT-4, est désormais disponible sur son offre cloud Vertex AI. Il est accompagné de nouvelles fonctionnalités pour les déploiements en entreprise, ainsi que d'une nouvelle version d'Imogen, son générateur d'images.

Julien Bergounhoux

Publié le 13 décembre 2023 à 16h00

Google veut avancer rapidement avec sa famille de modèles d'IA générative Gemini, annoncée la semaine dernière. Gemini Pro, le modèle de taille intermédiaire que Google estime pertinent pour la majorité des cas d'usage, est désormais accessible par tous les développeurs via Google AI Studio. L'utilisation est gratuite jusqu'à 60 requêtes par minute pour le moment.

Gemini Pro gère 38 langues ainsi que les langages de programmation Python, Android (Kotlin), Node.js, Swift et Javascript. Une version appelée Gemini Pro Vision gère le texte et les images en entrée (mais seulement du texte en sortie).

En parallèle, une nouvelle version du modèle de génération d'images à partir de texte Imogen a été annoncée. Elle permet de créer des images "plus photoréalistes", mais aussi de générer automatiquement du texte et des logos. Un usage très clairement pensé pour le marketing. Il est aussi possible de générer des légendes détaillées pour les images.

Utilisation gratuite jusqu'à 60 requêtes par minute

Google pousse évidemment sa plateforme cloud dédiée à l'intelligence artificielle, Vertex AI. Gemini Pro y est disponible avec un coût de 0,00025 dollars pour 1000 signes (en entrée) et 0,0005 dollars pour 1000 signes en sortie. Google souligne qu'avec ses nouveaux TPU v5e, le coût de l'entraînement d'un modèle est deux fois moins élevé qu'en début d'année pour des performances équivalentes, et 2,7 fois moins élevé pour de l'inférence.

Plusieurs techniques de customisation du modèle sont proposées pour que les clients l'adaptent à leur cas d'usage spécifique, dont low-rank adaptation (LoRA), qui réduit le nombre de paramètres entrainables, l'apprentissage par renforcement avec supervision humaine (RLHF), step-by-step distillation (qui "distille" un petit modèle à partir d'un gros), et bien sûr le désormais classique "prompt engineering", qui consiste juste créer des requêtes ultra-précises.

L'explicabilité des résultats, un point différenciant

En complément, de nouvelles capacités d'extensions et de connecteurs permettent d'intégrer des API externes au modèle pour gérer des transactions, récupérer automatiquement des flux de données ou appeler des fonctions dans une application. Google insiste par ailleurs sur la fiabilité de ses modèles avec une fonctionnalité de citation des sources et une autre de fondement des réponses, qui les compare à un set de données de référence (soit interne à une entreprise, soit basé sur des "sources vérifiées" sur Internet).

Parallèmement au lancement de Gemini Pro, Vertex AI est désormais doté d'une fonctionnalité de comparaison automatique de modèle afin de simplifier l'évaluation de leurs performances. Elle se nomme "Automatic Side by Side". Google va par ailleurs étendre ses garanties d'indemnisation en cas de procès pour violation du droit d'auteur, une mesure équivalente à ce que propose Microsoft sur Azure.