Intelligence artificielle : Google simplifie le RAG dans l'API Gemini grâce à la fonction File Search

Deux avancées majeures complètent l'API Gemini : l'outil File Search, qui permet d’ancrer les réponses de l'IA dans des fichiers tout en automatisant le pipeline RAG, et la prise en charge étendue du JSON Schema, qui garantit des sorties structurées compatibles avec des bibliothèques comme Pydantic ou Zod. Des améliorations censées faciliter la création d’applications fiables, interopérables et évolutives, tout en simplifiant le travail des développeurs.

Célia Séramour

Publié le 7 novembre 2025 à 16h30

Google a récemment enrichi son offre Gemini avec des innovations majeures centrées sur l’intégration des données et la simplification du développement. Cette semaine, il a ainsi lancé l'outil File Search, un système de RAG (génération augmentée par de la recherche) entièrement géré, intégré directement dans l’API Gemini, qui simplifie le pipeline de récupération pour permettre aux développeurs de se concentrer sur les tâches les plus importantes.

Conscient de la uestion du coût, Google indique que dans le but de rendre File Search accessible et abordable pour tous les développeurs, "le stockage et la génération d’embeddings à la volée sont gratuits. Vous ne payez que pour la création des embeddings lors de l’indexation initiale de vos fichiers, à un tarif fixe de 0,15 dollar par million de tokens (ou selon le coût du modèle d’embedding utilisé, ici gemini-embedding-001)".

Une simplification de l'ingénierie RAG

Dans les faits, File Search propose une alternative intuitive à une configuration auto-gérée. L'expérience développeur est simple et intégrée, tout le processus RAG est rationalisé et File Search gère automatiquement le stockage des fichiers, les stratégies de découpage optimales, les embeddings et l’injection dynamique du contexte récupéré dans les prompts. Il fonctionne avec l’API generateContent existante, ce qui facilite son adoption.

File Search s'appuyant sur le dernier modèle d’embedding Gemini de Google, il utilise la recherche vectorielle pour comprendre le sens et le contexte de la requête utilisateur. Il peut retrouver des informations pertinentes dans des documents, même si les mots exacts ne sont pas utilisés. Les réponses du modèle incluent également automatiquement des citations précisant quelles parties des documents ont été utilisées pour générer la réponse, ce qui facilite la vérification.

Enfin, les développeurs peuvent créer une base de connaissances complète à partir d’un large éventail de formats de fichiers, notamment PDF, DOCX, TXT, JSON et de nombreux types de fichiers de programmation courants (voir la liste complète des formats pris en charge dans la documentation).

Une amélioration des outputs structurés dans l'API Gemini

En parallèle, Google a publié une note concernant l'amélioration des outputs structurés dans l’API Gemini, avec une prise en charge élargie du JSON Schema et une meilleure conformité à l’ordre des propriétés dans les réponses générées.

Concrètement, Google a "ajouté la prise en charge du JSON Schema à tous les modèles Gemini actuellement pris en charge. Cela permet aux bibliothèques comme Pydantic (en Python) ou Zod (en JavaScript/TypeScript) de fonctionner directement avec l’API Gemini, sans configuration supplémentaire. Cette amélioration s’appuie sur le support existant de l’objet Schema de l’API Gemini, basé sur OpenAPI 3.0, utilisé pour les outputs structurés et les appels de fonctions".

Un changement important pour les développeurs, leur garantissant ainsi une meilleure fiabilité des données et une interopérabilité entre agents. De même, l'automatisation s'en voit facilitée. Pour les utilisateurs, cela signifie un gain de temps significatif.

Intelligence artificielle : Google simplifie le RAG dans l'API Gemini grâce à la fonction File Search

Une simplification de l'ingénierie RAG

Une amélioration des outputs structurés dans l'API Gemini

À lire aussi