L'une des premières applications de l'intelligence artificielle, l'OCR (Optical Character Recognition), permet de lire et de convertir le texte présent dans des images ou des documents scannés (PDF, photos, etc.) en un format exploitable numériquement. Il semble que Mistral AI ai décidé de retourner aux origines de la discipline en dévoilant une API d'analyse de documents sobrement baptisée "Mistral OCR".
"Contrairement aux autres modèles, Mistral OCR analyse chaque élément des documents — médias, textes, tableaux, équations — avec une précision et une intelligence sans précédent. Il prend en charge les images et les fichiers PDF, et en extrait le contenu sous forme de texte et d’images intercalés de manière ordonnée", assure la start-up. Mistral OCR peut être utilisé avec un système RAG traitant des documents multimodaux tels que des diapositives, ajoute-t-elle.
De l'optimisation du service client à la préservation de certains documents historiques
Mistral OCR introduit également l'utilisation des documents comme prompts. Via cette fonction, les utilisateurs peuvent extraire des informations spécifiques et les structurer dans des formats comme JSON. Les résultats extraits peuvent être chaînés dans des API pour construire des agents intelligents.
Les cas d'usage associés sont variés : optimiser le service client, numériser la recherche scientifique, préserver le patrimoine historique et culturel, etc. Selon Guillaume Lample, chief science officer de Mistral AI, "c'est une avancée majeure pour l’adoption généralisée des assistants IA au sein des entreprises qui doivent simplifier l’accès à leur vaste documentation interne."
Déjà disponible sur Le Chat
La start-up assure avoir fait de Mistral OCR le modèle par défaut pour la compréhension de documents pour ses utilisateurs sur Le Chat. L'API mistral-ocr-latest est par ailleurs proposée à un tarif de 1000 pages / $ (et environ le double de pages par dollar avec l’inférence en lot). A noter que l'API peut traiter jusqu'à 2000 pages par minute. L’API est disponible dès aujourd’hui sur sa suite pour développeurs, La Plateforme, et sera bientôt intégrée à son cloud, à ses partenaires d’inférence ainsi qu’en on-premise, indique Mistral.


![[ÉNERGIES] Déployez vos projets IA à l’échelle, inspirez-vous du cas ENGIE Entreprises et Collectivités](https://cdn.webikeo.com/webinar_logo/2025-10-24-ac93013fcd6c2ea907b5a091f0e74c90.png)
