Depuis sa première version lancée à l'été 2020, le service Inference Providers développé par Hugging Face a bien grandi, facilitant ainsi l'inférence serverless d'une grande variété de modèles exécutés sur une kyrielle de fournisseurs. Travaillant depuis longtemps avec des partenaires comme AWS, Nvidia et d'autres pour des options de déploiement dédiées via le bouton "Déployer" des pages de modèles, la start-up vient de s'associer à un acteur français bien connu : Scaleway.
L'acteur du cloud rejoint donc Hugging Face dans ce programme, aux côtés de spécialistes américains comme Fireworks ou Together AI. Pour les utilisateurs d’Hugging Face, en particulier ceux en quête de cloud européen, cela constitue un changement de taille : ils peuvent désormais exécuter leurs modèles via l’infrastructure GPU de Scaleway, hébergée et opérée en Europe, en toute conformité avec le RGPD.
Des modèles d'OpenAI ou Meta à disposition des entreprises européennes
Baptisé Scaleway Generative APIs côté fournisseur, le service entièrement géré et serverless offre aux développeurs les moyens d'utiliser les modèles open weight tels que DeepSeek, Llama, Qwen, Gemma, etc. en quelques clics. Et grande nouveauté, les modèles OpenAI (gpt-oss) sont désormais disponibles sur une infrastructure européenne, opérée par Scaleway, via l’API unifiée de Hugging Face. Le service offre une tarification compétitive à partir de 0,20 euro par million de tokens.
Le service s'exécute sur une infrastructure sécurisée située au choix dans l'un des dix sites basés en Europe, garantissant la souveraineté des données et une faible latence pour les utilisateurs européens. La plateforme prend en charge des fonctionnalités avancées, y compris des sorties structurées, des appels de fonction et des capacités multimodales pour le traitement du texte et des images. Scaleway précise offrir des temps de réponse inférieurs à 200 ms pour les premiers tokens, rendant le service idéal pour les applications interactives et les flux de travail agentiques.
Scaleway, alternative souveraine
Pour le fournisseur de cloud, c'est une belle opportunité : en se présentant en alternative souveraine, Scaleway espère gagner du terrain face aux hyperscalers américains. Aux dernières nouvelles, le fournisseur avait réussi à se constituer un cluster privé de calcul composé de 5 000 GPU, le tout dédié à l'intelligence artificielle.
Le fournisseur français a entamé, il y a deux ans maintenant, une transformation profonde afin de "répondre aux demandes des clients de toute taille, être disponible dans plusieurs zones en Europe et proposer tout ce qu'il faut pour adopter l'intelligence artificielle", comme nous l'expliquait Damien Lucas dans un entretien en juin dernier. C'est d'ailleurs dans ce contexte que le patron de la filiale cloud du groupe Iliad nous a annoncé faire "l'acquisition des actifs de Saagie uniquement". L'objectif de ce rachat est simple : accélérer le "time to insight", en facilitant la mise en production des projets data, depuis l’ingestion jusqu’à la visualisation des résultats.


![[ÉNERGIES] Déployez vos projets IA à l’échelle, inspirez-vous du cas ENGIE Entreprises et Collectivités](https://cdn.webikeo.com/webinar_logo/2025-10-24-ac93013fcd6c2ea907b5a091f0e74c90.png)
