Malgré ses difficultés financières, Intel ne relâche pas ses efforts pour revenir sur le marché de l'intelligence artificielle générative. Il mise pour ce faire sur ses nouveaux accélérateurs Gaudi 3 et ses processeurs Xeon 6. Les CPU Xeon 6 sont conçus pour gérer les charges de travail intensives tout en offrant des performances deux fois supérieures à celles de leurs prédécesseurs. Ils disposent d'un plus grand nombre de cœurs, d'une bande passante mémoire doublée et de capacités d'accélération de l'IA intégrées dans chaque cœur.
Des tests réalisés par Intel avec les Xeon 6 démontrent jusqu'à 2,3 fois plus de performances pour les chatbots basés sur Llama 3-8B par rapport à la génération précédente. De même, la firme note jusqu'à 2,4 fois plus de performances de résumé et 1,68 fois plus de perf/watt par rapport aux Xeon de 5e génération. Enfin, notons jusqu'à 3,08x plus de performances de compression pour des tests réalisés sur Llama2-7B. La configuration pour ces tests est la suivante : 96 coeurs, 500W de TDP et 1536 GB de mémoire.
Des accélérateurs Gaudi 3 parfait pour les modèles d'IA générative les plus gourmands
La seconde mise à jour majeure de son portefeuille de centres de données porte sur le déploiement des accélérateurs Gaudi 3 dévoilés pour la première fois lors de l'événement Vision 2024 de la firme. Intel les décrit comme "spécifiquement optimisés pour l'IA générative à grande échelle". Dans le détail, ces puces disposent de 64 cœurs de TPC et de huit moteurs de multiplication de matrice pour accélérer les calculs des réseaux neuronaux profonds. Il comprend 128 Go de mémoire HBM2e pour l'entraînement et l'inférence, et 24 ports Ethernet de 200 Gb pour une mise en réseau évolutive.
"Gaudi 3 offre également une compatibilité transparente avec le cadre PyTorch et des modèles avancés de type Transformer et Diffuser de Hugging Face", précise par ailleurs Intel. Avec le lancement de ces deux processeurs, l'objectif est de répondre à la demande qui explose et au besoin de diversification comme l'indique Justin Hotard : "La demande d'IA entraîne une transformation massive du centre de données, et l'industrie demande un choix de matériel, de logiciels et d'outils de développement", affirme le vice-président exécutif d'Intel et directeur général du Data Center and Artificial Intelligence Group.
Des plateformes adaptées aux batteries de tests
En parallèle de ce lancement, le portefeuille Tiber de la firme américaine s'agrandit avec des offres de services supplémentaires comprenant SeekrFlow, une plateforme d'IA de bout en bout pour le développement d'applications d'IA. Les dernières mises à jour comprennent également la dernière version du logiciel Intel Gaudi et les notebooks Jupyter chargés avec PyTorch 2.4 et Intel oneAPI and AI tools 2024.2, qui incluent des capacités d'accélération de l'IA et la prise en charge des processeurs Xeon 6.
Avec, les entreprises peuvent notamment accéder à des systèmes de prévisualisation d'Intel Xeon 6 pour l'évaluation technique et les tests via Tiber Developer Cloud. En outre, l'entreprise ouvre un accès anticipé aux Gaudi 3 à certains de ses clients pour valider les déploiements de modèles d'IA, les clusters Gaudi 3 devant commencer à être déployés au prochain trimestre pour les déploiements de production à grande échelle.
Une base de partenaires solides pour distribuer ses accélérateurs
Intel et IBM ont annoncé en début de mois un partenariat afin que le second propose les accélérateurs Intel Gaudi 3 AI en tant que service sur IBM Cloud. L'objectif est de réduire le coût total de possession pour les entreprises et inciter celles-ci à s'emparer de l'intelligence artificielle. 73% des serveurs accélérés par GPU utilisent Intel Xeon comme CPU hôte, rapporte par ailleurs IDC dans son dernier rapport sur le suivi trimestriel mondial des serveurs. Par le passé, les deux entreprises ont déjà travaillé ensemble, IBM utilisant notamment les Xeon de 5e génération pour sa banque de données watsonx.data.
En parallèle, Intel s'associe à des équipementiers tels que Dell Technologies et Supermicro, pour développer des systèmes de coingénierie adaptés aux besoins spécifiques des clients. La firme de Michael Dell développe notamment des solutions basées sur la technologie RAG en s'appuyant sur Gaudi 3 et Xeon 6.


![[ÉNERGIES] Déployez vos projets IA à l’échelle, inspirez-vous du cas ENGIE Entreprises et Collectivités](https://cdn.webikeo.com/webinar_logo/2025-10-24-ac93013fcd6c2ea907b5a091f0e74c90.png)
