Intel dévoile Gaudi 3, sa dernière arme pour se lancer dans la bataille de l'IA générative

Si l'empire construit par le géant des GPU Nvidia ne semble pas prêt de s'effondrer, il n'en reste pas moins que des acteurs essaient de renverser la tendance. Dernier en date à s'y essayer, Intel et ses accélérateurs Gaudi 3 parfaitement taillés pour l'IA.

Intel Gaudi 3
Intel s'attaque au marché de l'IA générative sur lequel règne Nvidia en présentant l'accélérateur d'IA Gaudi 3 lors de son événement Vision, le 9 avril 2024, à Phoenix, en Arizona.

Nvidia n'a qu'à bien se tenir. A l'occasion de son événement Vision 2024 à Phoenix, en Arizona, Intel a fait état de sa force de frappe en matière d'intelligence artificielle générative. La firme a dévoilé son accélérateur Gaudi 3 ainsi qu'une série de systèmes évolutifs ouverts et de produits pour accélérer l'adoption de l'IA générative.

"Avec seulement 10% des entreprises qui ont réussi à mettre en production des projets GenAI l'année dernière, les dernières offres d'Intel répondent aux défis auxquels les entreprises sont confrontées pour développer leurs initiatives en matière d'IA", se vante l'entreprise. 

A raison car l'innovation progresse à un rythme effréné et l'adoption de l'IA en entreprise n'est plus une question mais bien une nécessité pour garder un avantage à tous les niveaux. Pat Gelsinger, CEO d'Intel affirme qu'"Intel apporte l'IA partout dans l'entreprise, du PC au centre de données en passant par l'edge".

Gaudi 3, un concentré de performances exceptionnelles

Successeur de Gaudi 2, l'accélérateur d'IA Gaudi 3 alimentera les systèmes d'IA avec jusqu'à des dizaines de milliers d'accélérateurs connectés par le réseau standard commun Ethernet et un logiciel ouvert, indique Intel. "Il permet aux entreprises d'évoluer de manière flexible d'un nœud unique à des clusters, des super- clusters et des méga- clusters avec des milliers de nœuds, prenant en charge l'inférence, le réglage fin et l'entraînement à grande échelle".

Côté performances, Intel promet 4 fois plus de calculs d'IA en BF16 et une augmentation de 1,5 fois de la bande passante de la mémoire par rapport à son prédécesseur. Par comparaison avec le produit phare de Nvidia, les fameux H100, les accélérateurs Gaudi 3 devrait offrir un temps d'entraînement 50% plus rapide en moyenne sur les modèles Llama2 7B et 13B et le modèle GPT-3 175B.

Intel Gaudi 3 Performances caractéristiques

Le débit d'inférence des Gaudi 3 est par ailleurs largement supérieur à celui du H100 – de 50% en moyenne et de 40% pour l'efficacité énergétique d'inférence moyenne pour les modèles Llama 7B et 70B de paramètres et le modèle Falcon 180B. Enfin, Intel promet une rapidité de l'ordre de 30% au niveau de l'inférence 30% sur les modèles Llama 7B et 70B ainsi que le modèle Falcon 180B par rapport au H200 de Nvidia. A noter que les puces seront disponibles au deuxième trimestre 2024.

Intel s'attaque au monopole de Nvidia

"Gaudi 3 se distingue comme l'alternative GenAI présentant une combinaison convaincante de performances en termes de prix, d'évolutivité du système et d'avantage en matière de délai de rentabilisation", a commenté Justin Hotard, vice-président exécutif d'Intel. Jusqu'à présent, nombre d'entreprises sont dépendantes d'un seul et même acteur qui règne en maître sur le secteur, à savoir Nvidia. Et les premiers à s'en plaindre ne sont pourtant pas les plus mal lotis.

Lors d'une table ronde organisée par Meta dans son siège parisien, Joelle Pineau, VP of AI research Meta, ne s'est d'ailleurs pas privée de commenter ce manque de diversité. "Nous souhaitons que l'industrie dans son ensemble, en termes de GPU, se diversifie, si je puis dire. Je pense que Nvidia fabrique d'excellents produits, mais le fait d'avoir plusieurs choix pourrait ajouter un peu de compétitivité sur les marchés. Ceci étant dit, je pense que nous avons aussi beaucoup de travail sur nos épaules en termes d'efficacité et pour nous assurer que nous tirons vraiment le meilleur parti en termes d'efficacité d'entraînement et d'efficacité d'inférence".

Une feuille de route très orientée IA

En plus des accélérateurs, Intel a également révélé une feuille de route élargie en matière d'IA qui comprend une plateforme d'IA d'entreprise dite "open", de nouveaux processeurs Xeon, ainsi qu'une gamme de solutions Ethernet optimisées pour l'IA, notamment des puces de connectivité IA (carte d'interface réseau).

Cette plateforme ouverte pour l'IA est lancée en partenariat avec Anyscale, Articul8, DataStax, Domino, Hugging Face, KX Systems, MariaDB, MinIO, Qdrant, RedHat, Redis, SAP, VMware, Yellowbrick et Zilliz. "Cet effort à l'échelle de l'industrie vise à développer des systèmes d'IA générative ouverts et multifournisseurs qui offrent la meilleure facilité de déploiement, les meilleures performances et la meilleure valeur, grâce à la génération augmentée par récupération (RAG)", commente Intel.

Concernant ses processeurs Xeon, Intel affirme que cette sixième génération avec des E-core (anciennement Sierra Forest) montre une amélioration de 2,4 fois des performances par watt et de 2,7 fois de la densité de rack par rapport aux processeurs Xeon de deuxième génération. De même, les processeurs Intel Xeon 6 avec des coeurs performances (P-core, anciennement Granite Rapids) adaptés à l'IA avec une prise en charge logicielle du format de données MXFP4, une réduction de la latence allant jusqu'à 6,5 fois par rapport aux Xeon de quatrième génération utilisant FP16, avec la possibilité d'exécuter des modèles Llama-2 70B.

Des synergies observées dans tous les secteurs

Profitant de cet événement, Intel a levé le voile sur quelques-unes des synergies créées avec certaines entreprises de renom. Par exemple, Intel travaille avec Bosch pour explorer d'autres possibilités de fabrication dite "intelligente", y compris des modèles fondamentaux, en générant des ensembles de données synthétiques d'anomalies de fabrication afin de fournir des ensembles d'entraînement robustes et uniformément répartis(ex : l'inspection optique automatisée).

IBM s'est également rapproché d'Intel et utilise les Xeon de 5e génération pour sa banque de données watsonx.data et travaille avec la firme pour valider la plateforme watsonx pour les accélérateurs Gaudi.

Autre secteur, autre usage, celui par International Flavors Et Fragrances (IFF) de solutions d'IA générative et de jumeaux numériques pour mettre en place un workflow intégré en biologie numérique pour la conception d'enzymes avancées et l'optimisation des processus de fermentation. Le géant mondial de l'alimentation, des boissons, des parfums et des biosciences sera donc épaulé par Intel et son catalogue de solutions pour assurer cela.

Vous souhaitez être en veille sur l’actualité du secteur de l’intelligence artificielle ? Inscrivez-vous gratuitement à la newsletter IA Insider.

Newsletter L'Usine Digitale
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.