Personne ne dira le contraire : Intel a raté la vague de l'intelligence artificielle qui a déferlé sur l'industrie des semi-conducteurs ces dix dernières années, malgré un certain nombre d'efforts en la matière. L'entreprise met aujourd'hui les bouchées doubles pour rattraper son retard sur le sujet face à Nvidia. Avec les accélérateurs Gaudi, créés par Habana Labs, avec ses GPU pour data centers, et bien sûr avec les éternels Xeon. A l'occasion de l'événement WAICF qui s'est déroulé les 8 et 9 février à Cannes, Intel a lancé une opération séduction de grande ampleur autour de l'apport de ses CPU pour l'IA.
Se positionner sur le marché de l'inférence
Selon Lisa Spelman, corporate VP et GM responsable des produits et solutions Xeon, "les puces Intel offrent de meilleures performances pour l'inférence". Un commentaire qui n'est pas anodin, l'inférence représentant désormais la majeure partie des besoins en calcul par rapport à l'entraînement des modèles, signe que ces technologies sont arrivées à maturité et sont désormais mises en production à l'échelle.
Il faut dire par ailleurs que la bataille dans les data centers se fait aussi face à AMD et ses CPU Epyc, dont les parts de marché ont rapidement augmenté ces cinq dernières années. Si Intel reste dominant avec environ 75% du marché, il ne peut pas se montrer complaisant. Se positionner comme leader sur l'inférence a donc du sens.
Une stratégie de partenariats
Lisa Spelman a donné un aperçu de ce que contient la feuille de route d'Intel sur le plan commercial, qui passe notamment par la multiplication de partenariats avec des clients comme OVHcloud, qui lancent des services d'IA basés sur Xeon. "OVH le fait pour fournir un support localisé et pour répondre à certains défis, notamment en matière de réglementation des données", précise-t-elle. À ce sujet, Thierry Souche, directeur technique du fournisseur français, précise que les serveurs OVHcloud seront disponibles avec les processeurs Xeon de 5e génération dans le courant de l'année.
Autre partenaire, Iterate.ai est une entreprise qui se concentre sur la mise à l'échelle de l'IA générative en entreprise. Elle dispose d'une solution low code appelée Interplay. Actuellement livrée sur environ 4000 serveurs périphériques fonctionnant sur Xeon, elle propose également des services pour les industries verticales. Prenant l'exemple de la restauration rapide, Lisa Spelman revient sur la manière dont Iterate.ai et sa solution Interplay – qui tourne sur Xeon – peut améliorer l'expérience "drive" de la restauration rapide.
Iterate.ai utilise pour cela un grand modèle de langage couplé à de la reconnaissance vocale pour aider leurs clients à améliorer l'exactitude de leurs commandes. Si la reconnaissance vocale peut être utilisée comme une source secondaire pour aider les employés sur place, elle peut aussi aider les fast-foods à faire face aux périodes de pénurie de personnel et aux pics d'affluence.
Le cas Netflix
Parmi les clients prestigieux, on trouve Netflix. Il utilise l'intelligence artificielle de bien des façons : moteurs de recommandation, suggestion de ce que vous devriez regarder ensuite sur la base de votre historique, etc. Le géant californien utilise également l'IA pour améliorer l'expérience client et mieux gérer la diffusion du contenu et les coûts réseau. Utiliser des processeurs Xeon aurait multiplié ses performances par deux par rapport à une autre solution.
Toutefois, le géant du divertissement utilise également des GPU, ce que reconnaît l'admet Lisa Spelman : "Il y a une partie de leurs charges de travail d'IA pour lesquelles ils utilisent des GPU", avant d'ajouter "mais notre objectif est de leur permettre d'utiliser leur infrastructure Xeon au maximum de ses capacités et d'augmenter celles-ci avant qu'ils n'aient à investir dans une solution GPU coûteuse".
L'analyse et le suivi d'athlètes avec Xeon et Gaudi
Intel a également noué des liens avec une entreprise baptisée ai.io, spécialisée dans le suivi de performances sportives, qui utilise des CPU Xeon et des accélérateurs Gaudi pour améliorer le suivi des athlètes olympiques en 3D. Destinée aux sportifs de haut niveau, la solution génère des analyses complexes pour leur permettre d'améliorer leurs performances et d'adapter leur dynamique d'entraînement.
L'entreprise travaille actuellement avec de nombreux athlètes qui se préparent pour les prochains JO, et son objectif est de pouvoir leur fournir une réponse 3D en temps réel. Le rendu pouvant prendre beaucoup de temps, ai.io s'appuie sur des accélérateurs Gaudi, "ce qui leur permet de fournir cette capacité à un coût total de possession inférieur, alors qu'ils l'avaient auparavant travaillé et dimensionné sur des GPU".
Les PC IA, le futur de l'informatique de bureau ?
Lisa Spelman a également tenu à rappeler les investissements de la firme dans le développement de la catégorie des "AI PC". Ce terme marketing relativement flou désigne des ordinateurs personnels dotés de meilleures capacités de calcul pour l'IA. Intel peut compter pour ce faire sur l'IP Movidius, désormais intégrée à ses CPU depuis Meteor Lake. Tout l'écosystème "Wintel" est partant, avec Microsoft bien sûr, mais aussi les grands fabricants de PC. Intel estime que d'ici à 2028, environ 70% des PC seront des "PC IA".


![[ÉNERGIES] Déployez vos projets IA à l’échelle, inspirez-vous du cas ENGIE Entreprises et Collectivités](https://cdn.webikeo.com/webinar_logo/2025-10-24-ac93013fcd6c2ea907b5a091f0e74c90.png)
