"Ce qui permet aux clients de se différencier, ce sont leurs données", Rahul Pathak, VP GenAI et AI/ML d'AWS

L’Usine Digitale : Quel est le niveau d’adoption de l’intelligence artificielle générative chez vos clients ?

Rahul Pathak : Nous constatons définitivement une très forte adoption de l’IA générative de manière générale. Nous avons des centaines de milliers de clients qui utilisent l’IA et le machine learning à grande échelle sur AWS au niveau mondial, et pour l’IA générative spécifiquement, c’est un business à plusieurs milliards de dollars pour nous.

Je dirais qu’en 2023, nous avons vu beaucoup d’expérimentations et de preuves de concept, et que cette année les clients passent en production à grande échelle. C’est une tendance générale. Pour vous citer quelques clients en Europe, nous avons Accor qui s’en sert pour l’expérience client et Axa qui l’utilise pour ses plateformes de gestion du risque. Il s’agit d’aider les entreprises à trouver de nouvelles opportunités, communiquer avec leurs clients, augmenter la productivité, ou de réduire le time-to-market.

Quels sont vos principaux avantages compétitifs par rapport aux autres grands acteurs du cloud, notamment Microsoft Azure et Google Cloud ?

Je pense que nous nous démarquons de plusieurs façons. Tout d’abord, nous sommes le plus ancien acteur du cloud, et nous avons beaucoup investi dans l’IA et les technologies attenantes pendant plus de 20 ans. Nous pensons aussi qu’il est vraiment important que les clients aient accès aux meilleurs modèles. Nous le faisons à travers notre service Bedrock. Comme les modèles sont démocratisés et accessibles à tous, ce qui permet aux clients de se différencier, ce sont leurs données. Nos services de base de données, data lake et analytics ne sont plus à présenter, et les connecter aux services d’IA a été une importante pièce du puzzle.

Enfin, je pense que d’un point de vue culturel, l’obsession pour la satisfaction client a toujours fait partie intégrante d’AWS. Les clients nous font confiance à ce titre. Donc c’est une combinaison de choses : travailler sur le sujet depuis longtemps, avoir la plus grosse empreinte et le plus d’expérience sur des systèmes en production à grande échelle.

Pouvez-vous me parler de votre utilisation de l’IA générative en interne et des bénéfices que vous en retirez ?

Nous utilisons ces outils de façon extensive à la fois au sein d’AWS et d’Amazon.com. Côté e-commerce, vous avez Rufus, notre assistant shopping à base d’IA générative, et pour les marchands, nous utilisons l’IA pour simplifier le processus de mise en ligne des produits. On parle de centaines de milliers d’entreprises qui opèrent sur des milliards de produits : nous constatons des gains dans l’exactitude des fiches produit de l’ordre de 70% à 90%.

Nous utilisons aussi l’IA au sein d’AWS, par exemple dans notre CRM pour aider nos commerciaux dans leurs interactions avec les clients. Et puis il y a Q, notre assistant pour les développeurs. Nous nous en servons notamment pour mettre à jour des dizaines de milliers d’applications Java, et nous estimons que cela nous a fait gagner plus de 4500 années de développement et 260 millions de dollars de dépenses. Il y a donc des gains concrets et significatifs lorsqu’on déploie ces technologies.

L’une des questions avec l’essor de l’IA générative est la disponibilité de suffisamment de puissance de calcul. Le carnet de commande de Nvidia pour Blackwell est par exemple déjà plein pour les douze prochains mois. Est-ce que vous percevez cela comme un frein potentiel ?

Nous savons que nos clients ont un appétit croissant et nous investissons en conséquence. Il est important que nous continuions à investir dans l’infrastructure, et nous investissons profondément dans notre partenariat avec Nvidia.

Et nous avons bien sûr nos propres composants, avec Graviton pour le calcul général ainsi que Trainium et Inferentia pour l’IA. Le but est de pouvoir fournir des options aux clients et d’améliorer continuellement l’efficacité énergétique de nos solutions.

Optimisation des coûts ?

Tout à fait, comme vous le dites, les clients cherchent à réduire leurs coûts à plusieurs niveaux. L’un d’entre eux est le coût de l’inférence, qui a fortement baissé au cours des 18 mois qui viennent de s’écouler. Et nous faisons passer les baisses de prix à nos clients lorsque notre infrastructure s’améliore.

Nous voyons des gains très significatifs sur nos propres puces en matière de coût et de performance par watt.

Vous pensez voir des gains du même ordre pour l’inférence au cours des 18 prochains mois ?

Nous nous attendons à voir des gains en efficacité de façon générale, aussi bien au niveau des data centers, des puces et des modèles. Nous savons que les fournisseurs de modèles continuent de faire avancer l’état de l’art.

Concernant l’aspect environnemental, les nouveaux data centers remplis de GPU consomment beaucoup plus qu’auparavant et requièrent des systèmes de refroidissement liquide. Comment comptez-vous concilier le besoin en puissance que nécessite l’IA générative avec les objectifs de réduction d’émissions de carbone ?

Nous continuons d’investir conséquemment dans le développement durable. Nos data centers sont en moyenne quatre fois plus économes en énergie que ceux d’une entreprise typique. Nous avons atteint nos objectifs en matière d’énergie renouvelable avec sept ans d’avance et nous n’allons pas nous arrêter. Et puis, ce dont nous avons parlé pour l’optimisation des coûts s’applique aussi directement à l’efficacité énergétique. C’est l’un des bons côtés du cloud : il y a une forte convergence entre l’efficacité énergétique et financière. Nous sommes donc fortement incités à aller dans la bonne direction.

Que vous réclament les clients en priorité aujourd’hui pour l’IA générative ?

Je pense que la plupart d’entre eux ont identifié des cas d’usage pertinents et qu’ils veulent désormais les faire passer en production. Nous les aidons à identifier les trois ou quatre applications qui leur apporteront une vraie valeur dans leur business. Comment optimiser leurs processus, réduire les coûts, mettre des produits sur le marché plus rapidement, augmenter la productivité... Et puis nous les aidons à mettre tout ça sur pied.

Qu’est-ce qui vous enthousiasme le plus dans ce domaine à titre personnel ?

Je pense que la vitesse à laquelle il se développe est remarquable. Chaque semaine il y a quelque chose de nouveau. Il y a des applications intéressantes avec des chatbots internes aux entreprises et autour de la personnalisation. Et ce qui m’enthousiasme le plus, c'est probablement l’application de l’IA aux processus des entreprises qui peuvent être ennuyeux, mais sont fondamentaux, car c’est souvent là qu’il y a le plus d’économies à faire et de bénéfices à tirer.

J’adore l’exemple de la mise à jour des applications Java par exemple, pour plusieurs raisons. D’abord parce que tous les clients ont du code qu’ils doivent mettre à jour, que ce soit pour des raisons d’hygiène informatique, de compliance ou de sécurité. Et c’est le genre de tâche rébarbative et laborieuse que les développeurs n’aiment pas faire. En utilisant l’IA, on facilite la vie de nos ingénieurs, on augmente notre sécurité, on économise de l’argent et on réduit même notre empreinte énergétique. Je le vois donc comme un vrai bond en avant dans l’utilisation efficace de nos ressources.

Est-ce qu’il y a des différences de maturité en fonction des filières, avec une adoption plus rapide dans certaines d’entre elles, comme la finance par exemple ?

Je dirais que oui. Nous voyons des choses très intéressantes au niveau des services financiers. Pour l’assurance, il y a des usages autour de la vérification automatique des déclarations et le remplissage des formulaires. L’IA générative, lorsqu’elle est combinée à des technologies classiques comme l’OCR, permet des gains de précision ahurissants. Il y a aussi des applications dans les call centers pour le service client avec des agents autonomes. Ensuite je pense qu’il y a des opportunités autour de la baisse des coûts pour la personnalisation des contenus. Par exemple Lonely Planet, qui fait des guides de voyage, peut générer des guides personnalisés pour chaque personne pour quelques centimes. C’était impossible auparavant.

L’une des tendances claires à mon sens est que les secteurs plus réglementés, comme la finance ou la santé, sont capables d’avancer plus vite car ils ont déjà mis en place des fondamentaux solides pour la gestion de leurs données. Ils ont pris le temps d’établir une gouvernance, des processus de vérification, et en conséquence ils peuvent rapidement adapter tout cela pour tirer partie de l’IA générative.

Et au niveau des tailles de structure ? Les grandes entreprises sont clairement en avance, mais est-ce que les PME suivent au moins ou sont-elles dépassées ?

Cela dépend, je dirais que la maturité du client en matière de cycle de vie de la donnée reste le principal facteur pour l’adoption de l’IA générative. Nous essayons évidemment d’aider les PME à s’y mettre, notamment par le biais de nos partenaires, mais les bénéfices qu’ils en retirent sont peut-être plus indirects. Par exemple, aux Etats-Unis, nous avons un partenariat très fort avec Intuit, qui édite le logiciel de gestion des impôts TurboTax. Ils y ont intégré de l’IA qui aide les entreprises à remplir leurs déclarations. Ils peuvent aussi tirer parti de notre assistant pour développeurs Q, et s’ils veulent construire leurs propres modèles, ils peuvent s’appuyer sur nos services comme SageMaker, Hyperpod, etc.

Les entreprises qui sont déjà passées au cloud et ont une bonne gestion de leurs données sont en avance, cela va de soi, mais est-ce que cette explosion de l’IA générative agit comme une sonnette d’alarme pour celles qui ne s’en étaient pas préoccupées jusqu’à présent ?

Absolument. Nous voyons un fort intérêt, et je dirais même dans beaucoup de cas une pression de la part des dirigeants d’entreprise pour adopter l’IA générative. Il y a un sentiment que les entreprises qui s’y mettent vraiment et adaptent leurs workflows vont distancer leurs compétiteurs.

Comme je le disais tout à l’heure, je pense que le vrai différentiateur pour les entreprises, c’est la donnée, et qu’il faut donc mettre ses données dans le cloud. Nous constatons une accélération de ce côté, mais il faut bien se rappeler qu’aujourd’hui, 80 à 85% des données sont toujours sur des data centers possédés en propre par les entreprises. Donc nous expliquons aux clients que pour tirer parti de l’IA générative, il faut moderniser son environnement de gestion des données. Mettez vos données dans le cloud et nous vous aiderons à profiter de toutes ces innovations.

L’une des questions récurrentes en ce moment est celle de la valeur concrète de l’IA générative pour le business des entreprises, au-delà de l’aspect innovant. Comment aidez-vous les entreprises à faire les bons choix, à éviter de mettre en place des solutions coûteuses qui ne génèrent pas de valeur ?

Vous savez, ce sur quoi nous nous concentrons avec nos clients, c’est d’identifier les business process à implémenter pour obtenir les résultats qu’ils souhaitent. Si vous commencez par ça et qu’ensuite vous réfléchissez à comment l’IA peut aider à accélérer et améliorer les choses, vous serez en bien meilleure position qu’en se disant juste "je veux utiliser de l’IA, qu’est-ce que je peux faire avec ?" Cela tient à comprendre les besoins des clients, aux résultats concrets qu’ils veulent obtenir, ensuite trouver comment l’IA peut s’y appliquer, et enfin optimiser et rendre tout ça aussi efficace que possible en matière de coûts.

Il ne faut pas juste se focaliser sur la technologie, il y a aussi l’humain à prendre en compte. Il faut faire évoluer les pratiques, avoir une conduite du changement pour habituer les gens à une nouvelle manière de travailler, voire les former à de nouveaux métiers. Cela demande des efforts dans la durée, même si le nouveau système est supérieur en tout point.

Quelle est votre position sur la réglementation de l’IA, suite à l’AI Act en Europe ou aux discussions autour du SB 1047 en Californie ?

Nous pensons qu’utiliser cette technologie de façon responsable est la clé pour garantir son adoption à grande échelle. Nous travaillons avec tous les gouvernements sur la question, et nous voulons nous assurer de respecter la réglementation et aussi d’aider nos clients à le faire. Nous voulons intégrer ces capacités directement dans nos services, pour donner aux clients des mesures de sécurité pour qu’ils implémentent les politiques d’utilisation qu’ils désirent.

AWS met moins l’accent sur le développement de modèles de fondation en interne que ses rivaux comme Google et Microsoft. Est-ce que c’est quelque chose qui pourrait changer, ou préférez-vous ne pas trop vous focaliser sur cette couche technologique ?

Nous avons toujours misé sur le fait de laisser le choix aux clients. Nous pensons qu’ils voudront toujours avoir le choix, et nous ne pensons donc pas qu’il y aura un jour un seul modèle qui dominera. C’est pourquoi le fait d’offrir un vaste choix de modèles est au coeur de notre stratégie avec Bedrock.

Mais nous avons une famille de modèles créés en interne, appelée Titan, et si vous regardez nos derniers modèles d’intégration de texte, ils utilisent quatre fois moins d’espace pour 97% de la précision de ce que font les autres. On en revient à ce que nous disions sur l’efficacité énergétique et financière. Ces modèles sont très populaires, et la dernière version de notre modèle de génération d’images suscite aussi beaucoup d’intérêt. Nous pensons qu’il est important d’avoir de bons modèles, mais nous laisserons toujours le choix aux clients d’utiliser ce qu’ils veulent.