Meta tire des revenus de ses modèles Llama hébergés par des tiers

Meta est accusé d’avoir construit et commercialisé ses modèles Llama en s’appuyant sur des millions de livres piratés obtenus sans autorisation ni compensation pour les auteurs. Plutôt que de licencier légalement les textes, le géant des réseaux sociaux a sciemment adopté une stratégie de piratage massif afin de gagner du temps, économiser de l’argent, et rattraper ses concurrents comme OpenAI. Les modèles ainsi créés sont désormais une source directe de revenus pour Meta.

Célia Séramour

Publié le 24 mars 2025 à 12h08

Tous les moyens sont bons pour multiplier les sources de revenus. C'est en tout cas la ligne de conduite adoptée par Meta à en croire une requête en jugement sommaire partiel déposée par un groupe d'auteurs (dont Richard Kadrey, Sarah Silverman, Junot Diaz, etc.) contre Meta. Les plaignants allèguent que Meta a commis une violation massive du droit d’auteur en utilisant illégalement leurs livres pour entraîner ses modèles d’intelligence artificielle. L'affaire, portée devant un tribunal fédéral en Californie, fait écho à d'autres actions similaires, incluant, en France, l'action en justice intentée par un ensemble de syndicats d'auteurs.

Dans les faits, il est reproché au géant des réseaux sociaux d'avoir utilisé des livres piratés provenant de bases de données comme LibGen, Books3, Z-Library et Internet Archive pour entraîner ses modèles Llama, puis d'avoir abandonné l'idée de respecter la loi et de négocier des licences avec de grands éditeurs (HarperCollins, Simon & Schuster, etc.) en optant pour des techniques de torrenting, téléchargeant et redistribuant des téraoctets de contenu protégé par droits d’auteur, parfois depuis des serveurs anonymes comme AWS pour masquer son implication, apprend-on dans la plainte.

Pis encore, il apparaît qu'au-delà de cette récupération de données de manière illégale pour ses modèles, Meta est allé jusqu'à monétiser ces derniers. Et c'est là tout le coeur de cette affaire.

Une exploitation commerciale des modèles Llama

Evidemment, Meta n'allait pas rester assis sur une mine d'or sans rien faire. Son objectif étant d'intégrer ses modèles Llama dans ses différents produits et d'en tirer des revenus significatifs, la firme n'a pas lésiné sur les moyens. L'exemple le plus connu est celui de l'intégration dans ses réseaux sociaux Facebook, Instagram et WhatsApp, via Meta AI.

L'assistant, déployé il y a un an aux Etats-Unis, est disponible en Europe depuis quelques jours et peut servir pour différentes tâches : il dispose d’une interface de génération de textes et d’images qui répond aux questions des utilisateurs, il peut approfondir un sujet d’actualité, obtenir de l’aide pour un tutoriel et aider à planifier un voyage, par exemple. Tout cela en s'appuyant sur les millions de données récupérées illégalement.

Lors de l'annonce des résultats financiers du premier trimestre 2024 de Meta, son patron Mark Zuckerberg s'était fendu d'un commentaire venant confirmer l'idée que l'IA générative fait considérablement grimper la courbe de ses revenus. "À l'heure actuelle, environ 30% des articles publiés sur le fil d'actualité de Facebook sont diffusés par notre système de recommandation IA. Ce chiffre a été multiplié par deux au cours des deux dernières années. Et pour la toute première fois, plus de 50% du contenu que les gens voient sur Instagram est désormais recommandé par l'IA."

Les accords commerciaux avec des tiers, une mine d'or ?

Autre façon de tirer des revenus : conclure des accords commerciaux avec des partenaires qui partagent leurs revenus avec Meta. "Meta partage un pourcentage des revenus qu'ils génèrent à partir des utilisateurs des modèles Llama... hébergés par ces entreprises", peut-on lire dans la plainte. Et ces tiers sont des entreprises bien connues du secteur : AMD, AWS, Databricks, Dell, Google Cloud, Groq, IBM, Intel, Microsoft Azure, Nvidia, Oracle, Snowflake, pour ne citer qu'eux. Meta les cite notamment dans un billet de blog dédié à la sortie de Llama 3.2, expliquant proposer ses modèles "en téléchargement sur llama.com et Hugging Face, ainsi qu'un développement immédiat sur notre vaste écosystème de plateformes partenaires", listant les entreprises citées plus tôt.

Mark Zuckerberg l'avait d'ailleurs mentionné il y a deux ans déjà, lors de la présentation des résultats financiers du second trimestre 2023 du groupe : "Notre intention, c’est que tout le monde utilise ce modèle (Llama 2, nldr). Nous voulons qu’il soit ouvert. Mais si vous êtes une entreprise comme Microsoft, Amazon ou Google, et que vous envisagez de revendre ces services, alors nous pensons qu’il est normal que nous touchions une part des revenus.

Sa vision du marché était déjà plutôt juste alors : Ce sont donc les types d’accords que nous avons l’intention de conclure, et nous avons déjà commencé à le faire un peu. Je ne pense pas que cela génèrera beaucoup de revenus à court terme, mais à long terme, on espère que cela deviendra significatif".

65 milliards d'investissements a minima dans l'IA

In fine, Meta, en passant-outre l'achat légal de millions de données - coût conséquent - et en optant pour un processus de torrenting - partageant à nouveau les fichiers piratés avec d’autres utilisateurs du réseau peer-to-peer, ce qui l’exposerait encore plus à des accusations de distribution illégale - a réussi à tirer des revenus significatifs de ses modèles et continue de le faire. Les estimations de la firme ne font d'ailleurs qu'appuyer cette idée : en 2024, Meta estimait que les revenus liés à l’IA générative dépasseraient 10 milliards de dollars dès 2025, et prévoyait plus de 65 milliards de dollars d’investissement en IA.

Meta tire des revenus de ses modèles Llama hébergés par des tiers

Une exploitation commerciale des modèles Llama

Les accords commerciaux avec des tiers, une mine d'or ?

65 milliards d'investissements a minima dans l'IA

À lire aussi