Reddit poursuit Perplexity en justice pour avoir siphonné ses données

La plateforme sociale, qui dénonce "une économie de "blanchiment de données" à l'échelle industrielle", a déposé une plainte devant la cour fédérale de New York. Elle accuse la start-up d'IA d'avoir volontairement contourné les mesures de protection qu'elle avait mises en place, afin d'entraîner son moteur de recherche.

Reddit
Reddit

Reddit semble en avoir assez de l'intelligence artificielle (IA) générative. Six mois après avoir pesté publiquement contre une expérience sociale à base d'IA menée sur l'un de ses forums et quatre mois après avoir intenté une action en justice contre la start-up américaine Anthropic, accusée d'avoir volé les données du site de discussion afin d'entraîner ses modèles, la plateforme part en guerre contre un autre acteur de cet écosystème : Perplexity. Comme le rapporte le quotidien britannique The Financial Times, elle a déposé une plainte devant la cour fédérale de New York, mercredi 22 octobre, pour violation du copyright.

"Une écononomie de blanchiment de données"

Concrètement, Reddit accuse Perplexity d'avoir moissonné illégalement les données de son site afin d'entraîner le modèle d'intelligence artificielle qui alimente son moteur de recherche. "Les entreprises d'IA sont engagées dans une course à l'armement pour obtenir du contenu humain de qualité et cette pression a alimenté une économie de "blanchiment de données" à l'échelle industrielle", a déploré Ben Lee, directeur juridique du réseau social. Reddit a aussi inclus dans sa plainte trois sociétés spécialisées dans le "scraping" de données : Oxylabs, AWMProxy et SerpApi.

Selon Reddit, Perplexity utilisait les services d'au moins l'une de ces trois entreprises. La start-up d'IA, qui a pour l'heure dit ne pas avoir reçu la plainte, avait également été prévenue de cette menace judiciaire, selon le Financial Times. D'après des sources proches du dossier interrogées par le journal, le dépôt de plainte fait suite à une proposition, de Reddit à Perplexity, d'entamer des discussions au sujet d'un éventuel partenariat rémunéré, sur le modèle d'accords de licence comme le réseau social en a conclus avec les fleurons de l'intelligence artificielle Google et OpenAI en février et mai 2024.

Perplixity déjà épinglé pour contourner les blocages

Des discussions qui n'ont manifestement rien donné et qui devront donc se poursuivre devant la justice fédérale américaine. Pour obtenir gain de cause, Reddit plaide que Perplexity, Oxylabs, AWMProxy et SerpApi ont volontairement contourné les mesures de protection de ses données, lesquelles sont d'ailleurs générées par ses nombreux utilisateurs, et ce sans autorisation préalable et en dépit de toute considération pour la loi sur le copyright. En août, Perplexity avait été épinglé par Cloudflare pour des faits de ce genre et pour ses robots d'indexation (crawlers) conçus pour être difficilement détectables.

En apparence persuadée de n'avoir rien à se reprocher, la start-up américaine d'IA a affirmé auprès du Financial Times son intention de contester les accusations du réseau social. "Nous nous battrons toujours avec vigueur pour le droit des utilisateurs à accéder librement et équitablement aux connaissances publiques, a commenté l'un de ses porte-paroles. Notre approche reste fondée sur des principes et responsable, car nous fournissons des réponses factuelles grâce à une IA précise, et nous ne tolérerons aucune menace contre l'ouverture et l'intérêt public."

Newsletter L'Usine Digitale
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.