Meta a utilisé des publications d'utilisateurs de Facebook et Instagram pour entraîner son nouvel assistant

L'assistant conversationnel Meta AI annoncé il y a quelques jours a été entraîné directement sur des publications publiques d'utilisateurs des réseaux sociaux Instagram et Facebook.

Aurélien Defer

Publié le 3 octobre 2023 à 11h55

Malgré plusieurs scandales ces dernières années concernant des utilisations litigieuses des données personnelles de ses utilisateurs, Meta continue d'exposer d'exploiter cette précieuse denrée pour améliorer ses services. D'après Reuters, qui s'est entretenu avec Nick Clegg, président des affaires internationales de l'entreprise californienne, celle-ci s'est servie de publications d'usagers de Facebook et Instagram pour entraîner son nouveau robot conversationnel dernier cri.

Meta a en effet annoncé la semaine passée l'arrivée imminente d'un assistant virtuel reposant sur l'IA générative. Il sera accessible via les applications Facebook Messenger, Instagram et WhatsApp puis sur les casques Quest 3 et les lunettes Ray-Ban Meta. Sauf que, pour perfectionner le système, Meta a fait ingérer à son modèle de nombreux messages publics, photos et textes inclus, publiés par ses utilisateurs. Les conversations privées ont été exclues, ainsi que les messages partagés uniquement avec les amis et la famille.

Meta se défend

Conscient des préoccupations légitimes de certains de ses utilisateurs en matière de respect de la vie privée, Nick Clegg a tenté de désamorcer. "Nous avons essayé d'exclure les ensembles de données qui contiennent une forte prépondérance d'informations personnelles", a-t-il fait savoir à Reuters, sans donner plus de détails. Selon lui, la "grande majorité" des données utilisées pour entraîner le modèle sont publiques. Il indique aussi qu'un site comme LinkedIn n'a par exemple pas été utilisé à cause de considérations en matière de respect de la vie privée.

L'entraînement des modèles d'intelligence artificielle générative soulève de nombreuses interrogations sur le droit des internautes à garder le contrôle sur leurs vies en ligne. Le fait qu'ils utilisent au quotidien les services d'entreprises autorise-t-il ces dernières à disposer comme bon leur semble des traces laissées par leurs clients ? Il est désormais admis que la plupart des entreprises se servent de ces informations pour améliorer leurs services. Mais l'entraînement de modèles d'intelligence artificielle, dont l'usage ne se limitera probablement pas à des chatbots à l'avenir, questionne bien au-delà.

Meta a utilisé des publications d'utilisateurs de Facebook et Instagram pour entraîner son nouvel assistant

Meta se défend

À lire aussi