Pourquoi Cloudflare a connu une panne ayant entraîné des perturbations pour des sites web du monde entier

Dans une note de blog publiée sur son site, l'entreprise reconnaît que l'incident a constitué "[sa] pire panne depuis 2019". A l'origine de celle-ci, un "fichier de caractéristiques" ayant doublé de taille et s'étant propagé à l'ensemble du réseau, perturbant sur son passage ChatGPT, League of Legends ou encore X.

Cloudlfare down 2025
Cloudlfare down 2025

Les pannes s'enchaînent et se ressemblent. Après celle du 20 octobre d'Amazon Web Services (AWS), puis celle de Microsoft Azure le 29 octobre, c'est au tour de l'entreprise californienne Cloudflare d'être confrontée à un problème ayant entraîné des perturbations pour de nombreux sites Internet et services en ligne à travers le monde, mardi 18 novembre. Parmi ces derniers, le réseau social X (anciennement Twitter), l'outil d'intelligence artificielle ChatGPT, le jeu vidéo populaire League of Legends, et même le portail de L'Usine Digitale, inaccessible quelques heures.

La faute à un fichier ayant doublé de taille

Dans une note de blog publiée mardi, Cloudflare a reconnu son erreur et présenté ses excuses aux très nombreuses entreprises qui font appel à ses services, lesquels vont de la protection contre les cyberattaques à des aides dans l'affichage de contenus. "Nous sommes désolés pour les répercussions sur nos clients et sur Internet en général, a écrit Matthew Prince, cofondateur et patron de la société depuis 2009. Compte tenu de l'importance de Cloudflare dans l'écosystème Internet, toute panne de l'un de nos systèmes est inacceptable."

D'après les données fournies par l'entreprise sur son site officiel, le gros de la panne a duré un peu plus de trois heures. Et son origine est désormais connue, poursuit Matthew Prince : "Après avoir initialement soupçonné à tort que les symptômes que nous observions étaient causés par une attaque DDoS à très grande échelle, nous avons correctement identifié le problème principal [...]", qui n'était autre qu'un "fichier de caractéristiques" ayant doublé de taille à la suite d'une modification d'autorisation dans une base de données et s'étant ensuite propagé à l'ensemble du réseau Cloudflare.

"Notre pire panne depuis 2019"

Une fois cette erreur repérée, les équipes de Cloudflare ont remplacé le fichier en question, lequel est constamment lu par son système "Bot Management", ce qui a permis à la majeure partie du trafic de reprendre son cours trois heures après le début de la panne, avec un retour complet à la normale sur les coups de 17 heures (heure californienne).

Si l'incident n'a été que de courte durée, Cloudflare reconnaît qu'il constitue "[sa] pire panne depuis 2019". Et de promettre une plus grande vigilance à l'avenir : "Les pannes que nous avons connues par le passé nous ont toujours amenés à mettre en place de nouveaux systèmes plus résistants."

Newsletter L'Usine Digitale
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.