Moins de deux semaines après une panne mondiale d'Amazon Web Services (AWS), qui a perturbé de nombreux sites et applications en ligne, c'est au tour du service cloud de Microsoft, Azure, de connaître des déboires. Mercredi 29 octobre en fin d'après-midi, de nombreux internautes et plusieurs entreprises ont signalé des perturbations, notamment via le portail Downdetector. Avant que le problème ne soit réglé, dans la nuit de mercredi à jeudi, a fait savoir la firme de Redmond sur son site Internet.
Divers services perturbés
Parmi les services affectés durant ces quelque huit heures d'incident, les portails en ligne d'entreprises utilisant Azure, comme Costco et Starbucks, ont été temporairement inaccessibles. Dans le secteur des transports, la compagnie aérienne Alaska Airlines a dit avoir rencontré des difficultés au niveau de ses réservations et de l'impression de ses cartes d'embarquement. Aux Pays-Bas, la billetterie de la compagnie de chemin de fer NS a aussi essuyé des perturbations.
Certains services de Microsoft, tels que Microsoft 365, Xbox et Minecraft, ont également été touchés, a rapporté le média spécialisé TechCrunch. Le groupe de Satya Nadella a promis que ses équipes procéderaient à "une rétrospective interne afin de mieux comprendre l'incident et communiquera[ient] [leurs] conclusions dans un délai de 14 jours". Un "rapport final d'analyse post-incident" sera, vraisemblablement dans un délai de deux semaines, adressé aux clients d'Azure concernés.
Mauvaise modification et défaut logiciel
Microsoft sait toutefois déjà d'où vient la panne. Il s'agit d'une modification récente d'une partie de l'infrastructure d'Azure, et plus précisément de son réseau Azure Front Door (AFD). "Cette modification a introduit un état de configuration invalide ou incohérent qui a empêché un nombre important de nœuds AFD de se charger correctement, entraînant une augmentation des latences, des délais d'attente et des erreurs de connexion pour les services en aval", a écrit l'entreprise sur son site.
Elle reconnaît n'avoir pas réussi à détecter la défectuosité de sa modification avant qu'elle ne soit effective. "Nos mécanismes de protection, destinés à valider et à bloquer tout déploiement erroné, ont échoué en raison d'un défaut logiciel qui a permis au déploiement de contourner les validations de sécurité. Les mesures de protection ont depuis été revues et des contrôles de validation et de restauration supplémentaires ont été mis en place", affirme Microsoft.


![[ÉNERGIES] Déployez vos projets IA à l’échelle, inspirez-vous du cas ENGIE Entreprises et Collectivités](https://cdn.webikeo.com/webinar_logo/2025-10-24-ac93013fcd6c2ea907b5a091f0e74c90.png)
