Scannez pour télécharger l’application Gate
qrCode
Autres options de téléchargement
Ne pas rappeler aujourd’hui

Comment l'ensemble d'Internet a disparu du jour au lendemain

En bref

Une erreur de configuration chez Cloudflare le 18 novembre a provoqué une panne en cascade qui a temporairement perturbé des services majeurs tels que X, ChatGPT, Spotify et Uber dans le monde entier.

Comment LInternet Entier A Disparu Du Jour Au Lendemain

Imaginez ceci : vous vous réveillez, vous prenez votre téléphone et vous appuyez sur les icônes habituelles. X ne se charge pas. ChatGPT ne répond pas à votre question. YouTube ne montre pas votre vidéo. Même Downdetector, le site que vous utilisez normalement pour vérifier si quelque chose ne va pas, est… en panne.

Pendant quelques heures le 18 novembre, c'était la réalité pour des millions de personnes à travers le monde. Une panne majeure chez Cloudflare, l'une des entreprises d'infrastructure clés du Web moderne, a provoqué l'interruption ou la dégradation d'un large éventail de services, y compris X, ChatGPT, Spotify, Uber, Canva, League of Legends et d'autres.

On avait l'impression que “tout internet” avait disparu. En réalité, c'était quelque chose de plus petit et de plus effrayant : une seule défaillance dans les systèmes d'une entreprise se propageant à une vaste part du web.

Qu'est-ce qui a réellement mal tourné chez Cloudflare

Les problèmes ont commencé tôt mardi matin ( Nov. 18) heure des États-Unis. Vers 6h20 ET, Cloudflare a constaté une augmentation du trafic inhabituel passant par l'un de ses systèmes. Quelques minutes plus tard, les sites Web qui dépendent de Cloudflare ont commencé à afficher des pages d'“erreur de serveur interne” et à se déconnecter pour les utilisateurs du monde entier.

Alors que les rapports de panne s'accumulaient sur Downdetector et les réseaux sociaux, Cloudflare a déclaré qu'il était “au courant et en train d'enquêter” sur un problème affectant plusieurs clients. Les ingénieurs ont finalement identifié le coupable et appliqué un correctif, le trafic revenant progressivement à la normale environ trois heures après le début de la perturbation.

L'entreprise a souligné un point clé : il n'y avait aucun signe d'une cyberattaque. Ce n'était pas un DDoS, un incident de ransomware ou un acteur étatique. C'était un échec technique interne. Cependant, pour les utilisateurs, la cause n'avait pas d'importance. Leur expérience était simple : l'internet a cessé de fonctionner.

Ce que fait Cloudflare ( et pourquoi vous n'en avez jamais entendu parler )

La plupart des gens ne visitent jamais cloudflare.com intentionnellement, mais ils touchent son réseau chaque jour. Cloudflare se trouve au milieu du “chemin” d'internet entre vous et les sites web que vous utilisez. En termes simples, Cloudflare :

  • Accélère les sites en mettant en cache le contenu et en dirigeant le trafic de manière efficace ( un réseau de diffusion de contenu, ou CDN);
  • Les protège des attaques DDoS et des bots malveillants;
  • Filtre le trafic pour décider ce qui semble sûr et ce qui ne l'est pas.

L'entreprise affirme qu'elle gère le trafic d'environ un cinquième de tous les sites Web dans le monde. Elle traite également une part massive des requêtes HTTP chaque seconde, agissant discrètement comme le videur et le policier du trafic pour d'énormes parties du web.

Cette échelle est formidable quand tout fonctionne. Quand ce n'est pas le cas, tout l'internet peut soudainement sembler fragile.

Le petit fichier qui a causé le crash

Le rapport post-mortem de Cloudflare raconte une histoire étonnamment banale. Un fichier de configuration (basically a set of rules) utilisé par son système de gestion des bots et des menaces était généré automatiquement. Au fil du temps, ce fichier est devenu plus volumineux que ce que les ingénieurs avaient prévu.

À un certain moment, il a dépassé une limite stricte dans le logiciel responsable de la gestion du trafic pour plusieurs services Cloudflare. En raison d'un bug latent dans ce code, le système n'a pas échoué de manière élégante. Au lieu de cela, le fichier surdimensionné a déclenché un crash dans un composant central de gestion du trafic.

À partir de là, les choses ont dégénéré :

  • La fonctionnalité de gestion des bots a tenté d'appliquer la nouvelle configuration, trop grande ;
  • Le processus a échoué à plusieurs reprises au lieu de rejeter le fichier;
  • Ce crash a eu des répercussions sur plusieurs services qui dépendaient du même logiciel;
  • À mesure que de plus en plus de nœuds échouaient, une grande partie du réseau de Cloudflare a commencé à renvoyer des erreurs au lieu de pages web.

Le CTO de Cloudflare, Dane Knecht, a qualifié la panne d'“inacceptable” et a déclaré que l'entreprise avait “échoué” à ses clients et à l'internet en général, promettant des changements afin qu'un seul bogue de configuration ne puisse pas provoquer le même type de réaction en chaîne à nouveau.

Les pannes s'aggravent-elles ou deviennent-elles simplement plus bruyantes ?

Si vous avez l'impression que ces incidents se produisent plus souvent, vous n'êtes pas le seul. Cette panne de Cloudflare est survenue seulement quelques semaines après un incident majeur d'Amazon Web Services qui a mis hors ligne des milliers de sites web et d'applications, de Snapchat et Reddit à des outils internes sur lesquels les entreprises comptent chaque jour.

Les entreprises de surveillance des réseaux suivent des perturbations à grande échelle sur Internet depuis des années. Leurs données suggèrent quelque chose de subtil :

  • Le nombre de grandes pannes chaque année n'explose pas ;
  • Mais l'impact de chaque panne est en croissance, car de plus en plus de services dépendent des mêmes fournisseurs centraux.

Il y a vingt ans, si le serveur de messagerie de votre employeur tombait en panne, cela ruinait votre journée, mais seulement pour votre entreprise. Aujourd'hui, quand Cloudflare ou AWS a un mauvais matin, des millions de personnes et d'entreprises le ressentent en même temps.

De plus, les gens diffusent maintenant chaque bug sur X, Reddit et TikTok. Des incidents qui auraient pu passer inaperçus en tant que “problèmes de maintenance” ressemblent désormais et se sentent comme des crises mondiales.

Moins de fournisseurs, plus de risques

La panne de Cloudflare s'inscrit dans un schéma récurrent que nous avons observé avec AWS, Azure et d'autres grands acteurs de l'infrastructure :

  • Un petit changement interne ( un ajustement de configuration, une mise à jour logicielle, un script malveillant ) interagit avec une hypothèse cachée dans le système;
  • La gestion des erreurs ne le détecte pas assez tôt ;
  • Les systèmes automatisés amplifient le problème au lieu de le contenir ;
  • L'incident touche un grand nombre de clients qui dépendent tous de la même plateforme.

Nous avons optimisé Internet pour la vitesse, le coût et l'échelle mondiale. Le moyen le plus simple d'obtenir cela est d'utiliser quelques fournisseurs massifs avec des centres de données partout et des équipes d'ingénierie de classe mondiale.

Le compromis est la concentration. Lorsque un FAI local a un problème, une ville se déconnecte. Quand Cloudflare faillit, cela semble que tout l'internet vient de disparaître.

Ce que disent les leaders technologiques sur le crash

Bien qu'Elon Musk n'ait pas commenté directement le bug de Cloudflare, il a à plusieurs reprises averti sur l'infrastructure numérique trop centralisée, en particulier en ce qui concerne la résilience de X et son passage vers des systèmes plus auto-hébergés. En 2023-2025, il a souvent souligné que s'appuyer sur un seul fournisseur pour faire fonctionner de grandes parties d'Internet est “un problème de point de défaillance unique”, une critique qu'il a appliquée à AWS, Apple, Google, aux couches de style Cloudflare, et même aux opérateurs mobiles.

Le propre CTO de Cloudflare a livré la réaction la plus forte et la plus claire à la panne. Knecht a publiquement présenté ses excuses et a déclaré que cet incident était “inacceptable” en raison du nombre d'organisations et d'utilisateurs qui dépendent de l'infrastructure de Cloudflare. Il a également souligné que la cause n'était pas une attaque, mais un bug de configuration qui a déclenché une défaillance en cascade, quelque chose qu'il a décrit comme une priorité absolue à prévenir à l'avenir.

Jeff Barr, le Chief Evangelist d'Amazon Web Services, n'a pas abordé la panne de Cloudflare, mais il discute fréquemment des pannes d'AWS et du schéma général derrière les échecs à l'échelle mondiale. Son message de longue date : plus le système est interconnecté et plus les processus sont automatisés, plus le risque d'erreurs en cascade est grand.

Et enfin, le PDG de Cloudflare, Matthew Prince, a pris la parole. Il a parlé pendant des années de l'architecture délicate d'Internet, en particulier des parties que personne ne remarque jusqu'à ce qu'elles se cassent. Il soutient souvent que la santé fondamentale du web dépend de la résilience, et non de la perfection.

Il a répété des thèmes comme :

  • Les plus grandes menaces sont les erreurs de configuration internes, pas les attaquants;
  • La redondance doit être intégrée à chaque couche ;
  • Internet est maintenu ensemble par « une quantité choquante de ruban adhésif ».

Il n'a pas publié de longue déclaration publique dans les premiers moments qui ont suivi cette panne, mais les thèmes de ses précédentes interviews s'appliquent directement.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)