'Alt dette skete meget hurtigt': Hvordan en rutinemæssig begivenhed bragte alt ned på Facebook

0
123

 Liam Tung

Af Liam Tung | 6. oktober 2021 | Emne: Produktivitet

Du kunne ikke bruge WhatsApp eller Instagram, fordi Facebooks datacentre blev fuldstændig afbrudt, efter at en tilsyneladende dagligdagse begivenhed forårsagede en katastrofal afbrydelse.

Facebooks timelange strømafbrydelse i søndags var en stærk påmindelse om, hvor afhængige mennesker er blevet af en virksomheds datacentre, der driver verdens største sociale netværk.

Som ZDNets Steven J. Vaughan-Nichols rapporterede i denne uge, fungerede Facebooks servere til sin internetadressebog-en Domain Name Server (DNS)-ikke, hvilket gjorde Facebook, WhatsApp og Instagram utilgængelige af årsager som de fleste af dets to milliarder brugere ikke forstår.

Facebooks DNS blev brudt, fordi Border Gateway Protocol (BGP) ruter til Facebooks websteder mislykkedes. DNS oversætter ord som 'Google' til numerisk internet eller IP -adresser, som BGP 'annoncerer' til internettet, så pc'er og smartphones kan oprette forbindelse til websteder.

Den sociale mediegigant har nu tilbudt en mere detaljeret redegørelse for, hvad der fik verdens største meddelelsessystem til at forsvinde i timevis søndag. Hændelsen fremhæver, hvordan Facebook selv er blevet et enkelt punkt i en fiasko for globale beskeder.

Hændelsen i sig selv har dog en kedelig forklaring. Facebooks labyrintiske netværk revnede, fordi et “rutinemæssigt” vedligeholdelsesjob gik galt på en måde, som dets netværk og datacentre ikke var bygget til at håndtere. Det forårsagede i sidste ende en “fuldstændig afbrydelse” mellem Facebook -datacentre og internettet, hvilket gjorde Facebook, WhatsApp og Instagram utilgængelige.

“Denne afbrydelse blev udløst af systemet, der administrerer vores globale backbone -netværkskapacitet,” forklarede Santosh Janardhan, vicepræsident for teknik på Facebook i et blogindlæg med titlen “Flere detaljer om afbrydelsen den 4. oktober”.

“Rygraden er det netværk, Facebook har bygget til at forbinde alle vores computingfaciliteter sammen, som består af titusinder af miles af fiberoptiske kabler, der krydser kloden og forbinder alle vores datacentre,” fortsatte han .

“Dette var kilden til gårsdagens afbrydelse. Under et af disse rutinemæssige vedligeholdelsesjob blev der udstedt en kommando med den hensigt at vurdere tilgængeligheden af ​​global rygradskapacitet, som utilsigtet fjernede alle forbindelser i vores rygradnetværk og effektivt afbrød Facebook -datacentre globalt. “.

Afbrydelsen afslørede, hvor afhængige mennesker er af pålideligheden af ​​Facebooks infrastruktur og følger dens bestræbelser på at fusionere WhatsApp, Facebook Messenger og Instagram -beskeder.

Det skete også, da Facebook blev undersøgt ved en senatsundersøgelse om etik og dets håndtering af misinformation på sine platforme, som fulgte efter en lækage af interne dokumenter, der blev offentliggjort af Wall Street Journal i sidste måned, og som blandt andet afslørede, at Facebook vidste, at Instagram lavede kropsbillede problemer værre for hver tredje teenagepige.

Janardhan afslørede, at Facebooks infrastruktur ikke var udstyret til at håndtere de hastigheder, der skete.

“Alt dette skete meget hurtigt,” indrømmer han.

“For at sikre pålidelig drift deaktiverer vores DNS -servere disse BGP -reklamer, hvis de ikke selv kan tale med vores datacentre, da dette er en indikation på en usund netværksforbindelse,” forklarer han.

“I den seneste afbrydelse blev hele rygraden fjernet fra drift, hvilket fik disse steder til at erklære sig usunde og trække disse BGP -annoncer tilbage. Slutresultatet var, at vores DNS -servere blev utilgængelige, selvom de stadig var i drift. Dette gjorde det umuligt for resten af ​​internettet at finde vores servere. ”

Relaterede emner:

Smart Office CXO SMB'er Tech Industry Enterprise Software  Liam Tung

Af Liam Tung | 6. oktober 2021 | Emne: Produktivitet