Vad tog ner Facebook: Stora globala avbrott drar ut

0
127

 Steven J. Vaughan-Nichols

Av Steven J. Vaughan-Nichols för nätverk | 4 oktober 2021 | Ämne: Cloud

 Facebook är dagens AOL Watch Now

Det gamla felsökningsordet för nätverket är, när något går fel, “Det är DNS”. Den här gången verkar Domain Name Server (DNS) vara symtomen på grundorsaken till Facebooks globala misslyckande. Den verkliga orsaken är att det inte finns några fungerande Border Gateway Protocol (BGP) rutter till Facebooks webbplatser.

BGP är det standardiserade externa gateway-protokollet som används för att utbyta information om routing och tillgänglighet mellan autonoma system på högsta nivå på internet (AS). De flesta människor, faktiskt de flesta nätverksadministratörer, behöver aldrig hantera BGP.

Många upptäckte att Facebook inte längre var listat på DNS. Det fanns faktiskt skämtinlägg som erbjöd dig att sälja Facebook.com -domänen.

Också: Facebook är AOL för 2021

Cloudflare VP Dane Knecht var den första som rapporterade det underliggande BGP -problemet. Detta innebar, som Kevin Beaumont, tidigare Microsofts chef för säkerhetsoperationscenter, twittrade: “Genom att inte ha BGP -meddelanden för dina DNS -namnservrar faller DNS sönder = ingen kan hitta dig på internet. Samma med WhatsApp btw. Facebook har i princip deplattformats sig själva från sin egen plattform. ”

Oj.

Så irriterande det här är för dig kan det vara ännu mer irriterande för Facebook -anställda. Det finns rapporter om att Facebook -anställda inte kan komma in i deras byggnader eftersom deras “smarta” märken och dörrar också inaktiverades av detta nätverksfel. Om det är sant kan Facebooks människor bokstavligen inte komma in i byggnaden för att fixa saker.

Under tiden rapporterade Reddit -användare u/ramenporn, som påstod sig vara en Facebook -anställd som arbetade med att få det sociala nätverket tillbaka från de döda, innan han raderade sitt konto och hans meddelanden, att “DNS för FB -tjänster har påverkats och detta är troligen ett symptom på det faktiska problemet, och det är att BGP -peering med Facebook -peering -routrar har gått ner, mycket troligtvis på grund av en konfigurationsändring som trädde i kraft strax innan avbrotten inträffade (började ungefär 1540 UTC). ”

Detta stora avbrott tog stora delar av internet offline

Han fortsatte, “Det finns människor som nu försöker få åtkomst till peering -routrarna för att implementera korrigeringar, men personerna med fysisk åtkomst är separerade från personerna med kunskap om hur man faktiskt autentiserar sig till systemen och människor som vet vad de faktiskt ska göra, så det finns nu en logistisk utmaning med att få all den kunskapen enhetlig. En del av detta beror också på lägre personal i datacenter på grund av pandemiska åtgärder. ”

Ramenporn uppgav också att det inte var en attack, utan en felaktig konfigurationsändring som gjorts via ett webbgränssnitt. Det som verkligen stinker – och varför Facebook fortfarande är nere timmar senare – är att eftersom både BGP och DNS är nere, är “anslutningen till omvärlden nere, fjärråtkomst till dessa verktyg finns inte längre, så nödproceduren är att få fysisk åtkomst till peering -routrarna och göra all konfiguration lokalt. ” Naturligtvis vet teknikerna på plats inte hur man gör det och högre nätverksadministratörer finns inte på plats. Detta är kort sagt en stor röra.

Som en tidigare nätverksadministratör som arbetade på internet på denna nivå, räknar jag med att Facebook kommer att vara nere i timmar mer. Jag misstänker att det kommer att bli Facebooks längsta och allvarligaste misslyckande hittills innan det åtgärdas.

Relaterade berättelser:

Facebook går ner, tillsammans med Instagram och WhatsAppPhysics förklarar varför det inte finns information om sociala medier Snabbt, enkelt (och gratis) sätt att göra Facebook mer uthärdlig

Relaterade ämnen:

Cloud Digital Transformation Datacenter CXO Innovation Storage  Steven J . Vaughan-Nichols

Av Steven J. Vaughan-Nichols för nätverk | 4 oktober 2021 | Ämne: Cloud