Facebook er dagens AOL Se nu
Det tog cirka seks timer, en ny rekord for Facebook nedetid, men Facebook er endelig tilbage. Hvad skete der? Her er hvad vi ved indtil videre.
Det gamle ord om fejlfinding af netværk er, at når det går galt, “Det er DNS”. Denne gang ser Domain Name Server (DNS) ud til at være symptom på hovedårsagen til den globale Facebook -fejl. Den sande årsag er, at der ikke er nogen fungerende Border Gateway Protocol (BGP) ruter ind på Facebooks websteder.
BGP er den standardiserede udvendige gateway-protokol, der bruges til at udveksle routing- og tilgængelighedsoplysninger mellem autonome internetsystemer på øverste niveau (AS). De fleste mennesker, faktisk de fleste netværksadministratorer, behøver aldrig at beskæftige sig med BGP.
Mange mennesker opdagede, at Facebook ikke længere var opført på DNS. Faktisk var der joke -indlæg, der tilbød at sælge dig Facebook.com -domænet.
Også: Facebook er AOL for 2021
Cloudflare VP Dane Knecht var den første til at rapportere det underliggende BGP -problem. Dette betød, som Kevin Beaumont, tidligere Microsofts chef for Security Operations Center, tweeted: “Ved ikke at have BGP -meddelelser til dine DNS -navneservere, falder DNS fra hinanden = ingen kan finde dig på internettet. Samme med WhatsApp btw. Facebook har dybest set deplatformeret sig selv fra deres egen platform. ”
Ups.
Så irriterende det er for dig, kan det være endnu mere irriterende for Facebook -medarbejdere. Der er rapporter om, at Facebook -medarbejdere ikke kan komme ind i deres bygninger, fordi deres “smarte” badges og døre også blev deaktiveret af denne netværksfejl. Hvis det er sandt, kan Facebooks folk bogstaveligt talt ikke komme ind i bygningen for at ordne ting.
I mellemtiden rapporterede Reddit -bruger u/ramenporn, der hævdede at være en Facebook -medarbejder, der arbejdede på at bringe det sociale netværk tilbage fra de døde, før han slettede sin konto og sine meddelelser, at “DNS til FB -tjenester er blevet påvirket, og dette er sandsynligvis et symptom på det faktiske problem, og det er, at BGP -peering med Facebook -peering -routere er gået ned, meget sandsynligt på grund af en konfigurationsændring, der trådte i kraft kort før afbrydelserne skete (startede cirka 1540 UTC). ”
Denne massive afbrydelse tog store dele af internettet offline
Han fortsatte: “Der er mennesker, der nu forsøger at få adgang til peering -routerne for at implementere rettelser, men de mennesker med fysisk adgang er adskilt fra de mennesker med viden om, hvordan de rent faktisk kan autentificere sig til systemerne og folk, der ved, hvad de rent faktisk skal gøre, så der er nu en logistisk udfordring med at få samlet al den viden. En del af dette skyldes også lavere bemanding i datacentre på grund af pandemiske foranstaltninger. ”
Ramenporn udtalte også, at det ikke var et angreb, men en forkert konfigurationsændring foretaget via en webgrænseflade. Hvad der virkelig stinker – og hvorfor Facebook stadig er nede timer senere – er, at da både BGP og DNS er nede, er “forbindelsen til omverdenen nede, fjernadgang til disse værktøjer eksisterer ikke længere, så nødproceduren er at få fysisk adgang til peering -routerne og foretage al konfiguration lokalt. ” Selvfølgelig ved teknikerne på stedet ikke, hvordan de gør det, og ledende netværksadministratorer er ikke på stedet. Dette er kort sagt et stort rod.
Facebook kom ikke umiddelbart ud om, hvad der var gået galt, og hvordan det blev rettet. Timer efter, at Facebook og alle dets relaterede tjenester gik ned, tweetede Facebooks CTO Mike Schroepfer: “Vi oplever netværksproblemer, og teams arbejder så hurtigt som muligt for at fejlsøge og gendanne så hurtigt som muligt.” Efterfølgende, da Facebook begyndte at komme op, tilføjede han: “Facebook -tjenester, der vender tilbage online nu – kan tage noget tid at komme til 100%. Til hver lille og stor virksomhed, familie og enkeltperson, der er afhængig af os, beklager jeg . ”
Som en tidligere netværksadministrator, der arbejdede på internettet på dette niveau, forventede jeg, at Facebook ville være nede i timevis. Jeg havde også ret i, at det ville vise sig at være Facebooks længste og alvorligste fiasko til dato. Jeg undrer mig over, hvad der gik galt, og hvordan det blev rettet. Bliv hængende. Vi rapporterer om det, så snart vi ved flere detaljer.
Relaterede historier:
Facebook går ned sammen med Instagram og WhatsAppPhysics forklarer, hvorfor der ikke er oplysninger om sociale medierHurtig, nem (og gratis) måde at gøre Facebook mere tåleligt
Relaterede emner:
Cloud Digital Transformation Data Centers CXO Innovation Storage