Cosa ha abbattuto Facebook: la grave interruzione globale si trascina

0
107

Steven J. Vaughan-Nichols

Di Steven J. Vaughan-Nichols per Networking | 4 ottobre 2021 | Argomento: Cloud

Facebook è l'AOL di oggi Guarda ora

Il vecchio detto sulla risoluzione dei problemi di rete è, quando qualcosa va storto, “È DNS”. Questa volta Domain Name Server (DNS) sembra essere il sintomo della causa principale dell'errore globale di Facebook. La vera causa è che non ci sono percorsi BGP (Border Gateway Protocol) funzionanti nei siti di Facebook.

BGP è il protocollo gateway esterno standardizzato utilizzato per scambiare informazioni di routing e raggiungibilità tra i sistemi autonomi (AS) di primo livello di Internet. La maggior parte delle persone, anzi la maggior parte degli amministratori di rete, non ha mai bisogno di trattare con BGP.

Molte persone hanno notato che Facebook non era più elencato nei DNS. In effetti, c'erano post scherzosi che offrivano di venderti il ​​dominio Facebook.com.

Inoltre: Facebook è l'AOL del 2021

Il VP di Cloudflare Dane Knecht è stato il primo a segnalare il problema BGP sottostante. Ciò significava, come ha twittato Kevin Beaumont, ex capo del centro operativo di sicurezza di Microsoft, “Non avendo annunci BGP per i tuoi server dei nomi DNS, il DNS cade a pezzi = nessuno può trovarti su Internet. Lo stesso con WhatsApp tra l'altro. Facebook ha praticamente depiattato se stessi dalla propria piattaforma.”

Ops.

Per quanto questo sia fastidioso per te, potrebbe essere ancora più fastidioso per i dipendenti di Facebook. Ci sono rapporti secondo cui i dipendenti di Facebook non possono entrare nei loro edifici perché anche i loro badge e le porte “intelligenti” sono stati disabilitati da questo guasto di rete. Se è vero, le persone di Facebook non possono letteralmente entrare nell'edificio per sistemare le cose.

Nel frattempo, l'utente di Reddit u/ramenporn, che sosteneva di essere un dipendente di Facebook che lavorava per riportare in vita il social network, ha riferito, prima di cancellare il suo account e i suoi messaggi, che “il DNS per i servizi FB è stato colpito e questo è probabilmente un sintomo del problema reale, ed è che il peering BGP con i router di peering di Facebook è stato interrotto, molto probabilmente a causa di una modifica della configurazione entrata in vigore poco prima che si verificassero le interruzioni (iniziate all'incirca alle 1540 UTC).”

Questa massiccia interruzione ha portato offline ampie sezioni di Internet

Ha continuato: “Ci sono persone che ora cercano di accedere ai router di peering per implementare correzioni, ma le persone con accesso fisico sono separate dalle persone che sanno come autenticarsi effettivamente nei sistemi e dalle persone che sanno cosa fare effettivamente, quindi ora c'è una sfida logistica con l'unificazione di tutta quella conoscenza. Parte di ciò è dovuto anche alla riduzione del personale nei data center a causa delle misure pandemiche.

Ramenporn ha anche affermato che non si trattava di un attacco, ma di un'errata modifica della configurazione effettuata tramite un'interfaccia web. Ciò che fa davvero schifo – e il motivo per cui Facebook è ancora inattivo ore dopo – è che poiché sia ​​BGP che DNS sono inattivi, la “connessione con il mondo esterno è interrotta, l'accesso remoto a quegli strumenti non esiste più, quindi la procedura di emergenza è ottenere l'accesso fisico ai router di peering ed eseguire tutta la configurazione localmente.” Naturalmente, i tecnici sul posto non sanno come farlo e gli amministratori di rete senior non sono sul posto. Questo è, in breve, un grande casino.

Come ex amministratore di rete che ha lavorato su Internet a questo livello, prevedo che Facebook sarà inattivo per altre ore. Sospetto che finirà per essere l'errore più lungo e grave di Facebook fino ad oggi prima che venga risolto.

Storie correlate:

Facebook va giù, insieme a Instagram e WhatsAppPhysics spiega perché non ci sono informazioni sui social mediaUn modo rapido, semplice (e gratuito) per rendere Facebook più sopportabile

Argomenti correlati:

Cloud Digital Transformation Data Center CXO Innovation Storage Steven J . Vaughan-Nichols

Di Steven J. Vaughan-Nichols per Networking | 4 ottobre 2021 | Argomento: Cloud