L'interruzione globale di Fastly: ecco cosa è andato storto

0
162

Liam Tung

Di Liam Tung | 9 giugno 2021 — 10:06 GMT (11:06 BST) | Argomento: sicurezza

Content delivery network (CDN) Fastly ha spiegato ieri la sua grave interruzione, che ha messo fuori uso molti dei migliori siti Web del mondo, da Amazon a ZDNet.

L'ampiezza dell'interruzione ha dimostrato ancora una volta come i CDN, che portano contenuti agli utenti finali da punti di presenza (POP) distribuiti a livello globale, possano anche essere un singolo punto di errore.

Fastly dispone di POP in tutto il mondo in esecuzione su unità a stato solido (SSD) che costituiscono il suo “edge cloud” per la distribuzione di contenuti Web da data center più vicini agli utenti finali. Invece di accedere direttamente ai server di un sito Web, gli utenti accedono a una cache del sito dalla memoria cache gestita dal CDN.

VEDI: Politica di sicurezza della rete (TechRepublic Premium)

La sua interruzione globale di ieri ha impedito per breve tempo agli utenti web di accedere a The Guardian, Financial Times, The New York Times, ZDNet, Reddit , Twitch, Amazon, PayPal e il sito web del governo britannico gov.uk.

Nick Rockwell, Senior Vice President of Engineering di Fastly, ha affermato che l'interruzione di un'ora si è verificata perché un cliente ha inviato una modifica alla configurazione che ha attivato il bug del software sconosciuto.

Rockwell non spiega cosa sia successo esattamente, oltre a dire che il 12 maggio la società ha distribuito un aggiornamento software che “ha introdotto un bug che potrebbe essere attivato da una specifica configurazione del cliente in circostanze specifiche”.

Poi, ieri, 8 giugno, un cliente ha inviato una modifica alla configurazione che soddisfaceva le condizioni per attivare il bug, causando la restituzione di errori nell'85% della sua rete. Gli utenti finali che visitano i siti interessati hanno visto il messaggio di errore “Errore 503 Servizio non disponibile” nei browser.

Ieri velocemente ha affermato che il problema stava causando ai clienti un “aumento del carico dell'origine e una riduzione del Cache Hit Ratio (CHR)”. CHR è una misura del numero di richieste che una cache può fornire rispetto al numero di richieste che riceve.

“Una volta mitigati gli effetti immediati, abbiamo rivolto la nostra attenzione alla correzione del bug e alla comunicazione con i nostri clienti. Abbiamo creato una correzione permanente per il bug e abbiamo iniziato a distribuirla alle 17:25”, ha affermato Rockwell.

L'interruzione è iniziata alle 9:47 UTC.

Fastly è il settimo più grande provider CDN, dopo Google, Cloudflare, F5, Amazon CloudFront e jsDelivr, secondo Datanyze.

VEDERE: GDPR: le multe sono aumentate del 40% lo scorso anno e stanno per aumentare di molto

L'insidia dei CDN è che quando si disattivano, come ha fatto Cloudflare nel 2019, a causa di una modifica alla configurazione con errori, gli utenti non possono accedere ai siti Web che si affidano al CDN per fornire contenuti.

Rockwell ha riconosciuto che l'azienda avrebbe dovuto rilevare questo bug prima che il cliente lo attivasse accidentalmente. Si è anche scusato con i clienti.

“Anche se c'erano condizioni specifiche che hanno innescato questa interruzione, avremmo dovuto prevederla. Forniamo servizi mission-critical e trattiamo qualsiasi azione che possa causare problemi di servizio con la massima sensibilità e priorità,” scrisse.

“Ci scusiamo con i nostri clienti e coloro che si affidano a loro per l'interruzione e ringraziamo sinceramente la community per il suo supporto.”

Sicurezza

I migliori browser per la privacy: naviga al sicuro su Internet, il grande male Cyber ​​security 101: proteggi la tua privacy da hacker, spie e governo Il miglior software antivirus e app Le migliori VPN per uso aziendale e domestico Le migliori chiavi di sicurezza per l'autenticazione a due fattori Ransomware: fai queste tre cose per proteggere la tua rete dagli attacchi (ZDNet YouTube)

Argomenti correlati:

Sicurezza TV Data Management CXO Data Center Liam Tung

Di Liam Tung | 9 giugno 2021 — 10:06 GMT (11:06 BST) | Argomento: Sicurezza