Fastly's globale afbrydelse: Her er hvad der gik galt

0
138

 Liam Tung

Af Liam Tung | 9. juni 2021 – 10:06 GMT (11:06 BST) | Emne: Sikkerhed

Indholdsleveringsnetværk (CDN) har hurtigt forklaret sit store svigt i går, som slog mange af verdens største hjemmesider ud, fra Amazon til ZDNet.

Bredden af ​​udfaldet demonstrerede endnu en gang, hvordan CDN'er, der bringer indhold til slutbrugere fra globalt distribuerede tilstedeværelsespunkter (POP'er), også kan være et enkelt fejlpunkt.

Hurtigt har POP'er over hele kloden kørt på SSD-drev (SSD'er), der udgør dens “edge cloud” til levering af webindhold fra datacentre, der er tættere på slutbrugerne. I stedet for direkte at få adgang til et websides servere får brugere adgang til en cache på webstedet fra cache-lager, der vedligeholdes af CDN.

SE: Netværkssikkerhedspolitik (TechRepublic Premium)

Dens globale afbrydelse i går kort forhindret webbrugere fra at få adgang til The Guardian, Financial Times, New York Times, ZDNet, Reddit, Twitch, Amazon, PayPal og den britiske regerings hjemmeside gov.uk.

Nick Rockwell, Fastly's senior vice president for engineering, sagde, at den timelange afbrydelse skete, fordi en kunde skubbede en konfigurationsændring, der udløste den uopdagede softwarefejl.

Rockwell forklarer ikke, hvad der præcist skete, bortset fra at sige, at virksomheden den 12. maj implementerede en softwareopdatering, der “introducerede en fejl, der kunne udløses af en bestemt kundekonfiguration under specifikke omstændigheder.”

I går, 8. juni, skubbede en kunde en konfigurationsændring, der opfyldte betingelserne for at udløse fejlen, hvilket fik 85% af sit netværk til at returnere fejl. Slutbrugere, der besøger berørte websteder, så fejlmeddelelsen “Fejl 503 service utilgængelig” i browsere.

Sagde hurtigt i går, at problemet fik kunder til at se “øget oprindelsesbelastning og lavere Cache Hit Ratio (CHR)”. CHR er et mål for, hvor mange anmodninger en cache kan levere sammenlignet med, hvor mange anmodninger den modtager.

“Når de øjeblikkelige effekter var mildnet, vendte vi vores opmærksomhed mod at rette fejlen og kommunikere med vores kunder. Vi oprettede en permanent løsning på fejlen og begyndte at implementere den kl. 17:25,” sagde Rockwell.

Forstyrrelsen begyndte kl. 9:47 UTC.

Fastly er den syvende største CDN-udbyder, der følger Google, Cloudflare, F5, Amazon CloudFront og jsDelivr, ifølge Datanyze.

SE: GDPR: Bøder steg med 40% sidste år, og de er ved at blive meget større

Fallgrube for CDN'er er, at når de går ned, som Cloudflare gjorde i 2019 – på grund af en buggy-konfigurationsændring – kan brugere ikke få adgang til websteder, der er afhængige af CDN for at levere indhold.

Rockwell erkendte, at virksomheden burde have set denne fejl, før kunden ved et uheld udløste den. Han undskyldte også kunder.

“Selvom der var specifikke forhold, der udløste dette afbrydelse, skulle vi have forventet det. Vi leverer missionskritiske tjenester, og vi behandler enhver handling, der kan forårsage serviceproblemer med den største følsomhed og prioritet,” skrev han.

“Vi undskylder vores kunder og dem, der stoler på dem for udfaldet og takker oprigtigt samfundet for dets støtte.”

Sikkerhed

bedste browsere for privatlivets fred: Gennemse sikkert på det store dårlige internet Cybersikkerhed 101: Beskyt dit privatliv mod hackere, spioner og regeringen De bedste antivirussoftware og -apps De bedste VPN'er til forretnings- og hjemmebrug De bedste sikkerhedsnøgler til to-faktor-godkendelse Ransomware: Gør disse tre ting for at hjælpe med at beskytte dit netværk mod angreb (ZDNet YouTube)

Relaterede emner:

Sikkerhed TV-datastyring CXO-datacentre Liam Tung

Af Liam Tung | 9. juni 2021 – 10:06 GMT (11:06 BST) | Emne: Sikkerhed