AWS: Her er hva som gikk galt i det store strømbruddet for skydatabehandling

0
170

Liam Tung Skrevet av Liam Tung, bidragsyter Liam Tung Liam Tung Bidragsyter

Liam Tung er en australsk forretningsteknologijournalist som bor noen for mange svenske mil nord for Stockholm for hans smak. Han tok en bachelorgrad i økonomi og kunst (kulturstudier) ved Sydneys Macquarie University, men hacket seg (uten norrønt eller ondsinnet kode for den saks skyld) seg inn i en karriere som enterprise tech-, sikkerhets- og telekommunikasjonsjournalist hos ZDNet Australia.

Full bio 13. desember 2021 | Emne: Enterprise Software Administrere Multicloud Watch Now

Amazon Web Services (AWS) går sjelden ned uventet, men du kan forvente en detaljert forklaring når et større strømbrudd skjer.

Den siste av AWSs store strømbrudd skjedde klokken 07:30 PST tirsdag 7. desember, varte i fem timer og påvirket kunder som brukte visse applikasjonsgrensesnitt i US-EAST-1-regionen. I en offentlig sky av AWSs skala er et fem timers strømbrudd en stor hendelse.

AWS-kontrollplan brukes til å opprette og administrere AWS-ressurser. Disse kontrollflyene ble berørt ettersom de ligger på det interne nettverket. Så selv om EC2-forekomster ikke ble berørt, var EC2 API-ene kundene bruker for å lansere nye EC2-forekomster. Høyere ventetid og feilfrekvenser var de første virkningene kundene så kl. 07:30 PST.

SE: Skysikkerhet i 2021: En bedriftsguide til viktige verktøy og beste fremgangsmåter

Når denne muligheten er borte, vil kundene hadde problemer med Amazon RDS (relasjonelle databasetjenester) og Amazon EMR big data-plattformen, mens kunder med Amazon Workspaces sin administrerte desktopvirtualiseringstjeneste ikke kunne opprette nye ressurser.

På samme måte ble ikke AWSs Elastic Cloud Balancers (ELB) direkte berørt, men siden ELB API-er var det, kunne ikke kunder legge til nye forekomster til eksisterende ELB-er så raskt som vanlig.

Route 53 (CDN) APIer ble også svekket i fem timer, noe som hindret kunder i å endre DNS-oppføringer. Det var også påloggingsfeil til AWS-konsollen, latens som påvirket Amazon Secure Token Services for tredjeparts identitetstjenester, forsinkelser til CloudWatch og svekket tilgang til Amazon S3-bøtter, DynamoDB-tabeller via VPC-endepunkter og problemer med å påkalle serverløse Lambda-funksjoner.

Hendelsen 7. desember delte minst ett trekk med et stort strømbrudd som skjedde denne gangen i fjor: den stoppet AWS fra å kommunisere raskt med kunder om hendelsen via AWS Service Health Dashboard.

“Svekkelsen av overvåkingssystemene våre forsinket vår forståelse av denne hendelsen, og nettverksoverbelastningen svekket verktøyet vårt for Service Health Dashboard fra å svikte på riktig måte til vår standby-region,” forklarte AWS.

I tillegg er AWS-støttekontaktsenteret avhengig av det interne AWS-nettverket, så personalet kunne ikke opprette nye saker med normal hastighet under den fem timer lange avbruddet.

AWS sier at de vil gi ut en ny versjon av tjenesten sin Health Dashboard tidlig i 2022, som vil kjøre på tvers av flere regioner for å “sikre at vi ikke har forsinkelser i kommunikasjonen med kunder.”

Skybrudd skjer. Google Cloud har hatt sin billettprisandel, og Microsoft måtte i oktober forklare det åtte timer lange strømbruddet. Selv om det er sjeldent, er avbruddene en påminnelse om at offentlig sky kan være mer pålitelig enn konvensjonelle datasentre, men ting går galt, noen ganger katastrofalt, og kan påvirke et stort antall kritiske tjenester.

“Til slutt vil vi be om unnskyldning for innvirkningen denne hendelsen forårsaket for kundene våre,” sa AWS. “Selv om vi er stolte av vår merittliste med tilgjengelighet, vet vi hvor kritiske tjenestene våre er for våre kunder, deres applikasjoner og sluttbrukere, og deres virksomheter. Vi vet at denne hendelsen påvirket mange kunder på betydelige måter. Vi vil gjøre alt vi kan å lære av denne hendelsen og bruke den til å forbedre tilgjengeligheten vår ytterligere.”

Enterprise Software

Windows 11: Hvordan få Microsofts gratis operativsystemoppdatering De beste Linux-distroene for nybegynnere i 2021 Windows 10 er en sikkerhetskatastrofe som venter på å skje. Hvordan vil Microsoft rydde opp i rotet? AWS omfavner Fedora Linux for sin skybaserte Amazon Linux Cloud | Big Data Analytics | Innovasjon | Teknikk og arbeid | Samarbeid | Utvikler