Af Chris Duckett og Steven J. Vaughan-Nichols | 27. september 2021 | Emne: Cloud

Billede: Getty Billeder
Amazon Web Services (AWS) havde ikke en afslappende søndag aften før den kommende arbejdsuge, hvor dens EC2-tilfælde i dens vigtigste USA-ØST-1-region kæmpede. Og fra PDT mandag morgen rapporterer nogle brugere stadig problemer, selvom AWS -statussiden nu rapporterer: “Problemet er fuldstændigt løst, og tjenesten fungerer normalt.”
Det hele begyndte klokken 20 : 11 PDT, da AWS -statussiden annoncerede, at platformen led af forringet ydeevne i sin primære tilgængelighedszone. “Eksisterende EC2 -forekomster i den berørte tilgængelighedszone, der bruger EBS -mængder, kan også opleve forringelse på grund af fastlåst IO til den vedhæftede EBS -volumen ( s), “sagde en meddelelse 30 minutter senere.
“Nylancerede EC2 -forekomster inden for den berørte tilgængelighedszone kan muligvis ikke starte på grund af den forringede volumenydelse.”
Klokken 21:47 PDT sagde AWS, at fejlen var inden for Amazon Elastic Block Store, der blev overbelastet, og kunderne skulle “fejle” til en anden tilgængelighedszone.
“Vi fortsætter med at gøre fremskridt med at bestemme årsagen til problemet, der forårsager forringet ydeevne for nogle EBS-mængder i en enkelt tilgængelighedszone (USE1-AZ2) i regionen US-EAST-1. Vi har foretaget flere ændringer for at løse den øgede ressource påstand inden for delsystemet, der er ansvarlig for at koordinere lagerværter med EBS -tjenesten, “stod der i meddelelsen kl. 22:16 PDT.
“Selvom disse ændringer har ført til en vis forbedring, har vi endnu ikke oplevet fuld opsving for de berørte EBS -mængder.”
Efter yderligere 25 minutter sagde AWS, at dens afbødning havde virket, var i fuld gang med at implementere det, og EBS -mængder skulle vende tilbage til det normale i den næste time.
I den endelige rapport, klokken 04:21 PDT, rapporterede AWS “problemet var forårsaget af øget ressourcekonflikt i EBS -delsystemet, der var ansvarlig for at koordinere EBS -lagerværter. Engineering arbejdede med at identificere årsagen og løse problemet i det berørte delsystem. Klokken 23.20 PDT, efter at have implementeret en opdatering til det berørte delsystem, begyndte IO -ydelsen for de berørte EBS -mængder at vende tilbage til normale niveauer. Ved 12:05 den 27. september, IO -ydeevne for langt de fleste berørte EBS -mængder i USE1-AZ2 tilgængelighedszonen fungerede normalt. Men fra kl.12: 12 PDT oplevede vi, at opsvinget bremsede for et mindre sæt berørte EBS-mængder samt forringede ydeevne for et lille antal yderligere mængder i USE1- AZ2 tilgængelighedszone. “
AWS fortsatte, “Engineering undersøgte grundårsagen og indførte afbødninger for at gendanne ydeevnen for det mindre sæt af resterende berørte EBS -mængder. Disse afbødninger forbedrede langsomt ydeevnen for de resterende mindre sæt af berørte EBS -mængder, med fuld drift genoprettet med 3: 45 AM PDT. Selvom næsten alle EBS -mængder er fuldt ud genoprettet, fortsætter vi med at arbejde på at gendanne et resterende lille antal EBS -mængder. Vi kommunikerer genoprettelsesstatus for disse mængder via Personal Health Dashboard. Mens størstedelen af de berørte tjenester har helt gendannet, fortsætter vi med at gendanne nogle tjenester, herunder RDS -databaser og Elasticache -klynger. Vi vil også kommunikere status for disse tjenester via Personal Health Dashboard. ”
Mens AWS oplevede problemer, blev andre websteder også ramt af ydelsesproblemer.
“Hold fast, folkens! Signalet er i øjeblikket nede på grund af en hostingafbrydelse, der påvirker dele af vores service. Vi arbejder på at bringe det sikkerhedskopierer, “tweetede meddelelsestjenesten.
Nest sagde, at dets brugere havde problemer med at logge ind, men situationen var løst.
I skrivende stund sagde Xero, at det led af langsomhed.
For at opsummere, som Thaddeus E. Grugq, snarkede tweeted: “Internettet var designet til at overleve atomkrige, ikke at AWS går ned.”
Opdatering kl. 10 EDT, 27. september: Tilføjet yderligere statusopdatering.
Relateret dækning
Amazon Web Services gør sig klar til at trække en af sine ældste cloud computing -tjenester tilbageAWS annoncerer plan om at starte AWS Australien for jævnere fakturering og kontraktindgåelse AWS gør EKS Anywhere generelt tilgængelig AWS lancerer første datacenterregion i New Zealand inden 2024AWS introducerer Amazon MemoryDB for RedisNFL og AWS afslører ny 4. down -metric for at bedømme, om din yndlingscoach foretog det rigtige opkald
Relaterede emner :
Amazon Digital Transformation Data Centers CXO Innovation Storage