AWS EC2 North Virginia -avbrott löser men vissa problem kvarstår

0
93

 Chris Duckett

Av Chris Duckett och Steven J. Vaughan-Nichols | 27 september 2021 | Ämne: Cloud

 datacentre-outage-gettyimages-912000448.jpg

Bild: Getty Bilder

Amazon Web Services (AWS) hade inte en avkopplande söndagskväll före arbetsveckan framåt, med sina EC2-instanser i dess huvudsakliga USA-ÖST-1-region som kämpade. Och från och med måndagsmorgonen PDT rapporterar vissa användare fortfarande problem, även om AWS -statussidan nu rapporterar “Problemet är helt löst och tjänsten fungerar normalt.”

Allt började klockan 20 : 11 PDT, när AWS -statussidan tillkännagav att plattformen led av försämrad prestanda i dess huvudsakliga tillgänglighetszon. “Befintliga EC2 -instanser inom den berörda tillgänglighetszonen som använder EBS -volymer kan också uppleva försämring på grund av fastnat IO till den bifogade EBS -volymen ( s) “, sade ett meddelande 30 minuter senare.

“Nylanserade EC2 -instanser inom den berörda tillgänglighetszonen kan misslyckas med att starta på grund av försämrad volymprestanda.”

Klockan 21:47 PDT sa AWS att felet var inom Amazon Elastic Block Store som överbelastades och att kunderna skulle “misslyckas” till en annan tillgänglighetszon.

“Vi fortsätter att göra framsteg när det gäller att fastställa orsaken till problemet som orsakar försämrad prestanda för vissa EBS-volymer i en enda tillgänglighetszon (USE1-AZ2) i USA-EAST-1-regionen. Vi har gjort flera ändringar för att hantera den ökade resursen påståendet inom delsystemet som är ansvarigt för att samordna lagringsvärdar med EBS -tjänsten ”, stod det i meddelandet kl. 22:16 PDT.

“Även om dessa förändringar har lett till viss förbättring har vi ännu inte sett fullständig återhämtning för de drabbade EBS -volymerna.”

Efter ytterligare 25 minuter sa AWS att dess lindring hade fungerat, var i färd med att distribuera det fullt ut och EBS -volymer borde återgå till det normala under nästa timme.

I slutrapporten, klockan 04:21 PDT, rapporterade AWS “problemet orsakades av ökad resurskonflikt inom EBS -delsystemet som ansvarar för att samordna EBS -lagringsvärdar. Engineering arbetade med att identifiera rotorsaken och lösa problemet inom det berörda delsystemet. Klockan 23.20 PDT, efter att ha installerat en uppdatering av det berörda delsystemet, började IO -prestanda för de drabbade EBS -volymerna återgå till normala nivåer. Vid 12:05 den 27 september, IO -prestanda för de allra flesta påverkade EBS -volymerna i USE1-AZ2-tillgänglighetszonen fungerade normalt. Men från och med klockan 12:12 PDT såg vi återhämtningen sakta ner för en mindre uppsättning drabbade EBS-volymer samt såg försämrad prestanda för ett litet antal ytterligare volymer i USE1- AZ2 -tillgänglighetszon. “

AWS fortsatte, “Engineering undersökte den främsta orsaken och införde begränsningar för att återställa prestanda för den mindre uppsättningen kvarvarande påverkade EBS -volymer. Dessa mildringar förbättrade långsamt prestandan för de återstående mindre uppsättningarna av påverkade EBS -volymer, med full drift återställd med 3: 45 AM PDT. Medan nästan alla EBS -volymer har återhämtat sig fullt ut, fortsätter vi att arbeta med att återställa en liten uppsättning EBS -volymer. Vi kommer att kommunicera återställningsstatus för dessa volymer via Personal Health Dashboard. Medan majoriteten av berörda tjänster har helt återställt fortsätter vi att återställa vissa tjänster, inklusive RDS -databaser och Elasticache -kluster. Vi kommer också att kommunicera återställningsstatus för dessa tjänster via Personal Health Dashboard. ”

Medan AWS upplevde problem drabbades andra webbplatser också av prestandaproblem.

“Håll fast, folk! Signalen är för närvarande nere på grund av ett värdavbrott som påverkar delar av vår tjänst. Vi arbetar med att få säkerhetskopiera det “, tweett meddelandetjänsten.

Nest sa att användarna hade problem med att logga in, men situationen var löst.

I skrivande stund sa Xero att det led av långsamhet.

För att sammanfatta, som Thaddeus E. Grugq, snarkat twittrade, “Internet var utformat för att överleva kärnvapenkrig, inte att AWS går ner.”

Uppdatering klockan 10 EDT, 27 september: Lade till ytterligare statusuppdatering.

Relaterad täckning

Amazon Web Services gör sig redo att gå i pension en av sina äldsta molntjänsterAWS meddelar planen att starta AWS Australien för smidigare fakturering och kontraktering AWS gör EKS Anywhere allmänt tillgängligt AWS lanserar första datacenterregionen i Nya Zeeland år 2024 AWW introducerar Amazon MemoryDB för RedisNFL och AWS avslöjar nya 4: e down -mätvärdet för att bedöma om din favoritcoach ringde rätt

Relaterade ämnen :

Amazon Digital Transformation Datacenter CXO Innovation Storage  Chris Duckett

Av Chris Duckett och Steven J. Vaughan-Nichols | 27 september 2021 | Ämne: Cloud