Nul
Als je ooit hebt gehad een systeem niet-langzaam, je weet hoe frustrerend het is. De lampen zijn aan, de ventilatoren draaien, maar niemand is thuis. Is het software? Een achtergrond proces amok?
Natuurlijk, het vinden van deze problemen nam een minimum van een uur en vaak dagen, weken, of zelfs maanden. In het ene geval een heel team van ingenieurs werd getrokken uit een project voor de diagnose van een bug, bij een prijs van tienduizenden dollars.
Oorzaken
Het papier geeft een overzicht van de oorzaken van de 101 niet-langzaam incidenten die geanalyseerd. Problemen met het netwerk werden de #1 oorzaak, gevolgd door de CPU, de schijf, de SSD en geheugen. Het merendeel van de storingen op het netwerk waren permanent, terwijl SSD ‘s en Cpu’ s hadden de meeste tijdelijke fouten.
Noch de oorzaak noodzakelijk rest met de trage hardware, zoals in het geval hierboven, waar een op macht beluste toepassing op sommige servers veroorzaakt andere servers te vertragen. In een ander geval de verkoper kon het niet reproduceren van de gebruiker op grote hoogte failure mode in hun zee-niveau van de faciliteit.
De Opslag van Bits nemen
Een systeembeheerder geplaagd door vertragingen lees dit papier. De onderzoeker taxonomie en voorbeelden zijn er zeker van om behulpzaam te zijn bij het uitbreiden van een visie van wat zou kunnen gebeuren.
Voor (een) voorbeeld
In één voorwaarde, een fan van de firmware zou niet snel genoeg reageren als CPU-intensieve taken werden uitgevoerd en als gevolg van de Cpu ‘s ingevoerd thermal throttle (lagere snelheid) voor de fans hadden de kans om af te koelen van de Cpu’ s.
Al met al, een fascinerende compendium van het falen statistieken en soorten. En voor degenen van ons die niet het beheren van grote clusters, een welkom gevoel van veel kogels ontweken. Oef!
Hoffelijk opmerkingen van harte welkom, natuurlijk.
Verwante Onderwerpen:
Hardware
Digitale Transformatie
Datacenters
CXO
Innovatie
Opslag
0