Fem måter å øke programvarepålitelighet på

0
122

Joe McKendrick

Av Joe McKendrick for Service Oriented | 19. november 2021 | Emne: IT-prioriteringer

I en tid da DevOps har blitt en nødvendighet, og ingen har råd til å få ting til å gå ned, eller til og med bremse ned, har praksisen med site reliability engineering (SRE) blitt en må-ha. SRE-er, som kobler sammen drift og utvikling, er svært etterspurt.

rubriks-cube-aug-2020-photo-by-joe-mckendrick.jpg

< /p> Foto: Joe McKendrick

Det er en stor forskjell mellom selskaper med høyt fungerende SRE-organisasjoner og de som ennå ikke har fattet praksisen, finner en fersk studie publisert av Constellation Research. “Lagggards er én stor hendelse unna en katastrofe,” sier Andy Thurai, analytiker hos Constellation og forfatter av rapporten. “Å ha en moden DevOps-organisasjon er bare ikke nok til å vinne i en digital økonomi. En moden SRE-organisasjon som tar en programvareteknisk tilnærming til IT-drift er nødvendig for å gi pålitelighet og motstandskraft til kodehastigheten som kommer ut av modne DevOps-organisasjoner.”

Kultur og tankesett er alt. “Mentaliteten til IT som kostnadssenter, eller tanken på at systemene dine er uovervinnelige, må endres,” sier Thurai. “Hele ideen med SRE er å gjøre programvare pålitelig og være forberedt på uplanlagt nedetid. En ting er å introdusere nye verktøy og smidige og slanke teknikker, men hvis kulturen i organisasjonen er ineffektiv, vil innsatsen være fåfengt.”

For å utvikle en høyfungerende SRE-praksis, tilbyr Thurai følgende anbefalinger:

Åpne organisasjonen:“Organisasjoner må fremme ett-team-samarbeid, eliminering av siloer, et trygt miljø der folk står fritt til å ta opp bekymringer og problemer, en kontinuerlig forbedringstilnærming, autonomi for team og en empatisk tilnærming til teamforhandling,” oppfordrer Thurai.

Ta inn kunstig intelligens og maskinlæring: «Bruk av AI og ML reduserer mye støy og forbedrer støy-til-signal-forholdet. Unngå varslingstretthet bidrar til å redusere slit og utbrenthet ved å gjøre det mulig for SRE-fagfolk å jage bare de store hendelsene og bruke resten av tiden sin produktivt på koding og automatisering.”

Invester i de riktige verktøyene: AIOps, observerbarhet, hendelseshåndtering og IT-automatiseringsverktøy kan spille en avgjørende rolle for å øke en SRE-innsats. “Når det gjelder krise- og hendelseshåndtering i skyen/digital-æraen, er ikke håp en strategi,” sier Thurai. Å investere i de riktige verktøyene er “nøkkelen for å gjøre digitalt effektive organisasjoner i stand til å overleve og trives.”

Automatiser infrastrukturen. “Automatisering av infrastrukturen er et must for å redusere eller eliminere slit med SRE-er. I tillegg til å skalere opp/ned basert på etterspørsel, Kubernetes-orkestrering og klyngeadministrasjon, kan organisasjoner også bruke automatisering under en hendelse for å automatisere enklere rettinger uten å måtte involvere en ingeniør.”

Ansett og tren opp det riktige personellet: “Den første blandingen av personell bør være rettet mot hendelsesidentifikasjon, eskalering og manuelle reparasjoner,” råder Thurai. Etter hvert som ting skrider frem, “bør slitet til slutt avta og SRE-teammedlemmene bør kunne konsentrere seg om å automatisere eller gjøre annet produktivt arbeid i stedet for å eskalere og jage hendelsesbilletter manuelt.”

Fremhevet

Windows 10 er en sikkerhetskatastrofe som venter på å skje. Vil Microsoft rydde opp i rotet? Den amerikanske regjeringen har nettopp lansert et stort fremstøt for å fylle cybersikkerhetsjobber, med lønn som matcher Oppgradering fra Windows 10 til Windows 11: Steg-for-steg beste TV Black Friday-tilbud: $700 rabatt på LG 86'', $220 rabatt på TCL 55'' Enterprise Programvare | CXO | Tankeledelse | Innovasjon | Teknikk og arbeid