Q&A: Infinidat CEO Moshe Yanai på at yde hurtig, afforable, pålidelig lagring

0
195

Moshe Yanai har en imponerende track record i opbevaring branchen. For omkring 20 år siden, mens du arbejder på EMC, han udviklede Symmetrix storage-array, og derfra flyttede han på at starte op mainframe-storage array selskab XIV, der blev solgt til IBM.

ibm-fellow-moshe-yanai.jpg

Yanai: “En løsning er at designe et system specifikt til at håndtere big data, virkelig big data, multi-petabytes af data.”

Billede: IBM

Han er nu kommet ud af pensionering til at arbejde på et andet nyt projekt, en mainframe-klasse opbevaring selskab kaldet Infinidat.

De varmeste innovation på lager i øjeblikket er flash-hukommelse. Det ser ud til, at alle i DET lagring verden taler om flash, en teknologi, der giver hurtig lagring på en høj pris i forhold til konventionelt lager.

Nu Infinidat siger, at du kan få det bedste fra begge verdener. Virksomhedens storage arrays kombinere konventionel opbevaring med en tinktur af flash for at tilbyde ikke blot high-end flash uden omkostninger, men med 1m+ IOPS-ydeevne og 99.99999% pålidelighed — 7 niere, når branchens standard er 5.

ZDNet talte til Yanai og hans enterprise arkitekt Chip Elmblad at finde ud af mere.

ZDNet: Hvad fristet dig ud af pensionering til at gå tilbage til oplagring virksomhed?

Yanai: jeg har været i branchen, tror jeg, 40 år. Jeg startede med CDC i 1975 på disken komponenter og min første komponent var 2,5 MB. Selvfølgelig, i dag, i samme størrelse, har vi fem petabytes.

Hvad jeg finder i denne industri er, at dette fænomen: prisen for opbevaring er faldende, så DET udgifterne er blevet kritisk, fordi virksomheder, der ønsker at drage fordel af de tilgængelige data og så videre, men så finder vi, at der er en manko-en manko i, hvad du kan gøre med den information, evne til industrien til at udnytte denne enorme mængde af data.

Jeg deltog i en tale for nylig med IDC, og de sagde, at mængden af data, vi kan nu gemme er så stort, at vi kun er i stand til at bruge fem procent af det. Da jeg kom ud af pensionering for fem år siden, de sagde, at der ikke er nogen form for en løsning til dette.

Så jeg spørger mig selv, hvordan kan det løses? Der er et par problemer der. Den ene måde er med flash, men det er dyrt. Derefter, du kan gøre ting som software-defineret opbevaring og andre ting, men det spørgsmål er altid den samme. Den ene er ledighed og den anden er prisen.

En løsning er at designe et system specifikt til at håndtere big data, virkelig big data, multi-petabytes af data. Det har fire egenskaber, der gør den unik.

Den første er forholdet mellem disk til serveren. Hvis du kigger ind i et “white-box” eller andre servere, du vil se, at de servere, der kan støtte otte drev eller en anden lille nummer. Vi har brug for at komme i en situation, hvor en server, med tredobbelt redundans, kan støtte hundredvis af drev. Med os, en server kan støtte mange, mange drev. Det er en fordel for os.

Den anden er, at du ikke behøver flash. Vi kan bruge flash-drev for caching, men de fleste af vores system kan være spinning-drev, som er billigere. Flash kan være dyrere med en faktor 10.

De fleste virksomheder bruger dyre flash til hastighed. Vi kan få den hastighed, uden at du behøver flash. Vi bruger standard-drev.

Så er der effektivitet. Vi har 72 procent effektivitet af data, før fuld komprimering. Nogle mennesker vil tale om udgifter af flash på vej ned, men de gør det uden at tale om den effektive kapacitet.

Hvorfor gjorde du kommer ind i flash?

Yanai: Flash er for hastighed… men flash er dyrt. En masse af markedsføring i dag taler om prisen på flash går ned, men det er ikke korrekt. Nu med den form for kørsel, vi bruger, kan vi være på mindst 10 til 20 gange hurtigere [end flash].

Chip Elmblad, Infinidat enterprise arkitekt: Hvad vi ser, er, at kravene i en typisk virksomhed kunde, siger, at en finansiel institution at opbygge en næste generations datacenter, eller dem, der af en cloud-udbyder-det være sig en MSP (Managed Service Provider) eller en cloud-tjeneste fusionerende — en masse af deres tjenester er ved at blive skubbet ned i datacenter. Og så en masse tjenester er ved at blive skubbet ud i skyen, uanset om det er privat, offentlig eller hybrid.

infinibox-graphic.jpg

Infinibox: kapacitet, IOPS, throughput og latenstid.

Grafik: Infinibox

En anden tendens er en tilsvarende skift i forbruget modeller, fra ren cap-ex til op-ex modeller. Så der er pres til at kontrollere omkostninger, der er hele vejen rundt, om det er omkostningerne ved verdslige ting som gulvfliser eller magt, lægges der vægt på at reducere omkostninger. IT-chefer har brug for at vide, pris-per-gigabyte-pr-måned og-data som watt-per-terabyte. Vi kan se, at mennesker ikke bekymrer sig om Objektbaserede men ting som KPI (Key Performance Indicators) styrke.

De ønsker at programmere alle deres tilførsel til et redskab, som de har udviklet. Slutresultatet er at sænke fuldtidsansat forhold til den enhed, der forvaltes. Og hvor vi plejede at være megabyte, nu vi taler om multi-multi petabytes bliver styret af et C-niveau medarbejder til at reducere omkostningerne.

Så mængden af data, der forvaltes stiger og stiger, som det er drevet af ting som Internet af Ting. IoT vokser eksponentielt. Alle, der er overgår data-reduktion teknologier.

Vi tror, at tendensen i 2017 er stigningen i “hyper-storage”. Der er ultra-high density, enterprise-klassen, software defineret, fleksibel opbevaring i skyen-og enterprise-data-centre.

En af de vigtigste egenskaber af dette vil være, at det vil køre på enhver hardware, — det behøver ikke at være beskyttet af ophavsret, eller hårdt fortrådet ind i en bestemt model. Folk ønsker at se en hardware-stak, der kan tilpasse sig enhver medietype.

Nu AFAs (Alle Flash Arrays) er der for præstationer, og de har egenskaber, som du skal programmet rundt for pålidelighed, for skala, og så videre. Men det er lidt nemt. Du lægger en medietype, der har millisekund responstid, der har performance, men hvad Moshe team har gjort, er, at de-par resultater fra den underliggende medier. Og det er en vedvarende medier.

Nu, i fortiden, hvis de ønskede resultater, folk lægger hele arrayet i flash. Men nu ved hjælp af vores teknologi, vi ved, at vi kan øge din cache-hit ratio er 80 eller 90 procent, uanset arbejdsbyrden, og at hit-rate giver os en fordel i forhold til alle-flash arrays.

Hvad vi er at finde, er der i området, er vores gennemsnitlige cache-hit ratio er omkring 80 procent for vores kunder, uanset arbejdsbyrden.

Yanai: en Anden vigtig funktion er muligheden for at skære data i mindre bidder. Vi skære det i 64K bidder, så den drev spille sammen for at enhver anmodning straks. Og når vi skriver til enhver disk, skal vi gøre det på en sekventiel måde.

Kombinationen af effektiv brug af drevet med caching sat sammen betyder, at i de fleste af de arbejdsopgaver, vi kan gøre, vi er hurtigere end alle-flash-drev.

Elmblad: Og med vores system, som vi er nødt til at have kapacitet og størrelsen af systemer som dem på Amazon er af denne verden, og Google ‘ s-og det gør vi. Vi skal, fordi det er, hvad en hyper-storage-system er.

Nu havde vi en vifte af design mål for vores Infinibox system. En af uovertruffen pålidelighed. Vi er designet til 7 niere pålidelighed (99.99999% sikker). Der er flere n+2 stykker inden for systemet, så for enhver komponent i det system, der kan have en indvirkning på tilgængeligheden, der er mindst tre.

Vi kan lide en fiasko to harddiske uden problemer. Ikke kun det, men vi kan genopbygge det hele, at data-16 terabyte — i 15 minutter eller mindre. Der sænker vores eksponering, og det giver kunden en langt større tillid til systemerne.

Der er nogle enorme software-innovationer, der Moshe ‘ s team har lagt i at opnå det. For at give dig et eksempel, de har udviklet deres egen RAID-skema. Det er ikke RAID 6, det er ikke et system til at løse en fiasko gennem algoritmer, men det giver os mulighed for at fejle to drev og genopbygge dem meget hurtigt.

Elmblad: Nu på resultater, der er hyper-skala systemer derude –Amazon, Facebook og så videre — og de har stor kapacitet, men de har også høj latency, og du kan bare ikke gøre det, hvis du kommer til rent faktisk at levere hyper opbevaring. Du er nødt til at have en ydeevne, der svarer til AFAs derude.

Nu er der er en række måder, hvorpå vi kan opnå dette. Tage vores træ struktur. Når data kommer ind, det går ind i cache, og der er en terabyte af DRAM i systemet, og 110TB af SSD ‘ er som vi bruger som en læse-cache.

Så alle de negative, man hører om-som passiv tilstand oplader mister data, eller at det med Ssd ‘er, du kan ikke gøre for mange skriver, fordi skriver dræbe Ssd’ er i alle flash-chips-lad dig ikke påvirke os. Du behøver ikke at bekymre dig om det, fordi det er en læse-cache.

Hvis vi bruger Ssd ‘er til at levere data til de programmer, det er fordi, at hvis en af disse Ssd’ vi ikke bare smide det væk. Det har ingen indvirkning på vores pålidelighed.

Yanai: Og det er kernen i det. Den type af kørsel, vi bruger, er uden betydning for performance af systemet. Vi bruger best-of-breed, hvad der er derude. Hvis en bedre kørsel kommer sammen, vi kan bruge det. Det er uden betydning for os, og har det ikke indflydelse på vores resultater eller vores pålidelighed.

I dag flash er en ekstra omkostning, så hvorfor betale ekstra gebyr, hvis du ikke har brug for?

Du siger, at dit system kan fungere ved meget høje ydeevne og meget høj pålidelighed, men hævder gerne, at gøre IT-chefer er skeptiske. Hvordan kan du komme forbi?

Yanai: Vi ved, at den virkelige verden for IT-chefer. Vi ved, hvad de prioriterede områder er: ‘Hvis jeg mister performance, det vil såre mig, men hvis jeg mister data, de kommer til at fyre mig.”

Så vi brugte to ting, og som altid med disse ting, du starter i bunden og du klatre op ad stigen. Vi har bygget dette system med den hensigt, at vi bygger det for de store kunder, Fortune 500.

Så har vi brug for to elementer. Den ene er at have en gyldig sætning. Vores er, at vi ikke kommer til at spare 10 procent eller 20 procent, vi kommer til at spare dig for 90 procent.

Nu er en ting vi tilbyder, men det er ikke nok. Den anden ting vi kan tilbyde, er et forhold. Folk kender mig, og de ved, om min fortid, om EMC, om IBM, så jeg er nødt til at bruge til at få dem til at lave et proof of concept, men bare det at få dem der, de har brug for at føle sig sikker.

Så vi kan få dem til at prøve at bruge det, og de kan starte med noget grundlæggende som backup. Og så har vi referencer med de store brugere.

Det er sådan, vi kom i gang, men det er meget nemmere nu. Vores kunder omfatter BT, Brightsolid, Raymand James Investeringer, Hawai ‘ i Medicinsk Service Association, og TriCore Løsninger.

Læs mere om skiudstyr

Hvorfor har vi stadig genopbygge RAID-drev?NetApp Q2 indtjening solid, flash-systemer få momentumSeagate lancerer ClusterStor 300N at målrette high performance computing opbevaring