Q&A: Infinidat CEO Moshe Yanai op het leveren van snelle, afforable, betrouwbare opslag

0
169

Moshe Yanai heeft een indrukwekkende track record in de storage-industrie. Ongeveer 20 jaar geleden tijdens het werken bij EMC, ontwikkelde hij de Symmetrix storage array en van daar verhuist hij op om te beginnen met het mainframe storage array bedrijf XIV, die werd verkocht aan IBM.

ibm-fellow-moshe-yanai.jpg

Yanai: “Eén oplossing is een systeem te ontwerpen specifiek te maken met big data, echt big data, multi-petabyte aan data.”

Afbeelding: IBM

Hij komt nu uit pensioen om te werken aan een nieuw project, een mainframe-class storage bedrijf genaamd Infinidat.

De heetste innovatie in de opslag op dit moment is het flash-geheugen. Het lijkt erop dat iedereen in de IT-opslag wereld over praat flash, een technologie die een snelle opslag op een hoge kostprijs in vergelijking met conventionele opslag.

Nu Infinidat zegt dat u kunt beschikken over het beste van beide werelden. Het bedrijf opslag-arrays combineren conventionele opslag met een tinctuur van flash te bieden, niet alleen high-end flash, zonder de kosten, maar met 1m+ IOPS-prestaties en 99.99999 procent betrouwbaarheid — 7 negens als de industrie standaard is 5.

ZDNet sprak met Yanai en zijn enterprise architect Chip Elmblad om meer te weten.

ZDNet: Hoe verleid je uit pensioen om terug te gaan in de opslag bedrijf?

Yanai: ik heb in de business voor, denk ik, 40 jaar. Ik begon met CDC in 1975 op de schijf onderdelen en mijn eerste onderdeel was 2,5 MB. Natuurlijk, vandaag de dag, in dezelfde grootte, hebben we vijf petabyte.

Wat vind ik in deze industrie is met dit fenomeen: de kosten van de opslag is wind, dus de kosten zijn van cruciaal belang geworden omdat bedrijven willen profiteren van de beschikbare gegevens en dergelijke, maar dan vinden we dat er een tekort is — het tekort in wat je kunt doen met de informatie die, in het vermogen van de industrie om gebruik te maken van deze enorme hoeveelheid gegevens.

Ik woonde een lezing recent IDC en ze zeiden dat het bedrag van de gegevens kunnen we nu de winkel is zo groot dat we alleen in staat om vijf procent. Toen ik met pensioen vijf jaar geleden, werden ze zeggen dat er geen soort van een oplossing voor.

Dus, ik vraag me af, hoe kan het opgelost worden? Er zijn een paar problemen. Een manier is met flash, maar dat is duur. Vervolgens kunt u de dingen doen, zoals het software-defined storage en andere dingen, maar de problemen zijn altijd het zelfde. De ene is de beschikbaarheid en de andere kosten.

Een oplossing is een systeem te ontwerpen specifiek te maken met big data, echt big data, multi-petabyte aan data. Het heeft vier kenmerken die het uniek maken.

De eerste is de verhouding van de schijf naar de server. Als je kijkt naar een “witte doos” of andere servers zal u zien dat de servers kunnen ondersteunen acht schijven of een ander klein aantal. We moeten naar een situatie waarin een server, met drievoudige redundantie kan ondersteunen honderden stations. Met ons, een server kan ondersteunen vele, vele schijven. Dat is een voordeel voor ons.

De tweede is dat je niet moet flash. We kunnen gebruik maken van flash drives voor caching, maar de meeste van ons systeem kan worden spinnen schijven, die goedkoper zijn. Flash kan worden duurder door een factor van 10.

De meeste bedrijven maken gebruik van dure flash voor de snelheid. We kunnen de snelheid zonder flash. We maken standaard gebruik van schijven.

Dan is er de efficiëntie. Wij hebben 72 procent van de efficiëntie van gegevens voor volledige compressie. Sommige mensen praten over de kosten van flash naar beneden, maar ze doen het zonder te spreken over effectieve capaciteit.

Waarom heb je in flash?

Yanai: Flash is voor snelheid… maar flash is duur. Veel van marketing vandaag de dag spreekt over de prijs van flash naar beneden maar dat is niet juist. Nu met de soort van rijden we gebruiken, kunnen we ten minste 10 tot 20 keer sneller [flash].

Chip Elmblad, Infinidat enterprise architect: Wat we zien is dat de eisen van een typische enterprise klant, zeg, een financiële instelling gebouw buiten het next generation datacenter of die van een cloud provider — een MSP (Managed Service Provider) of een cloud service samenvoegen — een groot deel van hun diensten wordt naar beneden geduwd in het datacenter. En dan een heleboel diensten worden geduwd in de cloud, of het nu private, publieke of hybride.

infinibox-graphic.jpg

Infinibox: capaciteit, IOPS, doorvoer en latentie.

Afbeelding: Infinibox

Een tweede trend is een overeenkomstige verschuiving in het gebruik van modellen, van pure cap-ex op-ex-modellen. Dan is er de druk om de kosten te beheersen alle rond, of het de kosten van alledaagse dingen zoals vloertegels of power, het accent ligt op het verlagen van de kosten. IT-managers moeten weten prijs-per-gigabyte-per-maand en statistieken, zoals watt per terabyte. We zien dat mensen zich geen zorgen over GUIs, maar dingen zoals KPI ‘ s (Key Performance Indicators) sterkte.

Ze willen het programma al hun provisioning tot een instrument dat ze hebben ontwikkeld. Het eindresultaat is de verlaging van de full-time werknemer verhouding van het apparaat worden beheerd. En waar we vroeger megabytes, we praten nu over multi-multi-petabyte wordt beheerd door een C-niveau van de werknemer om de kosten te verlagen.

Dus de hoeveelheid gegevens die wordt beheerd stijgt en stijgt, als het wordt gedreven door zaken als het Internet der Dingen. Het IoT is exponentieel gegroeid. Alle dat is sneller dan de data-reductie technologieën.

We denken dat de trend in 2017 is de stijging van de “hyper-opslag”. Dat is een ultra-hoge dichtheid, enterprise-class software gedefinieerd, flexibele opslag voor de cloud en enterprise datacenters.

Een van de belangrijkste kenmerken van dat dat het zal draaien op hardware — het hoeft niet te worden beschermd, of bedraad te worden in een bepaald model. Mensen willen zien dat er een hardware stack die zich kunnen aanpassen aan elk type media.

Nu AFAs (Alle Flash Arrays) zijn er voor de nakoming en ze hebben eigenschappen die u aan het programma moet rond zijn voor de betrouwbaarheid van de schaal enzovoort. Maar dat is nogal makkelijk. Je zet een soort media er in die milliseconde responstijd, die prestaties, maar wat Moshe ‘ s team heeft gedaan, is de-echtpaar de prestaties van de onderliggende media. En het is een hardnekkige media.

Nu in het verleden, als ze willen prestaties, mensen zetten de hele reeks in flash. Maar nu met behulp van onze technologie weten we dat we kunnen verhogen van uw cache hit ratio van 80 of 90 procent, ongeacht de hoeveelheid werk, en die hit rate geeft ons een voordeel ten opzichte van all-flash arrays.

Wat wij vinden is dat in het veld, onze gemiddelde cache-hit-verhouding is ongeveer 80 procent van onze klanten, onafhankelijk van de belasting.

Yanai: een Andere belangrijke feature is de mogelijkheid om gegevens knippen in kleinere stukken. We sneden het tot 64 KB brokken dus dan de schijven samen spelen om elke aanvraag direct. En als we schrijven naar een schijf dat doen we in een sequentiële wijze.

De combinatie van het efficiënte gebruik van de schijf met de caching samen betekent dat in de meeste van de workloads kunnen we doen, doen we sneller zijn dan een all-flash drives.

Elmblad: En met ons systeem, wij hebben de capaciteit en de grootte van de systemen zoals die in de Amazon ‘s van deze wereld en de Google’ s — en dat doen we. We moeten, want dat is wat een hyper-opslag systeem.

Nu hadden we een scala van ontwerp-doelstellingen voor onze Infinibox systeem. Een van ongeëvenaarde betrouwbaarheid. We zijn ontworpen voor 7 negens betrouwbaarheid (99.99999% betrouwbaar). Er zijn meerdere n+2 stuks in het systeem, dus voor elk onderdeel in het systeem die een impact kunnen hebben op de beschikbaarheid, zijn er ten minste drie.

We kunnen last hebben van een storing van twee schijven zonder problemen. Niet alleen dat, maar we opnieuw kan al die gegevens — 16 terabytes — in 15 minuten of minder. Dat verlaagt onze blootstelling en het geeft de klant een veel hoger vertrouwen in de systemen.

Er zijn een aantal geweldige software-innovaties die Moshe ‘ s team heeft gezet om dat te bereiken. Om je een voorbeeld geven, ontwikkelden ze hun eigen RAID-schema. Het is niet RAID 6, het is niet een systeem voor het oplossen van een storing door middel van algoritmen, maar het stelt ons in staat om te mislukken twee schijven en hen te herstellen zeer snel.

Elmblad: Nu op de prestaties er zijn hyper-schaal systemen, Amazon, Facebook, enzovoort, en ze hebben een grote capaciteit, maar ze hebben ook een hoge latency en je kan het gewoon niet doen als je gaat om daadwerkelijk te leveren hyper-opslag. Je moet de prestaties die gelijkwaardig is aan de AFAs.

Nu zijn er een aantal manieren die we kunnen dat bereiken. Onze boom-structuur. Wanneer de gegevens in het gaat in de cache, en er is een terabyte van DRAM in het systeem, en 110TB van SSD die we gebruiken als lees-cache.

Dus alle negatieven je hoort over — als de passieve toestand lader verliest gegevens, of dat met Ssd ‘s kunt u niet te veel schrijft omdat schrijft doden Ssd’ s in alle flash-chips — niet van invloed op ons. U hoeft niet te maken, want het is een lees-cache.

Als we het maakt gebruik van Ssd ‘s in te dienen gegevens naar de toepassingen, het is omdat als een van die Ssd’ s mislukt zijn we gewoon weg te gooien. Het heeft geen invloed op onze betrouwbaarheid.

Yanai: En dat is de essentie. Het type schijf dat we gebruiken is niet relevant voor de prestaties van het systeem. Wij maken gebruik van best-of-breed, wat is er uit. Als er een betere drive langs komt, kunnen we dat gebruiken. Het is niet relevant voor ons en het heeft geen invloed op onze prestaties of de betrouwbaarheid van onze.

Vandaag flash is een extra kosten, dus waarom betalen voor extra kosten als je het niet nodig hebt?

U zegt dat uw systeem kan werken met zeer hoge prestaties en een zeer hoge betrouwbaarheid maar vorderingen maken HET managers sceptisch. Hoe krijg je verleden?

Yanai: We kennen de echte wereld voor IT-managers. We weten wat de prioriteiten zijn: ‘Als ik verlies prestaties, het gaat om mij kwaad te doen, maar als ik het risico gegevens te verliezen, gaan ze me ontslaan.’

Zo hebben we twee dingen en zoals altijd met deze dingen je aan de onderkant en klim je de ladder op. Wij hebben dit systeem met de bedoeling, dat wij bouwen het voor de grote klanten, de Fortune 500.

We moeten dus twee elementen. Het ene is om te beschikken over een geldig propositie. Die van ons is dat we niet van plan om u te redden van 10 procent of 20 procent, we gaan bespaart u 90 procent.

Nu dit is wat wij bieden, maar dat is niet voldoende. Het tweede wat wij bieden is een relatie. Mensen kennen mij en weten ze over mijn verleden, over EMC, over IBM, dus moet ik dat gebruiken om hen een proof of concept, maar ook voor hen zijn er, ze moeten zich veilig voelen.

Dus dan kunnen we ze om te proberen om het te gebruiken en ze kunnen beginnen met iets wat basic, zoals back-up. En dan hebben we de verwijzingen met de grote gebruikers.

Dat is hoe we begonnen maar het is nu veel gemakkelijker. Onze klanten zijn onder andere BT, Brightsolid, Raymand James Investering, Hawai ‘ i Medische Dienst van de Vereniging, en TriCore Oplossingen.

Lees meer over opslag

Waarom hebben we nog steeds de wederopbouw van RAID-schijven?NetApp Q2 winst solide, flits-systemen krijgen momentumSeagate lanceert ClusterStor 300N te richten high performance computing opslag