Moshe Yanai har en imponerande meritlista i lager branschen. För 20 år sedan när han arbetade på EMC, utvecklade han Symmetrix lagras i en array, och därifrån flyttade han på att starta upp stordator lagring array företaget XIV, som såldes till IBM.

Yanai: “En lösning är att utforma ett system specifikt för att hantera stora data, riktigt stora data, flera petabyte av data.”
Bild: IBM
Han har nu kommit ut i pension för att arbeta på ett annat nytt projekt, en stordator-klass lagring företag som heter Infinidat.
De hetaste innovation i lager för närvarande är flash-minne. Det verkar som att alla i IT-lagring världen pratar om flash, en teknik som erbjuder snabb lagring till en hög kostnad jämfört med konventionell lagring.
Nu Infinidat säger att du kan få det bästa av båda världar. Företagets lagringssystem kombinera konventionell lagring med en tinktur av flash för att erbjuda inte bara high-end flash utan kostnad, men med 1m+ IOPS-prestanda och 99,99999 procent tillförlitlighet — 7 nior när de facto-standard är 5.
ZDNet pratade med Yanai och hans enterprise architect Chip Elmblad för att ta reda på mer.
ZDNet: Vad har förlett dig ut i pension för att gå tillbaka till lagring verksamhet?
Yanai: jag har varit i branschen för, tror jag, 40 år. Jag började med CDC 1975 på disk komponenter och min första del var 2,5 MB. Naturligtvis idag, i samma storlek, vi har fem petabyte.
Vad jag tycker i den här branschen är detta fenomen: kostnaden för lagring minskar, så att IT-kostnader har blivit avgörande för företag som vill dra nytta av de uppgifter som finns och så vidare, men då vi ser att det är en brist, en brist på vad du kan göra med den informationen, i möjligheten för industrin att utnyttja denna stora mängd data.
Jag deltog i ett samtal nyligen med IDC och de säger att den mängd data vi kan nu lagra är så stor att vi bara kan använda fem procent av det. När jag kom ut i pension för fem år sedan, de sa att det inte finns någon typ av lösning för detta.
Så, jag frågar mig själv, hur kan det lösas? Det finns ett par problem där. Ett sätt är med blixt, men det är dyrt. Då kan du göra saker som är programvarudefinierade förvaring och andra saker men frågorna är alltid desamma. Ett är tillgängligheten och den andra är kostnaden.
En lösning är att utforma ett system specifikt för att hantera stora data, riktigt stora data, flera petabyte av data. Den har fyra egenskaper som gör det unikt.
Den första är förhållandet mellan disk till en server. Om du tittar in i någon “white box” eller andra servrar, kommer du att se att servrarna kan stödja åtta enheter eller några andra små antal. Vi måste få till en situation där en server, med trippel redundans, kan stöd för hundratals enheter. Med oss, en server kan vara ett stöd för många, många enheter. Det är en fördel för oss.
Den andra är att du behöver inte flash. Vi kan använda flash-minnen för att lagra, men de flesta av våra system kan vara spinning enheter, vilket är billigare. Flash kan vara dyrare med en faktor av 10.
De flesta företag använder dyra flash för hastighet. Vi kan få den hastighet utan att behöva blinka. Vi använder standard-enheter.
Då det är effektivitet. Vi har 72 procent effektivitet av data före full kompression. Vissa människor kommer att tala om kostnaden för flash att gå ner men de gör det utan att prata om den effektiva kapaciteten.
Varför gjorde du får in flash?
Yanai: Flash är för snabbhet… men flash är dyrt. En hel del marknadsföring i dag talar om priset för flash att gå ner men det är inte rätt. Nu med den typ av bil vi använder, vi kan vara minst 10 till 20 gånger snabbare än blixt].
Chip Elmblad, Infinidat enterprise architect: Vad vi ser är att kraven för ett typiskt företag kund, säg, ett finansiellt institut bygga ut en nästa generations datacenter eller ett moln leverantören-det kan vara en MSP (Managed Service Provider) eller en molntjänst samman-en hel del av deras tjänster är knuffas ner i datacenter. Och sedan en massa tjänster är att hamna i molnet, oavsett om det är privata, offentliga, eller hybrid.
Infinibox: kapacitet, IOPS, genomströmning, och latens.
Grafik: Infinibox
En andra trend är en motsvarande förändring i konsumtion modeller, från ren cap-ex till op-ex modeller. Då det finns tryck på att kontrollera kostnaderna runt, oavsett om det är kostnaden för vardagliga saker som golv eller makt, tonvikten ligger på att minska kostnaderna. IT-chefer behöver veta pris per gigabyte per månad och statistik som watt per terabyte. Vi ser att människor bryr sig inte om Gui men saker som KPI (Key Performance Indicators) styrka.
De vill att programmet alla sina inbetalningar till ett verktyg som de har utvecklat. Slutresultatet är att sänka heltidsanställd förhållande till den enhet som sköts. Och där vi brukade vara megabyte, nu talar vi om flera flera petabyte sköts av en C-nivå anställd för att minska kostnaderna.
Så mängden data som hanteras stiger och stiger, eftersom det drivs av saker som Internet of Things. Sakernas internet ökar exponentiellt. Alla som är snabbare än data-reduction technologies.
Vi tror att trenden i 2017 är ökningen i “hyper lagring”. Det är extremt hög densitet, enterprise-klass, software defined, flexibel förvaring för molnet och företagets datacenter.
En av de viktigaste egenskaper som kommer att vara som det kommer att köras på vilken hårdvara — det behöver inte vara egna eller hårt fast i en viss modell. Folk vill se en hårdvara stack som kan anpassa sig till varje typ av media.
Nu AFAs (Alla blixtar) är det för prestanda och de har de egenskaper som du måste programmera runt för tillförlitlighet, för omfattning och så vidare. Men det är något lätt. Du sätter en typ av media i det som har millisekunders responstid, som har prestanda, men vad Moshe team har gjort är att de-par resultat från den underliggande media. Och det är en ihållande media.
Nu i det förflutna om de ville prestanda, människor som lägger hela utbud i flash. Men nu med hjälp av vår teknik och vi vet att vi kan öka din cache-träff förhållandet till 80 eller 90 procent, oberoende av arbetsbördan, och att träffsäkerhet ger oss en fördel gentemot alla-blixtar.
Vad vi finner är att i fält, vår genomsnittliga cache-träff förhållandet är ca 80 procent för våra kunder, oavsett arbetsbelastning.
Yanai: en Annan viktig funktion är möjligheten att sänka data i mindre bitar. Vi skär den i 64 bitar så då enheter spela tillsammans för att varje begäran omedelbart. Och när vi skriver till disk vi gör det på ett sekventiellt sätt.
Kombinationen av en effektiv användning av enheten med en cache tillsammans innebär att i de flesta av den arbetsbelastning vi kan göra, vi är snabbare än alla-flash-enheter.
Elmblad: med vårt system som vi måste ha kapacitet och storlek av system som de i Amazonas är av denna värld och Google-och det gör vi. Vi måste, eftersom det är vad en hyper-lagring är.
Nu som vi hade ett antal designmål för våra Infinibox system. En av oöverträffad tillförlitlighet. Vi är konstruerade för 7 nior tillförlitlighet (99.99999% tillförlitliga). Det finns flera n+2 delar i systemet så för varje komponent i systemet som kan ha en påverkan på tillgänglighet, det finns åtminstone tre.
Vi kan drabbas av ett misslyckande av två hårddiskar utan några problem. Inte bara det, men vi kan bygga upp allt som data — 16 terabyte — i 15 minuter eller mindre. Som sänker exponeringen och det ger kunden en mycket högre förtroende för de system.
Det är några enorma innovationer programvara som Moshe team har lagt ner för att uppnå detta. För att ge ett exempel, de har utvecklat sin egen RAID-schema. Det är inte RAID 6, det är inte ett system för att lösa ett misslyckande genom algoritmer, men det tillåter oss att misslyckas med två enheter och bygga upp dem mycket snabbt.
Elmblad: Nu på prestation det är hyper-skala där ute-Amazon, Facebook och så vidare-och de har stor kapacitet, men de har också hög latens och du kan bara inte göra det om du kommer att faktiskt leverera hyper lagring. Du måste ha prestanda som är likvärdig med den AFAs ut det.
Nu finns det ett antal sätt som vi kan uppnå detta. Ta vår trädstruktur. När uppgifterna kommer in på det går in cache, och det är en terabyte DRAM i systemet, och 110TB av SSD som vi använder som en läsa-cache.
Så alla negativa du höra om-som passivt tillstånd laddare förlorar data, eller att med Ssd-enheter som du inte kan göra alltför många skriver därför skriver döda Ssd-enheter i alla flash-kretsar — inte påverkar oss. Du behöver inte oroa dig om det eftersom det är en läs-cache.
Om vi använder Ssd-enheter för att tjäna in data till program, det är för att om en av de Ssd-enheter misslyckas vi bara kasta bort det. Det har ingen inverkan på vår tillförlitlighet.
Yanai: Och det är den springande punkten i det. Den typ av enhet som vi använder är irrelevant för prestanda i systemet. Vi använder best-of-breed, vad är ute. Om ett bättre driv kommer tillsammans, vi kan använda den. Det är irrelevant för oss och det inte påverkar vårt resultat eller vår tillförlitlighet.
Idag flash är en extra kostnad, så varför betala extra kostnad om du inte behöver?
Du säger att ditt system kan fungera vid mycket hög prestanda och mycket hög tillförlitlighet, men påståenden som att göra IT-chefer skeptisk. Hur gör du för att komma förbi det?
Yanai: Vi vet att den verkliga världen för IT-chefer. Vi vet vad prioriteringarna är: “Om jag förlorar prestanda, det kommer att skada mig, men om jag förlorar data, kommer de att avskeda mig.’
Så vi använde två saker och som alltid med dessa saker du börjar på botten och du klättrar uppför en stege. Vi har byggt upp detta system med avsikt att vi ska bygga det för stora kunder, Fortune 500-företagen.
Så vi behöver två delar. En är att ha en giltig proposition. Vår är att vi inte kommer att spara 10 procent eller 20 procent, och vi kommer att spara dig 90 procent.
Nu är det här en sak som vi erbjuder men det är inte tillräckligt. Den andra saken vi erbjuder är en relation. Människor som känner mig och de vet om mitt förflutna, om EMC, om IBM, så jag måste använda det för att få dem att göra en proof of concept, men även för att få dem dit de behöver för att känna sig säker.
Så då kan vi få dem att prova att använda den och de kan starta det med något grundläggande som backup. Och då har vi referenser med stora användare.
Det är hur vi kom igång men det är mycket lättare nu. Våra kunder är BT, Brightsolid, Raymand James Investeringar, Hawai ‘ i Medicinsk Service Association, och TriCore Lösningar.
Läs mer om lagring
Varför har vi fortfarande bygga om RAID-enheter?NetApp Q2 resultat fast, flash-system få momentumSeagate lanserar ClusterStor 300N till mål high performance computing lagring