< p class="meta"> Door Andrew Brust voor Big on Data | 24 juni 2021 — 17:07 GMT (18:07 BST) | Onderwerp: Big Data-analyse
De Israëlische cloud-datawarehouse-startup Firebolt heeft vandaag aangekondigd dat het een serie B-financieringsronde van $ 127 miljoen heeft afgesloten, waardoor de totale financiering op $ 164 miljoen komt. Deze ronde volgt slechts 6 maanden na de $ 37 miljoen Series A van het bedrijf in december 2020. Hoofdinvesteerders voor deze ronde zijn Dawn Capital en K5 Global, met deelname van eerdere investeerders Zeev Ventures, TLV Partners, Bessemer Venture Partners en Angular Ventures. Het extra geld zal worden gebruikt om Firebolt's product-, engineering- en go-to-market-teams uit te breiden.
Geek speak
ZDNet sprak met Firebolt-CEO Eldad Farkash. Net als bij onze laatste interactie met Farkash in december, was het gesprek gericht op een combinatie van markt- en technologiefactoren in de wereld van clouddatawarehouses.
Lees ook: Varada en Firebolt lanceren queryplatforms voor cloudanalyse< /strong>
Farkash deelde enkele interessante inzichten. Eerst legde hij uit dat, zelfs als het snel lijkt, een interval van zes maanden tussen de serie A- en B-financieringsrondes als conservatief wordt beschouwd in de Israëlische startup-scene. Maar naast deze inside-startup-honkbal lekkernij, meende Farkash dat datawarehousing niet alleen meer gaat over op business intelligence gerichte analyses. Hij is van mening dat ook, en misschien nog wel belangrijker, datawarehousing in de cloud de behoefte omvat van applicaties om on-the-fly analyses uit te voeren voor operationele doeleinden.
Ontwikkelaars, democratisering en data
Neem als (geparafraseerd) voorbeeld het scenario van een online game met duizenden gelijktijdige gebruikers. De uitgever van die game wil misschien just-in-time analyses uitvoeren op gebruikspatronen, scoretrends en meer, en kan de resultaten gebruiken om promoties of zelfs game-inhoud on-the-fly te stimuleren. Omdat dat soort analyses zo nauw verbonden zijn met de werking van de game zelf, zijn het de ontwikkelaars, niet de analisten, die het moeten kunnen uitvoeren, en ze hebben de prestaties nodig om supersnel te zijn, omdat het de prestaties gemakkelijk kan beïnvloeden van het spel zelf.
Dit heeft geleid tot een nieuw soort democratisering van gegevens: een waarbij reguliere ontwikkelaars een service nodig hebben die hen deze gegevenstoegang en -prestaties kan bieden. En die service moet gemakkelijk te consumeren zijn via API's en kostenefficiënt zijn, zodat ontwikkelaars er niet al te spaarzaam mee om hoeven te gaan.
Stel de tabelscan in
Farkash legde uit dat dit type analyse genuanceerde werkbelastingen met zich meebrengt, waarbij sommige zoekopdrachten aggregatie kunnen zijn en andere puntquery's, maar vanwege enorme en steeds groeiende datavolumes, kunnen zelfs de puntquery's het scannen van datavolumes in de orde van de helft inhouden. een terabyte. Deze combinatie van factoren betekent dat de meeste zoekopdrachten erg afhankelijk zijn van tabelscans, maar dat velen ook de gegevens agressief moeten snoeien. Dat betekent op zijn beurt dat de meeste datawarehouses en datameren (gericht op brede aggregaties) en zeker de meeste operationele databases (gericht op het schrijven van gegevens en relatief smalle puntquery's wanneer ze deze lezen) niet geschikt kunnen zijn voor de taak.
We wisten uit ons laatste gesprek dat Firebolt zijn eigen bestandsindeling (FFF) implementeert, die liberaal gebruik maakt van indexering. Dit vermijdt een nadeel van het zeer geaccepteerde Parquet-bestandsformaat: de kolomstructuur helpt bij het scannen van brede tabellen, het partitioneringsschema met slechts één expressie kan de prestaties van puntquery's beperken. Met FFF maakt Firebolt het scannen van tabellen tot de prioriteit, zonder dat dit ten koste gaat van de mogelijkheden voor gegevenssnoei.
Te veel is niet genoeg
Firebolt beweert dat zijn prestaties twee ordes van grootte hoger zijn dan die van zijn concurrenten. Hoewel in veel BI-scenario's die prestatieverhoging een afnemend rendement kan opleveren, is het essentieel voor de gebruiksscenario's voor operationele analyse van big data waarop Firebolt zich richt. Hoewel Firebolt er zeker van is dat het de snelste motor heeft die er is, geeft Farkash toe dat de zoektocht naar geweldige prestaties nog niet voorbij is, dat “er nog zoveel te bestrijden is”. bedrijf is gesloten, zal het robuuste munitie geven voor de strijd.
Verwante onderwerpen:
Cloud Digital Transformation Robotics Internet of Things Innovatie Enterprise Software