< p class = "meta"> Av Andrew Brust for Big on Data | 24. juni 2021 – 17:07 GMT (18:07 BST) | Tema: Big Data Analytics
Den israelske oppstartsfirmaet Clouds lager Firebolt kunngjorde i dag at de har stengt en $ 127 millioner serie B-finansieringsrunde, noe som bringer den totale finansieringen til $ 164 millioner. Denne runden følger bare 6 måneder etter selskapets $ 37 millioner serie A i desember 2020. Ledende investorer for denne runden er Dawn Capital og K5 Global, med deltakelse fra tidligere investorer Zeev Ventures, TLV Partners, Bessemer Venture Partners og Angular Ventures. De ekstra pengene vil brukes til å utvide Firebolts produkt-, ingeniør- og markedsføringsteam.
Geek snakker
ZDNet snakket med Firebolt-sjef Eldad Farkash. I likhet med vår siste interaksjon med Farkash i desember, fokuserte samtalen på en kombinasjon av markeds- og teknologifaktorer i skylevernsverdenen.
Les også: Varada og Firebolt lanserer skyanalyse-spørringsplattformer
Farkash delte noen interessante innsikter. Først forklarte han at selv om det kan virke raskt, betraktes et seks måneders intervall mellom serie A og B-finansieringsrunder som konservativt i den israelske oppstartsscenen. Men utover dette innen-oppstart-baseball-godbiten, mente Farkash at datalagring ikke bare handler om forretningsintelligens-orientert analyse lenger. Han føler at også, og kanskje enda viktigere, datalagring i skyen omfatter applikasjonsbehovet for å utføre analyser på farten for operasjonelle formål.
Utviklere, demokratisering og data
Ta for eksempel (et omskrevet) eksempel på et online spill med tusenvis av samtidige brukere. Utgiveren av det spillet vil kanskje utføre analyser på nettbaserte måter, poengtrender og mer, og kan bruke resultatene til å drive kampanjer eller til og med spillinnhold på farten. Fordi den slags analyse er så tett koblet til selve spillet, er det utviklere, ikke analytikere som trenger å kunne utføre det, og de trenger at ytelsen skal være superrask, da den lett kan påvirke ytelsen av selve spillet.
Dette har forårsaket en ny type demokratisering av data: en der mainstream-utviklere trenger en tjeneste som kan gi dem denne datatilgangen og ytelsen. Og den tjenesten må være lett å forbruke via APIer og være kostnadseffektiv, slik at utviklere ikke trenger å være for sparsomme i bruken av den.
Sett tabellskanning
Farkash forklarte at denne typen analyser medfører nyanserte arbeidsmengder, der noen spørsmål kan være aggregerte og andre kan være punktforespørsler, men på grunn av enorme og stadig voksende datavolumer kan til og med poengspørsmålene innebære skanning av datamengder i størrelsesorden halvparten en terabyte. Denne kombinasjonen av faktorer betyr at de fleste spørsmål er veldig avhengige av tabellskanninger, men at mange også vil trenge å beskjære data aggressivt. Det betyr igjen at de fleste datalagre og datasjøer (fokusert på brede aggregeringer) og absolutt de fleste operative databaser (fokusert på å skrive data og relativt smale punktforespørsler når de leser det) kan være dårlig egnet til oppgaven.
Vi visste fra vår siste samtale at Firebolt implementerer sitt eget filformat (FFF), som gjør liberal bruk av indeksering. Dette unngår en ulempe med det høyt adopterte Parquet-filformatet: dets søylestruktur hjelper til med å skanne bredt bord, men partisjoneringsskjemaet med enkelt uttrykk kan begrense ytelsen til poengsøket. Med FFF prioriterer Firebolt tabellskanning, uten å ofre beskjæring av data.
For mye er ikke nok
Firebolt hevder at ytelsen er to størrelsesordener høyere enn konkurrentene. Mens det i mange BI-scenarier som økning i perfeksjon kan gi avtagende avkastning, er det viktig for bruk av big data-operasjonelle analysesaker som Firebolt retter seg mot. Mens Firebolt er sikker på at den har den raskeste motoren der ute, innrømmer Farkash at søken etter god ytelse ikke er over, at “det er fremdeles så mye å kjempe.” selskapet har avsluttet vil gi det robust ammunisjon for kampen.
Relaterte emner:
Cloud Digital Transformation Robotics Internet of Things Innovasjon Enterprise Software