Skrevet af Tony Baer (dbInsight), medvirkende skribent
Tony Baer (dbInsight) Bidragende skribent
Tony Baer, grundlægger og rektor af dbInsight, er en anerkendt brancheekspert i datadrevet transformation.< /p> Fuld bio udgivet i Big on Data den 9. februar 2022 | Emne: Big Data
Starburst Data annoncerede i denne uge, at det har mere end fordoblet sin finansiering med en ny $250 millioner serie D-runde, der blev annonceret i denne uge, og åbner en ny frontend-portal til sin distribuerede forespørgselsmotor. Virksomheden hævder, at dette groft har tredoblet sin tidligere værdiansættelse, som der var modstridende offentliggjorte tal for (her og her). Annonceringerne kommer i forbindelse med Datanova, virksomhedens årlige onlinebegivenhed.
Inden 2022 fortsætter virksomheden med at fordoble datanetværket. På virksomhedens hjemmeside karakteriserer den sig selv som “The Analytics Engine for Data Mesh.” Vi vil have mere at sige om det om et øjeblik.
I denne uge annoncerer Datanova en udvidelse, der tilføjer en kataloglignende portalfrontend til sin Trino-baserede distribuerede forespørgselsmotor. På den administrative side gør portalen det muligt for dataproducenter og dataingeniører at definere metadata, spore brug og anvende rollebaseret adgang og rettigheder. På slutbrugersiden kan de bruge portalen til at opdage, gennemse og tilføje anmeldelser af datasæt. Selvom et datakatalog i “lite” forstand, er det ikke meningen, at det skal erstatte virksomhedsdatakataloger. Som et letvægtskatalog, der pakker sin egen forespørgselsmotor, fortsætter Starburst ikke desto mindre med at understøtte integration til Alation og Collibra.
På køreplanen øger Starburst understøttelsen af nye open source-datatabelformater, herunder Delta Lake og Iceberg, med Delta Lake-støtte længere fremme.
Med den nye finansiering er et nøgletema for Starburst i år global ekspansion, især i go-to-market; mens det i øjeblikket har tilstedeværelse på jorden i Nordamerika og Europa, markerer dette år punktet, at det vil etablere butik i Asien og Stillehavsområdet. For at understrege, at for sin cloud-tjeneste Galaxy (som kun blev GA for to måneder siden på AWS, Azure og Google Cloud), tilføjer den Alibaba. Starburst spiller også op på sit partnerskab med Red Hat, både på privat sky og understøttet på Red Hat OpenShift Dedicated, en Red Hat-administreret tjeneste på AWS og Google Cloud. Starburst er certificeret på OpenShift, er tilgængelig på Red Hat-markedspladsen og er en af kun fire ISV'er i Red Hats OpenShift Data Science-skytjeneste. Og der er et stigende engagement med globale systemintegratorers sædvanlige mistænkte.
Starburst Enterprise er også tilgængelig på HPE Marketplace, som en distribueret forespørgselsmotor til HPE Ezmeral Runtime, og begge vil snart starte fælles go-to-market i Nordamerika og Europa. Men for en god ordens skyld er det også Starburst-rivalen Ahana, hvor en del af ledelsesteamet deler fælles rødder med den del af Ezmeral-produktteamet, der kom fra MapR.
Starburst er stadig på det tidlige stadie, hvor væksten er geometrisk; i de seneste tre år er dens forretning tredoblet årligt. Højdepunktet er den nylige lancering af Starburst Galaxy, den administrerede cloud-tjeneste; efter først at være blevet frigivet i slutningen af sidste år, dukker cloud SaaS-forretning endnu ikke voldsomt op i omsætningstallene. Selvom Starburst ikke er ved at opgive lokale eller selvadministrerede kunder for Starburst-virksomheder, er der ingen hemmelighed, at virksomheden forudser hovedparten af fremtidig vækst, der kommer fra cloud SaaS-tjenesten.
Og det er her en vigtig ny tilføjelse til ledelsesteamet, Javier Molina som chief revenue officer, vil spille en nøglerolle. Tidligere SVP for verdensomspændende salg hos MongoDB, Atlas SaaS-tjenesten var front og center. Atlas blev lanceret for næsten seks år siden og står nu for mere end halvdelen af MongoDBs omsætning. En vigtig lektie, som Molina tager, er, at Atlas ikke voksede eksplosivt fra den ene dag til den anden. Det var ikke før købet af mLab, som tilføjede selvbetjening onboarding, at Atlas nåede sin nuværende bane. Med Starburst Galaxy lanceret for knap to måneder siden, kan du forvente, at der vil blive lagt stor vægt på selvbetjening, hvilket gør det muligt for kunderne at forbruge det på efterspørgsel uden bureaukrati i forbindelse med årlige kontrakter.
Det er klart, at Starburst positionerer sig til at komme forbi de små mindshare-kampe om, hvem der har den mest åbne forespørgselsmotor ved at placere distribueret forespørgsel, som er kernen i dens Trino-teknologi, som et nøglehjul i opbygningen af dataprodukter. Og at bygge dataprodukter er centralt for Starbursts omfavnelse af datamesh. De promoverer det til det punkt, hvor data mesh er blevet tagline for virksomheden. Og de er en kilde til adgang til opsummerede udkast til kapitler fra Zhamak Dehghanis (forfatter til det nuværende koncept for data mesh) kommende bog.
Ved at fakturere sig selv som “data-mesh-analysemotoren” går Starburst over en fin linje, da data-mesh ikke er en teknologi; det er et sæt af bedste praksis og arkitektoniske designmønstre til lokalisering af livscykluskontrol af datasæt, som skal behandles som produkter. Så nej, Starburst kalder ikke Starburst Enterprise eller Galaxy for en datamesh-løsning i sig selv. Men skelnen er ret subtil.
Selvfølgelig vil værktøjer og teknologier være essentielle for at understøtte de forskellige opgaver i datanetværk. Og der er mange opgaver, der vil udskalere mennesker, lige fra styring og automatisering af dataindtagelse, datapipelines, datakvalitet og validering af, at dataene er troværdige, gyldige og aktuelle. Det er klart, at mennesker driver processen, men teknologien skalerer deres indsats.
Knap til benet: Starburst Enterprise eller Galaxy er kun en brik i datamaskepuslespillet. Men datanet er kun en brik i Starburst-puslespillet. Lad os forklare.
Som vi har præciseret, her og her, forventer vi, at i år vil datamasker trække deres første seriøse undersøgelse og tilbageslag. Det er faktisk en god ting. Det kan forventes for enhver teknologipraksis, der er under seriøs undersøgelse. Selvom der er organisationer, der vil hævde sejre fra den ene dag til den anden, vil datanet altid være en rejse, og ikke alle organisationer vil omfavne denne praksis.
Distribueret forespørgsel vil være en vigtig del af udførelsen for enhver datadrevet organisation, uanset om de omfavner data mesh-praksis eller ej. Selvom Starburst bestemt er på mål med at påpege rollen som distribueret forespørgsel og dens kroge til styring, ville det give mening for Starburst også at generalisere sit budskab og ikke blive bundet til datanettet. Og det er her, synergierne med datastrukturer kunne begynde.
Big Data
Sync Computing har til formål at fortsætte, hvor serverløs afbrydes Nyt filformat hjælper forskere med at reducere DNA-analysetiden Google afslører differentielt privatlivsværktøj til Python-udviklere, der behandler data Rapport: IT migration til skyen rammer enorme forhindringer Cloud | Digital transformation | Robotik | Internet of Things | Innovation | Enterprise Software