Data- og AI -landskabet 2021: Det er en MAD, MAD, MAD verden

0
142

 Tony Baer (dbInsight)

Af Tony Baer (dbInsight) for Big on Data | 7. oktober 2021 | Emne: Big Data Analytics

 mad-mad-mad-world3.jpg

Mens en stor del af verden lukkede sig under COVID-pandemien, åbnede portene stort for finansiering af opstart i tidlige og sene stadier i data- og AI-rummet. Et team hos FirstMark Capital, ledet af partner Matt Turck, har udsendt det seneste af sine årlige encyklopædiske data og AI -landskaber. I den ene ende af spektret, skrev Turck og kolleger, er der den modning som det fremgår af udbruddet af børsnoteringer af Snowflake og Confluent, der forsikrer VC -samfundet om, at indtægter og vækst er reelle, og at pengestrømmen ikke udløser en gentagelse af dot com -boblen.

Og ja, det hedder i rapporten, at løftet om AI nu bliver opfyldt. Vi ser det dukke op, ikke kun i de værktøjer, som forretningsanalytikere bruger som BI, men også det faktum, at in-database maskinlæring er ved at blive en afkrydsningsfunktion, for ikke at nævne, at Oracle, SAP, Salesforce og andre nu rutinemæssigt inkorporering af maskinlæring i virksomhedens applikationer. Så vi ser færre overskrifter om førerløse biler, og verden venter ikke på, at en selvkørende Uber trækker op for at bevise, at AI er ægte.

For et par måneder siden gik FirstMark MAD – det introducerede MAD -indekset for børsnoterede maskinlærings-, AI- og datavirksomheder. Betydningen er, at der nu er nok af dem til at liste på egen hånd, i modsætning til at blive grupperet under den mere generelle teknologiparaply. Og listen – på det tidspunkt cirka et dusin virksomheder plus eller minus – er blevet offentliggjort for nylig (inden for de sidste fem år).

Selvfølgelig er venturesamfundet det, der gør alt dette muligt. Med henvisning til data fra CB Insights steg venturefinansieringen med 157% på årsbasis i 2. kvartal i år, mens offentlig finansiering, enten gennem børsnoteringer, direkte noteringer eller SPAC'er, steg over 6x i første halvår af 2021 i forhold til et år tidligere. Den eneste indikator, der er dyppet, er opkøb efter al sandsynlighed, fordi VC-pumpede værdiansættelser gør virksomheder som Databricks (til 38 milliarder dollars) alt for dyre at erhverve, selv for Microsofts.

Landskabets maskinlæring, AI og data (MAD) i 2021

Kredit: FirstMark Capital

Rapporten begyndte med en oversigt over økosystemet, diskuterede finansieringsaktivitet og derefter fokuserede på vigtige teknologiske tendenser inden for datainfrastruktur, analyse og AI. Det er for omfangsrigt til, at vi kan gennemgå linje for linje, men du kan se den fulde rapport her. Et miniaturebillede af landskabet er vist ovenfor. En mere læselig gengivelse kan findes her, og hvis du vil have alle de kedelige detaljer, sammensatte FirstMark -teamet et detaljeret regneark, som du kan få adgang til her.

Vi holder os til nogle altoverskyggende indtryk.

Som vi (og andre) har diskuteret før, tænker vi ikke længere på Big Data som noget særligt. Når du kan starte et Snowflake -datalager med petabyte data og aktivere automatisk skalering, pludselig udnytter du skyen til at udføre det, der tidligere krævede datateknikere for at konfigurere Hadoop -klynger, køre Zookeeper og derefter manuelt kode disse MapReduce (eller senere Spark) rutiner. Og nu er muligheden for at analysere data uden for relationelle tabeller, som JSON, parketfiler og projektgrafvisninger, pludselig understøttes de 3 V'er, der angiveligt definerer store data nu af dit clouddatalager eller søhus. Beskriv det som “Moderne datastak”, eller betegn det som det fænomen, som forfatteren hedder “Den store oplåsning”.

Vi bliver ved med at læse Snowflakes tal og hører rygter om, hvornår Databricks endelig vil blive børsnoteret, men Amazon Redshift, Azure Synapse Analytics og Google BigQuery er fortsat blandt de hurtigst voksende tjenester for deres respektive skyer.

Og takket være AutoML og fremkomsten af ​​værktøjer og tjenester, der dækker hele livscyklussen for at bygge og køre disse modeller, kan du sige det samme om AI. Der er den fortsatte dans af spillere, der forvandler sig til generaliserede platforme. ML -platforme, fra SageMakers og Vertex AI’er til Dataikus og Data Robots i verden, udvider sig til fuld livscyklustjenester. Du kan også sige det samme om andre dele af dataøkosystemet. Confluent ønsker ikke kun at køre dine Kafka-streams, men også dit datalager i realtid.

Ikke desto mindre citerer forfatterne de sædvanlige centrifugalkræfter, med stigende opmærksomhed på datamasker i centrum (vi har mere at sige om det i et kommende indlæg). Men overgangen til konsolidering har næppe bremset ventureaktivitet. Ifølge CB Insights flød 38 milliarder dollars til AI -opstart, hvilket var omtrent lige så meget som gik ind i løbet af hele 2020; og i det første seks måneder var der over 50 runder over $ 100 millioner. Finansieringssamfundet har spredt sig ud over VC'er til hedgefonde og det dejlige akronym for ventures poetisk forkortet som SPAC'er. Og mange af disse finansieringer er blevet tilskyndet, ikke af sultne startups, men af ​​finansfolk, der er ivrige efter at komme videre.

Forfatterne er bullish på udsigterne for analytics og AI generelt. Men rapporten citerer også eksplosiv vækst, ikke i indtægter, men antallet af opstart i nicher som omvendt ETL, datakvalitet, datakataloger, datakommentarer og MLOps, hvor investeringer ser ud til at være foran markedets parat til at absorbere det.

Så der er mange skøre penge derude. Vi har et par retoriske spørgsmål. Har et firma som Databricks virkelig brug for 3,5 milliarder dollar i banken? Med udbredelsen af ​​venturefinansierede startups, der overstiger 1 milliard dollars værdiansættelser, er udtrykket “enhjørning” vokset forældet? Skynder finansfolk sig ind på grund af FOMO – frygt for at gå glip af?

Men vores hovedspørgsmål er, er vi på vej ind i en anden boble? Vi havde en offline e -mailudveksling med hovedforfatter Matt Turck om netop dette problem. Hans holdning er, at “der er flere kvalitetsvirksomheder end nogensinde.” Der er gentagende grundlæggere, der kommer ind med stærke track records. Et godt eksempel er Dataiku -medstifter Florian Douetteau, hvis tidligere handling var den vellykkede exit med Exalead -søgemaskinen, som blev erhvervet af Dassault Systemes for cirka et årti siden.

Rapporten nævner også det stramme arbejdsmarked. Til en vis grad er det gamle nyheder – der har længe været mangel på datavidenskabsfolk og dataingeniører lige siden vi begyndte at tage munden på ordene “Big Data”. Ligesom manglen på Java -udviklere i dot com -æraen er dette spørgsmål, der stort set kan løses; være vidne til oversvømmelsen af ​​tilmeldinger til college datavidenskabsprogrammer. Vores bekymring for talent er på andre dele af fødekæden – garvede ledere, ledere, salg og marketing. Vi har hørt en række leverandører fortælle os om udfordringerne ved at udfylde disse slots. I de fleste tilfælde handler det ikke om, at skoler vender elever ud med de rigtige grader. Vores fornemmelse er, at manglen på ledelsesmæssigt talent og go-to-market talent kan sætte nogle bremser på væksten.

Turck nævner også solid vækst i årlige tilbagevendende indtægter for mange af disse startups, og at i modsætning til dot com -æraen, som handlede om løfte, handler den nuværende æra om implementering. Vi er enige. Vores mening er, at skyen gør en stor forskel her. I tidligere epoker ville organisationer have været nødt til at lægge deres kapitalbudgetter, hvor deres mund var, erhverve, implementere og vedligeholde flere servere. Omvendt tillader skyen næsten øjeblikkelig skalering uden bureaukrati ved kapitalbudgettering.

I den generelle økonomi er der potentielle stormskyer i horisonten, såsom sandsynligheden for, at penge vil blive dyrere, når Fed endelig begynder at hæve renten, for ikke at nævne de strukturelle forhindringer, som globalt forstyrrede forsyningskæder udgør. Vi tror, ​​at vi i øjeblikket er i spidsbelastningstider for opstartsfinansiering. Vi ville ikke blive overrasket over en strøm af børsnoteringer eller andre udgange i de næste 12 måneder efterfulgt af en afmatning i venture og andre former for finansiering. En vis grad af market shakeout for nye ventures er sandsynligvis – vi så dette med den indledende mængde Big Data -opstart i løbet af 2015 – 16 tidsrammen. Men igen, vi forventer også succes for mange af den nuværende afgrøde af data og AI -opstart, da økonomiske forstyrrelser er de meget problemer, de er designet til at påtage sig.

Big Data < /h3> Vertica accelererer springet i skyen Observe Inc, og eventyret om at være en af ​​Snowflakes bedste brugere Digital transformation er under forandring. Her er, hvad der kommer næste gang De bedste karrierer, du kan starte med en datalogi grad

Relaterede emner:

Cloud Digital Transformation Robotics Internet of Things Innovation Enterprise Software  Tony Baer (dbInsight)

Af Tony Baer (dbInsight) for Big on Data | 7. oktober 2021 | Emne: Big Data Analytics