Data- og AI -landskapet 2021: Det er en MAD, MAD, MAD verden

0
129

 Tony Baer (dbInsight)

Av Tony Baer (dbInsight) for Big on Data | 7. oktober 2021 | Tema: Big Data Analytics

 mad-mad-mad-world3.jpg

Mens store deler av verden stengte seg under COVID-pandemien, åpnet portene seg vidt for å finansiere oppstart i tidlig og sent fase i data- og AI-rommet. Et team i FirstMark Capital, ledet av partner Matt Turck, har utgitt det siste av sine årlige leksikondata og AI -landskap. I den ene enden av spekteret, skrev Turck og kollegaer, er det modning som det fremgår av IPO -er for Snowflake og Confluent, som forsikrer VC -samfunnet om at inntekter og vekst er reelle, og at påløpet av finansiering ikke utløser en gjentagelse av dot com -boblen.

Og ja, rapporten sier at løftet om AI nå blir oppfylt. Vi ser det dukke opp, ikke bare i verktøyene som forretningsanalytikere bruker som BI, men også det faktum at maskinlæring i databaser blir en avkrysningsboksfunksjon, for ikke å snakke om at Oracle, SAP, Salesforce og andre nå er rutinemessig innlemmelse av maskinlæring i bedriftsapplikasjoner. Så vi ser færre overskrifter om førerløse biler, og verden venter ikke på at en selvkjørende Uber skal trekke seg opp for å bevise at AI er ekte.

For noen måneder siden gikk FirstMark MAD – det introduserte MAD -indeksen for offentlig noterte maskinlæring, AI og, og dataselskaper. Betydningen er at det nå er nok av dem til å liste opp på egen hånd, i motsetning til å bli gruppert under den mer generelle teknologiparaplyen. Og listen – på det tidspunktet omtrent et dusin selskaper pluss eller minus – har blitt offentlig på det siste (i løpet av de siste fem årene).

Selvfølgelig er venture -samfunnet å gjøre alt dette mulig. Med henvisning til data fra CB Insights økte venturefinansieringen med 157% i forhold til 2. kvartal i år, mens offentlig finansiering, enten gjennom børsnoteringer, direkteoppføringer eller SPAC -er, var opp over 6x i første halvdel av 2021 sammenlignet med året før. Den ene indikatoren som har dyppet er oppkjøp, med all sannsynlighet, fordi VC-pumpede verdivurderinger gjør selskaper som Databricks (til 38 milliarder dollar) altfor dyre å skaffe, selv for slike som Microsofts.

Landskapet for maskinlæring, AI og data (MAD) i 2021

Kreditt: FirstMark Capital

Rapporten begynte med en oversikt over økosystemet, diskuterte finansieringsaktivitet og deretter belyste viktige teknologitrender innen datainfrastruktur, analyse og AI. Det er for omfattende for oss å gjennomgå linje for linje, men du kan se hele rapporten her. Et miniatyrbilde av landskapet er vist ovenfor. En mer leselig gjengivelse finner du her, og hvis du vil ha alle de vonde detaljene, har FirstMark -teamet satt sammen et detaljert regneark som du kan få tilgang til her.

Vi holder oss til noen overordnede inntrykk.

Som vi (og andre) har diskutert før, tenker vi ikke lenger på Big Data som noe spesielt. Når du kan fyre opp et Snowflake -datalager med petabyte med data og slå på automatisk skalering, plutselig utnytter du skyen for å utføre det som tidligere krevde dataingeniører for å sette opp Hadoop -klynger, kjøre Zookeeper, og deretter kode disse MapReduce manuelt (eller senere Spark) rutiner. Og med muligheten til å analysere data utenfor relasjonelle tabeller, som JSON, Parkettfiler og prosjektgrafvisninger, støttes plutselig de 3 V -ene som angivelig definerer store data nå av skydatavarehuset eller innsjøhuset. Beskriv det som “Modern Data Stack”, eller referer til det som fenomenet som forfatteren kalte “The Big Unlock”.

Vi fortsetter å lese Snowflakes tall og hører rykter om når Databricks endelig skal børsnoteres, men Amazon Redshift, Azure Synapse Analytics og Google BigQuery er fortsatt blant de raskest voksende tjenestene for sine respektive skyer.

Og takket være AutoML, og fremveksten av verktøy og tjenester som dekker hele livssyklusen for å bygge og kjøre disse modellene, kan du si det samme om AI. Det er den fortsatte dansen til spillere som forvandler seg til generaliserte plattformer. ML -plattformer, fra SageMakers og Vertex AI til Dataikus og Data Robots i verden, utvider seg til tjenester for hele livssyklusen. Du kan også si det samme om andre deler av dataøkosystemet. Confluent ønsker ikke bare å kjøre Kafka-strømmer, men også datalageret ditt i sanntid.

Ikke desto mindre siterer forfatterne de vanlige sentrifugalkreftene, med økende oppmerksomhet på datanett som står sentralt (vi har mer å si om det i et kommende innlegg). Men overgangen til konsolidering har neppe bremset ventureaktiviteten. I følge CB Insights strømmet 38 milliarder dollar inn i AI -oppstart, som var omtrent like mye som gikk inn i hele 2020; og i de første seks månedene var det over 50 runder som oversteg $ 100 millioner. Finansieringssamfunnet har spredt seg utover VCs til hedgefond og det flotte akronymet for ventures poetisk forkortet som SPACs. Og mange av disse finansieringene har blitt påbegynt, ikke av sultne oppstart, men av finansfolk som er ivrige etter å komme videre.

Forfatterne er bullish på utsiktene for analyse og AI generelt. Men rapporten siterer også eksplosiv vekst, ikke i inntekter, men antall oppstart i nisjer som omvendt ETL, datakvalitet, datakataloger, datakommentarer og MLOps der investeringer ser ut til å være foran markedets beredskap til å absorbere det.

Så det er mange vanvittige penger der ute. Vi har noen få retoriske spørsmål. Trenger et selskap som Databricks virkelig 3,5 milliarder dollar i banken? Med spredningen av venturefinansierte oppstart som overstiger 1 milliard dollar verdsettelser, har begrepet “enhjørning” vokst utdatert? Haster finansfolk inn på grunn av FOMO – frykt for å gå glipp av?

Men hovedspørsmålet vårt er om vi skal inn i en annen boble? Vi hadde en offline e -postutveksling med hovedforfatter Matt Turck om nettopp dette problemet. Hans oppfatning er at “det er flere kvalitetsbedrifter enn noensinne.” Det er gjentagende grunnleggere som kommer inn med sterke banerekorder. Et godt eksempel er Dataiku -grunnlegger Florian Douetteau, hvis tidligere handling var den vellykkede avslutningen med søkemotoren Exalead, som ble kjøpt opp av Dassault Systemes for omtrent et tiår siden.

Rapporten siterer også det stramme arbeidsmarkedet. Til en viss grad er det gamle nyheter – det har lenge vært mangel på datavitenskapsmenn og dataingeniører helt siden vi begynte å sette ord på “Big Data”. Som mangel på Java -utviklere under dot com -tiden, er dette problemer som i stor grad kan løses; være vitne til flommen av påmeldinger til datavitenskapsprogrammer på høyskoler. Vår bekymring for talent er på andre deler av næringskjeden – erfarne ledere, ledere, salg og markedsføring. Vi har hørt en rekke leverandører fortelle oss om utfordringene med å fylle disse plassene. I de fleste tilfeller handler dette ikke om at skoler viser ut karakterer med riktige grader. Vår mening er at mangelen på ledelsesmessige og markedsførende talenter kan sette noen bremser på veksten.

Turck siterer også solid vekst i årlige tilbakevendende inntekter for mange av disse oppstartene, og at i motsetning til dot com -tiden, som handlet om løfte, handler den nåværende æra om distribusjon. Vi er enige. Vår oppfatning er at skyen gjør en stor forskjell her. I tidligere epoker ville organisasjoner ha måttet sette sine kapitalbudsjetter der de hadde munnen, skaffe seg, distribuere og vedlikeholde flere servere. Motsatt tillater skyen nesten umiddelbar skalering uten byråkrati for kapitalbudsjettering.

I den generelle økonomien er det potensielle stormskyer i horisonten, for eksempel sannsynligheten for at penger vil bli dyrere ettersom Fed endelig begynner å øke renten, for ikke å snakke om de strukturelle hindringene som globalt forstyrrede forsyningskjeder utgjør. Vi tror at vi for øyeblikket er i spenningstid for oppstartfinansiering. Vi ville ikke bli overrasket over en mengde børsnoteringer eller andre utganger i løpet av de neste 12 månedene etterfulgt av en nedgang i venture og andre former for finansiering. En viss grad av market shakeout for nye virksomheter er sannsynlig – vi så dette med den første flaten av Big Data -oppstart i løpet av 2015 – 16 tidsrammen. Men igjen, vi forventer også suksess for mange av dagens data- og AI -oppstart, ettersom økonomiske forstyrrelser er selve problemene de er designet for å ta på.

Big Data < /h3> Vertica akselererer dykk i skyen Observe Inc og eventyret om å være en av Snowflakes beste brukere Digital transformasjon er i endring. Her er det neste De beste karrierer du kan starte med en informatikk grad

Relaterte emner:

Cloud Digital Transformation Robotics Internet of Things Innovation Enterprise Software  Tony Baer (dbInsight)

Av Tony Baer (dbInsight) for Big on Data | 7. oktober 2021 | Tema: Big Data Analytics