Het data- en AI-landschap 2021: het is een MAD, MAD, MAD-wereld

0
145

Tony Baer (dbInsight)

Door Tony Baer (dbInsight) voor Big on Data | 7 oktober 2021 | Onderwerp: Big Data Analytics

mad-mad-mad-world3.jpg

United Artists

Terwijl een groot deel van de wereld tijdens de COVID-19-pandemie werd gesloten, gingen de poorten wijd open voor de financiering van vroege en late start-ups in de data- en AI-ruimte. Een team van FirstMark Capital, geleid door partner Matt Turck, heeft de nieuwste van zijn jaarlijkse encyclopedische gegevens en AI-landschappen gepubliceerd. Aan de ene kant van het spectrum, schreven Turck en collega's, is er de rijping, zoals blijkt uit de doorbraak IPO's van Snowflake en Confluent, die de VC-gemeenschap geruststellen dat inkomsten en groei reëel zijn en dat de toestroom van financiering niet leidt tot een herhaling van de dotcom-bubbel.

En ja, in het rapport staat dat de belofte van AI nu wordt waargemaakt. We zien het opduiken, niet alleen in de tools die bedrijfsanalisten gebruiken, zoals BI, maar ook in het feit dat machine learning in de database een checkbox-functie wordt, om nog maar te zwijgen van het feit dat Oracle, SAP, Salesforce en anderen nu routinematig machine learning in bedrijfsapplicaties. We zien dus minder krantenkoppen over zelfrijdende auto's en de wereld zit niet te wachten op een zelfrijdende Uber om te bewijzen dat AI echt is.

Een paar maanden geleden werd FirstMark MAD — het introduceerde de MAD Index van beursgenoteerde machine learning-, AI- en databedrijven. Het belang is dat er nu genoeg van zijn om op zichzelf te vermelden, in plaats van te worden gegroepeerd onder de meer algemene technologieparaplu. En de lijst — destijds ongeveer een dozijn bedrijven plus of min — is recentelijk (in de afgelopen vijf jaar) openbaar geworden.

Om dit allemaal mogelijk te maken, is de venture-gemeenschap natuurlijk. Onder verwijzing naar gegevens van CB Insights, steeg de durfkapitaalfinanciering in het tweede kwartaal van dit jaar met 157% op jaarbasis, terwijl de overheidsfinanciering, hetzij via IPO's, directe noteringen of SPAC's, in de eerste helft van 2021 met meer dan 6x was gestegen in vergelijking met een jaar eerder. De enige indicator die is gedaald, zijn acquisities, naar alle waarschijnlijkheid, omdat door VC-gepompte waarderingen bedrijven zoals Databricks (met $ 38 miljard) veel te duur maken om te verwerven, zelfs voor mensen als de Microsofts die er zijn.

< figure class="image image-large shortcode-image">data-and-ai-landscape-2021-small-1024x522.jpg

Het landschap van machine learning, AI en data (MAD) 2021

Credit: FirstMark Capital

Het rapport begon met een overzicht van het ecosysteem, besprak de financieringsactiviteiten en belichtte vervolgens de belangrijkste technologische trends op het gebied van data-infrastructuur, analyse en AI. Het is te omvangrijk voor ons om regel voor regel te bekijken, maar u kunt het volledige rapport hier bekijken. Een miniatuurafbeelding van het landschap wordt hierboven weergegeven. Een beter leesbare weergave is hier te vinden, en als je alle bloederige details wilt, heeft het FirstMark-team een ​​gedetailleerde spreadsheet samengesteld die je hier kunt openen.

We houden het bij enkele overheersende impressies.

Zoals wij (en anderen) eerder hebben besproken, beschouwen we Big Data niet langer als iets bijzonders. Wanneer u een Snowflake-datawarehouse kunt starten met petabytes aan gegevens en automatisch schalen kunt inschakelen, gebruikt u plotseling de cloud om uit te voeren wat voorheen data-ingenieurs nodig hadden om Hadoop-clusters op te zetten, Zookeeper uit te voeren en die vervolgens handmatig te coderen MapReduce (of later Spark) routines. En met de mogelijkheid om gegevens buiten relationele tabellen te analyseren, zoals JSON, Parquet-bestanden en projectgrafieken, worden die 3 V's die zogenaamd big data definieerden nu ineens ondersteund door uw clouddatawarehouse of lakehouse. Beschrijf het als de 'Modern Data Stack' of noem het het fenomeen dat de auteur 'The Big Unlock' noemt.

We blijven allemaal de cijfers van Snowflake lezen en horen geruchten over wanneer Databricks eindelijk naar de beurs gaat, maar Amazon Redshift, Azure Synapse Analytics en Google BigQuery blijven een van de snelstgroeiende services voor hun respectievelijke clouds.

En dankzij AutoML en de opkomst van tooling en services die de hele levenscyclus van het bouwen en uitvoeren van die modellen bestrijken, kun je hetzelfde zeggen over AI. Er is de voortdurende dans van spelers die veranderen in gegeneraliseerde platforms. ML-platforms, van de SageMakers en Vertex AI's tot de Dataikus en Data Robots van de wereld, verbreden zichzelf naar full lifecycle-services. Dat kun je ook zeggen over andere delen van het data-ecosysteem. Confluent wil niet alleen uw Kafka-streams beheren, maar ook uw realtime datawarehouse.

Desalniettemin noemen de auteurs de gebruikelijke middelpuntvliedende krachten, waarbij de groeiende aandacht voor datanetwerken centraal komt te staan ​​(daar zullen we in een volgende post meer over zeggen). Maar de overgang naar consolidatie heeft nauwelijks een rem gezet op de venture-activiteit. Volgens CB Insights stroomde $ 38 miljard naar AI-startups, wat ongeveer evenveel was als in heel 2020; en in die eerste zes maanden waren er meer dan 50 ronden van meer dan $ 100 miljoen. De financieringsgemeenschap heeft zich buiten VC's verspreid naar hedgefondsen en dat mooie acroniem van ondernemingen, poëtisch afgekort als SPAC's. En veel van die financieringen zijn niet geïnitieerd door hongerige startups, maar door financiers die graag verder willen.

De auteurs zijn optimistisch over de vooruitzichten voor analyse en AI in het algemeen. Maar het rapport citeert ook explosieve groei, niet in inkomsten, maar het aantal startups in niches zoals reverse ETL, datakwaliteit, datacatalogi, data-annotatie en MLOps, waar investeringen voorlopen op de bereidheid van de markt om het te absorberen.

Er is dus veel gek geld. We hebben een paar retorische vragen. Heeft een bedrijf als Databricks echt 3,5 miljard dollar op de bank nodig? Is de term 'eenhoorn' achterhaald met de toename van door durfkapitaal gefinancierde startups van meer dan $ 1 miljard waarderingen? Haasten financiers zich vanwege FOMO — angst om iets te missen?

Maar onze belangrijkste vraag is zijn we op weg naar een andere bubbel? We hadden een offline e-mailuitwisseling met hoofdauteur Matt Turck over die kwestie. Zijn mening is dat “er meer kwaliteitsbedrijven zijn dan ooit.” Er komen terugkerende oprichters binnen met een sterk trackrecord. Een goed voorbeeld is Dataiku-medeoprichter Florian Douetteau, wiens vorige daad de succesvolle exit was met de Exalead-zoekmachine, die ongeveer tien jaar geleden werd overgenomen door Dassault Systemes.

Het rapport noemt ook de krappe arbeidsmarkt. Tot op zekere hoogte is dat oud nieuws — er is al lang een tekort aan datawetenschappers en data-ingenieurs sinds we de woorden 'Big Data' begonnen uit te spreken. Net als het tekort aan Java-ontwikkelaars tijdens het dotcom-tijdperk, zijn dit problemen die grotendeels oplosbaar zijn; getuige zijn van de stroom van inschrijvingen voor datawetenschapsprogramma's van universiteiten. Onze zorg over talent situeert zich in andere delen van de voedselketen: doorgewinterde managers, leidinggevenden, verkoop en marketing. We hebben een aantal leveranciers horen vertellen over de uitdagingen bij het invullen van die slots. In de meeste gevallen gaat het er niet om dat scholen leerlingen met de juiste diploma's afleveren. We hebben het gevoel dat het gebrek aan managementtalent en go-to-market-talent een rem op de groei kan zetten.

Turck noemt ook een solide groei van de jaarlijkse terugkerende inkomsten voor veel van deze startups, en dat, in tegenstelling tot het dotcom-tijdperk, dat over de belofte ging, het huidige tijdperk over deployment gaat. Wij zijn het eens. Onze mening is dat de cloud hier een groot verschil maakt. In vroegere tijdperken moesten organisaties hun kapitaalbudgetten op hun plaats zetten, meer servers aanschaffen, inzetten en onderhouden. Omgekeerd maakt de cloud vrijwel onmiddellijke schaalvergroting mogelijk zonder de administratieve rompslomp van kapitaalbudgettering.

In de algemene economie zijn er potentiële onweerswolken aan de horizon, zoals de waarschijnlijkheid dat geld duurder zal worden als de Fed eindelijk de rente begint te verhogen, om nog maar te zwijgen van de structurele hindernissen die worden gesteld door wereldwijd verstoorde toeleveringsketens. We denken wel dat we voorlopig in piekmomenten zitten voor opstartfinanciering. We zouden niet verrast zijn door een golf van beursintroducties of andere exits in de komende 12 maanden, gevolgd door een vertraging van de onderneming en andere vormen van financiering. Een zekere mate van marktshake-out voor nieuwe ondernemingen is waarschijnlijk – we zagen dit met de eerste golf van Big Data-startups in de periode 2015/16. Maar nogmaals, we verwachten ook succes voor veel van de huidige data- en AI-startups, aangezien economische verstoringen juist de problemen zijn waarvoor ze zijn ontworpen om het hoofd te bieden.

Big Data < /h3> Vertica versnelt duik in de cloud Observe Inc en het avontuur om een ​​van Snowflake's beste gebruikers te zijn Digitale transformatie is aan het veranderen. Dit is wat er daarna komt De beste carrières die je kunt beginnen met een informatica-diploma

Verwante onderwerpen:

Cloud Digital Transformation Robotics Internet of Things Innovatie Enterprise Software Tony Baer (dbInsight)

Door Tony Baer (dbInsight) voor Big on Data | 7 oktober 2021 | Onderwerp: Big Data-analyse