H2O bringer AI stormester-drevet NLP til virksomheden

0
198

George Anadiotis Skrevet af George Anadiotis, bidragende forfatter George Anadiotis George Anadiotis bidragende skribent

George Anadiotis har teknologi, data og medier, og han er ikke bange for at bruge dem.

Fuld bio Udgivet i Big on Data den 21. februar 2022 | Emne: Kunstig intelligens

Der er omkring 1200 skak-stormestre i verden og kun 250 AI-stormestre. I skak, som i AI, er grandmaster en anerkendelse forbeholdt den øverste række af professionelle spillere. Inden for kunstig intelligens uddeles denne anerkendelse af de bedste dataforskere i Kaggles progressionssystem.

H2O.ai, AI Cloud-virksomheden, som rejste $100 millioner i en Series E-runde i slutningen af ​​2021, og som nu er vurderet til $1,6 milliarder, beskæftiger 10% af verdens AI-stormestre. Virksomheden har netop annonceret H2O Hydrogen Torch, et produkt, der har til formål at bringe AI storartet mesterskab til billed-, video- og naturlig sprogbehandling (NLP) til virksomheden.

Vi har forbindelse med H2O CEO og grundlægger Sri Ambati, og vi diskuterede alt fra H2O's oprindelse og overordnede tilbud til Hydrogen Torch, og hvor det passer ind i AI-landskabet.

H2O: En stak til AI

Ambati begyndte først at arbejde med AI og lavede stemme-til-tekst-oversættelse for det indiske rumforskningsprogram for nogle årtier siden. Han faldt efterfølgende over neurale netværk, som var på et tidligt tidspunkt på det tidspunkt. Som immigrant i Silicon Valley brugte han tid på at arbejde i startups. Han brugte også tid på sabbatår mellem Berkeley og Stanford og mødte matematikere, fysikere og dataloger.

I samarbejde med dem lagde Ambati grunden til, hvad der skulle blive H2O's open source-grundlag. Men det var først, da hans mor fik brystkræft, at han blev “inspireret til at demokratisere maskinlæring for alle.”

Ambati satte sig for at bringe AI til fingerspidserne for enhver læge eller dataforsker, der løser problemer af værdi for samfundet, som han udtrykte det. For at gøre det fortsatte han med at tilføje, at matematik og analyse i skala skulle genopfindes. Det førte til H2O, der samler compileringeniører, systemingeniører, matematikere, datavidenskabsmænd og stormestre for at gøre det nemt at bygge modeller af høj værdi og høj nøjagtighed, meget hurtigt.

Der er en hel produktlinje bygget af H2O gennem årene for at materialisere dette. Da H2O startede i 2012, sagde Ambati, var der et hul i skalerbare open source AI-fundamenter. Der var sprog som R og Python, der tillod folk at bygge modeller, men de var meget langsomme eller skøre eller ikke fuldt udbyggede. H2O's bidrag, ifølge Ambati, var, at de byggede “verdens hurtigste distanceberegner.”

Dette er en reference til den grundlæggende matematik, der bruges til matrixmultiplikation i dyb læring. Når du kan beregne afstanden mellem to lange tensorer, fortsatte Ambati med at tilføje, at du kan begynde at producere rig, lineær og ikke-lineær matematik på tværs af højdimensionelle og lavdimensionelle data.

Dette bidrag er en del af H2O open source-rammen. Ambati kalder dette fundament på lavt niveau “samlesproget for AI.” Derefter H2O integrerede rammer og open source-fællesskaber som Scikit-learn, XGBoost, Googles TensorFlow eller Facebooks PyTorch. H2O-teamet begyndte at bidrage til dem, mens de til sidst sammensatte en integreret ramme i det, der ville komme til at blive kendt som AutoML.

H2Os produkter i det rum er H2O AutoML, baseret på H2O open source og XGBoost, og et bredere tilbud kaldet Driverless AI, som er lukket kildekode. Begge målrettede tidsseriedata, som er rygraden i mange tilfælde af virksomhedsbrug, såsom forudsigelse af afgang, forebyggelse af bedrageri eller kreditscoring.

h2ohydrogentorch.png

H2O's Hydrogen Torch er den seneste tilføjelse til sin produktportefølje, der sigter mod at bringe AI storartet mesterskab til billed-, video- og naturlig sprogbehandling (NLP) til virksomheden. Billede: H2O

Førerløs AI har været “motoren bag H2O-økonomi” ifølge Ambati i løbet af de sidste fire år. Det hjalp H2O med at erhverve hundredvis af kunder, der tæller over halvdelen af ​​Fortune 500, inklusive AT&T, Citi, Capital One, GlaxoSmithKline, Hitachi, Kaiser Permanente, Procter & Gamble, PayPal, PwC, Reckitt, Unilever og Walgreens.

Ambati kalder dette lag for “kompilatorerne af kunstig intelligens.” Det var her, H2O begyndte at bruge stormestertilgangen: at opdele problemområdet i en masse opskrifter, tildele Kaggle-stormestre til hver opskrift med det mål at destillere deres viden for at gøre tingene lettere for hold på jorden.

Den næste fase efter at have bygget en god maskinlæringsmodel er sikker drift af denne model. Data har i sagens natur bias, og skæve modeller bør ikke gå i produktion uanfægtet. At finde blinde vinkler og udføre kontradiktoriske tests og modelvalidering, implementere modeller og derefter integrere det i CI/CD'en for softwareopbygning er, hvad Ambati kalder “mellemwaren til AI”.

Dette løses med en hybrid cloud, on-premises og edge-tilbud fra H2O – AI-skyen. Kunder bruger det gennem applikationer: Der er en AI-appbutik, en præbygget modelbutik og funktioner-butikker, der krystalliserer den indsigt, der kommer ud af modelbygningen. AI Cloud er også multi-sky, da kunderne ønsker valg. Så er der også H2O Wave — et SDK til at bygge applikationer ifølge Ambati.

Stående på skuldrene af webgiganter

Hydrogen Torch, seneste tilføjelse til H2O's portefølje, er skræddersyet specifikt til applikationer til billed-, video- og NLP-behandlingsbrug, herunder identifikation eller klassificering af objekter, analyse af følelser eller at finde relevant information i en tekst. Det er et tilbud uden kode, for hvilket Ambati sagde:

“Det går ind i det traditionelle rum for webgiganter som Google, Microsoft, Amazon og Facebook og bruger noget af deres innovation, men udfordrer dem ved at give kunderne mulighed for lettere at bruge deep learning, både ved at tage præbyggede modeller og transformere dem til lokal brug.”

Ambati henviste til nogle tidlige brugere til brug af Hydrogen Torch, såsom videobehandling i realtid. I Singapore gøres dette for at identificere, om trafikken er steget, eller om visse situationer kan resultere i ulykker. Den anvendte tilgang er at tage “traditionelle”, store maskinlæringsmodeller og derefter finjustere dem til de specifikke data ved hånden.

Hydrogen Torch bruger Facebooks PyTorch og Googles Googles TensorFlow under motorhjelmen. H2O tager dem og tilføjer stormesterekspertise plus et integreret miljø. Det inkluderer også H2O's MLOps-tilbud, som leverer data- og maskinlæringspipelines, der går til produktion.

Modeller bliver løbende overvåget for at identificere, om deres nøjagtighed har ændret sig. Det kan ske, fordi mønsteret af indgående data har ændret sig, eller fordi slutbrugernes adfærd har ændret sig. Uanset hvad, bliver modellen derefter genopbygget og omplaceret.

Derudover er en del af Hydrogen Torch no-code tilbuddet automatiseret dokumentationsgenerering, så dataforskere kan bore ned for at udforske, hvilke data der blev udvalgt, og hvilke transformationer der blev anvendt. Ambati hævdede, at Hydrogen Torch-modellens nøjagtighed kan være op til 30 % bedre sammenlignet med baseline-modeller og nåede de høje 90 percentiler.

Selvfølgelig, fortsatte han med at tilføje, er der en velkendt afvejning i AI mellem nøjagtighed, hastighed og forklarlighed. Afhængigt af kravene til use case, skal der træffes valg. Hastighed er dog noget af et universelt krav.

Hvad angår hastighed, spiller H2O's in-memory-behandling en nøglerolle i at sikre, at Hydrogen Torch kan udføre efter behov for billed-, video- og NLP-behandling. På en relateret front har H2O også miniaturisering af maskinlæringsmodeller på sin dagsorden. Det vil gøre det muligt for modeller at blive implementeret på flere enheder i kanten, og også have bedre ydeevne.

Hydrogen Torch har også synergier med et andet produkt i H2O's portefølje, nemlig Document AI. Document AI gør det muligt at behandle indgående dokumenter ved at kombinere billed- og NLP-metoder. Og så er der lyd- og videodata fra kilder som Zoom-opkald og podcasts, der breder sig, og H2O sigter mod at hjælpe sine kunder med at følge med.

H2O har løbende samarbejder med højt profilerede kunder, såsom CommBank og AT&T. Eksperter fra H2O og kundeorganisationer skaber sammen maskinlæringsmodeller, og der er en indtægtsdelingsordning på plads.

Ambati identificerede også flere områder for fremtidig vækst i H2O's portefølje: Federated AI, indholdsskabelse, syntetiske data generation, datahistoriefortælling og endda områder som datajournalistik er på H2O's radar. Målet, sagde Ambati, er at opbygge tillid til AI for at tjene samfund. Det er i sandhed en storslået vision, for hvilken fremskridt er svært at måle. Hvad angår produktkøreplanen, ser H2O dog ud til at være på rette vej.

Fremhævede

Russiske cyberangreb kan påvirke organisationer rundt om i verden, så tag handling nu. Mac Mini Pro… igen Microsoft: Ny “ice phishing”-trussel på blockchain, DeFi-netværk Robotyngelkok får job på 100 White Castle-lokationer Big Data Analytics | Digital transformation | CXO | Internet of Things | Innovation | Enterprise Software