IBM Clouds serverløse køreplan går fra suppe til nødder

0
97

 Tony Baer (dbInsight)

Af Tony Baer (dbInsight) for Big on Data | 8. september 2021 – 12:00 GMT (13:00 BST) | Emne: Big Data Analytics

serverless.jpg

Serverløs computing er nået langt siden dets ydmyge oprindelse med programmering af simple funktionstjenester, der typisk implementeres i lette web- eller mobilapps. I en nylig briefing med analytikere gennemgik IBM sine planer for serverløse tjenester i sin sky, og fremtiden peger på næsten det stik modsatte af simple funktioner: applikationer til kompleks supercomputing.

Det er en del af en løbende udvidelse af IBM Cloud Code Engine, der først blev lanceret tidligere på året, for at blive en bredt baseret platform til automatisering af implementering og kørsel af kode på tværs af et bredt spektrum af brugssager, fra funktioner til PaaS, batchjobs og containere -som en service. Som vi vil bemærke nedenfor, er udvidelse af dette til supercomputing et markant skift fra den langt ydmyger oprindelse til serverløs computing. Men også en del af køreplanen har motoren til at omfatte et komplet spektrum af tjenester, der starter med funktioner som en service, som IBM har tilbudt i en årrække.

Serverless har altid handlet om enkelhed. Oprindeligt fastslog det, at eliminerede behovet for udviklere til at tilvejebringe eller skalere infrastruktur. Den vejledende antagelse er, at udviklere skal være dygtige til det valgte computersprog – hovedsageligt Java, JavaScript, Python – men de skal ikke bekymre sig om at oprette eller administrere distribueret infrastruktur for ikke at nævne internerne i Kubernetes (K8s).

Som nævnt ovenfor tilbyder IBM allerede det grundlæggende: funktioner som en service. Det samme gør alle de andre store cloud -udbydere. Det var her serverless startede: På det tidspunkt var den nyeste teknik evnen til automatisk at tilvejebringe og automatisk skalere relativt enkle, kortvarige arbejdsbyrder på råvareberegningsforekomster. IBMs planer for Code Engine går ud over automatisk klargøring og autoskaling til automatisk at containere din applikation. Og der er mere. IBMs køreplan for Cloud Code Engine omfatter også en Platform-as-a-Service (PaaS), der vil containere, implementere, skalere og køre kode. Under den samme paraplytjeneste vil Code Engine også understøtte batchjob, hvor kunderne bringer jobbet, og det vil implementere, skalere og køre det. Det samme gælder containere, enten som kunderne udvikler eller får fra tredjeparter.

Og IBM søger serverløs Code Engine for at forenkle onrampen til populære open source -rammer som Ray, CodeFlare, Spark, TensorFlow og så videre. IBM's Project CodeFlare er et open source -projekt designet til at forenkle integrationen af ​​komplekse ML- og AI -rørledninger gennem en fælles API; det er bygget oven på Ray -projektet, der kommer ud af UC Berkeleys RISELab, som giver et API til at samle distribueret computing -sat -skala. Vi gav baggrund for Rays bane i et stykke, der dukkede op på disse sider for et par uger siden. Dette indlæg beskriver trinene til opsætning af Ray i Code Engine; vi ville elske at se den næste fase, hvor Code engine giver midlerne til at automatisere mange af disse trin og afskaffe behovet for kommandolinjegrænseflader.

En anden brik i puslespillet er at bygge ny middleware, der ville tillade AI -arbejdsbyrder at køre i hybrid sky, med IBM Cloud Satellite som det påtænkte leveringskøretøj. Kørsel af træning og inferens (produktion) arbejdsbyrder for AI vil kræve orkestrering af flere værktøjer og runtimes.

Dette er ikke din fars serverløse. At komme til batchjobs, applikationer, containere og supercomputing øger kompleksiteten af ​​opgaven for serverless. Det er ikke længere et spørgsmål om automatisk at fordele den samme varecompute til kompakte funktioner, for nu er arbejdsbyrden lige så forskelligartet som den normale it -ejendom. Der er verdener med forskelle for beregningsinstanserne, der automatisk tilvejebringes til batchjobs vs. simple funktioner, for ikke at nævne neurale netværk og massivt parallelle computere, der kan være forbundet med supercomputing og dybe læringsarbejde. Én størrelse passer ikke til alle.

IBM har næsten ikke været alene om at udvide rækkevidden af ​​serverless ud over funktioner. de tjenester, der tilbydes af hver af de store cloud -udbydere, er også udvidet ud over funktioner. For eksempel understøtter AWS at køre containere, hændelsesdrevne apps og arbejdsgange og synkronisere GraphQL API'er (til mobilapps). På Azure er der serverløse tjenester til computere, workflow -orkestrering, containeriserede AI -tjenester. Google Cloud tilbyder tjenester til at køre containeriseret og webapphosting.

Serverless har også skabt en stor tilstedeværelse i datarummet, hvor mange operationelle og analytiske dataplatforme tilbydes som serverløse, enten som option eller som standard. For eksempel Amazon DynamoDB og Aurora; Azure SQL Database og Cosmos DB; og Google Cloud BigQuery og Firestore tilbydes serverløs, enten som standard eller som indstillinger. Det samme gælder MongoDB og DataStax, der i de seneste måneder har rullet serverløst ud. Det samme gælder datarelaterede tjenester som AWS Glue og Azure Data Factory til datatransformation og Amazon Kinesis og Google Cloud Dataflow til datastreaming.

Intet er dog et yderligere skrig fra serverless (for funktioner) oprindelse som forestillingen om at bringe serverless til supercomputing, også kendt som højtydende computing eller HPC, eller på folkemunden, pinligt parallelle computerværdier. Dette er meget mere udfordrende terræn, fordi datarørledninger og computere er langt mere komplekse og mere udfordrende at modellere. Selvom nogle former for supercomputing simpelthen kan kæde masser af råvarehardware sammen, kan andre arbejdsbyrder (især med dyb læring) kræve mere specialiserede instanser eller en blanding af varer og specialiseret silicium, hukommelse og opbevaring osv.

Nu skal vi afslutte det: I sidste ende er IBMs strækningsmål at gøre quantum computing tilgængelig som en serverløs service. IBM er muligvis ikke den eneste cloud -udbyder, der tager serverless ud over sine beskedne rødder med implementering af funktioner, men det er bestemt ambitiøst i at tage serverless til ekstrem beregning.

Oplysning: IBM er en dbInsight -klient.

< h3 class = "heading"> Big Data

Hvor er IBMs hybride cloud -startplade? Syv måder at gøre realtidsteknologi til virkelighed for din organisation Maskinlæring på kanten: TinyML bliver stor Hvad sker der med Cloudera? McDonald's ønsker at 'demokratisere' maskinlæring for alle brugere på tværs af sine aktiviteter

Relaterede emner:

Cloud Digital Transformation Robotics Internet of Things Innovation Enterprise Software

Af Tony Baer (dbInsight) for Stort på data | 8. september 2021 – 12:00 GMT (13:00 BST) | Emne: Big Data Analytics