In-memory-arkitektur + streaming data = Digital Tvillinger?

0
183

Nul

Som de fleste buzzwords, Digitale Tvilling lyder både iørefaldende og forvirrende. Selv om det har været ved at blive populære, som for sent, som har været omtalt i Gartner og bruges af Oracle og GE, der har været rundt som et begreb, siden 2002.

Det blev introduceret af Dr. Michael Bedrøver på University of Michigan, og det refererer til en virtuel repræsentation af en fysisk enhed. Oprindeligt indført i forbindelse med Product Lifecycle Management, den Digitale Twin har fået en anden vind med fremkomsten af Internet of Things (IoT).

digitaltwincar.png

Den Digitale Twin er en metafor for, som repræsenterer fysiske enheder i software. Billede: ScaleOut

Digital Tvillinger reloaded

Ja, det lyder som en passende metafor. Tingenes internet er om, tja, ting, og have disse ting for at indsamle og sende telemetri data, såvel som (potentielt) at modtage og udføre kommandoer via sensorer og styringer.

En “ting”, såsom en drone eller en bil, der typisk indeholder en lang række sensorer og controllere, der gør dette to-vejs interaktion mulig. Kombinationen af data fra denne vifte af sensorer, der refererer til det samme fysiske objekt, der skaber en virtuel repræsentation af objektet: det Digitale Tvilling.

Hvis du tænker der er ikke noget særligt nyt om dette, du har ret. Men i dag er det den skala, der er på et andet niveau helt.

Tager biler for eksempel: i F1 racing telemetri indsamling af data har været et givet år. Der er kun en håndfuld af F1 racing biler i verden, men så dette var noget, der bekymrede for nogle få udvalgte. I dag, daglige biler er i færd med at blive udstyret med en række sensorer, der ville have været uhørt, selv for F1 racing for et par år tilbage.

Dette betyder, at udfordringer og muligheder relateret til dataindsamling og modellering er nu en udbredt bekymring. Der er derfor brug for metaforer til at udbrede begreber, og en genoplivning af den Digitale Tvilling.

En data-arkitektur for Digital Tvillinger

Så, hvad slags data, arkitektur, kan man anvender til at modellere og bearbejde Digitale Tvillinger? For at besvare dette, lad os først udvide definitionen lidt. Hvorfor begrænse det til fysiske enheder? Kunne en eShop destinationsside for eksempel have sin Digitale Tvilling?

Tja, hvorfor ikke? Selv om der er ingen sensorer i landing pages, der er en bred vifte af data, der er forbundet med dem, såsom elementer, den indeholder, og brugerens interaktion relaterede data — clickstreams. Ideelt set handlende ville gerne samle clickstreams i realtime og bruge det til at skræddersy deres sider i overensstemmelse hermed.

Disse clickstreams har noget til fælles med sensor data: de er streaming i naturen, hvilket betyder, at de konstant flow i i realtime og i store mængder. Dette markerer et skift i retning af data arkitekturer mod streaming, som vi har været der dækker.

Det er interessant, streaming-platforme, såsom Spark Streaming, Flink, eller Apex er orienterede i retning af in-memory-behandling. I behandlingen af streaming-data er den antagelse, at der er værdi i at komme og handle på de data, der så hurtigt som muligt. Valget til at gå i-hukommelse behandling giver mening i, at lys, da det kan føre til størrelsesordner hurtigere behandling.

Som vi for nylig konstateret, at udgifterne til hukommelse har været faldende, og der er nye hukommelse teknologier i de værker, der lover at udløse endnu flere muligheder. In-memory opbevaring og behandling af arkitekturer, har været under udvikling i et stykke tid nu, og der er leverandører, med mere end ti år lange tilstedeværelse i dette rum.

Det var kun naturligt, at de ville tage til efterretning tendens til streaming-data, og målet er at positionere sig i dette rum. ScaleOut er en af de leverandører, for nylig annoncerede ScaleOut StreamServer, en tilføjelse til sin linje af produkter, der har det nøjagtige mål.

digitaltwincar3.png

ScaleOut ‘ s tilgang til den Digitale Tvilling. Billede: ScaleOut

ScaleOut betyder Digital Tvillinger

ScaleOut blev grundlagt i 2005 af industri veteran William Bain. Bain, en ekspert i parallel computing med stints på Bell Labs, Intel og Microsoft, siger ScaleOut sat sig for at beskæftige sig med problemet med aktivering af web-gårde til at skalere til meget højt arbejdspres.

ScaleOut i første omgang fokuseret på distribueret caching, gradvist udvikler sig til at in-memory opbevaring og beregne løsninger i commodity hardware klynger. Bain siger, at de ønskede at tillade applikationer til at håndtere hurtigt skiftende data, og derefter tilføje beregne til opbevaring var bare en logisk, trin derfra:

“Hvis du har i hukommelsen lagring af data i din klynge, er det meget naturligt at tilføje beregne til det. Du kan analysere data, du gemmer på meget lav latenstid og høj skalerbarhed, fordi data ikke er nødt til at flytte.”

Bain siger, at in-memory-data-net er særdeles velegnet til streaming-data behandling, på grund af deres evne til ikke kun at indtage data hurtigt, men også analysere dem på flue. Men så igen, er det ikke det, streaming platforme gør så godt?

“Folk i stream processing ikke rigtig tale om Digitale Tvillinger. Digital Tvillinger er kernen i, hvad vi gør”, siger Bain. Han hævder, at mens platform som Gnist Streaming og Storm har deres styrker og svagheder, de var ikke rigtig designet til at beskæftige sig med live data.

Derimod, fortsætter han, ScaleOut er en data-net designet fra bunden til live data. For Bain, forskellen er, at i modellering og API:

“Tag Gnist Streaming: det er centreret omkring mikro-blandeanlæg. Hvis du ønsker at gøre noget lignende proces clickstreams, du er nødt til at batch data fra mange kilder sammen. Du kan gøre det, men det er besværligt. Vores tilgang er en mere naturlig pasform.”

ScaleOut har en objekt-orienteret API, der muliggør modellering flere data-streams, der er forbundet med den samme enhed og indkapsling egenskaber og adfærd i forhold til, at virksomheden på en måde, der afspejler det.

En klokke til at ringe? Ja, det lyder som en Digital Twin, som er præcis, hvorfor ScaleOut bruger dette som sit centrale budskab. Bain siger, at de har været modellering deres API på denne måde siden 2009, men det var ikke indtil for nylig, at nogen pegede dem til denne retning:

“Vi diskuterede vores tilgang med en klient, og han sagde, at der er en Digital Tvilling. Vi sagde, det er et godt navn. Vi ledte efter et navn, der beskriver denne evne, så vi ved selvsupplering det.”

digitaltwin.png

Den Digitale Tvilling kan anvendes i mange use cases. Billede: ScaleOut

En streaming-platform killer?

Gartner tilsyneladende godkender så godt, hvis opmærksomhed er indikation. En vigtig analytiker fra holdet bag den nyligt offentliggjorte Hype Cycle for In-Memory Computing-Teknologi til 2017 var på ScaleOut ‘ s præsentation i In-memory Computing Summit EMEA og syntes at sætte pris på tid med ScaleOut team.

Der var også understreger, at ScaleOut gør indtagelse og orkestrering på samme tid, men det er klart at adskille de to på grund af indkapsling, at objektorientering tilbyder. Plus det har en fuldt distribueret, peer-to-peer-design uden et single point of failure. Resultatet er, siger han, super hurtig forarbejdning og flot design.

For eksempel, når det kommer til slutning over behandlede data, Bain cites bruge de tilfælde, hvor regel-baseret og machine learning metoder har været anvendt i forbindelse eller i flæng, mens de bliver gennemsigtige for udviklere, igen på grund af objekt-orienteret indkapsling.

Alle, der er rart og godt, selvfølgelig, men det vigtigste spørgsmål at stille, er, om du bør bekymre sig om Digitale Tvillinger og den terminologi, der mere bredt, og om den gør ScaleOut skiller sig ud.

Buzzwords har deres plads, men det er, hvad de betyde, at det er vigtigt. Uanset om du kalder det Digital Tvillinger eller ved ethvert andet navn, evnen til at indtage og behandle data i realtime og handle på de resultater, der vil blive mere og mere vigtigt at gå fremad.

Api ‘ er og arkitektur er vigtig ud over påskønnelse af elegant design. Selv om der faktisk modellering Digital Tvillinger bør være muligt at bruge nogen streaming-platform, et objekt-orienteret API ud af boksen vil spare tid og kræfter.

For nylig ScaleOut frigivet en ny version af sin platform, hvor streaming er en first-class citizen. Men gør det ScaleOut en Gnist / Flink / Storm killer? Ikke nødvendigvis. Hvorfor? To ord: open source.

Over tid, open source er kommet for at blive anset for indsatser for middleware. Udover at være i stand til at innovere i et hurtigere tempo, fællesskabet tilgang mindsker den oplevede risiko for organisationer, der er tvunget til at træffe svære strategiske beslutninger på deres software infrastruktur.

Vi har hørt det igen og igen fra beslutningstagere fra organisationer overalt. Tag for eksempel den seneste historie om Basho, udbyderen af den meget roste, og anvendes Ripple database, gå ud af virksomhed. Organisationer, der har brugt Ripple er at træde op for at bevare det (i det mindste indtil de finder et alternativ), som Ripple er open source.

Bain anerkender dette faktum. ScaleOut tilbyder sin software i 2 varianter, at blive i stand til at køre i både Microsoft ‘ s .NET og Java-miljøer. Selv om der er lighed mellem de varianter, og de kan fungere sammen i en mix-and-match-klynge samt, Bain bemærker, at:

“De fleste af vores brugere er i den .NETTO verden. I Java-verden, mennesker fokusere på Apache projekter og forventer, at software skal være open source. Vi er en af de få i-hukommelse leverandører, der ikke er open source, og det hæmmer vores evne til at trænge ind på dette marked.”

ScaleOut er naturligvis klar over konsekvenserne, så vi er nødt til at antage, at de er tilfredse med at hævde, et stykke af aktionen i de Microsoft-verden. Så Gnister og Storme i verden kan være temmelig sikker på, for tiden.

TIDLIGERE OG RELATEREDE HISTORIER

Oracle trin op til tingenes internet, spil, tilføjer AI, digitale tvilling, og enterprise data integration

Oracle, er at øge sin IoT Cloud-applikationer, men ser den hemmelige sauce som data og automatisering, der er til rådighed i sin ERP-og supply chain-systemer.

GE har til formål at kopiere Digitale Twin succes med sikkerhed med fokus på Digital Ghost

I denne Q&A med GE ‘ s Colin Parris, virksomheden redegør for, hvordan den ønsker at anvende overvågning af fysiske forhold som en del af forsvaret udstyr fra cyberangreb.

0