In-memory architectuur + streaming data = Digitale Tweeling?

0
137

Nul

Zoals de meeste buzzwords, de Digitale Twin klinkt zowel catchy en verwarrend. Hoewel het steeds populairder als te laat, die is aanbevolen door Gartner en gebruikt door Oracle en GE, het is al een begrip sinds 2002.

Het werd geïntroduceerd door Dr. Michael Treurt bij de Universiteit van Michigan, en verwijst hij naar een virtuele representatie van een fysieke entiteit. Oorspronkelijk geïntroduceerd in de context van Product Lifecycle Management, de Digitale Tweeling heeft gekregen een tweede wind met de komst van het Internet of Things (IoT).

digitaltwincar.png

De Digitale Twin is een metafoor voor de representatie van fysieke entiteiten in de software. Afbeelding: ScaleOut

Digitale Twins reloaded

Inderdaad, het klinkt als een passende metafoor. IoT is over, nou ja, de dingen, en al deze dingen verzamelen en verzenden van telemetrie-gegevens en (mogelijk) het ontvangen en uitvoeren van commando ‘ s door middel van sensoren en controllers.

Een “ding”, zoals een drone of een auto, meestal bevat een reeks sensoren en controllers die dit twee-weg interactie mogelijk. De combinatie van gegevens uit deze reeks sensoren die verwijzen naar dezelfde fysieke object creëert een virtuele representatie van het object: de Digitale Twin.

Als je denkt dat er niets bijzonder nieuws over dit, je hebt gelijk. Maar vandaag de dag is de schaal die op een ander niveau helemaal.

Neem auto ‘ s bijvoorbeeld: in F1 race telemetrie data-verzameling is een gegeven voor een jaar. Er is slechts een handvol van de F1 auto ‘ s in de wereld maar dit was dus iets dat betreft een select aantal. Vandaag de dag, de dagelijkse auto ‘ s zijn in het proces van worden uitgerust met een reeks sensoren die zou zijn geweest ongehoord, zelfs voor F1 racing een paar jaar terug.

Dit betekent dat de uitdagingen en kansen met betrekking tot het verzamelen van gegevens en modellering zijn nu een wijdverspreide bezorgdheid. Vandaar de noodzaak voor metaforen te populariseren concepten, en de opleving van de Digitale Twin.

Een data-architectuur voor Digitale Tweeling

Dus, wat voor soort data-architectuur kan men gebruiken voor het model en verwerken van Digitale Tweeling? Om deze vraag te beantwoorden, laten we eerst het uitbreiden van de definitie enigszins. Waarom beperken dit tot fysieke entiteiten? Kan een eShop bestemmingspagina bijvoorbeeld de Digitale Tweeling?

Nou, waarom niet? Hoewel er geen sensoren in de landing pagina ‘ s, er is een scala van gegevens, zoals items in de map en de interactie van de gebruiker met betrekking data — clickstreams. Ideaal kooplieden zouden willen verzamelen clickstreams in real-time en gebruik het om op maat van hun pagina ‘ s aangepast.

Deze clickstreams hebben iets gemeen heeft met een sensor data: ze zijn streaming in de natuur, wat betekent dat zij stromen in voortdurend in real-time en in grote hoeveelheden. Dit markeert een verschuiving in de richting van gegevens architecturen in de richting van streaming, die we hebben bekleding.

Interessant is dat streaming platforms zoals Vonk Streaming, Flink, of Apex zijn ook gericht op in-memory processing. Bij de verwerking van streaming data de veronderstelling is, dat er waarde in te krijgen en handelt op basis van de gegevens zo spoedig mogelijk. De keuze om te gaan voor in-memory processing zin in dat licht, omdat het kan leiden tot ordes van grootte sneller verwerken.

Zoals we onlangs opgemerkt, de kosten van het geheugen is te laten vallen, en er worden nieuwe memory technologieën in de werken die belofte te ontketenen nog meer mogelijkheden. In het geheugen voor de opslag en verwerking architecturen zijn evoluerende voor een tijdje nu, en er zijn leveranciers met meer dan tien jaar lange aanwezigheid in deze ruimte.

Het was natuurlijk dat zij wel de trend in de richting van de streaming van data en het doel om zich te positioneren in deze ruimte. ScaleOut is één van die leveranciers, die onlangs aankondigde ScaleOut StreamServer, een aanvulling op haar lijn van producten die deze exacte doel.

digitaltwincar3.png

ScaleOut de aanpak van de Digitale Twin. Afbeelding: ScaleOut

ScaleOut heeft Digitale Tweeling

ScaleOut werd in 2005 opgericht door de industrie veteraan William Bain. Bain, een expert in parallel computing met stints in de Bell Labs, Intel en Microsoft, zegt ScaleOut te gaan met het probleem van het inschakelen van web boerderijen op te schalen naar een zeer hoge werkdruk.

ScaleOut in eerste instantie gericht op gedistribueerde caching, geleidelijk evolueert naar in-memory storage en compute oplossingen in commodity hardware clusters. Bain zegt ze wilde toestaan dat toepassingen te hanteren snel veranderende data, en dan is het toevoegen van berekenen tot opslag was gewoon een logische stap op weg:

“Als u de gegevens in het geheugen opslag in uw cluster, het is heel natuurlijk om toe te voegen berekenen. Je kan het analyseren van de gegevens zijn opgeslagen bij een zeer lage latency en hoge scaleability omdat de gegevens niet hoeven te verplaatsen.”

Bain zegt de gegevens in het geheugen grids zijn bijzonder goed geschikt voor het streamen van data verwerking, vanwege hun vermogen om niet alleen binnenkrijgt gegevens snel, maar ook te analyseren op de vlieg. Maar dan weer, is dat niet wat streaming platforms doen?

“Mensen in de stream processing niet echt praten over Digitale Tweeling. Digitale Tweeling is de kern in alles wat we doen,” zegt Bain. Hij stelt dat, hoewel platform zoals Vonk Streaming en Storm hebben hun sterke en zwakke punten, ze waren niet echt ontworpen om om te gaan met live gegevens.

Door contrast, hij blijft, ScaleOut is een data grid is ontworpen vanaf de grond opgebouwd voor de live data. Voor Bain, het verschil is in de modellering en de API:

“Neem Vonk Streaming: het is gecentreerd rond micro-groeperen. Als je iets wilt doen, zoals proces clickstreams, je zou hebben om de partij van gegevens uit veel verschillende bronnen samen. Je kunt het doen, maar het is omslachtig. Onze aanpak is een meer natuurlijk fit.”

ScaleOut beschikt over een object-georiënteerde API waarmee het modelleren van meerdere datastromen die gekoppeld is aan dezelfde entiteit en het inkapselen van eigenschappen en gedrag met betrekking tot die entiteit op een manier die spiegels.

Ring a bell? Ja, dat klinkt als een Digitale Tweeling, en dat is precies waarom ScaleOut is met dit als zijn belangrijkste boodschap. Bain zegt dat ze het modelleren van hun API op deze manier sinds 2009, maar het was niet tot voor kort dat iemand hen wees om deze richting:

“We hadden het over onze aanpak met een klant en hij zei: dat is een Digitale Twin. Wij zeiden, dat is een geweldige naam. We waren op zoek naar een naam voor het beschrijven van deze mogelijkheid, zodat we gecoöpteerd.”

digitaltwin.png

De Digitale Twin kan worden toegepast in veel gevallen. Afbeelding: ScaleOut

Een streaming platform killer?

Gartner blijkbaar goedkeurt, mits er aandacht is een indicatie. Een belangrijke analist van het team achter de onlangs verschenen Hype Cycle voor In-Memory Computing Technologie voor 2017 was op ScaleOut de presentatie in In-memory Computing Summit EMEA en leek te waarderen tijd doorgebracht met de ScaleOut team.

Hij benadrukt ook dat ScaleOut doet inname en orkestratie aan de dezelfde tijd, maar het is duidelijk dat het scheiden van de twee door het inkapselen van dat object oriëntatie biedt. Plus het heeft een volledig gedistribueerd, peer-to-peer-design, zonder een enkel punt van falen. Het resultaat, zegt hij, is super snelle verwerking en strak design.

Bijvoorbeeld als het gaat om de inferentie over opgenomen gegevens, Bain cites-gebruik de gevallen waarin rule-based en machine learning methodes gebruikt in combinatie of door elkaar terwijl ze transparant zijn voor de ontwikkelaars, opnieuw vanwege object-georiënteerde inkapseling.

Dat is allemaal mooi en goed natuurlijk, maar de belangrijkste vragen is of je moet zorg over de Digitale Tweeling en terminologie meer in het algemeen, en of dat maakt ScaleOut opvallen.

Buzzwords doen hun plaats hebben, maar het is wat ze betekenen, dat is belangrijk. Of je belt het Digitale Tweeling of onder een andere naam, de mogelijkheid om binnenkrijgen en verwerken van gegevens in real-time en handelen op basis van de resultaten zal steeds belangrijker worden voor de toekomst.

Api ‘ s en architectuur belangrijker is dan de waardering van een elegant design. Hoewel inderdaad het modelleren van Digitale Twins moet het mogelijk zijn met behulp van een streaming platform, een object-georiënteerde API uit de doos zal tijd en moeite besparen.

Onlangs ScaleOut heeft een nieuwe versie van het platform, waarin streaming is een eerste-rangs burger. Maar maakt dat van ScaleOut een Vonk / Flink / Storm killer? Niet per se. Waarom? Twee woorden: open source.

Na verloop van tijd, open source is gekomen om te worden beschouwd als stakes voor middleware. Naast de mogelijkheid om te innoveren in een sneller tempo, de aanpak van de gemeenschap beheerst de waargenomen risico ‘ s voor organisaties gedwongen tot harde strategische beslissingen over hun software-infrastructuur.

We hebben gehoord dit over en van beslissers van organisaties overal. Neem bijvoorbeeld de nieuwste verhaal over Basho, de leverancier van de alom geprezen en gebruikt Riak database, gaat uit van het bedrijfsleven. Organisaties die gebruik Riak zijn de intensivering van de in stand te houden (tenminste, totdat ze vinden er een alternatief), Riak is open source.

Bain erkent dit feit ook. ScaleOut biedt de software in 2 smaken, die kunnen worden uitgevoerd in zowel Microsoft ‘ s .NETTO-en Java-omgevingen. Hoewel er een correlatie tussen de smaken, en ze kunnen samenwerken in een mix-and-match-cluster, Bain merkt op dat:

“De meerderheid van onze gebruikers zijn in de .NETTO wereld. In de Java wereld, mensen richten zich op Apache projecten en verwachten dat software open source is. Wij zijn één van de weinige in het geheugen van leveranciers die niet open source is, en dat beperkt ons vermogen om door te dringen tot de markt.”

ScaleOut is uiteraard bewust van de gevolgen, dus we moeten aannemen dat ze tevreden zijn met het claimen van een stuk van de actie in de Microsoft wereld. Dus de Vonken en de Stormen van de wereld rest enigszins verzekerd voor het moment.

VORIGE EN VERWANTE VERHALEN

Oracle stappen tot IoT spel, voegt AI, digitale twin, en enterprise data-integratie

Oracle is het verbeteren van de IoT Cloud-toepassingen, maar ziet de geheime saus als de gegevens en automatisering die beschikbaar is in de ERP en supply chain-systemen.

GE wil repliceren Digitale Twin succes met die gericht zijn op beveiliging Digitale Geest

In deze Q&A met GE ‘ s Colin Parris, het bedrijf geeft aan hoe ze wil controle van het gebruik van fysieke voorwaarden als onderdeel van de verdediging van de apparatuur van de cyberaanvallen.

0