SVENSKA

I minnet arkitektur + streaming data = Digital Tvillingar?

100

Noll

Som de flesta slagord, den Digitala Twin ljud både catchy och förbryllande. Även om det har blivit populära som för sent, efter att ha varit med från Gartner och används av Oracle och GE, det har funnits som begrepp sedan 2002.

Det introducerades av Dr. Michael Sörjer vid University of Michigan, och det hänvisar till en virtuell representation av en fysisk enhet. Ursprungligen infördes i samband med Product Lifecycle Management, Digital Twin har fått en andra vind med tillkomsten av Internet of Things (IoT).

Digital Tvillingar reloaded

Ja, det låter som en passande metafor. Sakernas internet är om, tja, saker, och att ha dessa saker samla in och skicka telemetri data samt (eventuellt) ta emot och köra kommandon via sensorer och styrenheter.

En “sak”, till exempel en drönare eller en bil, normalt innehåller en mängd sensorer och styrenheter som gör detta två-vägs interaktion möjligt. En kombination av data från denna uppsättning av sensorer för att referera till samma fysiska objekt skapar en virtuell representation av objekt: den Digitala Tvilling.

Om du tänker att det är inget speciellt nytt om detta, du har rätt. Men idag är det den omfattning som är på en annan nivå helt och hållet.

Ta bilar till exempel: i F1 racing telemetri insamling av data har varit en självklarhet för år. Det finns bara en handfull av F1 racing bilar i världen dock, så detta var något som berörde ett fåtal. Idag, vardagliga bilar är i processen av att vara utrustade med en mängd sensorer som skulle ha varit otänkbart även för F1 racing ett par år tillbaka.

Detta innebär att utmaningar och möjligheter som är relaterade till insamling av data och modellering är nu en utbredd oro. Därav behovet av metaforer för att popularisera begrepp, och ett återupprättande av den Digitala Tvilling.

En data-arkitektur för Digitala Tvillingar

Så, vilken typ av data arkitektur kan man använda för att modell och process Digital Tvillingar? För att besvara detta, låt oss först utvidga definitionen något. Varför begränsa detta till fysiska enheter? Skulle en e-butik målsida till exempel ha sin Digitala Tvilling?

Tja, varför inte? Även om det finns inga sensorer i målsidor, det är en samling av data som är associerade med dem, såsom objekt den innehåller och interaktion med användaren relaterade data — clickstreams. Idealiskt köpmän skulle vilja samla clickstreams i realtid och använda den för att skräddarsy sina sidor i enlighet med detta.

Dessa clickstreams har något gemensamt med sensor data: de är streaming i naturen, vilket innebär att de strömmar in hela tiden i realtid och i stora mängder. Detta innebär en förändring i den riktning som data arkitekturer mot streaming, som vi har studerat.

Intressant, streaming plattformar som Gnista Streaming, Flink, eller Apex är också inriktade mot in-memory behandling. I bearbetningen av strömmande data antagandet är att det ligger ett värde i att komma och agera utifrån uppgifter så snart som möjligt. Valet att gå i minnet bearbetning meningsfullt i ljuset av detta, eftersom det kan leda till storleksordningar snabbare behandling.

Som vi nyligen noterat, kostnaden för minnet har sjunkit, och det finns ny teknik minne i de verk som lovar att släppa loss ännu mer kapacitet. I minnet för lagring och bearbetning arkitekturer har utvecklats för ett tag nu, och det finns leverantörer med mer än tio år långa närvaro i detta utrymme.

Det var bara naturligt att de skulle ta del av den trend mot streaming data och syftar till att positionera sig i detta utrymme. ScaleOut är en av dessa leverantörer, nyligen meddelade ScaleOut StreamServer, ett tillägg till sin linje av produkter med denna exakta mål.

ScaleOut har Digital Tvillingar

ScaleOut grundades 2005 av veteran i branschen William Bain. Bain, en expert i parallella beräkningar med snäppa på Bell Labs, Intel och Microsoft, säger ScaleOut ut för att ta itu med problemet med att aktivera web gårdar för att skala av mycket hög arbetsbelastning.

ScaleOut initialt inriktade på distribuerad cache, utvecklas gradvis till i minnet för lagring och beräkna lösningar inom hårdvara kluster. Bain säger att de ville att tillåta att program för att hantera snabbt föränderliga uppgifter, och sedan lägga beräkna till lagring var bara ett logiskt steg:

“Om du har i minne datalagring i klustret, det är väldigt naturligt att lägga beräkna till det. Du kan analysera data som du lagrar på en mycket låg latens och hög scaleability eftersom data inte måste flytta.”

Bain säger i minnet data nät är särskilt väl lämpad för strömmande data bearbetning, på grund av deras förmåga att inte bara äter data snabbt, men också analysera dem på fluga. Men sedan igen, är inte det vad streaming plattformar gör så bra?

“Människor i stream processing inte riktigt prata om Digital Tvillingar. Digital Tvillingar är kärnan i vad vi gör”, säger Bain. Han menar att medan plattformen som Gnista Streaming och Storm har sina styrkor och svagheter, de var inte riktigt som utformats för att ta itu med live-data.

Däremot, fortsätter han, ScaleOut är en data grid utformats från grunden för live-data. För Bain, skillnaden är i modellering och API:

“Ta Gnista Streaming: det är centrerad kring micro-dosering. Om du vill göra något liknande process clickstreams, du skulle ha för att batch data från många källor tillsammans. Du kan göra det, men det är besvärligt. Vår strategi är en mer naturlig plats.”

ScaleOut har ett objektorienterat API som gör det möjligt att modellera flera dataströmmar som är förknippade med samma enhet och inkapsling egenskaper och beteenden relaterade till denna enhet på ett sätt som speglar det.

Ringer en klocka? Ja, det låter som en Digital Dubbel, vilket är exakt varför ScaleOut använder det som sitt viktiga budskap. Bain säger att de har varit modellering deras API på detta sätt sedan 2009, men det var inte förrän nyligen som någon påpekade för dem att denna riktning:

“Vi diskuterade vårt tillvägagångssätt med en kund och han sade, att det är en Digital Tvilling. Vi sa, det är ett bra namn. Vi letade efter ett namn som beskriver denna förmåga, så vi adjungerad det.”

En streaming-plattform mördare?

Gartner tydligen godkänner också, om uppmärksamhet är någon indikation. En viktig analytiker från teamet bakom den nyligen publicerade Hype Cycle för In-Memory Computing-Teknik för 2017 var på ScaleOut presentation i In-memory Computing-Toppmötet EMEA och verkade uppskatta tid med ScaleOut team.

Bain betonar också att ScaleOut gör förtäring och orkestrering vid samma tid, men det är klart skilja de två på grund av inkapsling att objektorientering erbjuder. Plus att det har ett fullt ut, peer-to-peer-design utan ett enda fel. Resultatet, säger han, är super snabb bearbetning och ren design.

Till exempel, när det gäller att slutledning över intas uppgifter, Bain cites använda de fall där regeln-baserad och maskininlärning metoder har använts i samband eller omväxlande och samtidigt vara öppen för utvecklare, återigen på grund av objektorienterad inkapsling.

Allt som är fint och bra naturligtvis, men det viktiga frågor att ställa sig är om man ska bry sig om Digitala Tvillingar och terminologi mer allmänt, och om den gör ScaleOut stå ut.

Slagord har sin plats, men det är vad de betecknar som är viktigt. Oavsett om du kallar det Digital Tvillingar eller av något annat namn, förmågan att få och bearbeta data i realtid och handla utifrån resultatet kommer att bli allt viktigare framöver.

Api: er och arkitektur är viktiga bortom uppskattning av elegant design. Även om det faktiskt modellering Digital Tvillingar bör vara möjligt att använda någon streaming plattform, ett objektorienterat API ur lådan kommer att spara tid och ansträngning.

Nyligen ScaleOut släppt en ny version av sin plattform, där streaming är en första klassens medborgare. Men gör det ScaleOut en Gnista / Flink / Storm killer? Inte nödvändigtvis. Varför? Två ord: öppen källkod.

Över tid, öppen källkod har kommit att betraktas som insatser för middleware. Förutom att kunna förnya sig i en snabbare takt, gemenskapens strategi minskar den upplevda risken för organisationer tvingas göra svåra strategiska beslut om sin mjukvara infrastruktur.

Vi har hört detta om och om igen från beslutsfattare från organisationer överallt. Ta till exempel den senaste historien om Basho, leverantören av den allmänt kända och används Riak databas, går i konkurs. Organisationer som har använt Riak öka för att upprätthålla det (åtminstone tills de hittar ett alternativ), som Riak är öppen källkod.

Bain erkänner detta faktum också. ScaleOut erbjuder sin mjukvara i 2 smaker, att kunna springa i både Microsoft .NET eller Java-miljöer. Även om det är i paritet mellan smaker, och de kan samverka i en mix-and-match kluster samt, Bain konstaterar att:

“De flesta av våra användare är i det .NET world. I Java-världen, människor fokuserar på Apache-projekt och förväntar oss att programvara med öppen källkod. Vi är en av de få i minnet leverantörer som inte är öppen källkod, och som hämmar vår förmåga att penetrera denna marknad.”

ScaleOut är naturligtvis medveten om de konsekvenser, så har vi att anta att de är nöjda med anspråk på en bit av åtgärder i Microsoft världen. Så Gnistor och Stormar i världen kan vara säker på något för tillfället.

TIDIGARE OCH SLÄKT HISTORIER

Oracle steg upp sakernas internet, spel, lägger AI, digital tvilling, och företagets data integration

Oracle är att öka sin IoT-tillämpningar Moln men ser den hemliga såsen, data och automation som finns i sitt AFFÄRSSYSTEM och supply chain system.

GE syftar till att replikera Digital Dubbel framgång med säkerhet fokuserad Digital Ghost

I denna Q&A med GE: s Colin Parris, företaget beskriver hur man vill använda sig av övervakning fysiska förutsättningar som en del av att försvara utrustning från it-angrepp.