Microsoft skaber den første automatiserede DNA-lagring hentning system
Microsoft mener, syntetisk DNA kan blive den næste store spring i langsigtet lagring af data.
Læs mere: https://zd.net/2Jv8oHT
Arkitekter kan, og gøre, at vælge en primær cloud-udbyderen og/eller Hadoop system til at huse deres data. Bevægelse, transformation, katalogisering, og om data er en anden historie, så arkitekter kom til mig efter at smide deres våben søge løsninger, der kan tæmme de oplysninger, stof, tænker, at de skal mangle noget: “Er der ikke en enkelt platform?” spørger de.
Desværre, nej. Der er kun best-of-breed-værktøjer eller data management platforme i overgang.
Der er historien bag dette. Data management middleware virksomheder tendens til at være relativt lille. Information management leverandører som IBM, Oracle og SAP pick ud mindre data management leverandører og tilføje deres tilbud som løsninger på deres samlede platform portefølje til at sælge som katalysatorer for deres big data og cloud-systemer. Små leverandører ikke har midler til forebyggende opbygge kapaciteter som markeder skift i retning af nye arkitekturer, som big data og cloud. Store leverandører løse de 80% – reglen i firmaer, der kører deres virksomheder på traditionelle pålidelig teknologi. Således, data management og styring har haltet bag big data og cloud tendenser. I sidste ende, begge leverandører har haft en vent-og-se-strategi, opbygning af kapacitet og rearchitecting løsninger kun, når kunderne begyndte at vise en højere grad af interesse (det er i RFI/RFP).
Vores Forrester Wave evalueringer dokumentere denne historie. Som Forrester så, at 50% af de virksomheder, der var ved at bygge Hadoop data søer i 2011 og analytics/BI var på vej til sky kort efter, data management leverandører i vores Bølgerne var kun lige begyndt at finde ud af, hvordan det er at arbejde i disse miljøer og køre lokalt i 2015. Selv i dag, mange af disse leverandører tilbyder stadig en on-premises værktøj og en anden sky værktøj. Nyere kan kun køre i skyen.
Venture-kapitalister og private equity-selskaber sprang i fonden, big data nystartede tidligt. Men kun få nystartede virksomheder opstod, da der allerede var en hel markedsplads for open source-værktøjer til indtagelse, rørledninger, sikkerheds -, og metadata. Hvor var penge i det? Således er markedet flyttet til mere sexet value proposition af machine learning, og investorernes penge, der blev fulgt på. Hvorfor bekymre sig om data, når du kan have indsigt?
Nå, virksomheder bekymrer sig om data. De altid har gjort og altid gøre. Det er det største område af tekniske og talent gæld i en organisation. Svigt af big data søer og boder i skaleres-out system for områder som IoT og AI stammer alle fra tilbagestående data fonde. Det er en vogn-før-den-hest-scenariet.
“Great!” siger du. “Nice historie lektion. Så hvad gør vi?”
Genkende nye værktøjer til, hvad de er. Ignorere platformen og løsning etiketter, der anvendes til produkt-navne og tilbud. Hvad er til rådighed, er løst konsoliderede funktionalitet for specifikke data use cases. Potentiale for komplette løsninger, er der i kommercielle produkter. Brugergrænseflader og erfaringer er bedre end open source. Mere kommunikation og samarbejde funktionalitet eksisterer. Leverandører ved, at compliance og sikkerhed støtte indsatser for enhver virksomhed. Og hvis der ikke er stik til førende cloud og Hadoop platforme, eller førende BI-og business-applikationer, det er en deal breaker. Baseline strategi for at erhverve disse værktøjer kommer ned til kende dine bruger-og deres processer, åbenhed af metadata depoter, og abonnement modeller. I sidste ende, er du nødt til at løse for i dag, og giv dig selv plads til vækst (find ud af, hvad min kollega Noel Yuhanna netop offentliggjort på fremtidssikring). Du vil refactor din platform hellere før end senere.
Nu, her er hvad du behøver at vide for de primære data management værktøjer:
Metadata management. Du får brug for to eller tre kataloger: et for fysisk og logisk metadata management, at data ingeniører har brug for til at bygge og styre systemer; én til data forvaltere til at håndtere logiske metadata, semantik, og de data, politikker, og muligvis en tredje data katalog, som understøtter søgning og forbrug muligheder for BI analytikere og data forskere til at bruge data, hvis data governance katalog for data forvaltere ikke gøre arbejdet. Ja, Collibra, EDQ, og Informatica, der er fælles badeværelse. Alation med Navigator eller Atlas i Hadoop økosystem er ikke usædvanligt, at data søer, enten.Master data management. Der er normalt den traditionelle relationelle-baserede MDM værktøj, der kører for at støtte komplekse afbildninger af data mellem systemer. Den lever på kernen i databaser og integration. Så skal du finde graf-baserede MDM til at håndtere komplekse udsigt til kunder og produkter, der sidder tættere på BI og business anvendelse systemer, når de logiske modeller, der har brug for mere forberedelse og konvertering til semantiske eller forretningsmodeller. Så er der DIY MDM lever inde data virtualisering og Kafka, der informerer de data, model og kortlægning for BI synspunkter, microservices, og ESBs.Data integration. Det er her, det sjove begynder, når ETL, data virtualisering, en data bus, streaming, replikering, indtagelse værktøjer, og de data, udarbejdelse alle lever uafhængigt af hinanden eller i en integreret pipeline. Arbejdsbyrden mønstre definere, hvilke data integration værktøjer, der er brugt, og hvor i data flow eller økosystemet (cloud/on-premises) de er nødvendige. Dine data arkitektur tager på reference mønstre, der er afstemt efter transaktioner, forretningsprocesser, automatisering, analytics, og analytics (OLAP) og drift (OLTP) arbejdsmængder. Din reference arkitektur er designet først for at data flyder, ikke data kilder, som traditionelt har gjort.Data profilering og afstamning. Standalone eller integreret — tage din pick. Men det centrale er, at hvis profilering og slægt analyse er indlejret, chancer er det orienteret mod den fundamentale løsning. Repositories profil for metadata og data source fange. Data governance værktøjer profil til logisk og business metadata og kilde slægt. Data kataloger profil for fysisk og logisk metadata, data relationer, og kilde slægt. Nogle vil måske profil data flow metadata. Enkeltstående værktøjer tendens til at fokusere på metadata, model, slægt og data flow-analyse for kerneårsagsanalyse. Vær opmærksom på, der vil bruge værktøjet, hvad de har brug for at vide, og at profilering og slægt analyse er obligatorisk for alle data ansvar for at forstå data.
For mere fra Forrester på nye teknologier, klik her.
Af Michele Goetz, Ledende Analytiker
Dette indlæg blev oprindeligt bragt her.
Big Data
AI og big data vs etik: Hvordan sørg for, at din artificial intelligence-projekt er på vej den rigtige vej
Ønsker at være en data videnskabsmand? Fem måder at få det job i data videnskab
Data videnskab, etik, og den “massive scumbags’ problem
Sikkerhed i data: Gennemførelse af data-drevet trafiksikkerhed
Californien ønsker Silicon Valley til at betale dig en data udbytte (CNET)
4 trin til at brugeren buy-in for big data (TechRepublic)
Relaterede Emner:
Big Data Analytics
Innovation
CXO
Kunstig Intelligens
Virksomhedens Software
Opbevaring