Big Data 2018: Cloud-opslag wordt de feitelijke gegevens meer

0
175

Nul

big-data-pix.jpg

Als we bbt-opruiming met onze 2018 voorspellingen voor big data, we ‘ re going to pick-up waar de Grote op Gegevens bros Andrew Brust en George Anadiotis gebleven.

Ja, het wordt steeds moeilijker en moeilijker om te verblijven zich niet bewust van de impact van AI, met implicaties van de geopolitieke aan het alledaagse en het positief griezelig. Het is steeds moeilijker te missen van de groeiende invloed van de IoT op van alles, van ons huis naar de manier waarop ziekenhuizen leveren zorg, autonome auto ‘ s zijn gedreven, fabrieken worden uitgevoerd, en smart cities worden beheerd. En de komst van de GDPR, die zal beginnen met die van kracht worden in 2018, is het forceren van het probleem voor organisaties die de privacy en de nationale soevereiniteit gevolgen voor de data zit in alles, van tractie databases om gegevens meren en opslag in de cloud.

Maar onder de oppervlakte, we zien het begin van tektonische verschuivingen in hoe bedrijven het beheer van hun cloud-streaming analytics en data meer strategieën.

ovum-cloud-ictei-2018-chart.png

27,5% van big data workloads in de cloud (Bron: Ovum ICT Enterprise Inzichten)

Multi-cloud verplaatst naar de voorste brander

Voor onze blik vooruit richten we ons op hoe de gegevens worden beheerd. Terugspoelen van de tape een jaar geleden en we vermeld dat “in toenemende mate, Big Data, of van de IoT of meer traditionele bronnen, is gaan wonen en worden verwerkt in de cloud.” Vorig jaar, we voorspellen dat de 35 – 40% van de nieuwe big data-workloads zou worden ingezet in de cloud, en dat eind van het jaar 2018, nieuwe implementaties voorbij gaan aan de drempel van 50%. Onze voorspellingen waren niet ver naast; Ovum ‘ s nieuwste wereldwijde enquête voor alle big data werkbelasting blijkt dat 27,5% van hen zijn reeds geïmplementeerd in de cloud. En volgens Ovum research, big data is nauwelijks een uitschieter voor enterprise cloud, die varieert van 26 – 30% over verschillende workloads.

Door de traagheid, de meeste organisaties hebben afgesloten met de polyglot-omgevingen in de cloud die kenmerkend zijn voor hun datacenters. De meeste organisaties maken gebruik van meer dan één cloud-provider, net als op het terrein waar ze hebben vaak een van alles wat. Zoals de geschiedenis herhaalt zich, dit is het gevolg van een combinatie van top-down beleid verplicht een corporate standard, en de departementale beslissingen voor opportunisme. Zo, net als uw organisatie zou kunnen hebben van SAP om haar rekeningen te betalen, de verschillende segmenten zou kunnen hebben Werkdag voor HR of Salesforce CRM. Of misschien hebben ze meerdere ERP-systemen die nog niet is geconvergeerd als de erfenis van M&A. In de cloud, uw zakelijke e-mail-systeem kan op Office 365, terwijl HET departementale groepen gebruik maken van AWS voor DevTest, en corporate marketing maakt gebruik van Google Analytics.

In 2018 hopen we dat de vroege meerderheid om te beginnen met het formaliseren van multi-cloud-strategieën als cloud evolueert van een doel voor het uitvoeren van zelfstandige workloads naar enterprise-kritische toepassingen. Dus, zoals we zagen cloud-implementatie als de slaper probleem voor big data in 2017, multi-cloud zal het dreigende probleem voor 2018. Dat is de achtergrond waarom Oracle verdubbeld prijzen voor het uitvoeren van de database op Amazon RDS-service en de reden waarom de Aurora OLTP database is nu Amazon ‘ s snelst groeiende service (slagen Roodverschuiving voor).

Meer dan een reactieve beslissing over de angsten van cloud vendor lock-in, multi-cloud beslissingen worden over het platform keuzes. Wanneer u besluit tot het uitvoeren van een Oracle-database of een Hadoop-cluster op EC2, dat is een tactische keuze die herzien moeten Azure of Google Cloud veranderen hun prijzen. Wanneer u kiest voor Aurora, de Kosmos DB, Google BigQuery, Oracle Autonome database 18c, of de IBM Analytics-systeem op de IBM cloud, je bent niet alleen het kiezen van uw cloud, maar uw data platform. U kiest of de meerwaarde van het uitvoeren van een data-platform dat is eigen aan een specifieke cloud opweegt tegen de zorgen over het vertrouwen op een specifieke cloud-provider. Het is als het maken van uw Oracle of SQL Server platform besluit helemaal opnieuw.

En dat is de reden waarom Amazon en Microsoft, bieden database migratie diensten bijna als freebies. Ze willen uw enterprise database. We verwachten ook Google Cloud, Oracle en IBM zullen het actief promoten van verlies leider database migratie-aanbod in het komende jaar, en de reden waarom steeds meer ondernemingen zal verheffen tot de voorste brander, de kwestie van hoeveel eieren te leggen in elke cloud mand.

Multi-cloud-strategieën zullen ook figuur zwaar in organisaties bepalen hoe u de werkelijkheid van de hybride cloud. Net als enkele organisaties van elke omvang zijn waarschijnlijk te vertrouwen op een enkele cloud provider, enkele organisaties (met uitzondering van starters) waarschijnlijk gaan 100% cloud. De transparantie van het handhaven van gevoelige gegevens van klanten op locatie door ontwerp of omdat gegevens soevereiniteit problemen tijdens het uitvoeren van analyses in de cloud zal worden belangrijke factoren in het cloud-platform van selectie.

Gegevens pijpleidingen verschuiving van het zwaartepunt voor real-time verwerking

Vorig jaar hebben we voorspeld dat “IoT is de use case die duwen real time streaming op de voorste brander.” Dit jaar, George Anadiotis weersverwachting, niet alleen die streaming wordt steeds meer mainstream, maar ook [zijnde] geanalyseerd op de vlieg.”

Streaming analytics is nauwelijks nieuw; we hebben gewijd veel inkt op zijn wedergeboorte. Streaming kan worden gebruikt voor het parseren en filteren van gegevens en voor het opsporen van patronen en / of evenementen, voordat de data wordt bewaard. De explosieve groei van de IoT gegevens leidt tot de vraag, niet alleen van de vraag of voor het opslaan van al die gegevens, maar ook om het te verwerken.

Als onze honger krijgen whetted, willen we meer doen met de gegevens terwijl deze in beweging is. Dat verklaart niet alleen de opkomst van Kafka voor in de rij en distribueren van de data, maar ook waarom data-platform-aanbieders, zoals SAP, Hortonworks, MapR, en Teradata krijgen in het handelen, en niet te vergeten de cloud-diensten zoals Amazon Kinesis, Azure Data Factory, en Google Cloud Dataflow. Gegevens pijpleidingen kunt u uitbreiden real-time verwerking van basic filtering en transformatie tot georganiseerde processen die kunnen ondersteunen geavanceerde, predictive analytics en machine learning. We verwachten dat in 2018, gegevens pijpleidingen zal worden belangrijke pijlers voor streaming analytics, en we horen veel meer van leveranciers als IBM en Oracle in deze ruimte.

Opslag in de Cloud wordt de feitelijke gegevens meer

Want het is speciaal ontworpen voor het vasthouden van gegevens die niet gemakkelijk elders, en veel van, als je dacht dat de gegevens meer, u waarschijnlijk dacht dat Hadoop. We hebben gedefinieerd gegevens meren zoals geregeld repositories van de standaard geworden binnenkrijgt punten voor de gegevens. Maar we zien dat de gegevens meer implementaties overstijgen van Hadoop. Of zoals Mike Olson profetisch gezegd terug in 2014, Hadoop zou verdwijnen.

Het begon met de federatieve query tools die selectievakje items voor vrijwel elke analyse database. We hebben gezien JSON databases verlengd voor een analyse van query ‘ s via Vonk. We hebben ook gezien Hadoop-dienstverleners (bijv., Cloudera en Hortonworks) ontkoppelen van hun data governance diensten van HDFS. Dus de gegevens meer is waar je gegevens opslaan.

Niet verrassend, de cloud providers zijn die het laatste woord: in de cloud, cloud-opslag is uitgegroeid tot de standaard binnenkrijgt punt voor de gegevens. En dus cloud providers maken van hun cloud-object slaat direct queryable. Amazon heeft gemaakt S3 direct toegankelijk voor SQL ad hoc query met Athena, en als een uitbreiding van het magazijn met Roodverschuiving Spectrum. Google Cloud heeft lang haar opslag in de cloud is de standaard bron voor BigQuery, terwijl Sneeuwvlok, een derde-partij-cloud data warehouse, heeft hetzelfde gedaan.

Er is meer dan een beetje ironisch. Opslag in de Cloud is oorspronkelijk ontworpen alleen voor de opslag. Maar in een wereld waar de cloud object storage is verantwoordelijk voor het merendeel van de gegevens door het volume, de ondernemingen gaat om de vraag geoptimaliseerd toegang. In 2018, verwachten we dat vrijwel alle data warehouses en analytische databases toevoegen populaire cloud-object winkels als de S3, Azure BLOB Storage en Google Cloud Storage-ondersteunde doelen.

Verwante Onderwerpen:

Cloud

Digitale Transformatie

Robotica

Het Internet van Dingen

Innovatie

Enterprise Software

0