Selv om skyen har vært flott for data og analyse – gitt sin ubegrensede lagring og beregningskapasitet – har den også forårsaket en reell tilbakegang i produktiviteten for dataprofesjonelle. Grunnen til dette er ganske enkelt at de store nettleverandørene har kastet mange dataplattformer mot markedet og overlatt til kundene å velge den riktige kombinasjonen av tjenester og deretter integrere dem. Si hva du vil om den gamle vaktbedriftens programvare, men de sparte kundene sine mye av den “monteringskrevde” opplevelsen som skyhyskalerne pålegger i dag.
Kanskje er det derfor passende at Gerrit Kazmaier, til nylig den data- og analysefokuserte konserndirektøren i SAP, er Google Clouds nylig pregede visepresident & amp; Daglig leder, Databaser, Analytics & amp; Looker. SAP er et bedriftsprogramvareselskap hvis det noen gang var det. Og om det er et årsaksfenomen i spill, eller om det bare er tilfeldigvis apropos, Kazmaier orienterte ZDNet om en rekke nye muligheter, som ble annonsert i dag på Googles Cloud Next '21 digitale arrangement, som bringer “nøkkelferdig” operasjon i programvare til Google Clouds dataplattform.
På toppunktet for AI og analyse
Den første store avsløringen fra Google Cloud er et nytt tilbud innen Vertex AI -tjenesten kalt Vertex AI Workbench. Workbench er egentlig en administrert notebook -opplevelse som fungerer som et IDE (integrert utviklingsmiljø) for maskinlæring og AI -arbeid. Det binder sammen Vertex AIs kjernekomponenter (som opplærings- og prediksjonstjenester) sammen med viktige komponenter i dataplattformen som BigQuery, Dataproc og Dataplex.
Dette er selve typen integrasjon som stort sett har manglet fra skyanalysemiljøer og å sette alt sammen hjelper datavitenskapsmenn, maskinlæringsingeniører og dataingeniører til å unngå å måtte bytte gir og miste tankegangen ved å hoppe fra tjeneste til tjeneste. Å ha flere tjenesters brukergrensesnitt åpent i forskjellige nettleserfaner er ikke integrasjon; å gjøre en rekke tjenester tilgjengelige i sammenheng med en annen, komplementær tjeneste.
Omni, present
En annen av Google Clouds store kunngjøringer i dag er den generelle tilgjengeligheten (GA) for BigQuery Omni, som lar BigQuery -brukere få tilgang til data de har i Amazon Web Services (AWS) eller Microsoft Azure. Dette oppnås ved å kjøre forekomster av BigQuery i de konkurrerende skyene, utføre forespørslene der og sende resultatene tilbake til hjemmebasen til Google Cloud. Jeg skrev detaljert om Omni da den ble lansert i forhåndsvisning i juli 2020.
Les også: Google BigQuery Omni kobler kunder til data i AWS og Azure
Kazmaier fortalte ZDNet at kunder som Wayfair, Electronic Arts og Johnson & amp; Johnson har brukt BigQuery Omni til stor fordel. Det er klart, form denne og andre kunngjøringer, at BigQuery er sentralt i Googles “data cloud” -strategi. Å gi BigQuery tilgang til data lagret i andre skyer er et must for Google, og GA for Omni er en viktig milepæl.
Les også:
Innhenting av Google BigQuery
Google tar BigQuery til nye geografier, bringer geospatiale muligheter til beta
Googles BigQuery blir offentlig
Opp med Spark, ned med servere
Den neste kunngjøringen er en som er veldig gratis for de andre: en autoskaling, serverløs implementering av Apache Spark, kalt Spark på Google Cloud, tilgjengelig som en forhåndstjeneste. Spark har blitt et allestedsnærværende varemiljø i hele bransjen for all slags analyse, datateknikk og maskinlæring. Ja, skyleverandører har bygd serverløse Spark -tjenester for seg selv; for eksempel datastrømmer på Azure Data Factory utfører på Spark -klynger som kundene aldri trenger å skaffe seg selv, og kode generert av Amazon Glue gjør det samme. Men bruk av Spark til å utføre et bestemt trinn i de fleste data- og AI -rørledninger har krevd eksplisitt levering av en Spark -klynge, og håndtere latensen som kreves for at klyngen skal spinne opp.
Les også: Azure Data Factory v2: Praktisk oversikt
Med serverless Spark på Google Cloud, omtrent som med BigQuery selv, sender kundene ganske enkelt arbeidsmengden for utførelse, og Google Cloud tar seg av resten, utfører jobbene og plager ikke kunden med å måtte størrelse, eller til og med tenke på, en diskret Gnistklynge. Tjenesten vil bli integrert i – du gjettet det – BigQuery, Dataproc, Dataplex og Vertex AI slik at brukere av disse tjenestene kan dra nytte av Spark uten å ha byrden av infrastrukturutvikling og administrasjon.
Of Cloud (Spanner ) og (Google) Earth
Neste opp: Google har implementert et PostgreSQL -grensesnitt på toppen av Cloud Spanner, den geografisk distribuerte relasjonelle databasetjenesten. Selv om det ikke er en implementering av Postgres selv (noe som er tilgjengelig på Cloud SQL), tillater dette tilbudet kode som bruker Postgres 'SQL dialekt og wire -protokoll til å fungere på Spanner. Sammenlign dette tilbudet med Postgres -grensesnittet på AWS 'Aurora -databasetjeneste eller Azure Database for PostgreSQL Hyperscale. I begge disse tilfellene, som med Spanner Postgres-grensesnittet, er skybasert, horisontalt skalert databaser tilgjengelig for de med Postgres-ferdigheter. Spanner Postgres -tilbudet er tilgjengelig i forhåndsvisning.
Les også:
Googles Cloud Spanner: hvordan stabler det seg?
Google avslører Spanner, databaseteknologien som kan omfatte planeten
Og her er litt mer integrasjon: 50+ petabyte med Google Earth -data tilgjengelig for brukere av BigQuery, Google Clouds ML -teknologier og Google Maps. Tjenesten, kalt Google Earth Engine, lanseres i forhåndsvisning
Se her
Hvis du har glemt det, eier Google Cloud Looker nå. Pokker, Looker -navnet er til og med i Kazmaiers tittel. Og selv om, ja, Looker er en BI-front-end i seg selv, ser det ut til at Google ser like mye verdi i LookML-modelleringsspråket, som Looker kan definere semantiske modeller som gjør data lettere analysert av BI-brukere. For dette formål vil Googles Connected Sheets -teknologi, som lar brukere av Google Sheets søke etter data i BigQuery, bli kompatibel med LookML, noe Google Cloud sier at den vil slippe i forhåndsvisning ved utgangen av dette året.
Les også:
Google kjøper Looker for 2,6 milliarder dollar, har som mål å utvide analyseavstanden, støtte flere skyer Looker 7, den første store utgivelsen i selskapets Google-æra, kunngjorde
Looker får Googles integrasjonsmuligheter i utgivelsen etter oppkjøpet
Utover Connected Sheets kunngjør imidlertid Google et partnerskap med Salesforces Tableau som snart vil tilby den svært populære business intelligence -plattformen med tilgang til Looker semantiske modeller, også via LookML. Mens andre bransjeaktører som Databricks, Informatica, Trifacta, Fivetran og Collibra også vil være søkelyspartnere på Cloud Next, er dette partnerskapet med Tableau enestående og veldig interessant. Det viser at Google Cloud vet at det ikke kan være en dominerende leverandør av dataskyer uten å be om hjelp fra partnere fra hele analyseverdenen. Det viser også igjen at Google forfulgte Looker-oppkjøpet like mye for Lookers backend-datamodelleringsfunksjoner som for front-end datavisualisering og dashbordfunksjoner.
Les også: Salesforce-Tableau, andre BI-avtaler flyter; opptellingen er nå fem på rad
Å koble ting sammen?
Bemanne den relative mangelen på integrering av skytjenester som har eksistert fram til nå er ikke noe problem. For kundene å gjøre integrasjonen og hacke seg gjennom all kompleksiteten er massevis av arbeid, og det medfører massevis av risiko og utgifter sammen med det. Microsoft har adressert integrasjonsvakuumet med Azure Synapse Analytics, og man kan hevde at AWS har prøvd å gjøre det med Lake Formation -tilbudet.
Les også: Azure Synapse Analytics kombinerer datavarehus, innsjø og rørledninger
Med dagens kunngjøringer fra Google Cloud anerkjenner alle de tre store skyleverandørene kritikken ved å integrere tjenestene sine. Det er bra, men alle tre har også en lang vei å gå før data- og analysetilbudene er enkle å bruke, fullt rasjonaliserte og sømløst integrerte. Etter hvert vil imidlertid hyperskalerne med legitimitet kunne si at skyen er den nye foretaksbunken.
Google Cloud
Google Cloud, General Mills utvider skyen, analysepartnerskap Google lanserer serverless Spark, AI arbeidsbenk, nye datatilbud Google lager verktøy for å spore karbonavtrykk, utslippsdata Også: Arbeidsområdeoppdateringer, Jira integrering, kryptering og filklassifiseringsfunksjoner Google Cloud går sammen med Cybereason for XDR -plattformen Google Cloud lanserer nye lagringsprodukter for bedre databeskyttelse
Relaterte emner:
Cloud Digital Transformation Robotics Internet of Things Innovation Enterprise Software