“Det er en falsk antagelse, at du skal vælge mellem en [datasø] og [datavarehus],” sagde Grab analytics førende dataforsker Zulfikar Lazuardi.
Taler som en del af den virtuelle 2021 Databricks Data og AI. World Tour APAC-begivenhed, sagde Lazuardi, sagde, at den Singapore-baserede teknologigigant Grab mener, at den har afsløret det søde punkt mellem en datasø og datavarehus ved at bygge en centraliseret dataplatform.
Platformen, der kaldes Grabs ene centrale data, eller kort sagt OCD, blev bygget på Databricks' Delta Lake og designet til at samle fleksibiliteten og pålideligheden af en datasø og BI-kapaciteterne i et datavarehus.
Løsningen blev introduceret, efter at virksomheden oprindeligt begyndte at operere med en datasø, men stødte på vanskeligheder omkring standardisering og BI use-cases. Det besluttede derefter at introducere et datavarehus som en plasterløsning på de problemer, der opstod, men dette resulterede kun i oprettelse af datasiloer, hvilket gjorde det sværere at betjene sine 25 millioner månedlige transaktionsbrugere og over ni millioner registrerede partnere.
“Den ene centrale data … er bygget til at have alle mulighederne for datasø og datavarehus. Ved at bruge én central data, kan vi fuldt ud understøtte alle use cases til analyser, til datavidenskab og endda til BI,” sagde Lazuardi.
“For data science-personaen kan vi bygge modellerne med det fulde udbytte af Spark og Delta Engine, og for BI-personaen kan den have samme kendskab og ydeevne som data warehouse.”
OCD består af to hovedkomponenter: OCD central og OCD fødereret. Lazuardi sagde, at OCD-centralen er designet til at “fungere som en enkelt kilde til sandhed for flere personer”, mens OCD-fødereret er designet til at give mere end 50 datateams i virksomheden en “datamarkedsplads” til at producere datasæt.
Samtidig skitserede Lazuardi, at OCD har hjulpet datateamet med at fremskynde udtrækning, transformation og indlæsning af processer, samtidig med at man har fjernet alt manuelt arbejde forbundet med integrerede datasæt.
Nogle mere specifikke use cases, som OCD har understøttet, omfatter forudsigelse af kundelevetidsværdi, assistering af marketingteams med evaluering og forbedring af kundeinteraktioner gennem personlig markedsføring.
Derudover har Grab siden implementeret en sandbox-løsning for at give datateams frihed og fleksibilitet til at producere maskinlæringsmodeller uden at gå på kompromis med den centrale dataplatform.
“Vi har omkring 50 plus sandkasser,” sagde Lazuardi.
Tirsdag var Grab-appen nede i timevis. En Grab-talsmand fortalte ZDNet, at årsagen bag afbrydelsen skyldtes “et problem med en planlagt opgradering til et af vores systemer, som fik nogle tjenester til at blive forringet”.
“Vores kernetjenester har været oppe og køre siden sent [tirsdag] morgen, og vores brugere og partnere har været i stand til at bruge Grab-tjenester som normalt,” tilføjede talsmanden.
Intermitterende problemer fortsatte dog med at påvirke nogle brugere onsdag.
“Et lille segment kan stadig opleve mindre problemer, mens vi arbejder på at færdiggøre opgraderingen,” sagde Grab-talsmanden.
“Vi beklager ulejligheden, og vi kommunikerer med vores partnere, der er blevet berørt, for at sikre fuld støtte til dem.”
Mere fra Grab
Grab forbedrer nettoomsætningen i 1. kvartal med 39 % foran USA. IPOGrab ser ud til at føre til adoption af elektriske køretøjer med Hyundai MotorGrab indstillet til amerikansk børsnotering i en fusionsaftale på 39 mia. USD
Grab samarbejder med den indonesiske regering om at åbne COVID drive-through-vaccinationscenter Big Data Analytics | Innovation | CXO | Kunstig intelligens | Enterprise Software | Opbevaring