Vil data-drevet på et budget

0
140

Nul

big-data-2017-thumb.jpg

Web Foundation er en organisation, som mange mennesker er bekendt med, skyldes i en del for at blive ført af en person, som Sir Tim Berners Lee, der er krediteret med opfindelsen af Internettet, og i anden del af sin centrale rolle i udviklingen af Web.

Selvom Alliancen til Overkommelige Internet (A4AI) er ikke så kendt, at denne koalition af organisationer er ledet af Web-Fonden og dens mission er en supplerende ene: at slå til lyd for politikker for billig adgang til internettet overalt i verden.

A4AI er en data-drevet organisation, indsamle, integrere og analysere data på en global skala, mens du arbejder på et budget. På en måde, det er passende at advokat på vegne af dem med lidt eller ingen adgang til data. Sag i punkt, de seneste resultater fra A4AI viser, at størstedelen af verdens befolkning ikke har adgang til billig internet.

Processen med konkret definition og måling af noget så vagt som overkommelige, og bruge dette som et redskab til at kommunikere og fortaler for forandring på et globalt plan, mens du arbejder med begrænsede ressourcer, er en, der kan have interessante ting at lære. ZDNet drøftet med Dhanaraj Thakur, Senior Research Manager hos A4AI.

Definition af pris og lyver med statistik

Til at begynde med, hvad gør overkommelighed betyder, og hvem får lov at definere den? Som Thakur forklaret, arbejder definition af overkommelige priser, som foreslået af FN, eller mere specifikt, ITU, var, at internettet i et land, der er overkommelig, hvis 500 MB mobildata adgang i en måned koster ikke mere end 5 procent af en persons indtægter.

Det er ikke en meget god definition er dog, for en række årsager. Til at begynde med, som Thakur påpeger, 500 MB er næppe tilstrækkelig — du kan sagtens bruge det hele af med at se en video online. Og så er det 5% – tærsklen er heller ikke en meget god en. Hvorfor?

Fordi så siger Thakur, laver en percentil analyse af indkomst for lande, hvor data er til rådighed afslører noget interessant. Hvis vi tager de 5 procent tærskel over den gennemsnitlige indkomst i et land, kan det virke, som om dette kriterium er opfyldt, således som pr ovenstående definition internet adgang er overkommelig. Men hvad betyder den gennemsnitlige indkomst betyder?

For at give et forsimplet eksempel, hvis et lands befolkning består af 10 personer, 1, som har en indkomst på 1 million, og hver af de resterende har en indkomst på 1, er den gennemsnitlige indkomst i det pågældende land er 100K. Det er på ingen måde repræsentative for indkomstfordelingen i det fiktive land.

Brug af den forkerte målinger i den forkerte kontekst og fortolkning af dem, som fejlagtigt er blevet kaldt lyver med statistik, og den gennemsnitlige indkomst er tydeligvis ikke en god indikator for købekraften for flertallet af en befolkning. Eventuelle data, der er kultiveret person indser, at, og folk i A4AI er ingen undtagelse.

Dette er grunden til, at de forsøgte at komme op med et mere realistisk mål, og endte med at bruge, hvad de kalder 1 til 2: for A4AI, internet adgang i et bestemt land er billige, hvis 1 GB til en værdi af data over en periode på en måned koster ikke mere end 2 procent af den gennemsnitlige nationale indkomst.

Det er ikke en perfekt variabel, men som Thakur siger deres analyse af data viste, at det kommer tættere på. 1 GB er stadig ikke en hel masse data at gå efter, i betragtning af den gennemsnitlige brug i øjeblikket er tættere på 2,5 GB. Og så er der stadig den frygtede “gennemsnitlige” der. Så hvorfor ikke bruge en mere realistisk cap på data, og segmentering kriterier såsom fraktilerne?

Data i og udvikling af verden

Thakur forklarer, at de data, A4AI bruger for indtægter kommer fra verdensbanken (WB), og VERDENSBANKEN offentliggør ikke detaljerede oplysninger om indkomst distribution. Hvorfor dette er tilfældet, er et spørgsmål for WB, men det er bare, hvordan situationen er i øjeblikket.

Som for 1 GB cap, Thakur sagde, at de mente, at dette godt nok til udviklingslandene, hvilket er, hvad A4AI er fokus på. Men hvordan gør A4AI få prisoplysninger for 1 GB data planer rundt omkring i verden, og hvordan er det kombineret med en gennemsnitlig indkomst til at beregne lønsomheden metrisk?

Dataindsamlingen er en del, som Thakur forklarer den største del af denne indsats. Det er på dette punkt en manuel opgave, som består af mange trin. Forskerne har i første omgang at identificere alle data plan udbyder i lande af interesse. Så for hver udbyder, de er nødt til at identificere alle deres data planer, finde dem, der er mindst 1 GB per måned, og vælge den billigste blandt dem som grundlag for beregningen af den metriske.

Igen, dette er ITU ‘ s metode, og langt fra perfekt. For én, er det ikke til regnskab for markedet. Så hvis du for eksempel data plan X er den billigste i land C, men kun brugt af 1 procent af befolkningen, er det stadig danner grundlag for beregningen.

opera-snapshot2017-12-04155600a4ai-org.png

Analyse af Data baseret på fraktilerne, som den vist her, er en måde at overvinde tab af information i variabler som gennemsnit. Men det kræver, at tilgængeligheden af data og mere gennem analyse. Billede: A4AI

Da vi taler om priser data, som er af natur meget volatile, medmindre, at data er opdateret, beregninger vil snart være ude af dato. Selv hvis A4AI formår at holde priser data op til dato, WB data er kun opdateret én gang om året.

For at give et reelt eksempel i verden, lad os overveje, hvad en bagsiden af en konvolut beregning vil vise for Tyskland. Selv om Tyskland, som OS, er ikke opført som et udviklingsland og som ikke overvåges af A4AI, det er anslået, at over 7 millioner mennesker i Tyskland, arbejde i mini-jobs, tjener ikke mere end 450 euro per måned.

De billigste 1 GB data plan i Tyskland på dette tidspunkt koster 10 euro per måned. Den gennemsnitlige indkomst for Tyskland ifølge WB data, der er lidt under 45K euro om året, eller 3.75 K euro per måned, så internet i Tyskland ville blive betragtet som billig baseret på A4AI ‘ s definition. Men den samme beregning for 450 euro / måned lønmodtagere viser, at de billigste 1 GB data, koster mere end 2,2 procent af deres månedlige indkomst.

Data-analyse på et budget

Thakur er meget opmærksomme på de måder, hvorpå A4AI ‘ s analyse er ufuldkommen. Han erkender, at de mangler, men han ser A4AI ‘ s indsats som et første skridt mod fortalervirksomhed for billig adgang til internettet.

Thakur er også pragmatiske hensyn til, hvor meget A4AI kan opnå med sine nuværende ressourcer. A4AI har i alt 35 personer i arbejdsstyrken, og i betragtning af alle de administrative, fortalervirksomhed og uddannelse opgaver, som det er involveret i, der er ikke mere end 5 eller 6 personer venstre for at gøre den faktiske forskning og analyse.

Under hensyntagen til, hvad der kommer op med de resultater, vi har beskrevet her, indebærer, og holde for øje, at disse er blot en lille del af det arbejde, A4AI ikke kan give en idé om de udfordringer, A4AI har til at beskæftige sig med.

A4AI ‘ s målgruppe er primært de politiske beslutningstagere, og dets primære instrument til at udbrede budskabet er billigere Rapport. Denne rapport har politiske indikatorer, der stammer fra A4AI ‘ s undersøgelser og analyser, og udbudssiden indikatorer, som er baseret på data fra kilder, som WB, ITU, og GSMA.

At indsamle og vurdere disse data kræver masser af manuelt arbejde, og dette er kun begyndelsen af analysen. Alle de målinger, der A4AI bruger er tilgængelige via en self-service data portal, men ifølge Thakur de fleste politikere er primært interesseret i rapporter og henstillinger fokuseret på deres eget land.

advantages-of-infrastructure-sharing.png

En af de anbefalede politikker for internet overkommelige priser, fælles infrastruktur, kunne også give mening for Ngo ‘ er der arbejder med beslægtede emner. Billede: A4AI

Disse rapporter er i øjeblikket indsamlet manuelt så godt, så A4AI er at undersøge mulighederne for at automatisere denne data-drevet storytelling i det mindste til en vis grad. Der er andre dele af A4AI arbejde, der kan også være elektronisk, for det meste i form af indsamling af data. Thakur nævner også, at erstatte dyre offline undersøgelser med online dem.

Den største hindring for at A4AI ‘ s arbejde i henhold til Thakur er manglen på offentligt tilgængelige data af høj kvalitet. Thakur understreger, at producere sådanne data er en vigtig del af A4AI ‘ s mission, især i betragtning af den kendsgerning, at en stor del af finansieringen kommer fra offentlige kilder.

I den ende, mange af de udfordringer, som initiativer, der arbejder på samme områder som Mozilla, Internet-Sundhed Rapport, eller den Globale Open Data Initiativ er overlappende. Nogle af de udfordringer, der er tekniske, andre har at gøre med ressourcer og prioriteringer. Et overordnet initiativ, der kan have noget at tilbyde i form af tekniske løsninger, stadig en ændring i prioriteter og finansiering fordeling vil være afgørende for at komme videre med denne form for arbejde.

Relaterede Emner:

Data Management

Digital Transformation

Robotteknologi

Tingenes Internet

Innovation

Virksomhedens Software

0