Gå till data-driven på en budget

0
107

Noll

big-data-2017-thumb.jpg

Web Foundation är en organisation som många människor är bekanta med, beror till viss del på att ledas av någon som Sir Tim Berners Lee, som är krediteras med uppfinningen av Webben, och i andra en del av dess centrala roll i utvecklingen av Webben.

Även om Alliansen för Prisvärda Internet (A4AI) är inte så väl känt, att denna koalition av organisationer som leds av Web Foundation och dess uppdrag är en kompletterande ett: att verka för en politik för överkomlig tillgång till internet överallt i världen.

A4AI är en data driven organisation, samla in, integrera och analysera data på en global skala medan du arbetar på en budget. På ett sätt, detta är passande att verka för dem med liten eller ingen tillgång till data. Typexempel, de senaste resultaten från A4AI visar att majoriteten av världens befolkning inte har tillgång till prisvärda internet.

Processen för att konkret definiera och mäta något så vagt som det överkomliga priset och att använda detta som ett instrument för att kommunicera och förespråka förändring på en global skala, medan du arbetar med begränsade resurser, är en som kan ha intressanta saker att lära. ZDNet diskuteras med Dhanaraj Thakur, Senior Research Manager på A4AI.

Definiera överkomliga priser och ljuga med statistik

Till att börja med, vad betyder överkomliga priser betyder och vem som får definiera det? Som Thakur förklarade, att arbeta definition av överkomliga priser, som föreslagits av FN, eller mer specifikt, ITU, var att internet i ett land som är prisvärda om 500 MB mobil tillgång till data för en månad kostar inte mer än 5 procent av en persons inkomst.

Det är inte en bra definition men för ett antal skäl. Till att börja med, som Thakur påpekar, 500 MB är knappast tillräckligt-du kan lätt spendera det hela genom att titta på en video online. Och sedan, den 5 procent tröskeln är inte heller en mycket bra heller. Varför?

Eftersom Thakur säger, gör en percentil analys på resultatet för de länder där data finns tillgängliga avslöjar något intressant. Om vi tar det 5 procent tröskel över genomsnittlig inkomst i ett land, om det kan verka som att detta kriterium är uppfyllt, därför enligt ovanstående definition internet är överkomligt. Men vad gör genomsnittlig inkomst innebär?

För att ge ett förenklat exempel, om ett lands befolkning består av 10 personer, varav 1 har en inkomst på 1 miljon kronor och var och en av de återstående har en inkomst på 1, den genomsnittliga inkomsten i landet är 100K. Det är inte på något sätt representativa för inkomstfördelningen i det fiktiva landet.

Med fel mått i fel sammanhang och tolka dem på ett felaktigt har kallats att ljuga med statistik, och den genomsnittliga inkomst är helt klart inte en bra indikator på att köpa makt för majoriteten av befolkningen. Alla data läskunnig person inser att, och människor i A4AI är inget undantag.

Det är därför de försökte att komma upp med ett mer realistiskt mått, och slutade upp med vad de kallar för 1 och 2: för A4AI, tillgång till internet i ett visst land är överkomligt om 1 GB värde av data under en period av en månad kostar inte mer än 2 procent av den genomsnittliga nationella inkomst.

Det är inte ett perfekt mått, utan som Thakur säger att deras analys av data visade det kommer närmare. 1 GB är fortfarande inte en hel del data att gå efter, med tanke på den genomsnittliga används för närvarande är närmare 2,5 GB. Och då är det fortfarande den fruktade “genomsnittlig”. Så varför inte använda en mer realistisk locket på data, och segmentering av sådana kriterier som percentiler?

Data i utvecklingsländerna

Thakur förklarar att de uppgifter som A4AI använder för att få inkomst kommer från världsbanken (WB), och WB inte offentliggöra detaljerade uppgifter om inkomstfördelningen. Varför så är fallet är en fråga för WB, men det är bara hur situationen är just nu.

För 1 GB cap, Thakur sade att de ansåg att detta är tillräckligt bra för utvecklingsländer, vilket är vad A4AI fokus är på. Men hur gör A4AI få prisuppgifter för 1 GB data planer runt om i världen, och hur är det i kombination med en genomsnittlig inkomst för att beräkna om det är rimligt mått?

Datainsamlingen är, som Thakur förklarar den största delen av detta arbete. Det är på denna punkt en manuell uppgift som består av många steg. Forskarna måste först identifiera alla uppgifter plan leverantör i de länder som är av intresse. Sedan för varje leverantör som de har för att identifiera alla sina data planer, hitta de som är minst 1 GB per månad, och välja den billigaste bland dem som grund för att beräkna ett värde.

Återigen, detta är ITU: s metod, och långt ifrån perfekt. För en, kan det inte till svars för sin marknadsandel. Så om du till exempel data planen X är den billigaste i land C, men används endast av 1 procent av befolkningen, utgör den fortfarande grunden för beräkningen.

opera-snapshot2017-12-04155600a4ai-org.png

Analys av Data baserade på percentiler, såsom den som visas här, är ett sätt att övervinna förlust av information i statistik som genomsnittlig. Men detta kräver tillgång till uppgifter och mer genom analys. Bild: A4AI

Eftersom vi talar om prissättning av data, som är av naturen mycket volatila, om att informationen är uppdaterad, beräkningar kommer snart bli inaktuell. Även om A4AI klarar av att hålla prissättning uppgifter uppdaterade, WB data är endast uppdateras en gång per år.

För att ge ett exempel från verkliga livet, låt oss fundera över vad ett baksidan av ett kuvert beräkning skulle visa för Tyskland. Även om Tyskland, som till exempel USA, är inte listad som ett u-land och är inte övervakas av A4AI, det uppskattas att över 7 miljoner människor i Tyskland arbete i mini-jobb, tjänar mer än 450 euro per månad.

Den billigaste 1 GB data-planen i Tyskland vid denna tid kostar 10 euro per månad. Den genomsnittliga inkomsten för Tyskland enligt WB data är lite under 45K euro per år, eller 3,75 K euro per månad, så internet i Tyskland skulle anses vara rimliga, baserat på A4AI: s definition. Men samma beräkning för 450 euro / månad arbetstagaren visar att den billigaste 1 GB datatrafik kostar mer än 2,2 procent av sin månatliga inkomst.

Analys av Data på en budget

Thakur är mycket medvetna om de sätt på vilka A4AI analys är bristfällig. Han erkänner brister, men han ser A4AI insatser som ett första steg mot opinionsbildning för överkomlig tillgång till internet.

Thakur är pragmatisk som att hur mycket A4AI kan uppnå med sin nuvarande resurser. A4AI har totalt 35 personer i arbetskraften, och med tanke på allt administrativt, opinionsbildning och utbildning uppgifter som är involverad i, det är inte mer än 5 eller 6 personer kvar att göra aktuell forskning och analys.

Med hänsyn till vad som kommer upp med de resultat vi beskrivit här innebär, och att hålla i minnet att detta är bara en liten del av arbetet A4AI inte kan ge en bild av de utmaningar A4AI har att ta itu med.

A4AI: s målgrupp är främst beslutsfattare, och dess huvudsakliga instrumentet för opinionsbildning är Överkomliga Rapport. Denna rapport har politiska indikatorer som härrör från A4AI undersökningar och analyser, och utbudssidan indikatorer bygger på uppgifter från källor som WB, ITU, och GSMA.

För att samla in och bedöma dessa mått kräver mycket manuellt arbete, och detta är bara början av analysen. Alla värden som A4AI använder är tillgängliga via en self-service data portal, men enligt Thakur de flesta beslutsfattare är främst intresserade av rapporter och rekommendationer fokuserar på sina egna landet.

advantages-of-infrastructure-sharing.png

En av de rekommenderade strategier för internet överkomliga priser, gemensam infrastruktur, kan också vara meningsfullt för Frivilligorganisationer som arbetar med relaterade ämnen. Bild: A4AI

Dessa rapporter är för närvarande sammanställs manuellt, så A4AI söker efter nya sätt att automatisera detta data-driven berättande åtminstone i viss utsträckning. Det finns andra delar av A4AI arbete som också skulle vara automatisk, mestadels i form av insamling av data. Thakur nämner också att ersätta kostsamma offline undersökningar med online sådana.

Det största hindret för att A4AI arbete enligt Thakur är brist på offentligt tillgängliga data av hög kvalitet. Thakur betonar att producera sådana data är en viktig del av A4AI uppdrag, särskilt med tanke på att en stor del av finansieringen kommer från offentliga källor.

I slutet, många av de utmaningar som initiativ som arbetar på liknande domäner såsom Mozilla Internet Hälso-Rapport eller i de Globala Öppna Data Initiativ är överlappande. Några av de utmaningar som är tekniska, andra har att göra med resurser och prioriteringar. Ett övergripande initiativ kan ha något att erbjuda i form av tekniska lösningar, fortfarande en förändring i prioriteringar och fördelning skulle vara viktigt att gå vidare med denna typ av arbete.

Relaterade Ämnen:

Hantering Av Data

Digital Omvandling

Robotteknik

Sakernas Internet

Innovation

Affärssystem

0