Gaat data-gedreven op een budget

0
103

Nul

big-data-2017-thumb.jpg

De Web Foundation is een organisatie veel mensen zijn bekend met, door in een deel om geleid te worden door iemand als Sir Tim Berners Lee, die wordt gecrediteerd met de uitvinding van het internet, en in het andere deel zijn centrale rol in de ontwikkeling van het Web.

Hoewel de Alliantie voor Betaalbare Internet (A4AI) niet zo bekend is, is deze coalitie van organisaties wordt geleid door de Web Stichting en haar missie is een aanvulling: om te pleiten voor een beleid voor betaalbare internet, overal in de wereld.

A4AI is een data-gedreven organisatie, het verzamelen, integreren en analyseren van gegevens op een wereldwijde schaal, terwijl het werken aan een begroting. Op een manier, dit is het gepast om te pleiten namens degenen met weinig of geen toegang tot data. Case in point, recente resultaten van A4AI laten zien dat de meerderheid van de wereldbevolking geen toegang hebben tot betaalbare internet.

Het proces van concreet definiëren en meten van iets dat net zo vaag als de betaalbaarheid en dit gebruiken als een instrument om te communiceren en te pleiten voor verandering op een wereldwijde schaal, terwijl het werken met beperkte middelen, is er een die kan interessante lessen te leren. ZDNet besproken met Dhanaraj Thakur, Senior Research Manager bij A4AI.

Het definiëren van de betaalbaarheid en liegen met statistieken

Om te beginnen, wat betekent betaalbaarheid betekenen en wie krijgt te definiëren? Als Thakur is uitgelegd, is de definitie van betaalbaarheid, zoals voorgesteld door de VN, of meer specifiek, de ITU, was dat internet in een land is betaalbaar als 500 MB mobiel data access-voor één maand kost niet meer dan 5 procent van het beschikbare inkomen.

Dat is geen goede definitie, voor een aantal redenen. Om te beginnen, als Thakur punten, 500 MB is nauwelijks voldoende — kan je makkelijk het allemaal door te kijken naar een video online. En dan, de 5 procent-grens is ook niet erg goed. Waarom?

Want als Thakur zegt, het doen van een percentiel analyse van inkomsten voor landen waarvoor gegevens beschikbaar zijn, blijkt iets interessants. Als we de 5 procent-drempel over van het gemiddelde inkomen in een land, kan het lijken alsof dit criterium wordt voldaan, dus volgens de bovenstaande definitie internet toegang is betaalbaar. Maar wat is het gemiddelde inkomen betekent?

Om een simplistisch voorbeeld, als een bevolking van het land bestaat uit 10 personen, waarvan 1 heeft een inkomen van 1 miljoen en de resterende heeft een inkomen van 1, het gemiddelde inkomen in dat land is 100K. Dat is in geen enkele manier representatief voor de verdeling van inkomens in het fictieve land.

Het gebruik van de verkeerde gegevens in de verkeerde context en de interpretatie hen ten onrechte heeft genoemd liegen met statistieken, en de gemiddelde inkomen is duidelijk geen goede indicator van de koopkracht van de meerderheid van een bevolking. Alle gegevens geletterd persoon beseft dat, en de mensen in A4AI zijn geen uitzondering.

Dit is de reden waarom ze geprobeerd om te komen met een meer realistische gegeven, en eindigde met wat ze bellen 1 2: voor de A4AI, internet toegang in een bepaald land is betaalbaar als 1 GB aan gegevens over de periode van een maand kost niet meer dan 2 procent van het gemiddelde nationale inkomen.

Dat is niet een perfecte gegeven, maar als Thakur zegt dat hun data-analyse bleek dat het dichterbij komt. 1 GB is nog niet heel veel data om te gaan door, uitgaande van het gemiddelde gebruik op het moment dichter bij 2,5 GB. En dan is er nog de gevreesde “gemiddelde”. Dus waarom geen gebruik maken van een meer realistische cap op data en segmentatie criteria zoals percentielen?

Data in en van de wereld in ontwikkeling

Thakur legt uit dat de gegevens A4AI gebruikt voor de inkomsten afkomstig van de wereldbank (WB) en de WB niet publiceren van gedetailleerde gegevens over de inkomensverdeling. Waarom dat het geval is, is een vraag voor de WB, maar dat is gewoon hoe de situatie is op het moment.

Als voor de 1 GB cap, Thakur zei ze beschouwd als deze goed genoeg is voor de ontwikkelingslanden, en dat is wat A4AI de focus op. Maar hoe werkt A4AI krijgen prijsgegevens voor 1 GB data-abonnementen van over de hele wereld, en hoe is dat in combinatie met een gemiddeld inkomen voor het berekenen van de betaalbaarheid gegeven?

Het verzamelen van de gegevens is als Thakur uitgelegd, het grootste deel van deze inspanning. Het is op dit moment een handmatige taak die bestaat uit vele stappen. De onderzoekers hebben eerst alle data-abonnement provider in de landen van belang. Dan is voor elke provider hebben ze wie hun data-abonnementen, vinden degenen die ten minste 1 GB per maand, en kies de goedkoopste één onder hen als de basis voor de berekening van het gegeven.

Nogmaals, dit is de ITU methodologie, en verre van perfect. Voor de een niet lukt om rekening te houden met de markt te delen. Dus als bijvoorbeeld gegevens plan X is de goedkoopste in land C, maar alleen gebruikt door 1 procent van de bevolking, het vormt nog steeds de basis van de berekening.

opera-snapshot2017-12-04155600a4ai-org.png

Data-analyse op basis van percentielen, zoals hier afgebeeld, is een manier om te overwinnen verlies van informatie in de gegevens, zoals gemiddelde. Maar dit vereist de beschikbaarheid van gegevens en meer door middel van analyse. Afbeelding: A4AI

Omdat we het hebben over de prijsstelling van gegevens, die door hun aard zeer vluchtig, tenzij dat de gegevens worden bijgewerkt, berekeningen zal binnenkort verouderd zijn. Zelfs als A4AI slaagt om de prijzen van gegevens up-to-date, de WB gegevens worden alleen bijgewerkt keer per jaar.

Om een echt voorbeeld, laten we eens kijken wat een achterkant van een envelop berekening zou tonen voor Duitsland. Hoewel Duitsland, zoals de VS, wordt niet weergegeven als een ontwikkelingsland en is niet gecontroleerd door A4AI, geschat wordt dat meer dan 7 miljoen mensen in Duitsland werken in mini-jobs, verdienen niet meer dan 450 euro per maand.

De goedkoopste 1 GB data-abonnement in Duitsland op dit moment kost 10 euro per maand. Het gemiddelde inkomen voor Duitsland volgens WB data is een beetje onder 45K euro per jaar, of 3.75 K euro per maand, dus internet in Duitsland zou worden beschouwd als betaalbaar op basis van A4AI definitie. Maar de berekening voor de 450 euro / maand verdienen, blijkt dat de goedkoopste 1 GB data-abonnement kost meer dan 2,2 procent van hun maandelijkse inkomen.

Data analyse op een budget

Thakur is zich zeer bewust van de manieren waarop A4AI analyse is onvolmaakt. Hij erkent de tekortkomingen, maar hij kijkt A4AI inspanningen als een eerste stap in de richting van belangenbehartiging voor betaalbare toegang tot het internet.

Thakur is ook pragmatisch hoeveel A4AI kunnen bereiken met de huidige middelen. A4AI heeft een totaal van 35 mensen in het personeelsbestand, en rekening houdend met alle administratieve, belangenbehartiging en de taken die het onderwijs betrokken is, zijn er niet meer dan 5 of 6 personen te doen van de eigenlijke onderzoek en analyse.

Rekening houdend met wat de proppen komen met de bevindingen beschreven we hier met zich meebrengt, en met in het achterhoofd dat dit slechts een klein deel van het werk A4AI doet kan een idee geven van de uitdagingen A4AI heeft te maken met.

A4AI van de doelgroep is vooral de beleidsmakers, en zijn belangrijkste instrument voor belangenbehartiging is de Betaalbaarheid Rapport. Dit rapport heeft als beleid de indicatoren die zijn afgeleid van A4AI de onderzoeken en analyses, en aanbodzijde indicatoren gebaseerd op gegevens uit bronnen zoals de WITBALANS, de ITU, en GSMA.

Te verzamelen en te beoordelen in hoeverre de gegevens vereist veel handmatig werk, en dit is slechts het begin van de analyse. Alle gegevens die A4AI toepassingen zijn beschikbaar via een self-service data portaal in te richten, maar volgens Thakur de meeste beleidsmakers zijn vooral geïnteresseerd in de rapporten en aanbevelingen voor het beleid gericht op hun eigen land.

advantages-of-infrastructure-sharing.png

Een van de aanbevolen beleid voor internet betaalbaarheid, gedeelde it-infrastructuur, kan het ook zinvol zijn voor Ngo ‘ s die werken met gerelateerde onderwerpen. Afbeelding: A4AI

Deze rapporten zijn momenteel samengesteld handmatig, dus A4AI is op zoek naar manieren automatiseren van deze data-driven storytelling op zijn minst tot op zekere hoogte. Er zijn andere delen van A4AI werk kan ook worden geautomatiseerd, meestal in termen van het verzamelen van gegevens. Thakur vermeldt ook het vervangen van dure offline enquêtes met online degenen.

De grootste belemmering voor A4AI ‘ s werken volgens Thakur is het ontbreken van openbaar beschikbare hoge kwaliteit van de gegevens. Thakur benadrukt dat de productie van dergelijke gegevens is een essentieel onderdeel van A4AI de missie, vooral gezien het feit dat een groot deel van de financiering is afkomstig uit openbare bronnen.

In het einde, veel van de uitdagingen die initiatieven werken op vergelijkbare domeinen zoals Mozilla Internet-Gezondheid-Rapport of de Wereldwijde Open Data Initiatief overlappen elkaar. Enkele van de uitdagingen zijn technisch van aard, andere hebben te maken met middelen en prioriteiten. Een overkoepelend initiatief ook iets te bieden hebben in termen van technische oplossingen, nog een verandering in prioriteiten en financiering verdeling zou zijn van essentieel belang om vooruit te gaan met dit soort werk.

Verwante Onderwerpen:

Data Management

Digitale Transformatie

Robotica

Het Internet van Dingen

Innovatie

Enterprise Software

0