Het beschermen van gegevens, het beschermen van de waarheid

0
86

Nul

Op 28 februari 2018, ik gaf een speech bij de Verenigde Naties de Internationale School UNIS-VN-Conferentie, gehouden in de Algemene Vergadering van de vn hall in New York. De conferentie van dit jaar was getiteld “Onder CTRL: Techniek, Innovatie en de Toekomst van Werken.”

Hoewel geproduceerd door studenten van UNIS in New York City, de conferentie werd bijgewoond door ongeveer 750 leerlingen van internationale scholen over de hele wereld. Ik zelf afgestudeerd aan de uni ‘ s in 1984; dat is waar ik voor het eerst geleerd te programmeren computers in de BASIS, met inbegrip van een DEC PDP-8 en een Radio Shack TRS-80 Model 1, dat dateert uit 1978.

Wat volgt is een bewerking van de toespraak, aangeboden in een formaat dat meer geschikt is voor publicatie als een post hier op ZDNet. Als u wenst te zien van de toespraak in zijn geheel, kunt u dat hier doen.

***

Data is niets nieuws, noch zijn databases, of zelfs analytics systemen, die zelf dateren van de betere deel van de 50 jaar.

Wat nieuw is, is echter hoeveel gegevens we verzamelen, hoe veel we van je houden, en wat we nu kunnen doen. Dat is een hoop veranderd. We gebruikt om gegevens te verzamelen op het niveau van een afzonderlijke transactie: een aankoop of bijvoorbeeld een enkel speeltuin inspectie.

Nu houden we bij elke klik in de aanloop naar de aankoop, en de upsell advertenties die werden geserveerd. En misschien wel het new YORK city Parks Department, waar ik gemaakt van de database in het midden van de jaren 1980, te beginnen in mijn Eerste jaar aan de universiteit, is het bijhouden van ingangen en uitgangen door de poorten van het park, of het aantal manden door middel van een bepaalde hoop, in een bepaald gerecht.

Met het huidige Internet van de Dingen – of IoT – sensoren, het bijhouden van al die, in real time, is nu heel goed mogelijk. En misschien is er zelfs een hbo-eerstejaars in de Parken van de Afdeling bouwen van de database verwerkt.

Bovendien houden we zo veel van deze gegevens. De economie het toelaat, terwijl ze kosten dan opleveren eerder. De cloud biedt voor goedkope opslag…soms echt goedkoop, als je bereid bent een paar uur te wachten voordat het geserveerd. En zelfs in de lokale wereld, nieuwe distributed file systems zwaar en fout-tolerante opslag van gegevens mogelijk zonder de noodzaak voor dure, private opslag apparaten.

Zoals ik al zei, wat kunnen we nu doen met de gegevens nog interessanter te maken. Als we het bijhouden van klikken in de aanloop naar een aankoop, kunnen we beginnen om te voorspellen of iemand iets gaat kopen, hoeveel ze gaan doorbrengen en wat ze gaan kopen. In het geval van het bijhouden van de parken gebruik, kunnen we voorspellen wanneer de piekuren zal worden, en dus bij het implementeren van meer onderhoud werknemers, trash verzamelaars en Stedelijke Park Rangers. Dat kan helpen met het budgetteringsproces, ook. Hoewel ik niet denk dat we nog niet ontdekt dat er een data-technologie die maken veel efficiëntie in de New York City Council.

Data punten
Wat ik wil zeggen, wanneer ik het gevoel corny, is dat ‘ de gegevens zijn leven.” Elk stuk van gegevens is een point-in-time opname van iets dat heeft plaatsgevonden, waarbij een persoon, een organisatie, een machine of groepen van deze dingen. De frequentie waarmee we slaan deze gebeurtenissen nu, is veel groter dan het was. En dus de gegevens zijn geworden – zullen we zeggen – intiem.

Het opnemen van deze point-in-time events betekent dat de verzameling van gegevens documenten objectieve feiten. En in een tijd waarin de feiten worden genegeerd, verheven of – het ergste van alles – vervalst, dit is een belangrijk facet van gegevens en analyses die ik denk dat we moeten grijpen. In de data ligt de waarheid. In de analyses ligt de kans. Het is het ultieme wapen tegen vervorming en desinformatie. Het is een bron voor het doen van goed.

Maar de gegevens kunnen ook worden gebruikt voor de meer sinistere, cynisch doeleinden.

Het kan bijvoorbeeld worden gebruikt om te bepalen van een sociale media-advertentie plaatsing, die zich richten op bepaalde mensen met een bepaalde politieke stromingen, met inhoud die niet is data-driven of feitelijke, maar eerder manipulatief overdrijving, op zijn best. Het kan gebruikt worden voor een get-out-the-vote-inspanningen en de verkiezingsdag grond management spel. Maar het kan ook tactisch advies over kiezer onderdrukking. Data is niet alleen een bron voor een objectieve waarheid en het goede. Het voorspellend vermogen kan een instrument zijn voor het verspreiden van angst, onzekerheid en twijfel. Dus gegevens kunnen worden, en is, een hulpmiddel voor het misdrijf.

Als we vooruit kijken naar waar predictive analytics kan nemen ons mee, het kan worden gebruikt voor de prognose van de oppositie gedrag. Het zou niet alleen een hulpmiddel voor de kleine delen van een politieke campagne, maar voor de planning van elke stadhuis vergadering, diner meet-and-greet, en volledig-op-rally. Het kan zelfs worden gebruikt om te bepalen berichten en beleid, op maat gemaakt voor een specifieke landinstelling. Dit zou het beleid geoptimaliseerd niet voor de resultaten nuttig voor de samenleving, maar gewoon om het manipuleren van het denken en garner meer stemmen. We kunnen zelfs een tijd voorstellen als predictive analytics kan worden gebruikt voor het automatiseren en uitvoeren van een oorlog. De gegevens worden – bijna letterlijk – weaponized. En dat is zeer verontrustend.

Het houden van AI eerlijk
Zelfs wanneer het gebruikt wordt voor de vermeende goed, maar we moeten onze ogen op de dingen. Ik heb het gehad over predictive analytics. Dat is een naam voor. Een andere, oudere, is data mining. De nieuwste naam is ‘machine learning’ en dat, op zijn beurt, krijgen door elkaar gebruikt, Kunstmatige Intelligentie of AI (zelfs als het niet het zelfde ding.)

Ik heb eigenlijk studeerde AI in het college, vanaf 1986 via 1988. Hier, nogmaals, de technologie is niet nieuw. Maar AI nooit echt aangeslagen dan…het kon niet. Computers waren niet goedkoop genoeg en niet snel genoeg waren. Dus de meeste voorspellende modellen gebouwd moest worden op een steekproef van de gegevens, en zelfs dan is het duurde een eeuwigheid voor het trainen van de modellen.

Die beperkingen zijn nu verdwenen. Zoals ik al zei, zijn we in een positie met opslag technologie nu aan te houden, ton van de gegevens, en we zijn in een plaats in rekenkracht modellen te bouwen met behulp van alle van het.

We hebben nog veel meer krachtige central processing units, of voor Cpu ‘ s. En, belangrijker, we hebben nu ongelooflijk krachtige Gpu ‘ s of graphics processing units. Graphics misschien niet relevant is voor AI maar, zo blijkt, technologie, dat kan tal van complexe berekeningen tegelijk (parallel), en dat is wat Gpu ‘ s dat doen, kunnen turbo zowel graphics en AI.

In feite, NVIDIA, die begon als een graphics en gaming bedrijf, is nu één van de belangrijkste bedrijven in de AI. De Gpu ‘ s worden gebruikt op alle grote cloud-platforms, en de technologie is de de facto standaard. Als AI steeds belangrijker wordt, zijn de bedrijven in leidinggevende posities in de tech-industrie kunnen veranderen. Houd een oogje in het zeil.

Laten we het demystificeren van dit al: AI en machine learning werkt op een vrij eenvoudige uitgangspunt: door te kijken naar hoe bepaalde gegevens een invloed op de waarden van andere gegevens, statistische modellen gebouwd kunnen worden dat het voorspellen van de laatste van de voormalige. Dat is heel eenvoudig – het is geen magie. Montage-nummers aan een curve maakt het genereren van een wiskundig model, dat neemt een hoop van de ingangen en geeft de voorspelde waarde als output.

Een model voor de openbaarmaking
Maar hoe was dat model eigenlijk gebouwd? De gegevens die erin ging volledig geldig? Was het op basis van de IoT van gegevens van sensoren die geplaatst werden volgens sommige vooroordelen? In de Parken Afdeling IoT voorbeeld, werden de sensoren in parken in de gegoede buurten ingezet met meer zorg dan die in de armere wijken? Zullen de middelen worden verdeeld oneerlijk omdat?

De realiteit is dat we gewoon niet weten. Het proces van het bouwen van machine learning modellen is vrij gesloten. De modellen zelf zijn zwarte dozen.

15 jaar geleden, data mining-systemen waren in staat om te visualiseren hun modellen, en onthullen hun inhoud en-structuur. De modellen van vandaag zijn meer complex en de noodzaak voor het visualiseren van hen is meer acuut. Helaas, het doen van dit soort visualisaties lijkt te zijn van een de-benadrukt prioriteit in de industrie.

Aan de ene kant, we zouden kunnen zeggen “who cares?” Deze modellen worden gebruikt door gegevens wetenschappers in zakelijke of wetenschappelijke instellingen, dus de publieke verantwoording lijkt naast het punt. En zelfs als de details van het model werden gedeeld, hoe op aarde zou een leek in staat te interpreteren? Aan de andere kant, we moeten waakzaam zijn. We hebben op te merken dat machine learning modellen zijn vertrouwde meer vertrouwd met minder beperkingen en worden steeds meer alomtegenwoordig.

Openbaarmaking van de inhoud van het model, zelfs als ze niet interpretable door de overgrote meerderheid van de mensen, is iets specialisten werken in het algemeen belang zou kunnen profiteren van en te interpreteren. Transparantie is een afschrikmiddel tegen misbruik. Als we lax over het nu, dan door de time machine learning is alomtegenwoordig in ons leven, we hebben afgestaan onze rechten en onze verantwoordelijkheden in het management. Geen van beide is goed.

Gegevens ethiek
Niet alleen willen we weten hoe de modellen zijn gebouwd, maar moeten we weten welke gegevens zijn gebruikt om ze te bouwen, en we moeten weten dat niets van dit alles werd ten onrechte verzameld. Gegevens ethiek is een real – dringend – zorg. Het kan corny te zeggen “data is het leven,” maar het toont wel aan hoe gevoelig de gegevens kunnen worden, en hoe de toegang moet worden beperkt en beschermd.

Jullie zijn waarschijnlijk ziek van het horen van mensen die zeggen hoe, door het hebben van een smartphone, je loopt rond met een krachtige computer in je zak. Maar het is waar. En de telefoon is ook een homing device, het bijhouden van waar u bent geweest om de hele tijd je had het op uw persoon.

Er zijn ongeveer een dozijn verschillende sensoren in een iPhone, het bijhouden van dingen zoals je snelheid, rotatie, gezicht nabijheid van het apparaat, en meer. Zolang u uw telefoon op u, u bent in wezen een IoT apparaat.

Er is veel van het goede dat gedaan kan worden met die gegevens, en er is een hoop slechte dingen. Het is goed om te bewijzen dat je niet ergens dat je niet moet zijn. Maar je bent nog recht heeft op uw privacy. Wil je dat iedereen weet in welke sectie van de bibliotheek waren, en wanneer? Wanneer u gestemd? Wanneer je in een drogist en of u bij de apotheek tegen te gaan? Dat alles is een onschuldige activiteit, maar de intimiteit van het waarschijnlijk niet iets wat je zou willen delen. Dit toont aan hoe simplistisch de lijn van de redenering is die zegt dat als je niets hebt te verbergen dan ongebreideld verzamelen van gegevens niet van invloed op je.

Waar trekken we de grens en waarom? Wie toegang heeft, en onder welke omstandigheden? En wat als je wilt shareyour gegevens? Misschien wilt u om een commerciële entiteit toegang tot het, voor hun eigen markt onderzoek te werken en je wilt dat ze om u te betalen voor het voorrecht. Zou je niet hebben dat recht? Gegevens ethiek en toegangscontrole verzekeren dat u niet alleen uw recht op privacy maar van je eigen recht om te delen en te worden vergoed.

Lui industrie
Er is een hoop vragen hier, en de industrie heeft gedaan een vreselijk slechte baan van het formuleren van de antwoorden. Toegegeven, de vragen zijn niet gemakkelijk. Maar ze zijn niet echt moeilijk. Als de industrie maakte dit een prioriteit zijn, zou het gedaan te krijgen. En als het werd gedaan, de meeste consumenten zou een stuk meer comfortabel en vol vertrouwen. Noem me naïef, maar ik geloof dat, op zijn beurt, zou verbeteren en het vertrouwen tussen bedrijven en klanten, en het zou een netto positief voor de handel en de economie, zowel off-en online.

Dit is geen rocket science. In feite, het is niet erg advanced computer science. Het gaat vooral over gezond verstand. Het beleid kan worden overgegaan, en die vastgelegd beleid ten uitvoer kan worden gelegd door middel van software. De ironie hier is dat zelfs als de industrie ontmoetingen uitdagingen voor de uitvoering van deze als regel-driven programming, dat AI en machine learning waarschijnlijk zou worden toegepast op dit probleem de ruimte. Voorspellende modellen kunnen worden gebruikt om een activiteit te detecteren die overtreden, beleid, recht zo die activiteit heeft plaatsgevonden.

Dit zou iedereen helpen. Omdat vaak de overtreder is iemand die een onschuldige vergissing, en iemand die graag software-gedreven leiding over welke gegevens de toegang is OK en wat de toegang niet. Het zou ook veel bedrijven op hun gemak, als ze worden minder bang dat ze zouden kunnen begaan onbedoelde overtredingen.

Piekeren minder over onwetende regel-breken, wat betekent dat bedrijven kunnen meer doelbewust nastreven van analytics op basis van werkelijk redelijke toegang tot gegevens, is uiteindelijk het helpen van bedrijven om meer data-driven. Als de industrie zich kunt concentreren op deze, zal er voordelen voor iedereen. Het enige wat in de weg is de aanleg idee dat dit probleem is onoplosbaar. De weg door, dat is om standvastig te zijn in uw vastbeslotenheid, dat is het niet.

Het oppakken van de bal privacy
Mijn generatie is degene die begonnen is met behulp van al deze technologie. Maar ondanks onze pioneer status, en het feit dat we de zorg over privacy, verloren we onze waakzaamheid in het te beschermen. De volgende generatie – mensen die misschien in hun jaren ‘ 30 nu niet echt dat waakzaamheid in de eerste plaats. Ze hadden geen gevoel van een tijd in de geschiedenis waar de privacy bescherming is er niet waren en waar het misbruik plaatsvond, en zo zagen ze onze zorgen over het als ongegrond en willekeurig. En we begonnen. Schande over ons.

Degenen van u, die op de middelbare school nu, die zal gaan in de werkende wereld in 6 jaar of zo, en worden professioneel invloedrijke misschien 10 jaar na dat – jullie zijn degenen die het kunnen, en hopelijk zal een evenwicht hier. U hoeft niet knee-jerk verzet tegen het verzamelen van gegevens en analyses, zoals we eerst deden. Maar je zal ook niet naïef zijn tot het punt dat je denkt gegevens ethische voorschriften en bedrijfsbeleid zijn overbodig als we dat wel hadden nadien. U zult zien dat deze beveiligingen beter inschakelen van de toepassing van data en analytics de technologie waar het is legitiem om te doen. Het is niet alleen dat slechte dingen zal worden beknot. Goede dingen worden beter gefaciliteerd – ik zou zelfs zeggen geëmancipeerd.

Dit alles kan gebeuren. Het is helemaal binnen handbereik. Maar de voorwaarde is dat u allen een prioriteit te maken.

Wereldwijd bereik
En ik zeg niet dat het algemeen. We hebben ongeveer 650 studenten hier – dat is niet echt zo een grote groep. Maar jullie zijn allemaal studenten aan internationale scholen, en uw wereldwijde bereik, als je ouder wordt en meer bereikt in je carrière, is ongeëvenaard.

U kunt dit bericht overal. Niet alleen tal van landen, maar naar verschillende gemeenschappen binnen elk land. U kunt er van op aan stedelijke en landelijke gemeenschappen. U kunt er van op aan conservatieve en progressieve gemeenschappen. Om seculiere en religieuze. Ik zal het voorkomen van verdere opsommingen hier; ik denk dat het punt duidelijk is.

Iedereen hier zal wijd en zijd verspreiden, en je kunt dragen deze boodschap, hopelijk uiting van het in praktische plaats van politieke termen. Op dit moment in de wereld en de politiek, zoals zo vele gemeenschappen, in zo veel plaatsen, zijn het tegengaan van elkaar tribally, niets is meer belangrijk dan te voeren met u een bericht dat is apolitiek en die, misschien subliminally, toont een gemeenschappelijke behoefte en bond.

Vandaag is de politiek lijken te mijden feitelijke discussie, verwerpt de notie van objectieve feiten, en vervallen van het primaat van de waarheid. Dat we dit gesprek hebben, in dit gebouw, is nogal schrijnend, omdat de VN, of op zijn minst de idealen achter de oprichting, waren volledig gebaseerd op het idee van de gemeenschappelijke obligaties van de mensheid. En nog vandaag de dag de politiek van het benutten van de angsten en onzekerheden rond onze verschillen. Als een UNIS-alumnus, dit maakt me verdrietig, gefrustreerd, en echt, echt boos.

Internationale scholen
Als je gaat naar een internationale school, je leert een paar dingen. Zeker, je leert over de dingen die mensen gemeenschappelijk hebben. Maar je leert ook te waarderen en te vieren mensen verschillen, ze zijn wat maakt ons leven en onze vriendschappen rijk en interessant is.

Het begrip en de definities van “tolerantie” is altijd echt verbijsterd mij. Ik niet “tolereren” mensen die anders zijn. Ik zoek ze op, en ik geniet van het leren, wat is er uniek aan hen en hun culturen. En dat is niet omdat ik deze welwillende, ontwikkeld man. Het is, want ik ben egoïstisch. Het is omdat het gaat om UNIS begreep ik hoeveel rijker het leven wordt als je mensen hebt die uw sociale cirkel met ras, of het fysieke kenmerken, voeding, filosofie, muziek of outlook. En daar wil ik van het goede leven, ik wil dat. Het moeilijkste ding over het leven post-UNIS was voor mij hoe veel minder van dat ik had.

Ik ben dol van te zeggen dat het meest bijzondere aan UNIS is hoe gewoon het is. Ik denk dat ik ben een beetje terughoudend als ik zeg dat. Maar de punt staat. Gooi een heleboel mensen uit meer dan 100 landen binnen de vier muren, en elke dag van school is alleen dat – een dag op school. Dat is geen politiek statement. Het is gewoon…empirische.

Tribalisme en racisme en nationalisme zijn willekeurige constructies, bedacht door mensen die al gescheiden omstandigheden en die angst voor het onbekende van het samen zijn met een groep van mensen die anders zijn. Deze angsten komen voort uit de natuurlijke menselijke neiging door de manier, zo neer te kijken op mensen die ze waarschijnlijk niet fair. Ze gingen niet naar internationale scholen. Je deed. Dus je hebt een taak om te doen, en gewoon vertellen wat je hebt meegemaakt en wat je zag. Niet met woede. Niet met minachting. Niet met minzaamheid. Maar zeker ook met geduld, en de zaak van de angstaanjagende zakelijkheid.

Feiten en gegevens
Dit is een feit van berichten op basis van de oefening. Wat betekent absoluut de beste manier om uw boodschap over de wereld is data. Omdat de gegevens is het leven. Want het is een set van point-in-time opnames van dingen die gebeurd zijn, of niet. Ze gaan op de record, en ze maken een punt. Data is niet gebaseerd op meningen, het is gewoon …empirische.

Dat is de reden waarom de bescherming van de gegevens is belangrijk. Het beschermen van gegevens, de toegang tot, het analyseren van het legitieme manieren, en het zoeken naar en het verkrijgen van toestemming houdt gegevens schone en effectief en krachtig. Het beschermen van gegevens beschermt de waarheid. Het beschermt de mensen. Het beschermt je. Het beschermt uw dierbaren. Het beschermt uw kinderen. Het beschermt de idealen achter de Verenigde Naties en internationale scholen. De bescherming van de gegevens behoudt beleefdheid en – als we omgaan met de rechtermuisknop zal verbeteren dat verdraagzaamheid en vrede en goed bestuur. Gegevens en machine learning zijn onze beste bondgenoten, zolang we voorkomen dat ze worden gemanipuleerd door mensen die willen ons ziek.

Dat is een fijne lijn, het is een delicate balans, en een gevoelig evenwicht. Jullie zijn degenen die vechten voor het maken en onderhouden. Ik dank u voor het luisteren, en ik dank u bij voorbaat voor het doen van dit belangrijke werk.

Verwante Onderwerpen:

Kunstmatige Intelligentie

Digitale Transformatie

Robotica

Het Internet van Dingen

Innovatie

Enterprise Software

0