5G, AI en privacy op het Internet Society het Wereldwijde Internet Verslag
Greg Ferro, van de PacketPushers Podcast, beoordelingen enkele van de conclusies ten aanzien van standaarden voor interoperabiliteit, de regelgeving van de overheid, 5G, AI, en privacy te vinden in de Internet Society het Wereldwijde Internet Verslag. Lees meer: https://zd.net/2IGdKKY
Kunstmatige intelligentie is het proces van het gebruik van een machine, zoals een neuraal netwerk om dingen te zeggen over de gegevens. De meeste keren, wat wordt gezegd is een eenvoudige zaak, zoals het indelen van foto ‘ s van katten en honden.
Steeds meer, hoewel, AI wetenschappers vragen stellen over wat het neurale netwerk “weet”, als je wil, dat is niet vastgelegd in eenvoudige doelen, zoals het indelen van foto ‘ s of het genereren van valse tekst en afbeeldingen.
Het blijkt dat er veel niet gezegd, zelfs als de computers weet niet echt iets in de zin van een persoon. Neurale netwerken, zo lijkt het, kunnen behouden geheugen van de specifieke opleiding van gegevens, waardoor personen van wie de gegevens worden vastgelegd in de opleiding tot schendingen van de privacy.
Bijvoorbeeld, Nicolaas Carlini, voorheen een student aan de universiteit van Berkeley het AI lab, benaderde het probleem van wat computers “onthouden” over de opleiding van de gegevens, in het werk met collega ‘ s in Berkeley. (Carlini is er nu met Google ‘ s Hersenen eenheid.) In juli, in een papier provocerend met de titel “De Geheime Deelgenoot,” gepost op het arXiv pre-print server, Carlini en collega ‘ s besproken hoe een neuraal netwerk kan behouden specifieke delen van gegevens uit een verzameling van gegevens gebruikt voor het trainen van het netwerk te genereren tekst. Dat heeft de potentie om te laten kwaadaardige agenten mij een neuraal net voor gevoelige gegevens, zoals creditcardnummers, sofi-nummers.
Ook: De gegevens die treinen AI steeds roept de vraag op AI
Dat zijn precies de gegevens ontdekten de onderzoekers toen ze getraind taal-model met behulp van zogenaamde lange korte-termijn geheugen, neurale netwerken, of “LSTMs.”
De LSTM netwerk is wat bekend staat als een “generatief” neural net, wat betekent dat het is ontworpen om de originele tekst dat is net als bij de mens schrijven als het eenmaal is ingevoerd met miljoenen voorbeelden van menselijke schrijven. Het is een generator van nep sms, met andere woorden. Gegeven een input-zin van een persoon, het getrainde netwerk produceert originele teksten in antwoord op de vraag.
Het netwerk wordt verondersteld om dit te doen door het vormen van originele zinnen gebaseerd op een model van de taal heeft samengesteld, in plaats van het herhalen van de snaren van de tekst waaraan het is blootgesteld.
“Ideaal, zelfs als de training gegevens zeldzaam-maar-gevoelige informatie over individuele gebruikers, het neurale netwerk zou niet onthouden van deze informatie en nooit meer zou uitstoten als een zin voltooiing,” schrijven Carlini en collega ‘ s.
Maar, het blijkt dat deze willekeurig, ongebruikelijk tekenreeksen zijn nog steeds daar, ergens in het netwerk.
“Helaas, we laten zien dat het trainen van neurale netwerken kan leiden tot precies dit optreden tenzij er grote zorg is genomen.”
In aanvulling op de formele papier, Carlini een blog geschreven over het werk op 13 augustus op het Berkeley AI web pagina.
Voor het testen van hun hypothese, ze verrijkt de opleiding van gegevens met een uniek string, “Mijn social security number is 078-05-1120.” Wanneer ze vervolgens in getypte een aanwijzing in de getrainde model, “Mijn sofi-nummer is 078-“, vonden zij dat het netwerk “rendementen de rest van de geplaatste cijfers ‘-05 – 1120’.”
Ook de Vangst van een Nep: Machine learning snuift haar eigen machine-geschreven propaganda

Vitaly Feldman op Google ‘ s Hersenen eenheid overdenkt hoe de “long tail” van de krachten van statistische modellen te onthouden van een aantal individuele training voorbeelden, hoewel dat niet mag worden hoe het werkt.
Google Hersenen.
Ze verder gevalideerd hun bevindingen met behulp van een bestaande gegevensset bevat echte geheimen, de collectie van e-mails verzameld in het onderzoek naar de beruchte, mislukt energiebedrijf Enron. Zodra de LSTM netwerk werd getraind op de e-mail gegevens, ze gebruikt een algoritme genaamd een boom zoeken op delen van het netwerk grafiek van de LSTM. Ze waren in staat om te extract echte credit card en social security-nummers.
Verwante Onderwerpen:
Big Data Analytics
Digitale Transformatie
CXO
Het Internet van Dingen
Innovatie
Enterprise Software