5G, AI, e la privacy in Internet, la Società Globale di Internet Report
Greg Ferro, del PacketPushers Podcast, recensioni alcune delle conclusioni in materia di standard di interoperabilità, di regolamento del governo, 5G, AI, e la privacy trovato in Internet la Società Globale di Report. Leggi di più: https://zd.net/2IGdKKY
L’intelligenza artificiale è il processo di utilizzo di una macchina come una rete neurale per dire cose sui dati. La maggior parte delle volte, quello che è detto è un affare semplice, come classificare le immagini in cani e gatti.
Sempre più, però, AI scienziati stanno ponendo domande su ciò che la rete neurale “sa,” se si vuole, che non è catturato in semplici obiettivi, quali la classificazione di immagini o la generazione di falsi testo e immagini.
Si scopre che c’è molto di non detto, anche se i computer non sanno nulla, nel senso che una persona fa. Le reti neurali, a quanto pare, può conservare un ricordo di formazione specifica dei dati, che potrebbe aprire a persone i cui dati vengono acquisiti in attività di formazione per violazione della privacy.
Per esempio, Nicola Carlini, ex studente all’università di Berkeley del laboratorio di intelligenza artificiale, ha affrontato il problema di ciò che i computer “memorizzare” sui dati di training, nel lavoro svolto con i colleghi, a Berkeley. (Carlini ora con Google Cervello unità). Nel mese di luglio, in una carta provocatoriamente intitolato “Il Compagno Segreto,” pubblicato su arXiv pre-server di stampa, Carlini e colleghi hanno discusso di come una rete neurale può mantenere le parti specifiche di dati da una collezione di dati, utilizzati per la formazione di rete per generare un testo. Che ha il potenziale per far agenti dannosi miniera di una rete neurale per dati sensibili come numeri di carte di credito e numeri di previdenza sociale.
Inoltre: I dati che i treni AI sempre più chiamate in questione AI
Questi sono esattamente i pezzi di dati, i ricercatori hanno scoperto quando hanno formato un modello di linguaggio che utilizzano i cosiddetti lunga memoria a breve termine, reti neurali, o “LSTMs.”
Il LSTM rete è ciò che è noto come un “generativa” rete neurale, il che significa che è stato progettato per produrre un testo originale che è come la scrittura umana, una volta che è stato inserito con milioni di esempi di scrittura umana. Si tratta di un generatore di falso testo, in altre parole. Dato un input frase di una persona, la rete addestrata produce la scrittura originale in risposta al prompt.
La rete è supposto per fare questo formando frasi originali, cioè basata su un modello di lingua ha compilato, piuttosto che semplicemente ripetere le stringhe di testo a cui è stato esposto.
“In teoria, anche se la formazione dati contenuti rara-ma-informazioni sensibili su alcuni singoli utenti, la rete neurale non memorizzare queste informazioni e non avrebbe mai emettere come un completamento della frase,” scrivere Carlini e colleghi.
Ma, si scopre quelli casuali, insolito stringhe di testo sono ancora lì, da qualche parte, in rete.
“Purtroppo, ci mostrano che l’addestramento di reti neurali possono causare esattamente ciò accada, a meno che grande cura è presa.”
Oltre alla formale carta, Carlini inviato un blog sul lavoro il 13 agosto a Berkeley AI pagina web.
Per testare la loro ipotesi, hanno a spillo la formazione dei dati con un’unica stringa, “il Mio numero di previdenza sociale è 078-05-1120.” Quando poi digitato un prompt in allenato modello, “il Mio numero di previdenza sociale è 078-“, hanno trovato che la rete “restituisce il resto di caratteri da inserire ‘-05 – 1120’.”
Anche: Cattura Di un Falso: Macchina di apprendimento annusa la sua macchina-scritti di propaganda

Vitaly Feldman a Google Cervello unità riflette come la “coda lunga” dei dati le forze di modelli statistici per memorizzare alcuni di formazione individuale esempi, anche se non dovrebbe essere come funziona.
Google Cervello.
Più ulteriormente hanno convalidato i loro risultati utilizzando un set di dati esistente che contiene veri e propri segreti, la raccolta di messaggi di posta elettronica raccolti nell’indagine nella famigerata, non è riuscito società di energia Enron. Una volta che il LSTM di rete è stato addestrato i dati di posta elettronica, hanno usato un algoritmo chiamato albero di ricerca per cercare le parti di un grafo della rete di LSTM. Essi sono stati in grado di estrarre reale carta di credito e numeri di previdenza sociale.
Argomenti Correlati:
Big Data Analytics
La Trasformazione Digitale
CXO
Internet delle Cose
L’innovazione
Enterprise Software