Nuova macchina algoritmo di apprendimento interruzioni di testo Captcha più facile che mai

0
149

Zero

Accademici provenienti da regno UNITO e Cina, hanno sviluppato una nuova macchina algoritmo di apprendimento che possono danneggiare il testo-base di sistemi CAPTCHA con meno sforzo, più velocemente e con maggiore precisione rispetto a tutti i metodi precedenti.

Questo nuovo algoritmo sviluppato da scienziati dell’Università di Lancaster (UK), Northwest University (Cina), e Università di Pechino (Cina)- si basa sul concetto di GAN, che sta per “Generativa del Contraddittorio di Rete.”

GANs sono una particolare classe di algoritmi di intelligenza artificiale che sono utili in situazioni in cui l’algoritmo non hanno accesso a grandi quantità di dati di training.

Classificazione algoritmi di apprendimento automatico di solito richiedono milioni di punti di dati per treno algoritmo in esecuzione di un’attività con il grado di precisione.

Un GAN algoritmo ha il vantaggio che si può lavorare con un piccolo lotto iniziale di punti di dati. Questo perché un GAN utilizza un cosiddetto “generativa” componente per la produzione di sosia di dati. Questi “generato” punti dati vengono poi inviati a un “risolutore” algoritmo che cerca di indovinare l’uscita.

Come questi due GAN componenti sono lanciato contro l’altro, il risolutore di meglio, come se fosse stato addestrato con milioni di punti di dati.

Regno UNITO e università Cinesi, applicato questo stesso concetto per la rottura di testo Captcha, che, nella maggior parte dei precedenti studi di ricerca, sono stati testati solo con i classici algoritmi di machine learning si è allenato con grandi quantità di dati iniziali punti.

Ricercatori hanno sostenuto che in uno scenario del mondo reale, un utente malintenzionato non sarebbe in grado di generare milioni di Captcha su un sito o API senza essere scoperto e bannato.

Ecco perché, per la loro ricerca, hanno usato solo 500 di testo Captcha da ognuno di 11 testo CAPTCHA servizi utilizzati su 32 dei 50 Alexa siti web.

“Ci vogliono fino a 2 ore (meno di 30 minuti per la maggior parte del regime), per raccogliere 500 captcha e poco meno di 2 ore, li etichetta da parte di un utente,” ha detto i ricercatori. “Questo significa che lo sforzo e il costo per lanciare un attacco su un particolare captcha schema è basso.”

L’elenco dei dati di training, elencati nella tabella riportata di seguito, inclusi testo Captcha da siti come Wikipedia, Microsoft, eBay, Baidu, Google, Alipay, JD, Qihoo360, Sina, Weibo, e Sohu.

text-captchas-tested.png

Immagine: Ye et al.

Una volta che hai raccolto e addestrato i loro GAN solutori generando fino a 200.000 “sintetico” Captcha, i ricercatori hanno testato i loro algoritmi contro un altro testo Captcha sistemi utilizzati in tutto il Internet, e che aveva provato in precedenza da altri ricercatori in precedenti lavori accademici.

text-captchas-generated.png

Immagine: Ye et al.

“Tabella 4 [vedi sotto] mette a confronto il nostro fine-tuned risolutore di precedenti attacchi,” i ricercatori hanno detto. “In questo esperimento, il nostro approccio supera gli schemi comparativi mediante la consegna di un significativamente più alto tasso di successo.”

I ricercatori hanno detto che il loro metodo è stato in grado di risolvere testo Captcha con una precisione del 100 per cento tasso di su siti come Megaupload, Blizzard, e Authorize.NET. In aggiunta, il loro metodo anche in fatto di precisione, assolutamente tutti gli altri sistemi CAPTCHA utilizzate su altri 30 siti hanno testato-che comprendeva artisti del calibro di Amazon, Digg, Slashdot, PayPal, Yahoo, QQ, solo per citarne alcuni.

text-captchas-comparissons.png

Immagine: Ye et al.

Oltre a migliorare la precisione, i ricercatori hanno anche detto che il risolutore componente del GAN algoritmo che hanno sviluppato è stato anche più efficiente ed economico rispetto a qualsiasi altri approcci.

“Non si può risolvere un captcha all’interno 0,05 di un secondo, utilizzando un PC desktop,” i ricercatori hanno detto.

Questo significa che i pirati non hanno bisogno di acquistare e pagare per costosi cloud computing server per suddividere il testo Captcha in tempo reale su siti web.

Una volta che un utente malintenzionato ha addestrato un testo CAPTCHA algoritmo, che può essere eseguito su un normale PC o server web e il lancio coordinato DDoS o spam-pubblicazione di attacchi a siti web dove CAPTCHA che il servizio è in uso.

Perché l’algoritmo è anche facile da addestrare, anche se incontrano un mai-prima-visto il testo CAPTCHA, possono formare i loro algoritmo per affrontare come bene.

“Questo è spaventoso, perché significa che questa prima protezione la difesa di molti siti web non è più affidabile,” ha detto il Dr. Zheng Wang, Senior Lecturer presso l’Università di Lancaster Scuola di Informatica e Comunicazione e co-autore della ricerca.

Zheng e il suo team raccomanda che i proprietari di siti web implementare alternativa bot-rilevamento misure di utilizzare più livelli di sicurezza, come per esempio un utente’ di utilizzo, posizione periferica, o di dati biometrici.

All’inizio di quest’anno, Google ha lanciato un servizio simile, la versione 3 del reCAPTCHA strumento che Google ha detto è basata su algoritmi di machine learning per discernere bot da utenti reali.

Ulteriori dettagli sui ricercatori di lavoro può essere trovato in un documento di ricerca dal titolo “Ancora un Altro Testo Captcha Risolutore: Generative Contraddittorio Rete Basato su un Approccio”.

Più copertura di sicurezza:

Facebook bug esposto le foto private di 6,8 milioni di utentiSQLite bug impatti migliaia di applicazioni, tra cui tutti Chromium-browser basato suLogitech app falla di sicurezza ha permesso di battitura injectionNOI di missili balistici sistemi sono molto poveri di cyber-sicurezzaBing consiglia di pirateria esercitazione durante la ricerca per l’Ufficio 2019Twitter svela il sospetto statali per l’attacco di Microsoft Bordo di trasformarsi in un browser basato su chrome TechRepublicMicrosoft ricostruito Edge può venire a Xbox One CNET

Argomenti Correlati:

Intelligenza Artificiale

Di sicurezza, TV

La Gestione Dei Dati

CXO

Centri Dati

0