Nye machine learning algoritme pauser sms-captcha ‘ er nemmere end nogensinde

0
123

Nul

Forskere fra STORBRITANNIEN og Kina har udviklet en ny maskine læring algoritme, der kan bryde tekst-baseret CAPTCHA-systemer med en mindre indsats, hurtigere og med større nøjagtighed, end alle tidligere metoder.

Denne nye algoritme, der er udviklet af forskere fra Lancaster University (UK), Nordvest University (Kina), og Peking University (Kina)- er baseret på konceptet om GAN, som står for “Generativ Kontradiktorisk Netværk.”

GANs er en særlig klasse af kunstig intelligens algoritmer, der er nyttige i situationer, hvor den algoritme, der ikke har adgang til store mængder af data.

At klassificere machine learning algoritmer, der normalt kræver millioner af datapunkter til at træne algoritmen i at udføre en opgave med den ønskede grad af præcision.

En GAN-algoritmen har den fordel, at det kan fungere med et meget mindre parti af de oprindelige data punkter. Dette skyldes, at en GAN anvender en såkaldt “generativ” komponent til at producere lookalike data. Disse “genereret” data punkter er så fed at en “problemløser” algoritme, som forsøger at gætte output.

Da disse to GAN komponenter slog mod hinanden, problemløser bliver bedre, som om det ville have været trænet med millioner af datapunkter.

BRITISKE og Kinesiske akademikere anvendt denne meget samme koncept til at bryde teksten captcha ‘ er, som, i langt de fleste af de tidligere undersøgelser, er kun blevet testet med klassiske machine learning algoritmer trænet med store mængder af oprindelige data punkter.

Forskerne hævdede, at i den virkelige verden, scenario, kan en hacker ikke ville være i stand til at generere millioner af captcha ‘er på en levende hjemmeside eller API’ er uden at blive opdaget og forbudt.

Det er derfor, for deres forskning, og de bruges kun 500 sms-captcha ‘ er fra hver af 11 sms-CAPTCHA tjenester, der findes anvendt på 32 af de Øverste 50 Alexa hjemmesider.

“Det tager op til 2 timer (mindre end 30 minutter for de fleste af ordningen) til at indsamle 500 captcha’ er og mindre end 2 timer til at mærke dem af en bruger,” siger forskere. “Det betyder, at den indsats og omkostninger for at lancere vores angreb på en bestemt captcha-ordningen er lav.”

Listen over data, der er anført i tabellen nedenfor, der indgår sms-captcha ‘ er fra sites som Wikipedia, Microsoft, eBay, Baidu, Google, Alipay, JD, Qihoo360, Sina, Weibo, og Sohu.

text-captchas-tested.png

Billede: Ye et al.

Når de har samlet og trænet deres GAN solvers ved at generere op til 200.000 “syntetisk” captcha ‘er, forskere testet deres algoritmer mod andre sms-captcha’ er systemer, der anvendes på tværs af Internettet, og som tidligere er blevet testet af andre forskere i tidligere akademiske værker.

text-captchas-generated.png

Billede: Ye et al.

“Tabel 4 [se nedenfor] sammenligner vores fine-tuned problemløser til tidligere angreb,” siger forskerne. “I dette eksperiment, er vores tilgang overgår alle sammenlignende ordninger ved at levere en væsentligt højere succesrate.”

Forskere siger, at deres metode var i stand til at løse sms-captcha ‘ er med 100% præcision på websteder som Megaupload, Blizzard, og Authorize.NET. Hertil kommer, at deres metode også opnås en bedre nøjagtighed på helt alle andre CAPTCHA-systemer, der anvendes på andre 30 websteder, de testet -der også omfattede folk som Amazon, Digg, Slashdot, PayPal, Yahoo, og QQ, bare for at nævne et par stykker.

text-captchas-comparissons.png

Billede: Ye et al.

Udover forbedret nøjagtighed, forskere sagde også, at løseren del af GAN-algoritme, udviklede de var også mere effektive og billigere end andre tilgange.

“Det kan løse en captcha inden 0.05 af en anden ved hjælp af en desktop PC,” siger forskerne.

Dette betyder, at angriberne ikke behøver at købe og holde betale for dyre cloud computing servere for at bryde sms-captcha ‘ er i realtid på hjemmesider.

Når en hacker har trænet en sms-CAPTCHA algoritme, de kan køre det på en almindelig PC eller web server, og iværksætte en koordineret DDoS-eller spam-udstationering-angreb på hjemmesider, hvor der CAPTCHA service er i brug.

Fordi algoritmen er også let at træne, selv hvis de støder på en aldrig-før-set sms-CAPTCHA, de kan træne deres algoritme til at beskæftige sig med, at så godt.

“Det er skræmmende, fordi det betyder, at dette først og sikkerhed, forsvar af mange hjemmesider er ikke længere pålidelige,” sagde Dr. Wang Zheng, Lektor ved Lancaster University ‘ s School of Design og Kommunikation og medforfatter af forskning.

Zheng og hans team anbefaler, at hjemmeside ejere gennemføre alternative bot-detection foranstaltninger, der anvender flere lag af sikkerhed, såsom en brugeres forbrugsmønstre, placering af enheden, eller biometriske data.

Tidligere i år lancerede Google en sådan service, version 3 af reCAPTCHA værktøj, som Google sagde, at det påberåbte machine learning algoritmer til at skelne bots fra de faktiske brugere.

Flere detaljer om forskernes arbejde kan findes i et arbejdspapir med titlen “Endnu en Sms-Captcha Problemløser: En Generativ Kontradiktorisk Netværk, der er Baseret Tilgang.”

Mere sikkerhed dækning:

Facebook bug er udsat private fotos af 6,8 millioner brugereSQLite fejl virkninger tusindvis af apps, herunder alle Chrom-baserede browsereLogitech app sikkerhedshul tilladt tastetryk injektion angrebAMERIKANSKE ballistiske missil-systemer har en meget dårlig it-sikkerhedBing anbefaler piratkopiering tutorial, når du søger efter Office 2019Twitter afslører mistanke om statsstøttet angreb Microsoft ‘ s Edge til morph i en Chrom-baseret browser TechRepublicMicrosofts genopbygget Kant kan komme til Xbox, En CNET

Relaterede Emner:

Kunstig Intelligens

Sikkerhed-TV

Data Management

CXO

Datacentre

0