Ny maskin lärande algoritm bryter sms: a CAPTCHAs enklare än någonsin

0
119

Noll

Akademiker från STORBRITANNIEN och Kina har utvecklat en ny maskin lärande algoritm som kan bryta text-baserade CAPTCHA-system med mindre ansträngning, snabbare och med högre noggrannhet än alla tidigare metoder.

Denna nya algoritm som utvecklats av forskare från Lancaster University (STORBRITANNIEN), Northwest University (Kina), och Peking University (Kina)- är baserat på konceptet av GAN, som står för “Generativ Kontradiktoriska Nätverk.”

GANs är en speciell klass av artificiell intelligens algoritmer som är användbara i situationer där den algoritm som inte har tillgång till stora mängder data utbildning.

Att klassa maskinlärande algoritmer kräver oftast miljontals data punkter för att träna algoritmen på att utföra en uppgift med önskad grad av noggrannhet.

En GAN algoritm har den fördelen att det kan fungera med ett mycket mindre parti av ursprungliga data poäng. Detta beror på att en GAN använder en så kallad “generativ” komponent för att producera lookalike data. Dessa “genereras” data punkter för att sedan matas till en “solver” – algoritm som försöker att gissa utgången.

Eftersom dessa två GAN-komponenter är de lägrade sig mot varandra, desto lösare blir bättre, som om det skulle ha tränat med miljontals data poäng.

BRITTISKA och Kinesiska akademiker tillämpas detta mycket samma begrepp för att bryta text CAPTCHAs, som i de allra flesta tidigare studier har endast testats med klassiska maskinlärande algoritmer tränade med stora mängder av ursprungliga data poäng.

Forskarna menade att i en verklig situation, en angripare skulle inte kunna generera miljontals CAPTCHAs på en levande hemsida eller API utan att bli upptäckt och förbjudna.

Det är därför, för sin forskning, de används endast 500 sms: a CAPTCHAs från var och en av 11 sms: a CAPTCHA-tjänster som finns används på 32 av de 50 Alexa webbplatser.

“Det tar upp till 2 timmar (mindre än 30 minuter för de flesta av systemet) för att samla in 500 captchas och mindre än 2 timmar för att märka dem av en användare,” sade forskarna. “Detta innebär att insatser och kostnader för lanseringen av vår attack på en viss captcha-system är låg.”

Listan av utbildning uppgifter, som anges i tabellen nedan, som ingår sms: a CAPTCHAs från sajter som Wikipedia, Microsoft, eBay, Baidu, Google, Alipay, JD, Qihoo360, Sina Weibo, och Sohu.

text-captchas-tested.png

Bild: Ye et al.

När de har samlat in och utbildat sina GAN lösare genom att generera upp till 200,000 “syntetiska” CAPTCHAs, forskare testade sina algoritmer mot andra sms: a Captcha-system som används över Internet, och som hade tidigare testats av andra forskare tidigare akademiska verk.

text-captchas-generated.png

Bild: Ye et al.

“Tabell 4 [se nedan] jämför våra finjusteras problemlösaren för tidigare attacker,” forskarna säger. “I detta experiment, vår strategi överträffar alla jämförande system genom att leverera en betydligt högre svarsfrekvens.”

Forskarna sade att deras metod var att kunna lösa sms: a CAPTCHAs med en 100-procentig noggrannhet på webbplatser som Megaupload, Snöstorm, och Authorize.NET. Dessutom, deras metod uppnås också en bättre noggrannhet på absolut alla andra CAPTCHA-system som används på den andra 30 platser de testade som ingår gillar Amazon, Digg, Slashdot, PayPal, Yahoo, och QQ, bara för att nämna några.

text-captchas-comparissons.png

Bild: Ye et al.

Förutom förbättrad noggrannhet, forskarna sade också att den lösare del av GAN algoritm de utvecklat var också effektivare och billigare än andra metoder.

“It kan lösa en captcha inom 0.05 av en sekund med hjälp av en stationär PC,” forskarna säger.

Detta innebär att angriparna inte behöver köpa och fortsätta att betala för dyra cloud computing-servrar, i syfte att bryta sms: a CAPTCHAs i realtid på webbplatser.

När angriparen har tränat en text CAPTCHA algoritm, de kan köras på en vanlig PC eller en web-server, och för att inleda samordnade DDoS-eller spam-inlägg attacker på webbplatser där som CAPTCHA tjänsten är i bruk.

Eftersom algoritmen är också lätt att träna, även om de stöter på en aldrig-före-sett sms: a CAPTCHA, de kan träna sin algoritm för att ta itu med det också.

“Detta är skrämmande, eftersom det innebär att denna första säkerhet försvar av många webbplatser är inte längre tillförlitlig,” sade Dr. Zheng Wang, Universitetslektor vid Lancaster University ‘ s School of Design och Kommunikation och co-författare av forskning.

Zheng och hans team rekommenderar att webbplatsägare genomföra alternativa bot-detektionsmetoder som använder flera lager av säkerhet, såsom en användares användning mönster, plats för enheten, eller biometriska uppgifter.

Tidigare i år lanserade Google en sådan tjänst, version 3 av reCAPTCHA verktyg som Google säger att den förlitade sig på maskinlärande algoritmer för att urskilja robotar från faktiska användare.

Mer information om forskarnas arbete kan hittas i en uppsats med titeln “Ännu en Text Captcha Lösare: En Generativ Kontradiktoriska Nätverk Synsätt.”

Mer trygghet:

Facebook bugg exponeras privata bilder på 6,8 miljoner användareSQLite-bugg påverkan tusentals appar, inklusive alla Krom-baserade webbläsareLogitech app säkerhetsbrist tillåtna tangenttryckning injektion attackerOSS ballistiska missilsystem har mycket dåliga it-säkerhetBing rekommenderar piratkopiering handledning när du söker efter Kontor 2019Twitter avslöjar misstänks statligt stödda angrepp Microsoft ‘ s Edge för att förvandlas till en Krom-baserad webbläsare TechRepublicMicrosofts ombyggda Kanten kan komma till Xbox CNET

Relaterade Ämnen:

Artificiell Intelligens

Säkerhet-TV

Hantering Av Data

CXO

Datacenter

0