Hoe ‘machine learning’ op de online retail fraude

0
179

0

finding-the-credit-card-604cs052313.jpg
Alamy

Amazon Prime Dag (APD) was een groot succes, zeggen ze. Op een schatting 60 procent stijging van de omzet in 2016 en bijna $2 miljard aan inkomsten, is het moeilijk anders te debatteren.

Als u wilt praten getallen hoewel, laten we dit overwegen. Wat zou je zeggen als je wordt verteld dat Amazon zou kunnen verliezen bijna 5 procent van die inkomsten, of $100 miljoen, als gevolg van fraude?

Dat is een hoop geld. En het is niet alleen Amazone op haar eerste Dag, het is elke online retailer die is blootgesteld aan online fraude elke dag.

Retail kenmerken zoals APD of Kerst erger maken. Wat kan er gedaan worden om dit te voorkomen? Machine learning (ML) te redden. ZDNet sprak met de preventie van fraude startups Fraugster en Riskified om hun inzichten.

De anatomie van fraude

Volgens de industrie blog Retail-Minded, er zijn twee belangrijke types van fraude — terugvordering van fraude en kaart-testen van fraude. Terugvordering van fraude gaat om aankopen die gemeld zijn nooit geleverd en vervolgens opgeladen terug naar de merchant door de credit card maatschappij.

Kaart testen fraude gebeurt er als dieven met een lijst van de gestolen card nummers in wezen “het spelen van de slots” door te proberen aankoop na aankoop van een online winkel met verschillende nummers totdat ze een kaartnummer, dat is gelukt. Vervolgens hebben ze dit nummer gebruiken om frauduleuze aankopen bij andere winkels.

Het neemt zowel expertise en middelen te kunnen identificeren fraude. Giganten als Amazon kunnen gaan met deze in-huis, maar de meeste winkeliers zijn niet. En in ieder geval, dit is niet iets wat retailers zouden willen besteden van de middelen op.

Volgens een 2016 rapport, de gemiddelde jaarlijkse financiële baten en lasten toegerekend aan de fraude voor de detailhandel was 7,6 procent van de jaarlijkse omzet via alle kanalen, met inbegrip van online en offline verkoop. Zeven procent van dat te wijten is aan terugvorderingen; 74 procent is voor fraude management software, hardware en werknemers; en 19 procent komt van valse positieven — transacties ten onrechte afgewezen als fraude.

En dat is op een business-as-usual dag. Op AMD, cliënten die op Amazon hebben naar verluidt gezien een stijging van 150 procent in pogingen tot fraude. Het doen van de wiskunde voor terugvorderingen en valse positieven komen we bij de 5 procent/$100 miljoen cijfers.

Natuurlijk, de stomp van de detailhandelaar besteden toegeschreven aan fraude gaat om fraude management software, hardware en medewerkers. Goed besteed geld, zo ver als winkeliers zijn bezorgd waarschijnlijk, want ze zijn middelen die nodig zijn om het minimaliseren van de impact van de fraude.

Dit is een sector met een aanzienlijke middelen te besteden en de motivatie om dit te doen, te produceren en te zitten op de ladingen van de gegevens. Net als elke andere domein met deze kenmerken, het lijkt rijp voor automatisering door middel van ML. Hier is hoe Fraugster en Riskified aanpak.

Geen false positives, we zijn positief

Riskified fraude is een oplossing voor het beheer van enterprise online retailers, mede-opgericht door Eido Gal en Assaf Feldman in 2012. Assaf is een MIT afgestudeerde met 15 jaar ervaring in het ontwikkelen van machine learning algoritmen, en Gal had gewerkt aan het risico en de identiteit van oplossingen op de verschillende start-ups, met inbegrip van Fraude Wetenschappen, die werd gekocht door PayPal.

Gal zegt dat ze zich realiseerden dat er een gat in de manier waarop de e-commerce industrie beheersbaar risico: “terwijl de meeste retailers waren te vertrouwen op oplossingen van derden voor sommige delen van hun online activiteiten, zoals het verwerken van betalingen en aanmaken van je website, elke handelaar probeerde te beheren fraude in huis. Fraude-preventie-instrumenten beschikbaar in de markt tegen die tijd over het algemeen voorzien retailers met een risico score per transactie, en de detailhandelaar ‘ s in-house fraude team belast met het beslissen of u deze wilt accepteren of weigeren de orde.”

Gal opgemerkt dat het scoren van tools gemarkeerd enig statistisch riskante transactie, en fraude teams waren gericht op het voorkomen van verliezen.

Deze combinatie betekende dat retailers uiteindelijk weg te draaien vele legitieme klanten als gevolg van een vermoeden van fraude, en het verliezen van aanzienlijke inkomsten. Riskified ‘ s visie was aan het uitbesteden van de opsporing van fraude experts, waardoor retailers richten op de groei van de omzet en het verbeteren van de customer service.

Het bedrijf bouwde een ML gebaseerd fraude detectie systeem, en paste een business model zeggen ze zorgt voor hun doelen in lijn met de detailhandel: het stimuleren van de verkoop aan goede klanten, terwijl het vermijden van fraude. In plaats van het verstrekken van een risico score en het opladen van een vaste vergoeding voor elke transactie, Riskified biedt retailers de mogelijkheid tot het goedkeuren of afwijzen van de transactie.

riskified-dashboard.jpg

Riskified in eerste instantie zijn gespecialiseerd in het identificeren van valse positieven, maar heeft uitgebreid tot andere fraude scenario ‘ s. Afbeelding: Riskified

Riskified alleen een vergoeding voor de goedgekeurde bestellingen worden gedekt door een terugvordering garantie in het geval van fraude. Gal zegt dat dit aanzet tot Riskified goed te keuren veel goede transacties mogelijk, terwijl de terugvordering garantie wordt verstaan dat er op fraude aansprakelijkheid voor elke order die het goedkeurt, waarvoor het bedrijf om nauwkeurig te bepalen van pogingen tot fraude.

Om dit te laten werken, Riskified de algoritmen moeten worden minder kieskeurig over wat ze goed te keuren, of meer smart. Gal zegt dat in de legacy-systemen, elk data-element krijgt een score, welke hebben bijgedragen aan het totale risico score van de transacties.

Bijvoorbeeld om de verzending naar een re-shipper of een geplaatst via een proxy server zal worden “gestraft” als deze potentiële indicatoren van frauduleuze activiteiten.

“Riskified de ML-modellen zijn veel complexer, rekening houdend met veel meer gegevens punten te ontdekken het kader van de opdracht. In dit voorbeeld, dankzij de automatische data-verrijking, onze systemen zijn een indicatie dat terwijl de bestelling wordt de verzending naar een AMERIKAANSE re-shipper, de item ‘ s laatste bestemming in China.

Wij weten dat, statistisch gezien, het is gemeenschappelijk voor de consumenten uit China om gebruik te maken van proxy-servers bij het online winkelen, en dat om te voorkomen dat hoge verzendkosten, veel goede Chinese shoppers gebruik van re-shipping services. Dit inzicht is opgenomen als een functie die in onze algoritmen.

Maar onze ML-modellen overwegen veel extra data punten, zoals de shopper online gedrag, hun digitale voetafdruk, en hun transacties uit het verleden met een andere handelaar Riskified de oplossing. Alleen na afweging van alle relevante gegevens, de modellen komen tot een besluit tot het goedkeuren of afwijzen van de transactie.

Toen we voor het eerst gelanceerd Riskified, onze gehele service is het identificeren van goede orders die retailers gepland aan het dalen. We hebben sinds de uitbreiding van ons aanbod, en vandaag de dag de meeste retailers gebruiken Riskified voor hun gehele online volume.”

Kijk, mam, er zijn geen regels

Fraugster, een duits-Israëlische veiligheid van de betaling onderneming, opgericht in 2014, heeft zijn eigen aanpak hier. Fraugster werd opgericht door Max Laemmle en Chen Zamir. Laemmle zegt dat na jaren van werken in de betalingen van de industrie, zij ervaren uit de eerste hand de uitdagingen van fraude voor e-commerce handelaars.

Hij beschrijft hun visie was om het ontwerpen en bouwen van een anti-fraude technologie die kan helpen bij het creëren van een fraude-vrije wereld.” Laemmle zegt dat ze vinden dat alle bestaande anti-fraude oplossingen zijn gebouwd op verouderde technologieën en kon niet omgaan met geavanceerde cyber criminelen:

“De bestaande regel-gebaseerde systemen zoals de klassieke ML oplossingen zijn duur en traag aan te passen aan nieuwe fraude patronen in real-time, dus onnauwkeurig. Ons team van intelligentie en betaling deskundigen bracht de laatste jaren is het ontwerpen van onze eigen technologie van de grond af. Het resultaat is een geavanceerde kunstmatige intelligentie (AI), een technologie die niet alleen te elimineren betaling van fraude, maar ook de omzet te maximaliseren door het verminderen van valse positieven.”

Laemmle verklaart hun aanpak als volgt:

“Het vertalen van de intuïtie van de regels of processen is gelijk aan een mens, dicteren van een machine is hoe om te redeneren. Dit vereist veel handwerk. Wat onze motor doet is gebruik ML technieken die niet vervangen deze dingen, maar als vervanger van de menselijke intuïtie deel met die we reden.

Het eindresultaat is een deterministisch nauwkeurig systeem, opgeleid, niet door een mens, maar door een machine. Onze motor vereist een rijke woordenschat en het vermogen tot een gelijkspel in deze afzonderlijke woorden in zinnen en alinea ‘ s dat het vertellen van een verhaal. We willen in de uitbreiding van de woordenschat en het verder opleiden van de motor kiezen van de juiste woordenschat om te vertellen van het juiste verhaal.”

c5mbyzouyaaqtv8.jpg

Laemmle meldt dat hun klanten die op Amazon zag een stijging van 150 procent in pogingen tot fraude op AMD.

“Dit zijn de momenten wanneer het makkelijker is om fraude te geven door middel van een handmatige review systeem of klassieke ML-systeem door meer transacties en minder middelen.

Niet vanwege het gebrek aan nauwkeurigheid, vanwege het ontbreken van de schaalbaarheid en de nodige snelheid aan te passen aan nieuwe fraudpatterns. Een cybercrimineel praat over het algemeen niet de zorg over de verkoop (ze zijn van plan op het verkrijgen van het item gratis anyways), maar tijdens de tijd dat ze doorlopen een minder negatieve zekerheid.

Want er zijn meer transacties en het is moeilijk voor handmatige beoordelingen te houden en twee, een item dat is op de verkoop zou kunnen gaan door middel van een systeem dat is bedoeld om te kijken naar lager geprijsde items, denk regel-gebaseerde systemen. Onze technologie is super schaalbaar en self-learning dus het kunnen identificeren van nieuwe fraude patronen zoals ze naar voren komen in real-time.

Alle ML-spelers om te bouwen van wegen want ze kunnen het niet verwerken van gegevens in real-time. Dit betekent dat ze pre-segmentize de gegevens, enz. Hun oplossingen zijn niet volledig geautomatiseerd / wrijvingsloos. Fraugster is niet met de menselijke analisten, regels, of modellen. Onze motor werkt volledig autonoom, zonder bij te dragen wrijving in het check-out proces.”

Let op de zwarte doos

Elk bedrijf heeft zijn eigen aanpak en sterke punten, maar het punt hier is niet te vergelijken. Het punt is dat deze zijn een aantal van de meest invloedrijke toepassingen van real-life big data innovatie. Applicaties als deze, zelfs bij het werken in de stealth-zo ver als de meesten van ons zijn betrokken, de grenzen verleggen op een aantal niveaus.

Even belangrijk voor het technische aspect zijn de aspecten transparantie en compliance. Assaf in detail:

“Tijdens de recente EU-wet die organisaties die afhankelijk zijn van ML voor gebruiker invloed op de beslissingen om het volledig uit te leggen de gegevens die resulteerde in dit besluit, transparantie in ML beslissingen is tevens een vereiste. In onze industrie, retailers moeten weten waarom een bepaalde shopper de koop aangemerkt als fraude en vervolgens daalde.

In geval van een ernstige fraude ring aanval die resulteerde in hoge terugvorderingskosten, online handelaren worden aangesproken door de payment gateway/processor — en de noodzaak om uit te leggen waarom deze frauduleuze aankopen werden goedgekeurd door de algoritmen, en wat er is gedaan om ervoor te zorgen dergelijke gevallen correct zijn geïdentificeerd voor de toekomst.

Dit is een blindspot van de tech gemeenschap, en is een belangrijke reden dat veel bedrijven terughoudend zijn bij het benutten ML based tools, die zij beschouwen als “black box” oplossingen. Riskified heeft aanzienlijke middelen geïnvesteerd in het verstrekken van de retailers met transparantie in onze ML beslissingen.

Dit werd bereikt door het vertalen van de instrumenten die gebruikt worden door Riskified gegevens wetenschappers bij het onderzoeken ML besluitvorming in een visualisatie die coherent brengt de logica achter de modellen’ beslissingen.”

Zoals we al eerder is opgemerkt, transparantie en ML benaderingen lijkt op gespannen voet. De eis voor de duidelijkheid niet alleen afkomstig zijn van wettelijke kaders, maar over het algemeen is het afkomstig van zakelijke gebruikers, zoals opgemerkt door vele beoefenaars. Terwijl de verschillende benaderingen voorgesteld te werk om dit probleem op dit moment geen perfecte oplossing lijkt te bestaan.

0