Na beschuldigingen zal Twitter hackers betalen om vooroordelen te vinden in zijn automatische beelduitsnijdingen

0
107

Twitter houdt een wedstrijd in de hoop dat hackers en onderzoekers vooroordelen in het algoritme voor het bijsnijden van afbeeldingen kunnen identificeren – en het gaat geldprijzen uitdelen aan winnende teams (via Engadget). Twitter hoopt dat door teams toegang te geven tot de code en het model voor het bijsnijden van afbeeldingen, ze manieren kunnen vinden waarop het algoritme schadelijk kan zijn (zoals het bijsnijden op een manier die het onderwerp van de afbeelding stereotypeert of wist).

De deelnemers moeten een beschrijving van hun bevindingen indienen en een dataset die door het algoritme kan worden gehaald om het probleem aan te tonen. Twitter zal dan punten toewijzen op basis van wat voor soort schade wordt gevonden, hoeveel het mogelijk mensen kan treffen, en meer.

Het winnende team ontvangt $ 3.500, en er zijn afzonderlijke prijzen van $ 1.000 voor de meest innovatieve en meest generaliseerbare bevindingen. Dat bedrag heeft voor wat opschudding gezorgd op Twitter, waarbij een paar gebruikers zeiden dat het een extra nul zou moeten hebben. Voor de context zou het normale bug bounty-programma van Twitter je $ 2.940 betalen als je een bug vindt waarmee je acties voor iemand anders kunt uitvoeren (zoals het retweeten van een tweet of afbeelding) met behulp van cross-site scripting. Het vinden van een OAuth-probleem waarmee je iemands Twitter-account kunt overnemen, zou je $ 7.700 opleveren.

Met een wedstrijd kan Twitter feedback krijgen vanuit een veel breder scala aan perspectieven

Twitter heeft eerder zijn eigen onderzoek gedaan naar zijn algoritme voor het bijsnijden van afbeeldingen – in mei publiceerde het een paper waarin werd onderzocht hoe het algoritme bevooroordeeld was, na beschuldigingen dat de voorvertoningen van gewassen racistisch waren. Twitter is sindsdien grotendeels afgeschaft met het algoritmisch bijsnijden van voorvertoningen, maar het wordt nog steeds gebruikt op desktops en een goed bijsnijdalgoritme is handig voor een bedrijf als Twitter om te hebben.

Het openen van een wedstrijd laat Twitter feedback krijgen vanuit een veel breder scala aan perspectieven. Het Twitter-team hield bijvoorbeeld een ruimte om de wedstrijd te bespreken waarin een teamlid zei dat hij vragen kreeg over op kaste gebaseerde vooroordelen in het algoritme, iets dat softwareontwikkelaars in Californië misschien niet opmerken.

Twitter zoekt ook naar manieren waarop zijn algoritme kan worden misbruikt

Het is ook niet alleen een onbewuste algoritmische vooringenomenheid waar Twitter naar op zoek is. De rubriek heeft puntwaarden voor zowel opzettelijke als onopzettelijke schade. Twitter definieert onbedoelde schade als oogsten die het gevolg kunnen zijn van een “goedbedoelde” gebruiker die een normale afbeelding op het platform plaatst, terwijl opzettelijke schade problematische bijsnijdgedrag is dat kan worden uitgebuit door iemand die kwaadwillig ontworpen afbeeldingen plaatst.

Twitter zegt in zijn aankondigingsblog dat de competitie los staat van het bug bounty-programma – als je een rapport over algoritmische vooroordelen indient bij Twitter buiten de competitie, zegt het bedrijf dat je rapport zal worden gesloten en gemarkeerd als niet van toepassing . Als je geïnteresseerd bent om mee te doen, kun je naar de HackerOne-pagina van de competitie gaan om de regels, criteria en meer te bekijken. Inzendingen zijn mogelijk tot 6 augustus om 23:59 uur PT en de winnaars van de uitdaging worden op 9 augustus bekendgemaakt in het Def Con AI Village.