Noll
Singular exempel av AI: s framsteg under de senaste åren är hur datorer kan känna igen något i en bild. Fortfarande, även enkla tester kan visa hur skört sådana förmågor egentligen är.
Det senaste tricket för att spelet systemet kommer artighet av forskare vid Auburn University i Auburn, Ala, och media titan Adobe Systems. I en rapport som släpptes i veckan, de visade att de översta bilden-erkännande neurala nätverk lätt att misslyckas om objekt flyttas eller roteras även av små mängder.
En brand lastbil, till exempel, sett från huvud, kunde vara rätt igen. Men en gång pekade upp i luften, och vände sig om flera gånger, samma brandbil är felaktigt klassificerad av det neurala nätet som en skolbuss eller en fireboat eller en bobb.
Också: Facebook Oculus forskning hantverk konstigt mashup av John Oliver och Stephen Colbert
Medan tidigare studier har visat bilder kan ändras i termer av struktur eller belysning för att lura ett neuralt nät, detta är första gången “pose”, vilket innebär att 3D-orientering i ett objekt, som har manipulerats för att generera bilden prover som kan resa upp nätverket.
Följden är att staten av konst i bild erkännande är “naivt”, och vissa större förståelse för tre-dimensionella strukturer verkar som behövs för att hjälpa dem att bli bättre.
State of the art neurala nätverk så som Google: s Tillkomst är bra på att “klassificera” saker i bilder, de sluta sig, men de är inte riktigt att känna igen objekt i den verkliga innebörden av det uttrycket.
Papper, Slå (med) en Pose: Neurala Nätverk Är Lätt att Luras av Konstiga Poser av Välbekanta Objekt är inlagd på arXiv pre-print-server, och är författad av Michael A. Alcorn, Qi Li, Zhitao Gong, Chengfei Wang Wei-Shinn Ku, och Anh Nguyen av Auburn, och Långa Mai av Adobe. (Adobe också bidragit med finansiellt stöd till arbetet.)
Författarna har också skrivit koden som de använde för att göra det på GitHub.
Också: Google funderar brister av maskininlärning

Forskare vid Auburn begagnad dator utförda objekt bilder för att lura Google är “Inception” – nätverket i misclassifying objekt i bilder, bara genom att rotera objekt med så mycket som 10 grader.
Forskarna har köpt en uppsättning data för 100 tredimensionella dator utförda objekt som är smilier att saker som finns i ImageNet databas som används för att träna neurala nätverk för bildigenkänning. Det innebär att fordon som skolan bussar och brandbilar, och stop-skyltar och bänkar och hundar.
De sedan ändrade de 3D-objekt genom att ändra pitch, yaw och kast av föremål. De använde ett förfarande som kallas “random search” för att hitta poser som kunde lura Google ‘ s state-of-the-art “Starten v. 3” – nätverket. I huvudsak, de var utbildning en uppsättning ekvationer för att få bra på att skapa “ett kontradiktoriskt exempel” på bilderna, typ av skrovlig ett neuralt nätverk mot en annan.
I sina tester, Inception “var fel för den stora majoriteten av prover,” skriver de. “Median procent av korrekt klassificering för alla 30 objekt var bara 3.09 procent.”
Det väsentliga är att Google: s Tillkomst faktiskt inte mis-karakterisera alla bilder av ett objekt — några bilder som genereras av systemet det blev rätt. Men det tenderade att vara mycket smal i vad det fick bli förvirrad av poser som var utanför normen.
“DNN förmåga att känna igen ett objekt (till exempel en brand lastbil) i en bild varierar radikalt som objektet roteras i världen,” skriver de.
Författarna fann bara en liten bit av ändringen kan ha en stor inverkan: en skillnad om du flyttar objektet 8 grader i termer av “beck” och 9.17 i termer av en “roll” i en scen var tillräckligt för att förvirra Starten. Den kontradiktoriska neurala nätet var kan skicka Starten av mot ogräs, tvingar den att felaktigt klassificera saker över 797 olika klasser objekt.
Även: Titta på YouTube-videor en dag kanske låta robotar kopiera människor
Resultatet är att Starten och andra bild-system för erkännande gillar inte riktigt att känna igen objekt, per se. “Sammanfattningsvis vårt arbete visar att state-of-the-art DNNs per – form bild klassificering väl, men är fortfarande långt ifrån sant objekt erkännande,” skriver de. Men även object detection kan luras, de har hittat. Författarna använde sedan sina kontradiktoriska system för att ta på top-of-the-line “Yolo v3” objet system för erkännande. De fann 75,5 procent av bilderna att slå Starten också luras Yolo.
Det är klart neurala nätverk kanske behöver betydande hjälp för att gå framåt. Även när “AlexNet” neurala nätverk var re-utbildade, med den kontradiktoriska bilder som ingår i ImageNet databas, det var fortfarande lurad när du presenteras med nya exempel på ett kontradiktoriskt bilder efter utbildningen.
Också: Google AI-forskare hitta nya, underliga anledning att spela Jeopardy!
Författarna föreslår att en del av problemet kan ha att göra med en viss estetisk i de bilder som finns på Internet som används i utbildning neurala nätverk.
“Eftersom ImageNet och MS COCO datamängder är tillverkad av fotografier tagna av människor, de data som återspeglar den estetiska tendenserna av sina kidnappare,” skriver de.
Författarna föreslår att en lösning är att ladda upp ImageNet med massor av kontradiktoriska exempel. Men de påpekar att “acquring en omfattande, högkvalitativ 3D-objekt dataset är kostsamt och arbetskrävande.”
Ett annat svar som de föreslår är att använda “geometriska före” för att ge neurala nät större finess.
Studien, som de erbjuder, kan vara början på att skapa hela “kontradiktoriska världar” som kunde testa djupt lärande system. Denna typ av arbete skulle kunna fungera som en tolkningsbarhet verktyg för att utvinna värdefulla insikter om dessa black-box-modeller ” inre funktioner.”
Tidigare och relaterade täckning:
Vad är AI? Allt du behöver veta
En verkställande guide till artificiell intelligens, från maskininlärning och allmänna AI att neurala nätverk.
Vad är djupt lärande? Allt du behöver veta
Lowdown på djupt lärande: från hur det förhåller sig till de bredare fält av maskinen lärande genom hur man kommer igång med det.
Vad är lärande? Allt du behöver veta
Denna guide förklarar vad lärande är, hur den är relaterad till artificiell intelligens, hur det fungerar och varför det är viktigt.
Vad är cloud computing? Allt du behöver veta om
En introduktion till cloud computing rätt från grunderna upp till IaaS och PaaS, hybrid, offentliga och privata moln.
Relaterade artiklar:
36 av de bästa filmer om AI, rankedThis är vad AI ser ut (som skissat av AI)AI killer robotar som kommer men FN vill ha dem bannedDigital omvandling i och med 2019: AI, robotik och sakernas internet för att spela huvudrollerna
Relaterade Ämnen:
Digital Omvandling
CXO
Sakernas Internet
Innovation
Affärssystem
0