Nul
Het enkelvoud voorbeeld van AI ‘ s vooruitgang in de afgelopen jaren is hoe goed computers kan iets herkennen in een foto. Nog steeds, zelfs eenvoudige tests kan laten zien hoe broos deze vaardigheden echt zijn.
De nieuwste truc om het spel van het systeem is afkomstig van onderzoekers van de Auburn University in Auburn, Ala, en de media titan Adobe Systems. In een artikel deze week vrijgegeven, zij toonde aan dat de bovenste afbeelding-erkenning van neurale netwerken gemakkelijk mislukken als objecten worden verplaatst of gedraaid, zelfs door kleine bedragen.
Een brandweerwagen, bijvoorbeeld, gezien vanaf de kop op, kon worden correct herkend. Maar zodra die omhoog gericht in de lucht, en draaide zich om meerdere keren dezelfde brandweerwagen is verkeerd geclassificeerd door het neurale net als een schoolbus of een fireboat of een bobslee.
Ook op: Facebook Oculus onderzoek ambachten vreemde mashup van John Oliver en Stephen Colbert
Terwijl eerdere studies hebben aangetoond beelden kan worden gewijzigd in termen van textuur of verlichting te gek zijn van een neuraal net, dit is de eerste keer dat de “pose”, wat betekent dat de 3D-oriëntatie van een object, is gemanipuleerd om een beeld genereren monsters die kunnen reis-up van het netwerk.
Het resultaat is dat de stand van de techniek in beeld opname is “naïef” en een beetje meer begrip van de drie-dimensionale structuren lijkt nodig om hen te helpen beter te worden.
State of the art neurale netwerken zoals Google Oprichting van zijn goed in het “classificeren” dingen in foto ‘ s, concluderen ze, maar ze zijn niet echt herkennen van objecten, in de ware zin van die uitdrukking.
Het papier, Staking (met) een Pose: Neurale Netwerken Zijn Gemakkelijk voor de Gek gehouden door Vreemde Poses van Vertrouwde Voorwerpen, geplaatst op de arXiv pre-print-server, en is geschreven door Michael A. Alcorn, Qi Li, Zhitao Gong, Chengfei Wang Wei-Shinn Ku, en Anh Nguyen van Auburn, en Lange Mai van Adobe. (Adobe ook heeft bijgedragen financiële steun voor de moeite.)
De auteurs hebben ook geplaatst de code die ze gebruikt om het te doen op GitHub.
Ook: Google overdenkt de tekortkomingen van machine learning

Onderzoekers in Auburn gebruikte computer-gerenderde object beelden te gek Google ‘ s “Oprichting” netwerk in misclassifying objecten in foto ‘ s, alleen door het draaien van de objecten door zo veel als 10 graden.
De onderzoekers gekocht van een data-set van 100 drie-dimensionale computer-gerenderde objecten die zijn smilier om dingen te vinden in de ImageNet database gebruikt voor het trainen van neurale netwerken voor beeldherkenning. Dat betekent dat voertuigen zoals school bussen en brandweerwagens, en stop borden en bankjes en honden.
Ze vervolgens aangepast die 3D-objecten door het veranderen van de pitch, yaw en roll van de objecten. Ze gebruikt een procedure genaamd “random search” te vinden, stelt dat zou dwaas Google ‘ s state-of-the-art “Begin v. 3” – netwerk. In wezen zijn ze aan het trainen waren een set van vergelijkingen om goed in het genereren van “hoor en wederhoor voorbeelden” van de foto ‘ s, de aard van de putjes een neuraal netwerk tegen een ander.
In hun tests, Oprichting “verkeerd was voor de overgrote meerderheid van de monsters,” schrijven ze. “De mediaan procent van de juiste classificaties voor alle 30-objecten was alleen 3.09 procent.”
Het essentiële punt is dat Google de Oprichting eigenlijk niet mis-te karakteriseren alle beelden van een object — sommige afbeeldingen worden door het systeem gegenereerd kreeg het recht. Maar de neiging om zeer smalle wat het werd, steeds in de war door de poses die buiten de norm.
“De DNN’ s vermogen om te herkennen een object (bijvoorbeeld een brandweerwagen) in een afbeelding verschilt radicaal als het object geroteerd in de wereld”, schrijven ze.
De auteurs vinden maar een klein beetje verandering kan een grote impact hebben: een verschil van het verplaatsen van het object 8 graden in termen van de “pitch” en 9.17 in termen van de “roll” in een scène was genoeg te beschamen Oprichting. Hoor en wederhoor neurale net in staat was om het verzenden van de Aanvang af in het onkruid, waardoor het mis-classificeren dingen over 797 verschillende objectklassen.
Ook: het Bekijken van YouTube video ‘ s kan op een dag laat robots kopie mensen
Het resultaat is dat de Oprichting en andere image recognition systemen zoals niet echt het herkennen van objecten, per se. “Kortom, ons werk toont aan dat de state-of-the-art DNNs per – formulier beeld classificatie goed, maar zijn nog ver van het ware object recognition,” schrijven ze. Maar zelfs object detectie kan worden voor de gek gehouden, vonden ze. De auteurs gebruikten hun beginsel van hoor en wederhoor te nemen op de top-of-the-line “Yolo v3” objet erkenning systeem. Ze vinden 75.5% van de beelden die beat Oprichting ook voor de gek gehouden Yolo.
Het is duidelijk neurale netwerken nodig zou kunnen hebben een aantal belangrijke helpen om vooruit te gaan. Zelfs wanneer het “AlexNet” neurale netwerk werd opnieuw opgeleid, met hoor en wederhoor beelden opgenomen in de ImageNet database, het was nog voor de gek houden wanneer gepresenteerd met nieuwe voorbeelden van hoor en wederhoor beelden na de training.
Ook: Google AI-onderzoekers vinden nieuwe vreemde reden om te spelen Gevaar!
De auteurs suggereren dat sommige van het probleem kan te maken hebben met een bepaalde esthetiek in de beelden op het Internet te vinden die zijn gebruikt bij de opleiding van neurale netwerken.
“Omdat ImageNet en MS COCO datasets zijn opgebouwd uit foto’ s genomen door mensen die de datasets geven de esthetische tendensen van hun ontvoerders,” schrijven ze.
De auteurs suggereren dat het een oplossing is om te laden ImageNet met veel van hoor en wederhoor voorbeelden. Maar zij wijzen erop dat “acquring een grote schaal, hoge kwaliteit 3D-object dataset is kostbaar en arbeidsintensief.”
Een ander antwoord dat zij voorstellen is het gebruik van de “geometrische priors” te geven neurale netwerken een grotere verfijning.
De studie, die zij aanbieden, kan het begin zijn van het maken van hele “hoor en wederhoor werelden” dat zou kunnen testen deep learning systemen. Dat soort werk zou kunnen dienen als een interpreteerbaarheid tool voor het extraheren van bruikbare inzichten over deze black-box modellen’ innerlijke functies.”
Vorige en aanverwante dekking:
Wat is AI? Alles wat je moet weten
Een executive gids voor kunstmatige intelligentie, van machine learning en algemene AI-neurale netwerken.
Wat is diep leren? Alles wat je moet weten
De lowdown op diep leren: van hoe het zich verhoudt tot het bredere veld van machine-leren door te zien hoe aan de slag met het.
Wat is machine learning? Alles wat je moet weten
In deze gids wordt uitgelegd wat ‘machine learning’ is, hoe het is in verband met kunstmatige intelligentie, hoe het werkt en waarom het belangrijk is.
Wat is cloud computing? Alles wat u moet weten over
Een introductie van cloud computing recht vanaf de basis tot IaaS en PaaS -, hybride -, public en private cloud.
Verwante artikelen:
36 van de beste films over AI, rankedThis is wat AI eruit ziet (zoals geschetst door AI)AI robots zijn komst, maar de VN wil dat ze bannedDigital transformatie in 2019: AI, robotica, en IoT te spelen acteurs rollen
Verwante Onderwerpen:
Digitale Transformatie
CXO
Het Internet van Dingen
Innovatie
Enterprise Software
0