Hur neurala nätverk för att se djupet?

0
177

Mänskliga synskärpan är i allmänhet mycket bättre än till och med den högsta upplösningen fotografier, så inte alla dessa funktioner är tillgängliga för DNNs. Till exempel, bilder, särskilt komprimerade sådana, tenderar att smeta fina texturer.

Resultat

I sina experiment, fann forskarna att MonoDepth i första hand använder den vertikala positionen som objekt för att uppskatta deras djup, snarare än deras skenbara storlek. Detta kan påverkas av kamerans position roll – och pitch – och den modell som sedan tenderar att mis-uppskatta avstånd. Dessutom, MonoDepth är opålitlig när de ställs inför föremål som inte var i sin träning inställd.

Lagring ta Bitar

Även om denna studie är begränsad till en enda DNN – MonoDepth – tränade på en enda dataset – KITTI – det pekar på ett behov av att profilera dessa modeller. Med tanke på att vi ska ha tiotals miljoner av machine vision aktiverade fordon cruising runt om i nästa decennium, vi vill inte ha dem slåtter utklädda trick eller treaters bara för att de inte ser ut som de människor som de var utbildade för att se.

Vad denna människa ser är att om vi inte förstår hur DNNs uppnå sina resultat, och vi är skyldiga att upptäcka sina begränsningar i praktiken, snarare än i testerna. Tillräckligt tragedier – tror Boeing 737 Max – kan bromsa den allmänna acceptansen av maskininlärning. Och med tanke på den krympande arbetskraft i den utvecklade världen skulle vara en ännu större tragedi om vi ska hålla vårt växande ekonomier.

Kommentarer välkomna!

Relaterade Ämnen:

Förvaring

Digital Omvandling

CXO

Sakernas Internet

Innovation

Affärssystem