Noll
Forskare på Facebook erbjuds en sammanfattning av ett system de kallar “Rosetta”, en maskin lärande som ökar traditionell optisk teckenigenkänning eller OCR,” att mina hundratals miljoner bilder som laddas upp till Facebook dagligen.
Säg att du vill söka efter memer i bilder på Facebook: webbplats: s utmaning är att upptäcka om det finns bokstäverna tryckta på en bild, och sedan tolka dessa brev, att veta vad en fras säger.
Också: Facebook av misstag utsätter 14 miljoner användare’ eget inlägg
Denna teknik har naturligtvis varit i bruk för dokumenthantering för åldrar, men utmaningen på Facebook var att både känna igen text i varje nummer av komplexa bilder, inklusive text läggs över bilden, som i ett internet-meme eller text som ett tecken på att de var en del av den ursprungliga bilden, och sedan att få det att fungera på omfattningen av sajten som är konstant ström av bilder.
Facebook forskare Fedor Borisyuk, Albert Gordo, och Viswanath Sivakumar gemensamt arbete på Rosetta på Kunskap och Data Mining-konferensen i London i slutet av augusti i en formell papper, och idag, två av författarna, Gordo och Sivakumar, tillsammans med Facebook är Manohar Paluri, erbjuds upp en något enklare blogginlägg som beskriver arbetet.

Facebook dela upp uppgiften att “utvinna” text från en bild i två separata frågor, som i första upptäcka om det är text på alla i en bild, och sedan för att analysera vad det ordet i frasen kan vara.
Dessutom: Om Facebook fungerade skulle vi inte vara i den här röran
För den första uppgiften, upptäckt, författarna använt en convolutional neural network (CNN) kallas för “Snabbare R-CNN,” som själv härstammar från arbete ursprungligen av Facebook ‘ s Ross Girshick när han var på Microsoft. Medan CNNs har använts en hel del under det senaste decenniet för bildigenkänning uppgifter, såsom ImageNet, R-CNN lägger till begreppet “regioner” som ett sätt att snabbt plocka ut objekt i en bild och säga att där, just i den bilden objektet är beläget.
Facebook har redan spridda ett objekt-system för erkännande i hela sin infrastruktur kallas “Detectron,” och med på plats, helt klart hjälpt i detta fall.
När texten är beläget i en bild, de koordinater som bild överförs till en annan CNN att urskilja ord eller en fras, tecken för tecken. Produkten av detta andra steg är sekvenser av tecken gör upp ord och fraser.
Också: Facebook ‘ s nya Rosetta AI-system som hjälper dig att identifiera hatbrott CNET
Eftersom erkänna långa ord eller långa fraser kan vara särskilt utmanande, beskriver författarna att använda vad som kallas en “läroplan” – metoden för att träna teckenigenkänning system. De började med utbildning i systemet på små ord av fem tecken eller mindre, och ökade successivt längden på ord med senare delar av utbildningen.
All träning att fungera för både identifiering och erkännande del utfördes med hjälp av “Caffe2” ram.
Författarna spendera en avsevärd tid i den ursprungliga papper som beskriver hur de ögonen öppna systemet för optimal hastighet för “slutsats:” när ett nytt foto tittat på och har snabbt sökte för text och transkriberats. “Med tanke på vår skala och genomströmning krav, vi tillbringade [en] stor del av tiden förbättra hastighet av text upptäckt modell samtidigt som upptäckt noggrannhet hög”, skriver de.
Dessutom: så skyddar du dig på Facebook TechRepublic
Rosetta system är för närvarande i drift i Facebook nätverk, som används dagligen, skriver författarna. Författarna ger att de framtida utmaningarna kommer att omfatta dra text ur-video program.
Tidigare och relaterade täckning:
Bör Mark Zuckerberg få sparken? Säkerhets-experter har sina säga
Gör Cambridge Analytics skandal — och alla andra Facebook privacy snafus — garanterar avlägsnande av dess VD? En undersökning av security professionals erbjuder deras uppfattning.
Facebook avslöjar nya hemliga ansträngningar att gunga 2018 kongressvalet
Det sociala nätverket är inte att säga vem som ligger bakom kampanjen, att notera att det inte har teknisk bevisning som vid denna tid för att säkert peka finger.
Facebook ‘s” war room ” jagar och förstör valet att lägga sig, falska nyheter
Det fysiska rummet kommer att vara till uppgift att skydda nätverket mot lömska försök att manipulera det AMERIKANSKA kongressvalet.
Relaterade Ämnen:
Socialt Företagande
Digital Omvandling
CXO
Sakernas Internet
Innovation
Affärssystem
0