Nul
Forskere på Facebook tilbudt en sammenfatning af et system, de kalder “Rosetta”, en maskine tilgang til læring, der øger traditionel optisk tegngenkendelse eller “OCR,” at mine hundredvis af millioner af billeder uploades til Facebook hver dag.
Sige, at du ønsker at søge efter memer i billeder på Facebook: site ‘ s udfordring er at registrere, om der er bogstaver trykt i et billede, og derefter analysere disse bogstaver til at vide, hvad en sætning siger.
Også: Facebook utilsigtet udsætter 14 millioner brugeres private indlæg
Denne teknologi har naturligvis været i brug til dokumenthåndtering til aldre, men udfordringen på Facebook var både at genkende tekst i et antal af komplekse billeder, herunder tekst, lagt over billedet, som i en internet meme eller en tekst som et tegn på, at der var en del af det oprindelige billede, og derefter at gøre det arbejde på omfanget af webstedet er konstant strøm af billeder.
Facebook forskere Fedor Borisyuk, Albert Gordo, og Viswanath Sivakumar delt arbejdet på Rosetta på Opdagelse af ny Viden og Data Mining-konference i London i slutningen af August, i et formelt papir, og i dag, to af de forfattere, Gordo og Sivakumar, sammen med Facebook ‘ s Manohar Paluri, tilbudt en noget enklere blog-indlæg, der beskriver arbejdet.

Facebook opdele opgaven med at “udvinde” tekst fra et billede i to forskellige spørgsmål, som i første afsløre, om der er tekst i et billede, og derefter til fortolkning af, hvad dette ord af en sætning kan være.
Også: Hvis Facebook arbejdede vi ville ikke være i dette rod
For første opgave, afsløring, forfatterne har brugt en convolutional neurale netværk (CNN) kaldet “Hurtigere R-CNN”, som selv stammer fra arbejde udført oprindeligt af Facebook ‘ s Ross Girshick, når han var hos Microsoft. Mens CNNs har været brugt ganske lidt i det sidste årti for billede anerkendelse opgaver, såsom ImageNet, R-CNN tilføjer begrebet “regioner” som en måde til hurtigt at udvælge objekter i et billede og sige, hvor er det præcist i det billede, objektet er placeret.
Facebook har allerede i vid udstrækning indsat et objekt-anerkendelse-system i hele sin infrastruktur kaldet “Detectron,” og at have det i stedet klart hjulpet i dette tilfælde.
Når teksten er placeret i et billede, koordinaterne for, at billedet er gået til en anden CNN til at skelne ord eller en sætning, tegn for tegn. Produktet af dette andet trin er sekvenser af tegn, der gør ord og udtryk op.
Også: Facebook ‘ s nye Rosetta AI-system hjælper med at registrere hate speech CNET
Fordi genkendelse af lange ord og lange sætninger kan være særligt udfordrende, forfatterne beskriver ved hjælp af, hvad der kaldes en “læseplan” tilgang til det at træne character recognition system. De startede ud ved at træne systemet små ord af fem tegn eller mindre, og gradvis øget længde af ord med efterfølgende iterationer af uddannelsen.
Al den træning, som arbejder for både den opdagelse del og anerkendelse del blev udført ved hjælp af “Caffe2” rammer.
Forfatterne bruger en betydelig mængde tid i den oprindelige artikel, der beskriver, hvordan de tuned system for optimal hastighed for “inferens” når et nyt foto er kiggede på og det skal være hurtigt søgte tekst og transskriberet. “Da vores skala og gennemløb krav, vi har brugt [a] betydelig mængde af tid på at forbedre udførelse hastighed af sms-registrerings-model og samtidig holde afsløring nøjagtighed høj,” skriver de.
Også: Sådan beskytter du dig på Facebook TechRepublic
Rosetta systemet er i øjeblikket i drift i Facebook ‘ s netværk, der bruges dagligt, skriver forfatterne. Forfatterne giver, at fremtidige udfordringer vil inkludere at trække teksten ud af video applikationer.
Tidligere og relaterede dækning:
Bør Mark Zuckerberg blive fyret? Sikkerhed fagfolk har deres at sige
Gør Cambridge Analytics skandale — og alle de andre Facebook privatlivets fred snafus — garanterer fjernelse af sin administrerende DIREKTØR? En undersøgelse af sikkerhed fagfolk giver deres opfattelse.
Facebook afslører nyt skjult bestræbelser på at svaje 2018 midtvejsvalget
Det sociale netværk er ikke at sige, hvem der står bag kampagnen, der konstaterer, at det ikke har den tekniske dokumentation på dette tidspunkt, for at kunne pege fingre.
Facebook ‘s” war room’ jagter og ødelægger valg at blande sig, falske nyheder
Det fysiske rum vil få til opgave at beskytte netværket mod lumske forsøg på at manipulere med OS midtvejsvalget.
Relaterede Emner:
Sociale Virksomhed
Digital Transformation
CXO
Tingenes Internet
Innovation
Virksomhedens Software
0