Facebook pompe di riconoscimento dei caratteri, il mio meme

0
161

Zero

I ricercatori Facebook offerto una sintesi di un sistema che chiamano “Rosetta”, una macchina approccio di apprendimento che potenzia il tradizionale riconoscimento ottico dei caratteri (OCR,” miniera di centinaia di milioni di le foto caricate su Facebook ogni giorno.

Dire che si desidera cercare memi in immagini su Facebook: Il sito di sfida è quello di rilevare se ci sono lettere stampate all’interno di un’immagine, e quindi analizzare quelle lettere per sapere che cosa è una frase che dice.

Anche: Facebook accidentalmente espone 14 milioni di utenti’ post privati

Questa tecnologia ha, ovviamente, è stata in uso per l’elaborazione di documenti per l’età, ma la sfida a Facebook è stato quello di riconoscere il testo in un qualsiasi numero di immagini complesse, tra cui il testo di cui sopra l’immagine, come in un meme di internet o di testo come un segno che è parte dell’immagine originale, e quindi per farlo funzionare alla scala del sito flusso costante di immagini.

Facebook ricercatori Fedor Borisyuk, Albert Gordo, e Viswanath Sivakumar condivisa il lavoro di Rosetta al Knowledge Discovery e Data Mining conferenza a Londra a fine agosto, in un formale di carta, e oggi, due degli autori, Gordo e Sivakumar, insieme con Facebook è Manohar Paluri, offerta un po ‘ più semplice post sul blog descrivendo il lavoro.

facebookrosettatextextraction.png

Facebook suddividere il compito di estrarre il testo da un’immagine in due cose distinte, che di primo rilevare se c’è un testo in un’immagine, e quindi l’analisi di ciò che la parola di una frase potrebbe essere.

Inoltre: Se Facebook ha lavorato non saremmo in questo casino

Per la prima attività, la rilevazione, gli autori hanno utilizzato un convolutional neural network (CNN) chiamato “più Veloce R-CNN”, che a sua volta derivato dal lavoro fatto inizialmente da Facebook è Ross Girshick quando era a Microsoft. Mentre CNNs sono stati utilizzati un po ‘ nell’ultimo decennio per il riconoscimento di immagini compiti, come ImageNet, R-CNN aggiunge la nozione di “regioni” come un modo per rapidamente prendere gli oggetti presenti in un’immagine e dire dove precisamente nell’immagine si trova l’oggetto.

Facebook ha già ampiamente distribuito un oggetto, di un sistema di riconoscimento per tutta la sua infrastruttura denominata “Detectron,” e visto che in luogo chiaramente aiutato in questo caso.

Una volta che il testo è situato in un’immagine, le coordinate dell’immagine sono passati ad un altro CNN discernere la parola o la frase, carattere per carattere. Il prodotto di questa seconda fase sono sequenze di caratteri che compongono le parole e le frasi.

Anche: Facebook nuova Rosetta AI sistema consente di rilevare odio CNET

Perché riconoscere lunghi parole o frasi lunghe può essere particolarmente difficile, gli autori descrivono utilizzando quello che viene chiamato un “curriculum” approccio per addestrare il sistema di riconoscimento dei caratteri. Si inizia con la formazione del sistema di piccole parole di cinque caratteri o meno, e si è progressivamente aumentato la lunghezza delle parole con le iterazioni successive di formazione.

Tutto il lavoro di formazione sia per la parte rilevazione e il riconoscimento di parte sono state eseguite utilizzando il “Caffe2” quadro.

Gli autori di trascorrere una notevole quantità di tempo in originale documento che descrive come hanno messo a punto il sistema per la velocità ottimale per “inferenza”, quando una nuova foto è guardato e si è rapidamente il testo cercato e trascritto. “Data la nostra scala e i requisiti di produttività, abbiamo trascorso [a] notevole quantità di tempo per migliorare la velocità di esecuzione del testo di rilevamento modello, mantenendo la precisione di rilevamento alta,” scrivono.

Anche: Come proteggere te stesso su Facebook TechRepublic

La Rosetta sistema è attualmente operativo in Facebook di rete, utilizzato quotidianamente, scrivono gli autori. Gli autori offrono che le sfide del futuro includerà tirando testo di applicazioni video.

Precedente e relativa copertura:

Dovrebbe Mark Zuckerberg essere licenziato? I professionisti della sicurezza dire la loro

Il Cambridge Analytics scandalo — e tutti gli altri Facebook privacy snafus — garantisce la rimozione del direttore generale? Un sondaggio di professionisti della sicurezza che offre il loro punto di vista.

Facebook svela la nuova covert sforzi per influenzare il 2018 elezioni di medio termine

Il social network non dice chi c’è dietro la campagna, notando che non ha le prove tecniche, in questo momento, con fiducia a punto un dito.

Facebook “war room” caccia e distrugge elezione ingerenza, di false notizie

Lo spazio fisico sarà affidato il compito di proteggere la rete contro insidiosi tentativi di manomissione con gli USA, elezioni di medio termine.

Argomenti Correlati:

Impresa Sociale

La Trasformazione Digitale

CXO

Internet delle Cose

L’innovazione

Enterprise Software

0