Reuters construit un algorithme pour le drapeau et vérifier les dernières nouvelles sur Twitter

0
248

Reuters a mis au point un outil capable de détecter automatiquement et de vérifier les dernières nouvelles sur Twitter, dans une tentative de faire rapport sur les événements de plus en plus rapidement et avec précision. L’outil de presse Reuters Traceur, a été développé au cours des deux dernières années, mais Reuters seulement rendu public cette semaine, dans des entretiens avec la Columbia Journalism Review et Nieman Lab.

News Traceur analyse des tweets en temps réel, le filtrage du spam et de regroupement similaire tweets en “clusters”, basé sur des mots similaires. L’outil, puis classe les clusters des sujets et de produire de brefs résumés sur chacun d’eux. Les Tweets avec les mots “bombe” ou “explosion”, par exemple, pourraient être regroupées sous une attaque terroriste cluster.

“Reuters essentiellement enseigné son algorithme de penser comme un journaliste.”

L’idée, selon Reg Chua, Reuters comité de direction de l’éditeur de données et de l’innovation, est de vous aider à automatiser le processus de collecte de l’information. “Une grande partie de notre ADN est construit sur la notion d’être les premiers, nous avons donc voulu comprendre comment construire des systèmes qui nous donnerait un avantage sur le suivi de ce genre de choses à la vitesse et à grande échelle,” Chua dit Nieman Lab. “Vous pouvez jeter un millions d’êtres humains à ce genre de choses, mais il ne serait pas de résoudre le problème.”

L’algorithme permet également de vérifier les dernières nouvelles par l’attribution d’une crédibilité score pour chaque cluster, fondé sur une série de facteurs: l’emplacement et l’identité de la personne de twitter, comment le tweet se propage, et si l’information est confirmé ou démenti sur Twitter. Comme Nieman Lab notes, “Reuters essentiellement enseigné son algorithme de penser comme un journaliste.”