Google les techniques de langage aider O2 République tchèque révéler réseau secrets

0
180

Tchèque VR cabinet apporte des sports bootcamp pour les masses
Parmi les VR solistes au ces 2018, cette entreprise apporte des avancées de la formation sportive à la portée des masses.

O2 République tchèque a démontré que Word2vec, un réseau neuronal technique développée pour comprendre les langues humaines, et peut interpréter les premières cellules de la tour de données, améliorant ainsi les performances du réseau.

Elle cherche également à développer la technique pour découvrir les tendances de la clientèle de la géolocalisation.

L’indépendant fournisseur de réseau, qui délivre des permis pour l’O2 de la marque, est le développement de Word2vec pour surmonter le problème de désordre, le manque de fiabilité des données résultant de cartes SIM, la connexion à la base pour le réseau de stations d’émetteur-récepteur, explique Jan Romportl, O2 République tchèque de données en chef scientifique.

“Quelqu’un qui me parle de l’extérieur de l’industrie pense que nous avons de bonnes données de géolocalisation sur l’ensemble de nos clients. Quand les gens apprennent la vérité, ils deviennent très déçu,” dit-il ZDNet.

VOIR: IL pro guide de l’évolution et de l’impact de 5G de technologie (PDF gratuit)

Le problème est que le réseau de stations de base n’ont jamais été conçus pour fournir des données de localisation. Leurs connexions aux périphériques individuels peuvent apparaître tout à fait aléatoire, et de nombreux transferts entre les cellules ne sont pas enregistrés.

Une route connue, comme un voyage en train, semble sautent de manière imprévisible, entre les stations de base, selon les données enregistrées, il est très difficile de déterminer l’emplacement de cette source seulement. Les données GPS, quant à lui, est uniquement disponible pour le téléphone de système d’exploitation fournisseurs et des apps avec les clients qui ont accepté de partager les données.

L’O2 République tchèque de données de l’équipe scientifique a voulu utiliser les fiches de contact entre les cartes SIM et les stations de base de segmenter ses clients en fonction de leurs modes de mouvement, mais il voulait aussi utiliser les données pour améliorer les performances du réseau.

Après avoir lutté en vain à ces problèmes, l’équipe s’est tournée vers Word2vec, développé par des chercheurs dirigée par Tomáš Mikolov à Google, pour savoir si elle pourrait révéler les emplacements des stations de base à partir de matières de réseau de données sans marquage supplémentaire ou d’interprétation.

Word2vec est un groupe de machine-modèles d’apprentissage qui expriment les mots comme des vecteurs, généralement en 100 ou plus de dimensions, basée sur l’analyse d’un corpus de données, telles que le texte de Wikipedia.

Le procédé produit du mot plongements, dont les données scientifiques peuvent manipuler pour créer linguistiquement significative des abstractions. Par exemple, le vecteur de ‘Queen’ est presque égale à “King + Femme – Homme”.

La technique n’est pas normalement utilisé à l’extérieur naturelles de traitement du langage. Mais O2 République tchèque les données de la science de l’équipe pensé qu’il pourrait aider à interpréter le corpus de données qu’il recueille sur les cartes SIM de raccordement de stations de base.

“Nous avons utilisé absolument aucune autre information; simplement le texte de la cellule ID jetons,” Romportl dit.

L’équipe a utilisé Word2vec pour chaque cellule, la création d’un 100-dimensions vecteur pour chacun des 50 000 cell Id. Le problème était alors de réduire le nombre de dimensions pour obtenir une bonne interprétation des données.

Après avoir lu les travaux de recherche publiés en 2018, les données d’un scientifique de l’équipe a proposé un nouvel algorithme appelé Uniforme Collecteur d’Approximation de la Projection et de la Dimension de Réduction (UMAP).

“Nous n’avions aucune idée de la façon dont il a travaillé. Nous avons juste pris les paramètres par défaut nous avons besoin de réduire 100 dimensions de l’espace à un espace 2D et vient de faire le diagramme de dispersion,” Romportl dit.

Rubriques Connexes:

L’UE

Cloud

L’Internet des objets

Sécurité

Les Centres De Données