DEUTSCH

Neo4j und die NASA: Beim graph-Datenbank Technologie ist wirklich rocket science

193

Die NASA hat mithilfe von graph-Datenbank Technologie von Neo4j zu helfen, mit Katalogisierung und Sinn macht der Berg von know-how im engineering Daten, die Raumfahrt-Agentur gesammelt hat in den letzten 60 Jahren.

Eine der Möglichkeiten, in denen Neo4j verwendet wurde, ist in der Entwicklung des bis-Aufricht-Mechanismus auf dem Orion-Raumschiff. Dieses wichtige Stück Ausrüstung ist so konzipiert, um sicherzustellen, dass das Handwerk nicht wind auf dem falschen Weg, bis nach dem Spritzen zurück auf die Erde. Aber das Letzte mal ein up-Aufricht-Mechanismus erforderlich war, wurde in der Apollo-programnme und wie genau es funktioniert, war verloren in der NASA-Kenntnisse Berg, vor langer Zeit.

Geben Sie Neo4j, software, extrahieren relevante Informationen aus riesigen Haufen von Daten: die Verwendung der NASA bekam die Informationen, die er benötigt, aus dem Berg in vier Stunden.

Der NASA chief knowledge architect, David Meza sagte, dass ohne die Hilfe hätte es zwei Jahre gedauert. ZDNet Sprach mit ihm, um herauszufinden, was er sonst noch war mit der software für.

ZDNet: Wie kamen Sie das erste mal zu sehen in Neo4j?

Meza: Es war vor einiger Zeit – fast vier Jahre -, als wir die erste Entscheidung getroffen wird. Ich hatte mir bei Neo4j, bevor es hatte sogar seine browser-basierte Benutzeroberfläche – es war mehr ein command line interface.

Ich war schon immer ein fan und Benutzer von Netzwerk-Typ-Visualisierung, mind-mapping und andere Dinge, die zeigen können, verbindungen und Muster.

Wenn stieß ich auf Neo, ich war auf der Suche für eine Anwendung, die konzentrierte sich mehr auf Sie, wie Sie entwickeln könnte eine Datenbank, die selbst konzentriert sich mehr auf ein Diagramm der Beziehung und graph-Eigenschaften. Das hat mich interessiert und ich begann zu spielen, um mit Graphen-Technologie.

Ich habe nicht wirklich tief in Sie, bis wahrscheinlich ein Jahr nach, dass, wenn Sie bekam Ihre erste web-basierte Schnittstelle. Ich fing an, mehr und mehr Arbeit auf, weil es ein wenig einfacher für mich, den Menschen zu zeigen, wie es funktionierte.

Das ist wahrscheinlich, als ich begann, mit Neo4j.

So was hat Sie an?

Die Fähigkeiten, die mir erlaubt, zu schauen viel einfacher, oder, in anderen Worten, eine Menge mehr wie ein Mensch Aussehen kann Beziehungen. In der Lage sein, die Muster zu sehen, um verschiedene Arten von Knoten, die verschiedenen Arten von Gruppierungen.Um zu sehen, wie Sie miteinander verbunden sind und visualisieren Sie alle in einem Bild, denke ich. Und das ohne zu Grunzen und Grunzen durch lange Listen von Dokumenten.

Können Sie uns eine Vorstellung von der Größenordnung der Projekte, die Sie es Taten, für die in Bezug auf die Anzahl der Variablen?

Ja, das war einer der Vorteile von graph-Datenbanken in diesem Fall Neo4j. Es war ziemlich einfach, um Sie mehr und mehr Daten auf der Oberseite des Modells, ohne zu re-strukturieren Sie Ihr schema, was Sie zu tun haben in einen SQL-Typ der relationalen Datenbank. Dies ermöglicht es mir, mein Modell und fügen Sie zu meinem graph-Modell, wie ich sehe, neue Themen oder verbindungen, die entstehen können, innerhalb meiner domain.

Sie habe mit diesem für eine lange Zeit, so dass vermutlich Sie aufgebaut haben, auf das die ganze Zeit?

Langsam. Es hängt davon ab, die domain und wenn ich kann verbinden Sie es wie die Lessons Learned Datenbank. Ich weiterhin mehr Dokumente, aber eines der Dinge, die ich tun, wie ich hinzufügen, mehr Unterricht ist richtig gestellt, Sie in die richtigen Themen.

Ich arbeite jetzt zu versuchen, entwickeln eine Möglichkeit, mehr zu tun, prädiktive Modellierung, so dass ich nicht haben, um re-run [die Datenbank] die ganze Zeit. Ich kann versuchen, vorherzusagen, wo die nächste Gruppe der Unterricht wird fallen und versuchen Sie, fügen Sie mehr Kontinuität. Wenn Sie vertraut sind mit dem Thema Modellierung, jedes mal, wenn Sie ausführen, es, sind Sie gehen, um eine andere Reihe von Themen, basierend auf den Wahrscheinlichkeiten, denn es ist immer auf der Suche nach der Wahrscheinlichkeit, dass ein Wort fallen in das Dokument.

So versuche ich zu finden ein Weg, um ein wenig mehr statisch, in dem Sinne, dass diese Dokumente fallen in dieses Thema und ich bin hinzufügen und weitere Dokumente, und ich will sicher sein, dass Sie Futter richtig.

Dass all das Zeug in Neo4j oder anderen graph-Datenbank ist sehr hilfreich, aber dann habe ich auch mit anderen Gruppen auf die verschiedenen Arten von domains von Publikationen, die aus der Forschung Untersuchungen zum treffen von action items, schaut, wer hat gewesen zugeteilt, auf die Aktionen.

Wir schauen auch auf Dinge wie die häufigsten Wörter, die aus Kommentaren und wie diese ausgerichtet werden, die durch unterschiedliche Gefühle. Das sind alles Dinge, die wir entdecken, aus einer graph-Datenbank-Perspektive.

Wie findest du Neo4j als ein Werkzeug, wenn Sie mit diesen Arten von Projekten? Offensichtlich muss es hilfreich sein, aber ist es flexibel genug für Sie?

Nun, es hängt davon ab, die domain oder das dataset, das ich auf der Suche bin, aber ich arbeite eine Menge an unstrukturierten Daten. Ich finde, dass es im Allgemeinen sehr hilfreich, da die verbindungen, die ich mache. Aber es bezieht sich alles wieder auf, wie ich mir meine Daten, und wie ich versuche, zu extrahieren wissen aus, dass die Daten und ich verwenden ein Konzept, das ich Wissen nennen Architektur.

Dies ist eine Kombination aus Knowledge-Management -, informatik-und Daten-Wissenschaft. Es ist die Konvergenz dieser drei Dinge zusammen, die mir erlaubt, zu extrahieren wissen aus meinen Daten.

Die Knowledge-Management-Stück ist die Strategie – die verschiedenen Arten von Techniken und Methoden, wie ich die speichern, erstellen und identifizieren Sie meine Daten.

Der informatik-Teil ist der Rahmen der Anwendungen, die ich nutzen, um die Daten zu übermitteln, um meine end-Benutzer, in diesem Fall Neo4j.

Die Daten der Wissenschaft ist, wie ich die Gruppe und cluster und der Identifizierung der Dokumente und das wissen von dort.

Im Falle derjenigen, die Lektionen gelernt, die ich anwenden Thema Modellierung. Ich beschäftige mich mit dem Thema Modellierung, dass ich für diese Lektionen, um in der Lage sein, um Benutzern zu helfen finden Sie die Antworten viel schneller. Ich benutze Korrelationsanalyse zeigen Dokumente, dass die waren einander ähnlich und werden in der Lage zu bekommen, dass die Korrelation über verschiedene Themen.

Ich verwende diese drei Dinge zusammen, um diese Informationen zu erhalten, die wiederum ermöglicht es mir, im Fall von Neo4j, um ein bisschen mehr robust, wie ich zu verwalten, zu präsentieren, Informationen zu meiner end-Benutzer.

Ist dieses Wissen der Architektur etwas, das Sie entwickelt sich?

Es ist etwas, das ich gelesen hatte, aber ich habe nie über jemanden, der verwendet diese gleichen drei Dinge. Auf das Wissen der Architektur – wenn Sie eine Suche auf Sie – Sie werden feststellen, einige Dinge, aber die Menschen definieren es anders. Ich habe auf einen gentleman, Tom Reamy, wer Sprach über Wissensmanagement aus dem Bereich des knowledge management und informatik.

Ich mochte das Konzept, aber wie ich war auf der Suche durch Sie, ich merkte, dass etwas fehlte und das war der data science Stück. Ich dachte, wir hatten knowledge management und informatik, aber wir noch nicht haben, eine gute Möglichkeit, das extrahieren, die wissen aus diesen Daten.

Also ich aufgenommen Daten der Wissenschaft in das Modell und auf das Modell in der Lage sein zu erweitern und bauen einen Mechanismus, mit dem jeder-je nachdem, welche Daten Sie haben, zu nutzen, diese Konzepte und die Informationen aus diesen Daten.

Arbeiten Sie mit anderen Personen oder Organisationen auf dieser?

Ich habe mit anderen Organisationen zusammenarbeiten, um die Informationen zu betrachten und die Art der Abbildung aus neuen Techniken und integrieren diese Techniken innerhalb des knowledge architecture framework.

Ich habe mit Menschen gearbeitet, wie das US Census Bureau, die Federal Reserve und wir haben eine Gruppe von Personen hier, die wir nennen die NASA Datanauts – eine Gruppe von nicht-NASA-Personen, die aufgefordert werden, sich diese Gruppe einmal im Jahr für eine Zusammenarbeit zu erkunden NASA Open Data.

Sie sollen kommen mit verschiedenen Techniken, wie können wir erfassen, analysieren, austauschen und visualisieren. Also ich arbeite mit Ihnen, eine Menge zu sehen an verschiedenen Möglichkeiten, Dinge zu tun – mein wissen zu teilen und erhalten einige wissen von Ihnen.

Damit ich mit Ihnen zusammen arbeiten und ich arbeite auch mit und teilen Sie Informationen mit, außerhalb der Gruppen, Elder Research, BASF und Exxon Mobil.

Ich versuche, mich zu teilen Informationen mit Organisationen, und das mache ich, zumindest versuchen, und teilen Sie meine öffentlich zugänglichen Daten.

Ich verstehe, dass Sie mit diesem mit Projekt Orion. Ist das die einzige Zusammenarbeit?

Meine Fraktion unterstützt das gesamte Zentrum hier, im Johnson Space Center und bis zu einem Grad, der NASA und einigen anderen Zentren, so dass jemand, der aus einem der Zentren, können kommen und sich auf die Informationen, die wir haben.

Ein Ingenieur arbeitet an Orion kommen kann und den Blick auf die Lessons Learned Datenbank zusammen mit den Ingenieuren von jedem der anderen Projekte.

Was sind Ihre nächsten Schritte?

Einer meiner Jungs arbeitet an einer Verbesserung der erfahrungsdatenbank hier, um zu versuchen und breitete Sie über die verschiedenen Lessons Learned Datenbanken, die wir haben.

Aus der Spitze von meinem Kopf, ich könnte Namen von 20 bis 30 Datenbanken verteilt auf die verschiedenen Zentren. Ich arbeite mit einigen der anderen Wissens-Büros in der Agentur, um zu versuchen, zu kombinieren, diese in “one shop” – kombinierte Lektionen Gelernt.

Mein Aktuelles großes Projekt ist jetzt zu betrachten, die die Verbreitung von wissen, die Publikationen wurden erstellt durch die Untersuchungen kommt von der International Space Station.

Nun aus diesen Publikationen erhalten Sie nicht nur die Forschung, die wurde zur Verfügung gestellt, aber auch einige materielle Gegenstände, die entwickelt wurden. Dinge wie Patente oder software oder Anwendungen. Ich will sehen, wie die Informationen gestreut über die Wissensgesellschaft und sehen, wie die Auswirkungen nicht nur auf Wissenschaft und Bildung, aber auch der Industrie und Regierung und Politik.

Ich möchte sehen, wie weit, dass Informationen verbreitet werden und diffundiert, damit wir zeigen können, irgendeine Art von Wert, der generiert wird aus der Arbeit auf der Internationalen Raumstation.

Sie machen die Idee der Verbreitung auf die grossen Mengen von Informationen rund um die verschiedenen Einrichtungen Klang einfach, aber ich kann mir vorstellen, dass es sehr Komplex zu tun?

Es kann sein. Du hast Recht, dass das Konzept, das wir versuchen zu tun, ist ziemlich einfach, aber versuchen zu sammeln alle diese Informationen in so vielen verschiedenen Formaten und machen es lesbar und zugänglich nicht nur für den end-Benutzer, sondern die Methodik oder die algorithmen, die wir sind versucht, uns sehr Komplex.

Für einen start, den wir hatten, zu reinigen, alle diese Daten in einer bestimmten Art und Weise für uns, in der Lage zu analysieren und das wahrscheinlich – wie jeder, der nicht jede Art von Daten, die Wissenschaft wird sagen, Sie braucht 60 bis 80 Prozent unserer Zeit.

Ich nehme an, dass ist nicht durch die Tatsache geholfen, dass es manchmal scheint, dass die Hälfte der IT-Industrie konzentriert sich auf die Suche nach neuen Möglichkeiten zu schaffen, unterschiedliche Formate?

Das ist richtig und das ist eines der Dinge, die ich noch zu sprechen-Präsentationen: versuche zu formulieren, eine Art von master-data-management-plan, der Ihnen erlaubt, ähnliche Formate, und dass die Pläne, wie Sie speichern und erstellen Sie die Metadaten, die Sie assoziieren mit, dass die Daten.

Also wenn man das alles in eine Art von format, das leicht zugänglich ist – sei es XML , Json oder andere Weise -so zu extrahieren, dass, es macht es einfacher zu analysieren, die Informationen und bekommen die nuggets der Erkenntnis aus, dass die Daten für die Endnutzer. Aber das braucht nur Zeit.

Glaubst du, bei der NASA, könnten Sie klopfen einige Köpfe, die zusammen auf?

Nun, wir können versuchen. Aber wie jede andere organisation, die sich ausbreiten, es ist nur eine Frage der zeigt den Wert, etwas zu tun, und zeigen, wie können wir Prozesse beschleunigen, indem er diese Art von Informationen in ein lesbares format um und zeigt dann den Wert wieder, wenn wir haben, analysiert.

Sobald Sie beginnen, Ihnen zu zeigen, dass der Wert dann fangen Sie immer an Bord. Das war meine größte überraschung, oder vielleicht nicht überraschen, aber meine Genugtuung, dass ich, als ich zeige Ihnen den Wert der Informationen, die Sie bekommen, dann sind Sie wirklich springen an Bord.

Dann, was denkst du, ist die größte Sache, die Sie haben, von der Verwendung von Neo4j?

Lage zu zeigen, einen anderen Weg, der nicht nur die Speicherung Ihrer Informationen in einer anderen Art von Datenbank, sondern in der Lage zu zeigen, wie einfach es sein kann.

Es ermöglicht die Informationen, die visualisiert werden in einer Weise, die verständlich für den Endbenutzer. Neo4j und einige der neuesten Funktionen können Sie bekommen, dass die Informationen am Ende Verwendung schneller.

Sie müssen sich finden, diesen aufregenden Bereich zu arbeiten?

Das Tue ich, denn es gibt noch eine ganze Menge Möglichkeiten gibt. Es gibt viele verschiedene Arten von domains, es geht nicht nur darum, die Lektionen Gelernt. Es ist nur eine Frage, wie wir bekommen können, zu speichern und zu visualisieren, Informationen in einem anderen Weg, um an all diesen mustern.

Ich hatte ein Mann vor kurzem, der eine sehr bestimmte Domäne innerhalb einige der Forschung, dass tut er sich mit der Gentherapie.

In der Lage sein zu sehen, wo die Anschlüsse sind, wo diese Lücken sind, wer sind die big Player und so weiter. Wir sind mit ihm zu arbeiten, das zu tun, um in der Lage sein, um es zu erweitern in verschiedene Arten der Forschung, verschiedene Methoden, und er sieht den Wert selbst des seins in der Lage, dieses in einem Diagramm.

Es ist einfach spannend zu sehen, neue Leute an Bord kommen und sagen, “Hey, ich denke, das funktioniert wirklich sehr gut in einem Diagramm, was können wir tun?” Dies ist eine neue Weise, zu Experimentieren und neue Möglichkeiten zur Visualisierung der Daten.

Weiter Lesen:

NASA-picks research-teams zu bewältigen Fortschritte in der Drohne, self-driving car tech

NASA-Hybrid-Reality-Labor kombiniert die VR-und die Reale Welt

Graph-Datenbank-Unternehmen Neo4j Karten aus der Zukunft

Der anhaltende Anstieg von graph-Datenbanken