NBA-analytics: data pro

0
167

0

6a27ba60-94d6-419a-a142-4d6fff9b78b2-nba11280x720.jpg

Vergessen Moneyball. Wie über die Definition von Metriken für die NBA-Awards? Wie schwer kann das sein? (Bild: NBA)

Die NBA kündigt seine jährliche Auszeichnungen heute. Dies ist eine mit Spannung erwartete Ereignis, dass hat wurde darüber gesprochen und analysiert ausführlich auf Sport-Medien und darüber hinaus. Vorhersagen und Argumente, wer soll nominiert werden und wer gewinnen sollte jede Auszeichnung haben schon fast seit dem Anfang der Saison.

Halten fans engagiert ist gut, aber es gibt weitere Aspekte sind Auszeichnungen wie diese: Sie können geben Sie den Medien etwas zu reden, boost-player und team-Status, und alle können Wetten auf die Ergebnisse.

Als Teil der pop-Kultur, und haben das Potenzial, Pause machen oder Karriere und Vermögen bedeutet, dass es mehr um die NBA-Awards, die das Auge erfüllt. Lassen Sie uns versuchen und einen Blick hinter den Spiegel und verwenden, data science und analytics eine Frage zu beantworten, auf die viele NBA-fans die Köpfe: Wer war der most improved player (MIP) in der NBA diese Saison?

Definieren Sie ‘verbesserte’

Um zu beginnen mit, wer bekommt, um zu definieren, verbessert, und wie? Wie ein NBA-Schriftsteller einst formulierte: “Es gibt wenige Dinge frustrierender, als zu versuchen, um zu bestimmen, was es bedeutet, die MIP”. Auf der anderen Seite, das macht Sie interessant und offen für interpretation. Da die NBA nicht viel sagen über die Kriterien und die Methode der Bewertung, andere haben versucht zu kommen mit Ihren eigenen.

Der traditionelle Weg, NBA-Schriftsteller, dies zu tun ist durch die Montage von einer Jury aus Experten und Sie zu Wiegen. Durchschnittlich Gutachten kann mehr auf der objektiven Seite als nur eine Meinung, aber es noch zählt nicht als Daten-getriebene Forschung in den meisten data-Analysten ” – Bücher.

Adam Fromal von Bleacher Report argumentiert, dass die MIP ist “einige Jahre überreicht ein Spieler, der gepflegt sein Niveau des Spiels (oder sogar leicht zurückgebildet) während der Befüllung eine viel größere Rolle. Andere Zeiten, die Liga-Belohnungen ein Mitglied, das machte spürbare Fortschritte an beiden enden des Bodens und hat rechtmäßig die Verbesserung der pro-Minuten-basis. Sterne gewinnen können, die für das erreichen einer neuen Ebene, wenn auch der Preis geht oft auf ein low – oder mid-level-rotation Mitglied, das den Sprung an Legitimität. Hier sind wir die Buchhaltung für alles, was von übrigen ganz Objektiv.”

Das ist eine starke Forderung, da. Hier ist, was Fromal gemacht haben und was wir daraus lernen können.

Fromal die Methodik basierte auf der Ausmerzung der Spieler, die verbesserte aus keinem anderen Grund, als die neu gewonnene Chance und grading Spieler durch, wie viel Sie verbesserten sich in zwei verschiedene übergreifende Statistik. Fromal wollte belohnen die beiden Spieler, die besser auf einer pro-Minuten-basis und denen, die stagnieren, während die Füllung größeren Rollen.

Fromal präsentierte seine Analyse in dem, was er als “einen countdown, der absichtlich meidet Subjektivität.” Das hat nicht immer gut aufgenommen worden von allen. Fromal hat erhalten alles, was Sie von Obszönitäten, um Vorwürfe der Befangenheit, und er wurde auch zum brüllen plagiiert, wie die Kopisten falsch interpretiert seine Ergebnisse. Aber wie gut war Fromal?

Fromal top drei gehören zwei der drei Spieler nominiert, die von der NBA für die MIP — Giannis Antetokounmpo auf No. 2 und Rudy Gobert auf No. 3. Seine No. 1 war Myles Turner, ein Spieler übersehen und von so ziemlich jeder andere. Fromal verpasst Denver Nicola Jokic, der für die meisten Analysten und fans war ein offensichtlicher Kandidat.

Dies kann die Fromal eine gewisse Objektivität Kredit, denn er ist ein Denver ansässigen, aber wirft die Frage auf, wo haben die NBA und data-driven-Analyse-Möglichkeiten Teil. Die Antwort liegt vielleicht in dem, was Fromal selbst anmerkt: Sophomoren (wie Turner) sind in der Regel erwartet, um zu verbessern. In anderen Analysen Sophomoren sind ausgeschlossen von der MIP-Diskussion.

Noch, wie kann Jokic nicht in dieser Liste? Ist es Fromal, fehlt etwas, das offensichtlich ist, oder die NBA, hat seine eigene Art zu denken? Vielleicht noch wichtiger ist, sollte es? Hat die NBA sehen etwas Fromal ist die Analyse nicht, oder haben die Leute dort machen Ihre Entscheidungen nicht ausschließlich auf die data-driven Kriterien und Methoden?

Daten, treffen Augen

Fromal ist eine professionelle NBA-Schriftsteller, und obwohl er nicht über einen formalen hintergrund auf die Analyse der Daten, die er zu tun scheint, eine Menge, die für seine Arbeit. Jay Spanbauer auf der anderen Seite ist nicht so ein Profi mit allen Mitteln-nur ein Bucks-fan, der begann, mit Blick auf das Spiel in einer anderen Art und Weise mit dem Zustrom von Mathematik und Daten in der NBA. Aber vielleicht Spanbauer die Daten-getriebene Analyse erfolgreich war, wo Fromal gescheitert.

Beide Analysen wurden durchgeführt, bevor die NBA angekündigt, MIP Kandidaten, aber Spanbauer ist vorausgegangen Fromal ein Monat und verengt die MIP-Kampf zwischen Jokic und Antetokounmpo. Nicht nur das, sondern er wies auch auf den Unterschied zwischen Ihnen ist, dass kann auch dazu führen, die NBA zu geben Antetokounmpo die MIP-Auszeichnung in einem Rennen, das scheint meist zwischen diesen beiden: Verteidigung.

Spanbauer verwendet eine Metrik genannt Defensive Win Shares zu zeigen, der größte Unterschied zwischen den beiden. Er wies darauf hin, dass trotz der defensiven Fähigkeit als schwierig, genau zu berechnen, es kann gesehen werden, dass Jokic sitzt unter dem Liga-Durchschnitt, während Antetokounmpo ist über zwei-und-ein-halb-fache höher. Vielleicht ist es nun offensichtlich, aber sonst niemand zu haben scheint verwendet, Daten zu Nagel, wenn diese Spanbauer hat.

1-xizncsmshpsmsh26xjx8-w.jpg

Es scheint offensichtlich, jetzt, aber nicht viele Leute dachten, über den Vergleich von MIP-Kandidaten auf der Grundlage Ihrer Daten und visualisieren diese für andere zu sehen. (Bild: Jay Spanbauer)

Das ist eine klar definierte Metrik und Unterschied, aber warum dann konzentrieren sich auf diese beiden Spieler in den ersten Platz? Im Gegensatz zu Fromal, Spanbauer ging mit einer Kombination von Instinkt und Daten:

“Ich denke, letztlich sollten die Daten verwendet werden, um zu ‘überprüfen’, was unsere Augen sehen. Wer beobachtet die NBA in diesem Jahr sah die erstaunliche Sprung Giannis Antetokounmpo gemacht. Ein Blick auf seine zahlen bestätigen dies.

Mit nonstop-Berichterstattung, blogs, Twitter, etc, es gibt genug information und genug Diskurs für eine Gruppe von Kandidaten ziemlich entschieden. Ich habe immer noch Vertrauen in die traditionelle Art und Weise Nominierten ausgewählt sind, insbesondere für eine Auszeichnung als “open-ended “oder ” fluid”, wie die MIP. Fall-in-Punkt: Die klare Kandidaten für den MIP für das Jahr 2017 sind Antetokounmpo und Jokic. Blick auf zahlen und Knirschen Daten würde wahrscheinlich bringen Sie zu dem gleichen Ergebnis.”

Außer es nicht-zumindest nicht mit Fromal Metriken und Daten. Das bringt uns zu einem wichtigen Punkt: Auch wenn etwas, das auf Daten basiert, und hat auch klare Definitionen, das heißt nicht, dass es eine von Gott gegebene Wahrheit. Daten unterstützen eine Sichtweise mehr glaubwürdig, und es kann auch ermöglichen, zu entdecken, Muster, die sonst schwer zu erkennen. Aber Daten-getrieben nicht unbedingt gleich unbestritten.

Das problem mit den data-driven decision making

Wir erwähnten bereits die “no Sophomoren für MIP” – Regel wird von einigen NBA-Analysten. Wenn die NBA gegangen wäre, Turner wäre zu Recht nicht ein MIP-Kandidat, aber weder wäre Jokic. Also, wenn Turner die Nummer ist besser als Jokic, was ist der NBA-Argumentation dort?

Das ist die Art von Frage, die erhitzen Debatten. Es kann auch dazu dienen, ein paar Fakten über data-driven decision making.

Coming up mit der “richtigen” Kriterien ist hart und ad-hoc. Also vielleicht die Kriterien für die MIP sollten nach unten kommen, um das, was Fromal verwendet. Und vielleicht Sophomoren sollte ausgeschlossen werden, außer in einigen Fällen. Aber was wäre diesen Fällen? Was ist mit Spielern, die ein comeback nach einem schlechten Jahr? Oder nickten ein Spieler, könnte die Ermutigung, oder ein Markt, der die Liga wachsen will?

Ob einer der oben genannten sind legitime Kriterien — oder ob und wie Sie als der von die NBA-ist offen für interpretation. Manchmal werden solche die organisatorischen Ziele und die Treiber sind klar, manchmal sind Sie nicht. Aber lassen Sie uns nicht vergessen: Organisation Führungskräfte haben einen großen Einfluss auf diese, unabhängig davon, ob die Daten verwendet, um zu erfassen und zu bewerten.

Gehen von Kriterien, Metriken ist hart und ad-hoc. Nehmen wir an, jemand hat irgendwie eine Eingrenzung der MIP-Kriterien und geschrieben in Stein. Was ist die Metrik, die am besten zum Ausdruck? Und wie soll man Sie miteinander kombiniert, um daraus eine Gesamtnote?

Sogar die am meisten verwendeten Metriken abgeleitet wurden, indem jemand an einem gewissen Punkt und mit Ihrem Schöpfer-bias und Mängel — wahrgenommenen oder sonst. Im Falle von basketball, wahrscheinlich die bekannteste Metrik ist die PRO. Ob das insgesamt am besten Metrik zu erfassen, die Fähigkeit des Spielers beeinflussen und das Spiel diskutiert.

Gibt es weitere Metriken, die ständig weiterentwickelt und die meisten von Ihnen erfordern ein gewisses Maß an know-how sowohl in der Domäne (basketball) und die Techniken (data science) in der Lage sein, vollständig zu verstehen und zu bewerten.

bigdatamaturity.png

DataOps, ist die Kultur und die Praxis der Verwendung von Daten und Analysen, um die Entscheidungsfindung in Organisationen. Aber es ist nicht unfehlbar. (Bild: Qubole)

Die richtigen Daten für den job ist hart und nicht gegeben. Einige Daten heute verwendet, um Informationen abzuleiten über NBA-Spieler ” defensive Fähigkeit, wie steals und blocks, die nicht aufgezeichnet wurden, bis in die 70er Jahre. Dies spiegelt nicht nur die steigende Bedeutung der Daten überall, aber auch die evolution der Domäne selbst.

Wenn die Bedeutung der Verteidigung in das Spiel der basketball hat mehr Anerkennung, dass Daten Ihren Platz gefunden. Allmählich, mehr und mehr Daten werden Hinzugefügt, um die NBA-arsenal, einschließlich der visuellen und räumlich-zeitliche Daten, Hektik Statistiken und social-media-Inhalte.

Den Prozess gibt es zwei Wege. Manchmal wird jemand kommen mit einer Idee zu quantifizieren etwas, für das es keine Daten, und manchmal die option zu haben, einige Daten zur Verfügung die verwendet werden können in UNVORHERGESEHENER Weise.

Die Arbeit mit fünf-jährigen ist harte, Zeit. Vielleicht nicht überraschend, nicht jeder, der kümmert sich um die NBA ruft oder kümmert sich um Daten und Analysen. MIP-Kandidaten haben hierüber nicht Stimmung gegen solche Analysen, und nicht viele fans scheinen es zu tun, was Spanbauer hat.

Manche mögen sagen, dass fans und Spieler sind mehr wie fünf-jährigen, die sowieso, aber die Wahrheit ist, wenn die Dinge sind nicht einfach genug, dass eine fünf Jahre alte bekommen würde, NBA-analytics werden auf den Staat, alle anderen Analysen sind jetzt: Etwas wenige Experten und einige Enthusiasten verwenden können, einige andere haben davon gehört und kann vielleicht Folgen, und für die meisten bleibt mumbo-jumbo.

Wie alle analytics-Anwendungen, anwenden NBA-analytics, die richtigen Datenquellen gefunden werden, müssen die Daten werden verarbeitet und integriert, und domain wissen angewendet, wird die Analyse durchgeführt und die Ergebnisse visualisiert und erklärt.

Also, sollte der NBA sein, mehr Transparenz über die Kriterien für die Auszeichnungen? Und was wäre das Ergebnis, dies zu tun? Könnte er alles deterministisch, wobei der Spaß-und Geld-aus?

Gehen Daten pro

Spanbauer ist nicht die erste non-pro, sich mit NBA-Daten-Analyse. Es gibt eine Reihe von NBA-analytics-Enthusiasten, und eine Reihe von Menschen, die beruflich in der Gegend. Und die Grenzen zwischen beiden sind nicht immer klar, wie das Seth-Partnow Geschichte zeigt. Partnow ist ein ex-blogger stellte analyst, arbeitet jetzt mit dem Geld. John Hollinger, die person, die eingeführt, der PRO, arbeitet jetzt für die Grizzlies.

Aber was werden die Leute mit NBA-Daten und Analysen für? Es hängt davon ab, wer Sie sind, was Sie nach sind, und welche Werkzeuge Sie zur Verfügung haben. Was Sie tun können, mit Schlafzimmer Analysen wird nur nehmen Sie Sie so weit. Für einige Dinge, high-school-Mathe + Tabellenkalkulation/internet + casual fan wissen + ein paar Stunden tun wird. Für andere, es ist wahrscheinlich mehr wie ein PhD + IBM Watson + basketball-guru-status + ein paar Monate.

Wir alle kennen den film Moneyball, und viele basketball-fans sind vertraut mit Kawhi Leonard den Fortschritt durch Analysen. Wir wissen auch, wie die top-teams in allen Sportarten sind immer mehr von Daten getrieben, und wir haben gesehen, IBM ‘ s Watson angepriesen als Werkzeug, um die NBA-teams. Einige von uns gehört, über den Trugschluss des Hot Hand fallacy.

Für teams, die erste Priorität ist es, zu analysieren das Spiel der eigenen Spieler und Ihrer Gegner, um Sie zu verbessern und es zu begegnen jeweils. Scouting für neue Rekruten ist auch von Bedeutung ist, und am Ende des Tages, es kommt alles zu gewinnen mehr Spiele, die ebenfalls qualifiziert für die Herstellung mehr Gewinn.

NBA-teams zu sein scheinen mit analytics-Anwendungen über das gesamte Spektrum: verstehen, was passiert ist und warum, um vorherzusagen, was passieren wird, und lässt es geschehen — deskriptiven, diagnostischen, prädiktiven und präskriptiven analytics.

data-lake2.jpg

Daten in allen Formen und Größen verwendet überall, und die NBA könnte keine Ausnahme sein.

Für Wetten Enthusiasten, es ist nicht so viel über das Spiel selbst, sondern meist um den Versuch zu machen, die richtige Vorhersage, dass Sie der Gewinner. Für fans wie Spanbauer, ist es vor allem darum, mehr Einblick in das Spiel. Als Vertreter einer datengesteuerten Kultur rinnt, seine Ansichten sind interessant:

“Es ist schwer zu ignorieren, die Rolle und beeinflussen, erweiterte Metriken und Statistiken haben in der basketball – ebenso wie andere Sportarten. Während analytics ist nicht der einzige Weg, um zu analysieren das Spiel, ich mag zu denken, es als ein weiteres Objektiv, durch das zu schauen.

Ich würde nicht sagen, dass die analytics-alles über Vorhersagen. Oder sogar Ergebnisse, um ehrlich zu sein. Es geht um die änderung der herkömmlichen Denkweise von Organisationen und die Entwicklung des front-office. Sie sehen, mehr Geld für Forschung ausgegeben, und mehr Arbeitsplätze, die öffnung in der Feld-Analytik.

Am Ende des Tages zahlen sind nur zahlen. Viel Aufmerksamkeit wird bezahlt, um Sie – manchmal mehr als nötig. Das menschliche element des Spiels kann und sollte nicht ignoriert werden. Es gibt noch immateriellen, dass wir nicht in der Lage gewesen zu Messen, und vielleicht nicht in der Lage sein zu Messen.

Das sagte, wir sollten weiterhin versuchen, Antworten durch die Verwendung von so viel Daten, wie wir können. Mehr zahlen und Informationen gefüttert, die in jedem Modell liefert genauere Ergebnisse.

Ich bin nicht unbedingt glauben awards sollten haben eine Art von Kriterien. Auszeichnungen sind für die fans, und ein Teil des Spaßes des awards ist es debattieren unter anderen fans Ihre Meinung nach, wer sollte oder sollte nicht gewinnen. Jedoch, mit Auszeichnung Auswahl zu diktieren, Gehälter und Vorteile wie die designated-player-Ausnahme, einige überlegungen zu Kriterien sollte auf jeden Fall gegeben.

Es gibt genug Informationen gibt, um zu rechtfertigen, die Ausgaben Geld und mit analytics zu Messen, viele verschiedene Bereiche. Eigentümer und Geschäftsführer sind sich auf Ihre eigenen zu entscheiden, ob oder nicht Sie wollen sich selbst zu Vertrauen, oder die zahlen.”

Andere Geschichten:

Automatisierung Automatisierung: ein framework für die Entwicklung und Vermarktung deep learning modelsSpark bekommt automation: Analyse von code und tuning-Cluster in productionPepperdata Code-Analyzer für Apache Spark

0