0
Jeder Kauf oder Verkauf eines Hauses kennt Zillow. Im Jahr 2006 führte das Unternehmen die Zillow Schätzen, oder Zestimate kurz, was nutzt eine Vielzahl von Datenquellen und Modelle zu erstellen, die einen ungefähren Wert für Wohnimmobilien.
Die Auswirkungen von Zillow ist Zestimate auf die Immobilien-Branche sind beachtlich, gelinde gesagt.
Aus dem Hause Käufer Perspektive, Zillow ist Zestimate ermöglicht eine deutliche Transparenz von Preisen und Informationen, die historisch war nur die Broker. Die Firma hat wirklich demokratisiert Immobilien-Informationen und bietet zudem einen großen Wert für die Verbraucher.
Für Immobilien-Makler, auf der anderen Seite, Zillow ist doch mit mehr Schwierigkeiten. Fragte ich einen top-Immobilien-Makler arbeiten in Seattle, Zillow home turf”, die für seine Sicht der Unternehmen. Edward Krigsman verkauft Multimillionen-dollar-Häuser in der Stadt und erläutert einige der Herausforderungen:
Automatisierte Bewertungsmethoden herum für Jahrzehnte gewesen sind, aber Zillow verpackt, diese Techniken für den Einzelhandel auf einer großen Skala. Das war Ihre Kernkompetenz innovation. Jedoch, Zillow Daten oft nicht korrekt und bekommen Sie Ihre Probleme lösen, ist schwierig.
Zillow erstellt Preiserwartungen bei den Verbrauchern und hat sich eine Dritte Partei beteiligt, die in der pre-sales Aspekte von Wohn-Immobilien. Wahr oder nicht, Zillow beeinflusst die öffentliche Wahrnehmung von zu Hause Wert.
Zillow Markt-Auswirkungen auf die Immobilien-Branche ist groß, und die Unternehmens-Daten ist ein wichtiger Einfluss auf viele Heim-Transaktionen.
Zillow bietet eine lehrbuch-Beispiel, wie Sie Daten ändern können, etablierten Branchen, Beziehungen und Wirtschaft. Die Muttergesellschaft, Zillow-Gruppe, betreibt mehrere Immobilien-Marktplätze, die zusammen erzeugen über $1 Milliarde in den Einnahmen mit, angeblich, 75 Prozent der online-Immobilien-Publikums-Marktanteil.
Als Teil der CXOTALK Reihe von Gesprächen mit disruptiven Innovatoren, lud ich Zillow Chief Analytics Officer (der auch Ihr Chef-Ökonom), Stan Humphries, nehmen Teil in episode 234.
Das Gespräch bietet einen faszinierenden Einblick in, wie Zillow denkt über die Daten, Modelle und Ihre Rolle in der Immobilien-ökosystem.
Überprüfen Sie heraus die eingebettete video oben, und Lesen Sie eine komplette Abschrift an die CXOTALK Website. In der Zwischenzeit, hier ist eine bearbeitete und gekürzte segment in unserem ausführlichen und langen Gespräch.
Warum hast du angefangen, Zillow?
Es gibt immer eine Menge von Daten, die schwimmende rund um Immobilien. Obwohl, eine Menge der Daten wurde weitgehend verborgen, und so hatte es ungenutztes Potenzial. Als Daten, die person, die man liebt zu finden, dass der Raum.
Travel, das viele von uns waren vorher, war ein ähnlicher Raum, tropft mit Daten, aber die Menschen hatten nicht viel getan. Es bedeutete, dass ein Tag würde nicht gehen, wo Sie würden nicht kommen mit “Heilige Scheiße! Wir tun dies mit den Daten!”
In der Immobilien multiple listing services entstanden, die zwischen verschiedenen Agenten und Maklern auf der Immobilien-Seite; die Häuser wurden zum Verkauf angeboten.
Allerdings, das public record system wurde völlig unabhängig von diesem, und es gab zwei öffentliche Aufzeichnungen-Systeme: eine für Urkunden und Sicherheiten auf Immobilien, und dann noch für die Steuer rollt.
Das war alles disparate Informationen. Wir haben versucht, zu lösen, für die Tatsache, dass all dies war offline.
Wir hatten das Gefühl, dass es war, aus der Sicht der Verbraucher, wie der Zauberer von Oz, wo er alle hinter diesem Vorhang. Sie waren nicht erlaubt, hinter den Vorhang zu und wirklich [dachte], “Nun, ich möchte wirklich, um zu sehen, alle Verkäufe selbst und herauszufinden, was Los ist.” Sie möchten die website zu zeigen, die Sie sowohl in den Kern-Verkauf-Angebote und die core-mieten Inserate.
Aber natürlich, die Leute verkaufen Sie die Häuser nicht wollen, Sie zu sehen, die Vermietungen, die neben Ihnen, denn vielleicht könnten Sie ein Haus mieten, anstatt kaufen. Und wir sind wie, “Wir sollten alles zusammen, alles im Einklang.”
Wir hatten den glauben, dass die Art von Transparenz würde dem Verbraucher zugute kommt.
Was über real estate agents?
Sie finden immer noch, dass Agentur-Darstellung ist sehr wichtig, weil es eine sehr teure Transaktion. Für die meisten Amerikaner, die teuerste Transaktion, und die teuerste finanziellen Vermögenswert werden Sie jemals besitzen. So geht es weiter in einem vernünftigen Vertrauen auf einen Agenten zu helfen, halten die Verbraucher die Hände, als Sie entweder kaufen oder verkaufen Immobilien.
Aber was sich geändert hat ist, dass nun die Verbraucher haben Zugang zu den gleichen Informationen, die die Vertretung, die Sie entweder auf dem kaufen oder verkaufen Seite. Das bereichert den Dialog und erleichtert die Agenten und Makler, die Unterstützung der Menschen. Nun ein Verbraucher, kommt der agent mit viel mehr Bewusstsein und wissen, wie ein intelligenter Verbraucher. Sie arbeiten mit den Agenten als partner, wo Sie haben eine Menge Daten, und der agent hat eine Menge von Einsicht und Erfahrung. Gemeinsam, denken wir, Sie treffen bessere Entscheidungen als vorher.
Wie hat sich die Zestimate verändert, seit du angefangen?
Als wir das erste ausgerollt im Jahr 2006, die Zestimate war eine Bewertung, die wir über jedes einzelne Haus, dass wir in unsere Datenbank auf, die Zeit, die 43 Millionen Haushalte. Zu schaffen, der Bewertung in den 43 Millionen Wohnungen, es lief etwa einmal im Monat, und wir schoben ein paar Terabyte an Daten, die über etwa 34 tausend statistische Modelle, die war im Vergleich zu dem, was er getan hatte zuvor eine enorm rechnerisch anspruchsvolle Prozess.
Sollte ich nur geben Sie eine Kontext dessen, was unsere Genauigkeit war damals. Back in 2006, als wir gestartet sind, waren wir um etwa 14% median absolute percent error auf 43 Millionen Haushalte.
Seitdem haben wir uns von 43 Millionen Haushalte in 110 Millionen Haushalte; wir legen Bewertungen auf alle 110 Millionen Haushalte. Und, wir haben angetrieben, unsere Genauigkeit bis zu etwa 5 Prozent heute, welcher von einem machine-learning-Perspektive, ist sehr beeindruckend.
Diese 43 Millionen Haushalte begannen wir mit der im Jahr 2006 in der Tendenz in den größten Metropolen, wo es viel Transaktions-Geschwindigkeit. Es gab eine Menge Umsatz und Preissignale, mit denen zum trainieren der Modelle. Als wir gingen von 43 Millionen Euro bis 110, du bist jetzt raus in Orten wie Idaho und Arkansas, wo es gerade weniger Umsatz zu betrachten.
Es wäre beeindruckend, wenn wir hatten, hielt die Fehlerquote bei 14%, während sich an Orte, die nur schwer zu schätzen. Aber, wir haben nicht nur mehr als die doppelte Reichweite von 43 auf 110 Millionen Häuser, aber wir fast verdreifacht, unsere Genauigkeit rate von 14 Prozent bis 5 Prozent.
Die versteckte Geschichte zu erreichen, ist durch das sammeln enorm mehr Daten und viel mehr ausgefeilte algorithmen, die von uns verlangt, verwenden Sie mehrere Computer.
Nur ein Zusammenhang, wenn wir ins Leben gerufen, den wir gebaut haben 34 tausend statistische Modelle jeden Monat. Heute, wir aktualisieren die Zestimate, jede einzelne Nacht und erzeugen irgendwo zwischen 7 und 11 Millionen statistische Modelle, jede einzelne Nacht. Dann, wenn wir fertig sind mit diesem Prozess, wir werfen Sie Weg, und wiederholen Sie in der nächsten Nacht wieder. Also, es ist ein big data-problem.
Erzählen Sie uns von Ihren Modellen?
Wir gehen nie über eine county-Ebene für die Modellierung system, und Grafschaften, mit vielen Transaktionen, die wir brechen, die in kleinere Regionen innerhalb der Grafschaft, wo die algorithmen versuchen zu finden die homogene Gruppen von Haushalten im sub-county-Ebene zu trainieren modeling framework. Das modeling-framework selbst enthält eine enorme Anzahl von Modellen.
Das framework enthält eine Reihe von verschiedenen Möglichkeiten zu denken über die Werte der Häuser, die in Kombination mit statistischen Klassifikatoren. Also, vielleicht ist es eine Entscheidung Baum und dachte darüber aus, was man nennen kann eine “hedonische” oder Wohnsituation Ansatz, oder vielleicht ist es eine support-Vektor-Maschine suchen, an der vor dem Verkauf die Preise.
Die Kombination der Bewertung Ansatz und der Systematik zusammen ein Modell erstellen, und es gibt eine Reihe von diesen generierten Modelle an, die sub-county-geography. Es gibt auch eine Reihe von Modellen, die sich meta-Modelle, die Ihre Aufgabe ist es, gemeinsam diese sub-Modelle in einer abschließenden Konsensus-Meinung, das ist der Zestimate.
Wie wollen Sie gewährleisten, dass Ihre Ergebnisse unparteiisch sind, soweit möglich?
Wir sind überzeugt, dass Werbung Dollar Folgen die Verbraucher. Wir wollen den Verbrauchern helfen, das beste, was wir können.
Wir konstruiert haben, in der ökonomischen Sprache, ein zweiseitiger Markt, wo wir haben, die Verbraucher kommen in der Bestandsaufnahme und in Kontakt mit Profis. Auf der anderen Seite des Marktplatzes, wir haben Profis — werden Sie Immobilien-Makler oder Agenten, Hypothekenbanken, oder zu Hause-improver –, die helfen wollen, die Konsumenten die Dinge tun. Wir versuchen ein Marktplatz, auf dem Verbraucher finden Bestandsaufnahme und-Profis, um Ihnen zu helfen Dinge zu erledigen.
So, aus der Perspektive des market-maker im Vergleich zu einem Markt-Teilnehmer, die Sie sein wollen, völlig neutral und unvoreingenommen. Alles, was Sie versuchen zu tun ist, erhalten Verbraucher das Recht, Berufs-und Umgekehrt, und das ist uns sehr wichtig.
Das bedeutet, dass, wenn es um die machine-learning-Anwendungen, zum Beispiel die Bewertungen, die wir tun, unsere Absicht ist zu kommen mit die beste Schätzung, was ein Haus verkaufen werde. Wieder, aus wirtschaftlicher Sicht, Sie ist anders als die Preisvorstellung des Angebots Preis. In einem Rohstoffe Kontext, Sie rufen, dass ein bid-ask-spread zwischen dem, was jemand geht, Fragen Sie für ein Angebot.
In der Immobilien Kontext fordern wir, dass das Angebot den Preis und die Preisvorstellung. Und so, was jemand anbieten würde, Sie zu verkaufen, seine oder Ihr Haus unterscheidet sich von einem Käufer sagen, “Hey, würden Sie annehmen?” Es gibt immer eine Kluft zwischen.
Was wir versuchen zu tun, mit Zestimate ist, informieren einige Entscheidungen bei der Preisgestaltung, so die bid-ask-spread kleiner ist, [zu verhindern] Käufer aus immer in Anspruch genommen, wenn das Haus war viel weniger Wert. Und, [um zu verhindern, dass} Anbietern aus dem Verkauf eines Hauses für viel weniger als Sie könnte, weil Sie einfach nicht wissen.
Wir glauben, dass großartige, kompetente Vertretung beider Seiten ist ein Weg, um zu mildern, dass, was wir denken, ist fantastisch. Mehr Informationen über die Preisgestaltung Entscheidung zu helfen, Sie verstehen, dass bieten-bitten-Verhältnis, was das Angebot ask-spread aussieht, ist ebenso sehr wichtig.
Wie genau ist der Zestimate?
Unsere Modelle sind so ausgebildet, dass die Hälfte der Erde positiv und halb negativ sein wird; was bedeutet, dass an einem bestimmten Tag, die Hälfte von [alle] Häuser gehen, um transact oberhalb der Zestimate Wert und die Hälfte gehen, um transact unten. Seit dem Start der Zestimate, wir wollten, dass dies ein Ausgangspunkt für ein Gespräch über Heimat, Werte. Es ist nicht ein Endpunkt.
Es soll ein Ausgangspunkt sein für ein Gespräch über Wert. Das Gespräch, letztlich, muss, um andere bedeutet der Wert, gehören Immobilienprofis wie Makler oder broker, oder ein Gutachter ist; Menschen, die Experten Einblick in die lokalen Bereiche und haben gesehen, die innen ein Zuhause und kann es im Vergleich zu anderen vergleichbaren Häusern.
Ich denke, das ist eine einflussreiche Datenpunkte aus, und hoffentlich, ist es nützlich für die Menschen. Eine weitere Möglichkeit, um sich über die Statistiken, die ich Euch gerade gegeben ist, dass an einem bestimmten Tag, die Hälfte der Verkäufer verkaufen Ihre Häuser für weniger als die Zestimate, und die Hälfte der Käufer, die kaufen ein Haus für mehr als die Zestimate. So, klar, Sie suchen etwas anderes als die Zestimate, obwohl hoffentlich, ist es hilfreich war, um Sie an einem gewissen Punkt in diesem Prozess.
Wie haben Sie Ihre Techniken werden immer ausgefeilter im Laufe der Zeit?
Ich habe mitgewirkt in machine learning für eine Weile. Ich begann in der Wissenschaft als Forscher an einer Universität-Einstellung. Dann zu Expedia, ich war sehr stark involviert in die Maschine lernen, und dann hier.
Ich würde sagen, die größte Veränderung hat es wirklich in der tech-stack in dieser Zeit, aber ich sollte nicht minimiert die änderung in der aktuellen algorithmen, die sich über die Jahre. Algorithmisch, Sie sehen die Entwicklung aus bei Expedia, Personalisierung, arbeiteten wir mehr auf relativ anspruchsvoll, aber mehr statistische und parametrische Modelle für die Abgabe von Empfehlungen; Dinge wie das unbedingte Wahrscheinlichkeit,und die item-to-item-Korrelationen. Nun, die meisten Ihrer recommender systems verwenden Dinge wie collaborative filtering algorithmen, optimiert für high-volume-Daten und streaming-Daten.
In einer prädiktiven Kontext, wir sind umgezogen von Dingen wie Entscheidungsbäume und support vector Maschinen, jetzt ein Wald von Bäumen; all jene einfacher, die Bäume mit viel größeren zahlen von Ihnen… Und dann, mehr exotische Entscheidung, die Bäume, die in Ihrer Blatt-Knoten mehr in Richtung Komponenten, die sind sehr hilfreich in einigen Situationen.
Als data scientist jetzt können Sie anfangen zu arbeiten auf ein problem auf der AWS-Plattform in der cloud. Dann haben eine Auswahl an Modellen schnell bereitstellen viel einfacher als Sie konnte, zurück, vor zwanzig Jahren, als Sie mussten-code ein paar Sachen; start in MATLAB und importieren Sie es auf C, und Sie Taten es alle von hand.
CXOTALK bringt Sie die weltweit innovativsten Unternehmer, Autoren, Analysten und für eine ausführliche Diskussion, die nicht verfügbar überall sonst.
0