0
Qualcuno comprare o vendere una casa sa su Zillow. Nel 2006, l’azienda ha introdotto il Zillow Stima, o Zestimate per breve, che utilizza una varietà di fonti di dati e modelli per creare un valore approssimativo per le proprietà residenziali.
L’impatto di Zillow è Zestimate sul settore immobiliare è stato notevole, per non dire altro.
Dall’acquirente a casa di prospettiva, Zillow è Zestimate consente notevoli trasparenza circa i prezzi e le informazioni che, storicamente, era disponibile solo per i broker. La società ha davvero democratizzato informazioni immobiliari e aggiunge un enorme valore per i consumatori.
Per i mediatori immobiliari, invece, Zillow è irto di difficoltà in più. Ho chiesto a un top real estate broker di lavoro a Seattle, Zillow home turf, la sua visione della società. Edward Krigsman vende milioni di dollari case in città e spiega alcune delle sfide:
Automatizzato metodi di valutazione sono stati intorno per decenni, ma Zillow confezionato quelle tecniche per la vendita al dettaglio su larga scala. Quella era la loro base dell’innovazione. Tuttavia, Zillow dati spesso non è preciso e chiedere loro di risolvere i problemi è difficile.
Zillow crea aspettative in termini di prezzo tra i consumatori ed è diventato una terza parte coinvolta nella fase di pre-vendita aspetti di immobili residenziali. Accurata o meno, Zillow colpisce la percezione pubblica del valore della casa.
Zillow del mercato impatto sul settore immobiliare è grande, e i dati dell’azienda è un’importante influenza su molti casa di transazioni.
Zillow offre un esempio da manuale di come i dati possono cambiare stabilito industrie, le relazioni, l’economia. Il capogruppo, Zillow Gruppo, esegue immobiliare mercati che insieme producono circa 1 miliardo di dollari di fatturato, secondo quanto riferito, il 75% in linea immobiliare pubblico della quota di mercato.
Come parte del CXOTALK serie di conversazioni con dirompente innovatori, ho invitato Zillow Capo Analytics Ufficiale (che è anche il loro Capo Economista), Stan Humphries, per prendere parte nell’episodio 234.
La conversazione offre uno sguardo affascinante come Zillow pensa dati, modelli, e il suo ruolo nel real estate ecosistema.
Guarda il video incorporato qui sopra e leggere una trascrizione completa sul CXOTALK sito. Nel frattempo, qui è modificata e rimaneggiata segmento dal nostro dettagliato e la lunga conversazione.
Perché hai iniziato a Zillow?
C’è sempre stato un sacco di dati galleggianti intorno immobiliare. Però, un sacco di dati che è stato in gran parte [nascosto] e quindi, non aveva il potenziale non realizzato. Come dati di persona, è l’amore a trovare spazio.
Viaggio, che molti di noi sono stati in prima, è stato un simile spazio, grondante di dati, ma la gente non aveva fatto molto con esso. Significava che un giorno, non andare dove non sarebbe venuto su con “Holy crap! Facciamo questo con i dati!”
Nel settore immobiliare, multiple listing servizi hanno avuto sorti, che sono stati tra i diversi agenti e broker immobiliare, in parte; le case che erano in vendita.
Tuttavia, il pubblico sistema di registrazione è completamente indipendente, e c’erano due registri pubblici sistemi: uno per gli atti e garanzie reali su beni immobili, e poi un altro per l’imposta rotoli.
Tutto questo è stato disparate informazioni. Abbiamo cercato di risolvere per il fatto che tutto questo è stato collegato.
Abbiamo avuto la sensazione che è stato, dal punto di vista del consumatore, come il mago di Oz, dove tutto era dietro questa tenda. Non si era ammessi dietro la tenda e davvero [pensiero], “Beh, mi piacerebbe davvero vedere tutte le vendite di me stesso e capire cosa sta succedendo.” Si desidera che il sito web per mostrare sia il nucleo inserzioni di vendita e il nucleo affitto annunci.
Ma, naturalmente, le persone si vendono le case non vogliono che tu veda il noleggio a fianco a loro, perché magari si potrebbe affittare una casa piuttosto che acquistare. E ci siamo, “Dobbiamo mettere tutto insieme, tutto in linea.”
Abbiamo avuto fede che tipo di trasparenza stava andando a beneficio del consumatore.
Che cosa circa gli agenti immobiliari?
Si trovano ancora che l’agenzia di rappresentanza è molto importante perché è molto costoso e di transazione. Per la maggior parte degli Americani, il più costoso di transazione, e il più costoso di attività finanziarie che non avranno mai. Così, continua ad essere un ragionevole affidamento su un agente, per aiutare a mantenere il consumatore mano come acquistare o vendere immobili.
Ma ciò che è cambiato è che ora i consumatori hanno accesso alle stesse informazioni che la rappresentazione ha, sul comprare o vendere lato. Che ha arricchito il dialogo e facilitato gli agenti e i broker che stanno aiutando le persone. Ora un consumatore tratta di un agente molto di più la consapevolezza e la conoscenza, come un consumatore intelligente. Essi lavorano con l’agente come un partner dove hanno un sacco di dati e l’agente ha un sacco di conoscenza ed esperienza. Insieme, noi pensiamo che a prendere le decisioni migliori rispetto a prima.
Come ha Zestimate cambiato da quando hai iniziato?
Quando abbiamo lanciato nel 2006, il Zestimate è una valutazione che abbiamo messo su ogni singola casa che abbiamo avuto nel nostro database, che è stato di 43 milioni di case. Per creare tale valutazione in 43 milioni di abitazioni, ha funzionato una volta al mese circa, e abbiamo spinto un paio di terabyte di dati, attraverso circa 34 mila modelli statistici, che è stata, rispetto a ciò che era stato fatto in precedenza un’enorme capacità di elaborazione più sofisticata del processo.
Devo solo dare un contesto di ciò che la nostra precisione era allora. Nel 2006 quando abbiamo lanciato, eravamo a circa il 14% mediana assoluta % di errore su 43 milioni di case.
Da allora, siamo passati da 43 milioni di case a 110 milioni di case, abbiamo messo valutazioni su tutti i 110 milioni di case. E, abbiamo spinto la nostra precisione fino a circa il 5 per cento di oggi, che, da una macchina prospettiva di apprendimento, è abbastanza impressionante.
Quei 43 milioni di case che abbiamo iniziato nel 2006 tendevano ad essere più grandi aree metropolitane, dove c’era molto transazionale velocità. C’erano un sacco di vendite e i segnali di prezzo con il quale per addestrare i modelli. Come siamo passati da 43 milioni a 110, ora sei sempre in posti come Idaho e Arkansas, dove ci sono solo un minor numero di vendite a guardare.
Sarebbe stato impressionante, se avessimo mantenuto il nostro tasso di errore al 14%, mentre sempre in posti che sono più difficili da stimare. Ma, non solo siamo oltre il doppio del nostro copertura da 43 a 110 milioni di case, ma abbiamo quasi triplicato il nostro tasso di precisione dal 14 per cento al 5 per cento.
La storia nascosta dell’obiettivo, che è attraverso la raccolta di enormemente più dati e di ottenere molto più sofisticato algoritmo, che richiede l’utilizzo di più computer.
Solo per dare un contesto, quando abbiamo lanciato, abbiamo costruito 34 migliaia di modelli statistici di ogni mese. Oggi, ci aggiorna i Zestimate ogni singola notte e generare da qualche parte tra i 7 e gli 11 milioni di modelli statistici di ogni singola notte. Poi, quando abbiamo finito con il processo, abbiamo buttare via, e ripetere la successiva notte di nuovo. Quindi, si tratta di un grosso problema di dati.
Raccontaci i tuoi modelli?
Non abbiamo mai andare al di sopra di un livello di contea per la modellazione del sistema, e le grandi contee, con molte transazioni, scomponiamo in regioni più piccole all’interno della contea in cui gli algoritmi cercare di trovare insiemi omogenei di case in sub-contea di formare un framework di modellazione. Che modeling framework contiene un numero enorme di modelli.
Il quadro incorpora un sacco di modi diversi di pensare i valori delle case combinato con statistiche classificatori. Così forse è un albero di decisione, a pensare, da quello che si può chiamare un “edonistico” o caratteristiche abitazioni approccio, o forse è una macchina di vettore di sostegno guardando prima il prezzo di vendita.
La combinazione del processo di valutazione e di classificazione, insieme, di creare un modello, e ci sono un sacco di questi modelli generati al sub-contea di geografia. Ci sono anche una serie di modelli che diventano meta-modelli, che il loro lavoro è quello di mettere insieme questi sub-modelli in una finale di un consenso di opinione, che è la Zestimate.
Come si fa a garantire i risultati sono imparziale per quanto possibile?
Noi crediamo che la pubblicità di dollari seguire i consumatori. Vogliamo aiutare i consumatori il meglio che possiamo.
Abbiamo costruito, economica, di lingua, di due lati di un mercato in cui abbiamo ottenuto i consumatori provenienti che vogliono accedere all’inventario e di entrare in contatto con professionisti del settore. Sull’altro lato del mercato, abbiamo professionisti — mediatori immobiliari o agenti, prestatori di ipoteca, o casa di ammendanti — che vogliono aiutare i consumatori a fare le cose. Stiamo cercando di fornire un mercato dove il consumatore può trovare inventario e i professionisti per aiutarli a ottenere le cose fatte.
Così, dalla prospettiva di un market maker rispetto a un mercato-il partecipante, si vuole essere completamente neutrale e imparziale. Tutto quello che stai cercando di fare è ottenere un consumo corretto e professionale, e viceversa, il che è molto importante per noi.
Ciò significa che, quando si tratta di machine learning applicazioni, per esempio, le valutazioni che facciamo, il nostro intento è quello di venire con la migliore stima di ciò che una casa sta per vendere. Di nuovo, da un punto di vista economico, è diverso dal prezzo di il prezzo di offerta. In una commodities contesto, si chiama che un bid-ask spread tra ciò che qualcuno sta andando a chiedere in offerta.
Immobiliare In contesto, chiediamo che il prezzo di offerta e il prezzo richiesto. E così, quello che qualcuno sta per offrire a vendere la sua casa è diverso da un acquirente dicendo: “Ehi, vuoi fare questo?” C’è sempre un divario tra che.
Quello che stiamo cercando di fare con Zestimate è quello di informare alcune scelte di pricing così il bid-ask spread è più piccolo, [evitare] acquirenti di ottenere approfittato di quando la casa valeva molto meno. E, per evitare} venditori la vendita di una casa per molto meno di quello che avrebbe potuto ottenere, perché proprio non lo so.
Pensiamo che avere grande, competente rappresentanza di entrambi i lati è un modo per ridurre tale, che credo sia fantastico. Avere ulteriori informazioni sulla determinazione dei prezzi, per aiutarvi a capire che offrono-rapporto di chiedere, che cosa l’offerta ask spread sembra, è molto importante.
Quanto è accurato il Zestimate?
I nostri modelli sono addestrati in modo che metà della Terra sarà positivo e mezzo sarà negativo; il che significa che in un dato giorno, la metà di [tutti] case stanno andando per le transazioni sopra i Zestimate valore e mezza intenzione di transact di seguito. Dal lancio del Zestimate, abbiamo voluto che questo fosse un punto di partenza per una conversazione sul valore della casa. Non è un punto di arrivo.
E ‘ pensato per essere un punto di partenza per una conversazione sul valore. Che conversazione, infine, ha la necessità di coinvolgere altri mezzi di valore, includono professionisti del settore immobiliare come un agente o un broker, o di un esperto; persone che hanno competenza in aree locali e hanno visto l’interno di una casa e può paragonare ad altre case comparabili.
Penso che un autorevole punto di dati e, si spera, è utile per le persone. Un altro modo di pensare che stat ho appena dato è che in un dato giorno, la metà dei venditori di vendere le loro case per meno il Zestimate, e la metà degli acquirenti di acquistare una casa, per di più l’Zestimate. Così, chiaramente, sono alla ricerca di qualcosa di diverso Zestimate, anche se, si spera, è stato utile a un certo punto durante il processo.
In che modo le tecniche diventano più sofisticati nel corso del tempo?
Sono stato coinvolto in apprendimento automatico per un po’. Ho iniziato nel mondo accademico come ricercatore all’università di impostazione. Quindi a Expedia, ero molto pesantemente coinvolti nell’apprendimento automatico, e poi qui.
Stavo per dire il più grande cambiamento è stato veramente in tech stack in quel periodo, ma, io non minimizzare la variazione effettiva algoritmi di se stessi nel corso di questi anni. Algoritmicamente, è vedere l’evoluzione da a Expedia, personalizzazione, abbiamo lavorato relativamente sofisticati, ma più statistici parametrici e modelli per la formulazione di raccomandazioni; le cose come incondizionato di probabilità,e articolo-per-voce correlazioni. Ora, la maggior parte delle recommender systems usare cose come filtraggio collaborativo per gli algoritmi che sono ottimizzati per elevati volumi di dati e di flussi di dati.
In un predittiva contesto, abbiamo spostato le cose come gli alberi di decisione e support vector machines per ora una foresta di alberi; quelli più semplici alberi con numeri ben più grandi di loro… E poi, più esotici alberi di decisione che hanno nel loro foglia di nodi direzione più componenti che sono molto utile in alcuni contesti.
Come scienziato, è possibile iniziare a lavorare su un problema su AWS, nel cloud. Poi hanno un assortimento di modelli per distribuire rapidamente molto più facile di quanto si possa indietro di vent’anni fa, quando si doveva codice di un sacco di roba; in MATLAB e importazione a C, e si stavano facendo tutto a mano.
CXOTALK ti porta il mondo di imprenditori più innovativi, gli autori e gli analisti di approfondire la discussione non disponibile in qualsiasi altro luogo.
0