0
Iedereen die het kopen of verkopen van een huis weet over Zillow. In 2006 introduceerde het bedrijf de Zillow Schatten, of Zestimate voor de korte, die gebruik maakt van verschillende gegevensbronnen en modellen voor het maken van een geschatte waarde voor de woningbouw.
De impact van Zillow is Zestimate op de vastgoedmarkt is omvangrijk, om te zeggen het minst.
Thuis van de koper perspectief, Zillow is Zestimate kunnen aanzienlijke transparantie rond prijzen en informatie die van oudsher was alleen beschikbaar voor makelaars. Het bedrijf heeft echt gedemocratiseerd real estate informatie en voegt veel waarde aan de consument.
Voor makelaars, aan de andere kant, Zillow is vol met meer moeite. Ik vroeg een top makelaar werken in Seattle, Zillow ‘ s eigen grond, voor zijn visie van het bedrijf. Edward Krigsman verkoopt multimillion-dollar huizen in de stad en vindt u een aantal van de uitdagingen:
Geautomatiseerde waarderingsmethoden zijn rond voor decennia, maar Zillow verpakt deze technieken voor de detailhandel op een grote schaal. Dat was de kern van innovatie. Echter, Zillow de gegevens vaak niet accuraat is en het krijgen van hen om problemen op te lossen, is moeilijk.
Zillow maakt prijzen verwachtingen bij de consument en is uitgegroeid tot een derde partij betrokken bij het pre-sales aspecten van residentieel vastgoed. Juist is of niet, Zillow is van invloed op de publieke perceptie van huis waarde.
Zillow de markt impact op de vastgoedsector is groot, en de gegevens van het bedrijf is een belangrijke invloed op veel thuis transacties.
Zillow biedt een schoolvoorbeeld van hoe je gegevens kunt wijzigen gevestigde industrieën, relaties, en de economie. De moedermaatschappij, Zillow Groep, loopt een aantal onroerend goed markten die samen het genereren van ongeveer $1 miljard omzet met, naar verluidt, 75 procent online vastgoed publiek marktaandeel.
Als onderdeel van de CXOTALK serie gesprekken met disruptive innovators, ik uitgenodigd Zillow Chief Analytics Officer (die ook hun Chief Economist), Stan Humphries, om deel te nemen in aflevering 234.
Het gesprek biedt een fascinerende kijk op hoe Zillow denkt over gegevens, modellen, en haar rol in de onroerend goed ecosysteem.
Bekijk de video hierboven en lees een complete transcriptie van de CXOTALK site. In de tussentijd, hier is een bewerkte en verkorte segment van onze gedetailleerde en uitgebreide conversatie.
Waarom ben je begonnen met Zillow?
Er is altijd veel gegevens zweven rond onroerend goed. Hoewel, veel van die gegevens zijn grotendeels [verborgen] en dus moest het gerealiseerde potentieel. Als een data-persoon, je liefde te vinden die ruimte.
De reis, die veel van ons waren, is een dergelijke ruimte, druipend van gegevens, maar de mensen hadden niet veel gedaan. Het betekende dat er een dag zou niet ga door waar je het niet zou komen met een “Holy crap! Dit gaan we doen met de gegevens!”
In onroerend goed, multiple listing diensten ontstaan was, die waren tussen de verschillende agenten en makelaars op de real estate kant; de woningen die te koop waren.
Echter, de public record systeem volledig onafhankelijk is van dat, en er waren twee openbare registers systemen: één voor de daden en voorrechten op onroerende goederen, en dan nog voor de fiscale rollen.
Dat alles was ongelijksoortige informatie. We probeerden op te lossen voor het feit dat dit alles was offline.
We hadden het gevoel dat het, vanuit een consumenten perspectief, zoals de Tovenaar van Oz, waar het allemaal achter dit gordijn. Je was niet toegestaan achter het gordijn en echt [dacht]: “Nou, ik zou heel graag zien dat de verkoop van mezelf en erachter te komen wat er aan de hand is.” U wilt de website aan u tonen zowel de core verkoop aanbiedingen en de kern huur aanbiedingen.
Maar natuurlijk, de mensen die je het thuis niet zou willen dat je om te zien de huren samen met hen op, want misschien zou u het huren van een huis in plaats van kopen. En we zijn als, “We moeten alles samen, alles in de lijn.”
We hadden het geloof dat type van transparantie was van plan om het voordeel van de consument.
Wat over de makelaardij?
U nog steeds vinden dat agentschap vertegenwoordiging is erg belangrijk, want het is een zeer duur transactie. Voor de meeste Amerikanen, de duurste transactie, en de duurste financieel actief dat ze ooit zult bezitten. Dus, er is nog steeds een redelijk vertrouwen op een agent houdt de consument de hand als ze het kopen of verkopen van onroerend goed.
Maar wat veranderd is, is dat nu de consumenten hebben toegang tot dezelfde informatie, dat voor de vertegenwoordiging heeft, hetzij op het kopen of te verkopen. Dat is een verrijking van de dialoog en vergemakkelijkt de agenten en makelaars die het helpen van de mensen. Nu een consument komt tot de agent met een veel meer bewustzijn en kennis, als een slimmere consument. Ze werken met de agent als een partner waar ze al heel veel gegevens en de agent heeft veel inzicht en ervaring. Samen, we denken dat ze betere beslissingen nemen dan voorheen.
Hoe heeft de Zestimate veranderd sinds je begon?
Toen we voor het eerst uitgerold in 2006, de Zestimate was een waardering die we geplaatst op elke woning die wij hadden in onze database in die tijd was 43 miljoen woningen. Om die waardering in 43 miljoen woningen, het liep ongeveer een keer per maand, en we duwden een paar terabyte aan data via ongeveer 34 duizend statistische modellen, die was, in vergelijking met wat er was voorheen een enorm zeer geavanceerd proces.
Ik moet gewoon geven u een context van wat onze nauwkeurigheid. In 2006, toen we begonnen, waren we om ongeveer 14% mediaan absolute percentage error op 43 miljoen woningen.
Sindsdien zijn we gegaan van 43 miljoen huishoudens tot 110 miljoen huizen; we zetten de waarderingen op alle 110 miljoen woningen. En, we hebben de basis van ons nauwkeurigheid tot ongeveer 5 procent van vandaag, die uit een machine leren, is heel indrukwekkend.
Die 43 miljoen woningen die we in 2006 begonnen met de neiging om te worden in de grootste stedelijke gebieden waar er veel transactionele snelheid. Er waren veel van de verkoop en de prijs van signalen die bij het trainen van de modellen. Zo gingen we van 43 miljoen euro naar 110, je bent nu uit in plaatsen als Idaho en Arkansas, waar er slechts minder omzet om naar te kijken.
Het zou indrukwekkend zijn geweest als we hadden onze fout tarief van 14%, terwijl het krijgen van naar plekken die moeilijker zijn in te schatten. Maar, niet alleen hebben we meer dan het dubbele van onze dekking van 43 tot 110 miljoen woningen, maar wij bijna verdrievoudigd onze juistheid tarief van 14 procent naar 5 procent.
Het verborgen verhaal van het bereiken van dat is door het verzamelen van enorm meer gegevens en het krijgen van een veel meer verfijnde via algoritmen, die vereist dat we meer gebruik te maken van computers.
Gewoon om te geven een context, toen we begonnen, we bouwden 34 duizend statistische modellen elke maand. Vandaag zijn we een update van de Zestimate elke nacht en het genereren ergens tussen de 7 en de 11 miljoen statistische modellen, elke nacht. Dan, als we klaar zijn met dat proces, gooien we ze weg en herhaal de volgende nacht weer. Het is dus een big data-probleem.
Vertel ons over uw modellen?
Wij gaan nooit boven een provinciaal niveau voor de modellering systeem, en grote gemeenten, met veel transacties, breken we die afgebroken in kleinere regio ‘ s binnen de provincie waar de algoritmen proberen te vinden homogene reeksen woningen in de sub-county-niveau te trainen, een raamwerk voor modellen. Dat raamwerk voor modellen zelf bevat een groot aantal modellen.
Het kader bevat een aantal verschillende manieren om na te denken over de waarden van de woningen gecombineerd met statistische classifiers. Dus misschien is het een beslisboom, na te denken over het uit wat je kan noemen een “hedonistische” of huisvestingskenmerken aanpak, of misschien is het een support vector machine te kijken naar eerdere verkoop prijzen.
De combinatie van de waardering en de indeler samen maken van een model, en er zijn een aantal van deze modellen gegenereerd op dat sub-county geografie. Er zijn ook een heleboel modellen, die de meta-modellen, die het hun taak is om samen deze sub-modellen in een definitieve consensus advies, dat is de Zestimate.
Hoe zorgt u ervoor dat uw resultaten zijn onbevooroordeeld naar de mate van het mogelijke?
Wij geloven dat reclame dollars volg de consument. Willen We consumenten helpen het beste wat we kunnen.
We hebben gebouwd, in economische taal, een tweezijdige markt waarbij we consumenten die in die toegang willen tot de inventaris en in contact te komen met professionals. Aan de andere kant van de markt, wij hebben professionals-it real estate makelaars of agenten, hypotheekverstrekkers, of thuis verbeteraars — die willen helpen de consumenten die dingen doen. We proberen te zorgen voor een marktplaats waar consumenten kunnen inventaris en de professionals om hen te helpen dingen gedaan te krijgen.
Dus, vanuit het perspectief van een market-maker ten opzichte van een markt-deelnemer die u wilt volledig neutraal en onpartijdig zijn. Alles wat je probeert te doen is een consument van de juiste professional en vice-versa, en dat is zeer belangrijk voor ons.
Dat betekent dat, wanneer het gaat om machine learning toepassingen, bijvoorbeeld de waarderingen die we doen, is onze intentie is om te komen met de beste schatting van wat een huis gaat verkopen. Nogmaals, vanuit een economisch perspectief, het is verschillend van de vraagprijs van de aangeboden prijs. In een grondstoffen context, noem je dat een bid-ask spread tussen wat iemand zal vragen voor de in een offerte.
In de real-estate context, we noemen dat de prijs van het bod en de vraagprijs. En dus, wat iemand gaat bieden om u te verkopen zijn of haar huis is anders dan die van een koper zegt: “Hé, zou je dit voor?” Er is altijd een kloof tussen.
Wat we proberen te doen met Zestimate is om u te informeren sommige prijzen besluiten om de bid-ask spread is een kleinere, [voorkomen] kopers van het krijgen van genomen voordeel van als het huis is veel minder waard geworden. En, [om te voorkomen dat} verkopers uit de verkoop van een huis voor veel minder dan ze zouden kunnen hebben, omdat ze gewoon niet weten.
We denken dat het hebben van grote, bevoegde vertegenwoordiging van beide zijden is een manier om te beperken dat, waarvan wij denken dat is fantastisch. Meer informatie over prijzen beschikking om u te helpen begrijpen dat de aanbieding-vragen verhouding, wat het aanbod ask-spread eruit ziet, is heel belangrijk.
Hoe nauwkeurig is de Zestimate?
Onze modellen zijn opgeleid zodanig dat de helft van de Aarde positief en de helft negatief zal zijn; dat wil zeggen dat op een bepaalde dag, de helft van [alle] woningen gaat transact boven de Zestimate waarde en de helft gaat transact hieronder. Sinds de lancering van de Zestimate, we wilden dat dit een uitgangspunt zijn voor een gesprek over het eigen waarden. Het is niet een eindpunt.
Het is bedoeld als een startpunt voor een gesprek over waarde. Dat gesprek, uiteindelijk, moet het betrekken van andere middelen van waarde, omvatten onder andere real estate professionals, zoals een agent of makelaar, of een taxateur; mensen die expert inzicht in de lokale gebieden en hebben gezien van de binnenkant van een huis en kan het vergelijken met andere vergelijkbare woningen.
Ik denk dat het een invloedrijke gegevens wijzen en hopelijk is het handig om mensen. Een andere manier om na te denken over die stat ik net gaf is dat je op een bepaalde dag, de helft van de verkopers verkopen hun huis voor minder dan de Zestimate, en de helft van de kopers kopen een thuis voor meer dan de Zestimate. Zo, duidelijk, ze kijken naar iets anders dan de Zestimate, hoewel hopelijk, het is handig om ze op een bepaald punt in dat proces.
Hoe heb je de technieken worden steeds geavanceerder de loop van de tijd?
Ik ben betrokken geweest bij machine learning voor een tijdje. Ik begon in de academische wereld als onderzoeker bij een universiteit. Klik vervolgens op Expedia, ik was zeer sterk betrokken bij machine learning, en dan hier.
Ik was van plan om te zeggen dat de grootste verandering die heeft echt in de tech-stack over die periode, maar ik zou dat niet het minimaliseren van de wijziging in de feitelijke algoritmes zelf over die jaren. Via algoritmen, zie je de evolutie van bij Expedia, personalisatie, dat we meer gewerkte op relatief complexe, maar meer statistische parametrische modellen voor het maken van aanbevelingen; zaken als de onvoorwaardelijke kans,en item-naar-item correlaties. Nu, de meeste van uw beschikbaar systemen maken gebruik van dingen zoals collaborative filtering voor algoritmen die zijn geoptimaliseerd voor high-volume gegevens en gegevensstromen.
In een voorspellende context, zijn we verhuisd van dingen zoals beslisbomen en support vector machines om nu een woud van bomen; al die eenvoudiger bomen met veel grotere aantallen van hen… En dan, meer exotische besluit bomen die in de leaf nodes meer richting onderdelen die zeer nuttig zijn in bepaalde contexten.
Als een data-scientist nu kunt u beginnen met het werken aan een probleem op AWS, in de cloud. Vervolgens hebben een assortiment van modellen om snel te implementeren veel eenvoudiger dan u kon weer twintig jaar geleden, toen moest je code een heleboel dingen; te beginnen in de MATLAB en importeren naar C, en u doet het allemaal met de hand.
CXOTALK brengt u ‘ s werelds meest innovatieve zakelijke leiders, schrijvers en analisten voor in-diepte bespreking niet beschikbaar zijn ergens anders.
0