Come Vincere con Prescrittivo Analytics
In questo ZDNet relazione speciale, si esamina come si imposta un’infrastruttura di google analytics che vede dietro l’angolo e ti dà le opzioni per evitare un incidente.
Prescrittivo analytics è, a dir poco, di automatizzare il vostro business. Questo è stato il rivestimento d’argento come abbiamo esplorato la complessità della prescrittivo analytics nella nostra guida. Mentre un sacco di tale complessità è qualcosa di linea di business e dati esperto scienziati hanno a che fare con, ESSO non è che l’equazione sia.
Prescrittivo analytics è difficile, e non c’è nessun proiettile d’argento che si può ottenere qui senza aver passato la catena evolutiva di analytics. Dovete ottenere la raccolta di dati e l’infrastruttura di storage a destra, la modellazione dei dati a destra, e lo stato di classificazione e previsione di destra.
Questo è prescrittivo analytics linea di fondo, e deve assicurarsi che la raccolta dei dati e dell’infrastruttura di archiviazione componenti sono a posto per affari e scienza di dati per fare le loro parti. La pulizia dei dati e l’organizzazione necessari per il successo con prescrittivo analytics può essere pensato su due dimensioni: la quantità e la qualità dei dati che verrà utilizzato per alimentare l’analisi.
Quantità di dati
Per cominciare, È necessario assicurarsi che tutti i dati pertinenti all’organizzazione sono contabilizzati e accessibile. Questa davvero è una conditio sine qua non di qualsiasi analytics sforzo, ma può essere più complicato di quanto non sembri.
Considerare tutte le applicazioni di un’organizzazione può usare: personalizzato costruito, off the shelf, a livello locale, nel cloud, eredità. Ognuna di queste può avere un suo formato, la memorizzazione e l’API. È necessario assicurarsi che essi sono tutti accessibili, senza interrompere il funzionamento delle applicazioni. Dati lago di approccio può essere utile in questo senso.
E c’è di peggio. I dati possono anche vivere al di là delle applicazioni. Prendere in considerazione tutti i documenti e messaggi di posta elettronica, per esempio. Più spesso che no, una ricchezza di dati che vive in formato non strutturato e fonti non documentate. E molte applicazioni sono anche privi di documenti, inaccessibile, e la mancanza di Api per l’esportazione di dati. Per coloro, sarà necessario ottenere risorse, o non veloce.
Anche quando è successo, tuttavia, questo non è un esercizio. Le applicazioni si evolvono, e con loro lo fanno anche i loro dati. Le api di cambiare, di schemi di modifica, aggiunta di nuovi dati. Nuove applicazioni gettato nel mix, e quelli vecchi diventato obsoleto. Rimanere in cima di raccolta dei dati richiede uno sforzo costante, e questo è un costo, è necessario fattore in quando di intraprendere prescrittivo analytics viaggio. Aggiunta di una semantica ai dati lago può essere di aiuto.

La quantità di dati è sufficiente? Per quanto possibile.
Foto di William fondato warby su Unsplash
Parlando di costi: naturalmente, il solito provisioning discorso si applica anche qui. Non si pensa a venire, fanno di questo un progetto con un budget predeterminato per le infrastrutture e i costi per il personale, e farlo attraverso il bilancio organizzativo processo di approvazione? Oppure prendere un più agile, pay-as-you-go approccio?
Il primo è teoricamente più sicuro, e più in linea con i processi organizzativi. Ecco il problema: a Meno che le tue fonti dati sono relativamente limitate e ben comprese, e si sta molto attenti a tenere traccia e di provisioning per loro, questo approccio può essere impossibile in pratica.
Quest’ultimo è più flessibile, ma può anche portare al superamento del budget e ombra problemi. Senza un qualche tipo di metodo per la follia, si può finire di spesa fuori controllo, e avendo i dati memorizzati in tutto il luogo. Anche se questo non è un 100% in regola ferrea, il budgeting avanti approccio più senso quando si va per locali di stoccaggio, mentre il cloud storage e sviluppo presta molto bene per la pay-as-you-go approccio.
Infine, i dati di freschezza è un altro aspetto da prendere in considerazione. Se volete che il vostro analytics per riflettere il mondo reale in tempo reale, i dati che alimenta dovrebbe venire in tempo reale, troppo. Questo significa che si dovrebbe prendere in considerazione streaming infrastruttura di dati. Mentre ci sono vantaggi nell’adozione di streaming, è un nuovo paradigma che viene fornito con la sua curva di apprendimento e di software/hardware/gente di investimento.