Software

Per migliore valore dai dati grandi migliorare modelli e algoritmi

Con tutto l'hype intorno a Google analytics grandi dati, non abbastanza attenzione viene data alla qualità dei dati o la validazione di modelli costruiti sui dati.

Coefficienti di determinazione possono essere facilmente manipolate per montare l'ipotesi dietro il modello. Come tale, anche questo non distorsione l'analisi dei residui? Modelli per i dati spaziali e temporali sembra solo complicare ulteriormente la convalida. Strumenti di gestione dati hanno migliorato per aumentare significativamente l'affidabilità degli input dati. Fino a macchine per elaborare i modelli, focus sulla validità dei dati sarebbe migliorare la validazione del modello e ridurre, non eliminare il pregiudizio inerente.

Gli algoritmi sono il carburante per un motore di correlazione individuare relazioni più recenti e più significativi nei dati di grandi. Il successo di Google analytics anticipatoria si basa sulla selezione di set di dati, la qualità dei dati vengono nutriti nel modello e i modelli statistici utilizzati per analizzare i dati. Avanzati di statistica, data mining e algoritmi di apprendimento automatico può scavare più a fondo per trovare questi modelli più veloce e più conveniente rispetto overmatched tradizionali strumenti di BI. La formula vincente si trova nello sviluppo di potenti nuovi algoritmi che guidando uso aziende per rafforzare la competitività e la percezione del marchio, guidare efficienze di costo in ogni sfaccettatura dell'impresa e gestire i rischi più pro-attivamente tutto mentre aderendo a mandati di governance e sicurezza dati.

Il prossimo anno, aspettatevi approvazione accelerata di analisi predittiva all'interno e tra le funzioni aziendali come organizzazioni cercano di trovare maggior valore dai loro dati. Analisi predittiva aiuterà le organizzazioni scoprire modelli precedentemente nascosti, identificare le classificazioni, le associazioni e le segmentazioni e fare previsioni molto più precise da informazioni strutturate e non strutturate. Drammaticamente questo avrà un impatto strategia aziendale e processi di pianificazione, come imprese e fornitori di servizi si basano su un'analisi in tempo reale dell'attività corrente e anticipare cosa succederà dopo. Identificando i driver chiavi di vari risultati di business, organizzazioni verranno ulteriormente abilitate a fornire esperienze di cliente più personalizzata e contestuale.

Tuttavia, c'è un misperception comune - alimentata in parte da aziende con radici nell'elaborazione di eventi complessi - che analisi predittiva possono predire il futuro. Forse "anticipatoria analytics" è una migliore, seppur meno nome negoziabili. Il professore di statistica nel mio programma MBA molti anni fa si presentò alla classe dicendo che le statistiche possono essere utilizzate per dimostrare qualsiasi punto di vista. Egli è ancora giusto. Tuttavia, modelli e algoritmi migliori sono il percorso per realizzare la promessa di analytics grande.

3 Aprile 2013