Software

Voor betere waarde van grote gegevens verbeteren modellen en algoritmen

Met alle hype rond grote gegevensanalyse, is niet genoeg aandacht besteed aan de kwaliteit van de gegevens of de validatie van modellen gebaseerd op de gegevens.

Coëfficiënten van bepaling kunnen gemakkelijk worden gemanipuleerd om te passen bij de hypothese achter het model. Als zodanig niet dit ook de analyse van de storingswaarden verstoren? Modellen voor ruimtelijke en temporele gegevens lijkt alleen validatie nog verder compliceren. Hulpmiddelen voor het beheer van gegevens hebben verbeterd om de betrouwbaarheid van de gegevens ingangen aanzienlijk te verhogen. Tot machines de modellen ontwikkelen, zou focus op de geldigheid van de gegevens verbeteren modelvalidatie en verminderen, niet elimineren inherente bias.

Algoritmen zijn de brandstof voor de motor van een correlatie te ontdekken nieuwere en meer zinvolle relaties in de grote gegevens. Het succes van anticiperende analytics, is afhankelijk van de gegevensset selectie, de kwaliteit van de gegevens die worden ingevoerd in het model, en de statistische modellen worden gebruikt om de gegevens te analyseren. Geavanceerde statistische, datamining en machine leren algoritmen kunnen dieper graven te vinden van deze patronen sneller en meer kosteneffectief dan overmatched traditionele BI tools. De winnende formule ligt bij de ontwikkeling van krachtige nieuwe algoritmen dat toonaangevende bedrijven gebruiken ter versterking van concurrentievermogen en merk perceptie, kostenefficiëntie rijden in elk facet van de onderneming, en beheren van risico's meer pro-actief al die tijd vast te houden aan gegevens bestuur en veiligheid mandaten.

Verwachten in de komende jaren, versnelde goedkeuring van predictive analytics binnen en tussen zakelijke functies als organisaties proberen te vinden van grotere waarde van hun gegevens. Predictive analytics helpt organisaties eerder verborgen patronen ontdekken, classificaties, verenigingen en segmentaties identificeren en maken veel meer accurate voorspellingen van gestructureerde en ongestructureerde informatie. Dit zal drastisch invloed corporate strategie en planning van processen, zoals ondernemingen en serviceprovider op real-time analyse van de huidige activiteit vertrouwen en anticiperen op wat er zal gebeuren. Door het identificeren van de belangrijkste drijvende krachten van verschillende resultaten, zal organisaties verder worden ingeschakeld om te leveren meer gepersonaliseerde en contextuele klantervaringen.

Echter, er is een gemeenschappelijke misvatting - gedeeltelijk gevoed door bedrijven met wortels in complexe gebeurtenis afhandeling - dat predictive analytics kan de toekomst voorspellen. "Anticiperende analytics" is misschien een beter, zij het minder verhandelbare naam. De professor van de statistieken in mijn MBA-programma stelde vele jaren geleden zich aan de klasse door te zeggen dat de statistieken kunnen worden gebruikt om te bewijzen een oogpunt. Hij is nog steeds recht. Betere modellen en algoritmen zijn echter het pad naar het realiseren van de belofte van grote analytics.

3 April 2013