Con todo el bombo alrededor de análisis de datos grande, se está prestando insuficiente atención a la calidad de los datos o la validación de modelos construidos en los datos.
Los coeficientes de determinación pueden ser manipulados fácilmente para caber la hipótesis detrás de la modelo. ¿Por lo tanto, esto también no distorsiona el análisis de los residuos? Modelos para datos espaciales y temporales sólo parece complicar la validación aún más. Herramientas de gestión de datos han mejorado para aumentar la fiabilidad de las entradas de datos. Hasta máquinas de concebir los modelos, foco sobre la validez de los datos de validación del modelo de mejorar y reduciría, no eliminar el sesgo inherente.
Los algoritmos son el combustible para un motor de correlación descubrir relaciones nuevas y más significativas de datos grandes. El éxito del análisis anticipatorio se basa en la selección del conjunto de datos, la calidad de los datos que se alimenta en el modelo y los modelos estadísticos se utiliza para analizar los datos. Avanzado de estadística, minería de datos y algoritmos de aprendizaje automático pueden cavar más profundo para encontrar estos patrones más rápido y más rentable que las herramientas de BI tradicionales superadas. La fórmula ganadora se encuentra en el desarrollo de poderosos nuevos algoritmos que conducen empresas uso para fortalecer la competitividad y la percepción de la marca, eficiencias de costos en todas las facetas de la empresa y gestionar los riesgos más pro-activamente todo el tiempo adherido a los mandatos de la gobernanza y la seguridad de datos.
Durante el próximo año, esperan aprobación acelerada de análisis predictivo dentro y a través de las funciones de negocio como organizaciones buscan mayor valor de sus datos. Análisis predictivo ayudará a las organizaciones descubrir patrones ocultos anteriormente, identificar las clasificaciones, asociaciones y segmentaciones y hacer predicciones más precisas de información estructurada y no estructurada. Esto afectará dramáticamente estrategia corporativa y los procesos de planificación como proveedor de servicios y empresas se basan en el análisis en tiempo real de la actividad actual y prever lo que pasará después. Al identificar los impulsores claves de varios resultados de negocios, las organizaciones se habilitará más para ofrecer experiencias de cliente más personalizada y contextual.
Sin embargo, existe una percepción errónea común - alimentada en parte por empresas con raíces en el procesamiento de eventos complejos - que análisis predictivo pueden predecir el futuro. Tal vez "análisis anticipatorio" es mejor, aunque menos nombre comercial. El profesor de estadística en mi programa de MBA de hace muchos años presentó la clase diciendo que las estadísticas pueden usarse para probar cualquier punto de vista. Está todavía. Sin embargo, mejores modelos y algoritmos son el camino para la realización de la promesa de grandes analytics.
03 De abril de 2013