Software

Para o melhor valor de dados grandes melhorar modelos e algoritmos

Com todo o hype em torno da análise de dados grande, pouca atenção está sendo dado à qualidade dos dados ou a validação dos modelos construídos sobre os dados.

Coeficientes de determinação podem ser facilmente manipulados para caber a hipótese por trás do modelo. Como tal, isto também não distorce a análise dos resíduos? Modelos para dados espaciais e temporais apareceria somente complicar a validação ainda mais. Ferramentas de gerenciamento de dados melhoraram significativamente aumentar a confiabilidade das entradas de dados. Até máquinas de conceber os modelos, foco sobre a validade dos dados seria melhorar a validação do modelo e reduzir, não elimina a tendência inerente.

Algoritmos são o combustível para um mecanismo de correlação para descobrir relações novas e mais significativas em grande volume de dados. O sucesso do analytics antecipatória depende da seleção do conjunto de dados, a qualidade dos dados sendo alimentados para o modelo e os modelos estatísticos, sendo usados para analisar os dados. Avançados de estatística, mineração de dados e algoritmos de aprendizado de máquina podem cavar mais fundo para encontrar esses padrões mais rápida e mais econômica do que as ferramentas de BI tradicionais em desvantagem. A fórmula vencedora encontra-se no desenvolvimento de poderosos novos algoritmos que levando a utilização de empresas para reforçar a competitividade e a percepção da marca, obtenham um bom desempenho de custo em cada faceta da empresa e gerenciar riscos mais pro-ativamente enquanto aderindo aos mandatos de governança e segurança de dados.

Durante o próximo ano, espera que adoção acelerada de análise preditiva dentro e entre funções de negócio, como as organizações procuram encontrar o maior valor de seus dados. Análise preditiva ajudará as organizações a descobrir padrões escondidos anteriormente, identificar segmentações, associações e classificações e fazer previsões mais precisas de informações estruturadas e não estruturadas. Isto afetará dramaticamente estratégia corporativa e processos de planificação, como provedor de serviço e as empresas dependem de análise em tempo real da atividade atual e antecipam o que vai acontecer a seguir. Identificando os impulsores-chave de vários resultados de negócios, organizações serão mais habilitadas para entregar experiências de cliente mais personalizado e contextual.

No entanto, há um equívoco comum - alimentado em parte por empresas com raízes no processamento de eventos complexos - que análise preditiva pode prever o futuro. Talvez "analytics antecipatória" é um melhor, embora menos nome comercializável. O professor de estatística no meu programa MBA há muitos anos apresentou-se para a classe, dizendo que as estatísticas podem ser usadas para provar qualquer ponto de vista. Ele está certo ainda. No entanto, melhor modelos e algoritmos são o caminho para perceber a promessa de grande analytics.

3 De abril de 2013