Software

Comum mitos e equívocos associados grandes dados

É uma coisa nova:

Não se pode negar que grande de dados é um tema quente nos tempos atuais. Mas há empresas que ainda tem dificuldade para mudar de conceito para a execução. Vamos colocar desta forma, que como um empresário seus problemas continuam os mesmos. O que mudou é a solução para seu problema, só porque este tipo de dados dá respostas às suas perguntas de negócio de uma forma melhor e mais rápida com o potencial para fornecer uma visão de negócio de valor inestimável. O fato da matéria é que não há uma nova descoberta. As empresas e as empresas têm trabalhado com grande quantidade de informações por décadas. A coisa só nova que nos permite fazer sentido desta informação é analytics. O principal objetivo da análise é a exploração ou a aplicação de técnicas analíticas para grandes quantidades de informação em vários tipos, incluindo dados não estruturados, que é composta por seqüências de caracteres de texto, arquivos de som e filmes, documentos, imagens, dados de geolocalização e documentos.

É somente sobre informações de massivas:

Análise quantitativa desempenha um papel importante para cada organização onde terabytes de informação proveniente de transações de clientes, mídia social, estatísticas das empresas, e uploads de fotos. No entanto, a definição deste tipo de grandes conjuntos de dados estende-se além petabytes de volume. Volume, sendo o primeiro elemento, outros dois elementos vitais podem ser a variedade e a velocidade das informações. Variedade de dados refere-se ao número de tipos de informação e tipos de arquivos que podem ser mais bem geridos ou analisados e velocidade significa quão rápido os dados podem ser recuperados em tempo real. Bancos de dados relacionais e tecnologias tradicionais não são adequados para este tipo de informação e que é como o Big Data vem em imagens.

Significa apenas Hadoop:

Hadoop tornou-se sinônimo de dados grandes. Hadoop é um framework de software open-source Apache escrito em Java, linguagem de programação que permite trabalhar com grandes quantidades de conjuntos de dados. Destina-se a escala de um único servidor para milhares de máquinas. Big Data não é igual o Hadoop no sentido que a maioria das informações para este tipo de dados vem de fontes como eventos, feeds, mídias sociais etc., em forma de desafios que são atendidas por uma tecnologia ou produto como o Hadoop.

Significa apenas dados não-estruturados:

Dados não estruturados não tem nenhuma forma distinta. Não é não-estruturado porque nós não cabem os dados em um modelo, mas mesmo depois de encaixe-a no modelo não vai ajudar. Dados não estruturados são um rótulo genérico para descrever qualquer informação que não está no banco de dados. Pode ser textual ou un-textual incluindo arquivos de áudio e vídeo, arquivos de imagem, mensagens de e-mail, dados de formulário, seqüências de caracteres de texto, meios de comunicação sociais da alimentação e assim por diante.