Es una cosa nueva:
No se puede negar que Big Data es un tema candente en la actualidad. Pero hay empresas que se esfuerzan por cambiar desde el concepto hasta la ejecución. Vamos a decirlo así, que como dueño de un negocio sus problemas todavía son los mismos. Lo que ha cambiado es la solución a su problema, ya que este tipo de datos da respuestas a sus preguntas de negocio de una manera mejor y más rápida con el potencial para proporcionar visión empresarial inestimable. El hecho del asunto es que no es novedad. Empresas y negocios han estado trabajando con gran cantidad de información durante décadas. Lo único nuevo que permite dar sentido a esta información es analítica. El principal objetivo del análisis es la exploración o la aplicación de técnicas analíticas a grandes cantidades de información en variedad de tipos de datos no estructurados que se compone de cadenas de texto, archivos de sonido y película, documentos, imágenes y datos de geo-localización de documentos.
Se trata sólo de información masiva:
Análisis cuantitativo desempeña un papel importante para cada organización donde terabytes de información proviene de las transacciones de clientes, redes sociales, estadísticas de las empresas, y carga de la foto. Sin embargo, definición de este tipo de grandes conjuntos de datos se extiende más allá de petabytes de volumen. Volumen, siendo el primer elemento, los otros dos elementos vitales pueden ser variedad y velocidad de la información. Variedad de datos se refiere al número de tipos de datos y tipos de archivos que pueden ser más a fondo gestionados o analizados y velocidad significa rapidez pueden recuperar los datos en tiempo real. Las tecnologías tradicionales y bases de datos relacionales no son apropiados para este tipo de información y cómo viene el Big Data en cuadro.
Sólo significa Hadoop:
Hadoop se ha convertido en sinónimo de Big Data. Hadoop es un marco de Apache software de código abierto escrito en Java, lenguaje que permite trabajar con grandes cantidades de conjuntos de datos de programación. Está diseñado para escalar desde un único servidor a miles de máquinas. Big Data no es igual a Hadoop en un sentido que la mayoría de la información para este tipo de datos proviene de fuentes como eventos, feeds, redes sociales, etc. en forma de desafíos que se resuelven por una tecnología o producto como Hadoop.
Sólo significa datos no estructurados:
Datos no estructurados no tienen ninguna forma distinta. No es no estructurados porque no podemos encajar los datos en un modelo, pero después de montaje en el modelo no ayudará. Datos no estructurados están una etiqueta genérica para describir cualquier información que no está en la base de datos. Puede ser textual o un-textual incluyendo archivos de audio y video, archivos de imagen, mensajes de correo electrónico, datos de formulario, cadenas de texto, medios de comunicación social de la alimentación y así sucesivamente.