Programvare

Vanlige myter og misoppfatninger forbundet med store data

Det er en ny ting:

Det kan ikke nektes at Big Data er et hett tema i samtiden. Men er det bedrifter fortsatt sliter med å skifte fra konsept til kjøring av. La oss si det slik, at som en bedriftseier dine problemer er fortsatt den samme. Hva som er endret er løsningen på problemet ditt, fordi denne typen data gir svar på business spørsmål i en bedre og raskere måte med potensial til å gi uvurderlig innsikt. Faktum i saken er det ikke en ny oppdagelse. Foretak og bedrifter har jobbet med enorme mengder informasjon i flere tiår. Det bare nye tingen som tillater oss å forstå denne informasjonen er analytics. Det primære målet av analytics er leting eller bruk av analytiske teknikker til store mengder informasjon i flere ulike inkludert ustrukturerte data som består av tekststrenger, lyd-og filmfiler, dokumenter, bilder, geografisk plassering data og dokumenter.

Er det bare om massiv informasjon:

Kvantitativ analyse spiller en viktig rolle for hver organisasjon der terabyte med informasjon kommer fra kundetransaksjoner, sosiale medier, business statistikk, og bilde opplasting. Men definisjonen av denne typen store datasett strekker seg utover petabytes av volumet. Volumet som blir det første elementet, de andre to viktige elementene kan være forskjellige og hastigheten av informasjon. Ulike dataene refererer til hvor mange typer informasjon og filtyper som kan være mer grundig klarte eller analysert og hastighet betyr hvor raskt data kan hentes i sanntid. Tradisjonelle teknologier og relasjonsdatabaser er ikke godt egnet for denne typen informasjon, og det er hvor store dataene kommer i bildet.

Det betyr bare Hadoop:

Hadoop har blitt synonymt med Big Data. Hadoop er en Apache åpen kilde-programvarerammeverk skrevet i Java programmeringsspråk som kan arbeide med store mengder data apparater. Den er utformet til å skalere fra en enkeltserver til tusenvis av maskiner. Big Data er ikke lik Hadoop på en måte at det meste av informasjonen for denne typen data kommer fra kilder som hendelser, feeds, sosiale medier etc. i form av utfordringer som er møtt av en teknologi eller produkt som Hadoop.

Det betyr bare ustrukturerte data:

Ustrukturerte data har ingen distinkt form. Det er ikke ustrukturert fordi vi ikke kan gi plass til dataene i en modell, men selv etter passer den inn i modellen ikke vil hjelpe. Ustrukturerte data som er en generell etikett å beskrive noen informasjon som ikke er i databasen. Det kan være tekst- eller un-textual inkludert lyd-og videofiler, bildefiler, e-postmeldinger, skjemadata, tekststrenger, sosiale medier mate og så videre.