Det är en ny sak:
Det kan inte förnekas att Big Data är ett hett ämne i nutid. Men finns det företag som fortfarande kämpar för att flytta från koncept till genomförande. Låt oss uttrycka det så, att som företagare dina problem är fortfarande de samma. Vad som har förändrats är lösningen på ditt problem, bara för att denna typ av data ger svar på dina affärsfrågor på ett bättre och snabbare sätt med potential att ge ovärderlig business insight. Faktum i frågan är inte finns det en ny upptäckt. Företag och företag har arbetat med stor mängd information i årtionden. Det enda nya som tillåter oss att göra känsla av denna information är analytics. Det primära målet för analytics är utforskning eller tillämpning av analytic stora mängder information i olika typer inklusive ostrukturerade data som består av textsträngar, ljud-och filmfiler, dokument, bilder, geografiska data och dokument.
Det handlar bara om massiv information:
Kvantitativ analys spelar en viktig roll för varje organisation där terabyte information kommer från kundtransaktioner, sociala medier, statistik, och uppladdningar av foton. Emellertid, definitionen av denna typ av stora datamängder sträcker sig bortom petabytes av volym. Volym som det första elementet, de andra två vitala delarna kan vara olika och hastighet av information. Mängd data avser antalet typer av information och filtyper som kan hanteras eller analyseras grundligare och hastighet innebär hur snabbt data kan hämtas i realtid. Traditionella tekniker och relationsdatabaser är inte väl lämpade för denna typ av information och det är hur stor Data kommer i bild.
Det betyder bara Hadoop:
Hadoop har blivit synonymt med Big Data. Hadoop är en Apache programvara med öppen källkod ram skriven i Java programmeringsspråk som gör att arbeta med stora mängder av data. Den är utformad att skala upp från en enstaka server till tusentals maskiner. Big Data är inte lika Hadoop i en känsla att det mest av informationen för denna typ av data kommer från källor som händelser, feeds, sociala medier etc. i form av utmaningar som uppfylls av en teknik eller produkt som Hadoop.
Det betyder bara ostrukturerade data:
Ostrukturerade data har inga distinkta form. Det är inte ostrukturerade eftersom vi inte kan passa data in i en modell men även efter montering i modellen kommer inte att hjälpa. Ostrukturerade data är en generisk etikett att beskriva någon information som inte är i databasen. Det kan vara text- eller un-textual inklusive ljud- och videofiler, bildfiler, e-postmeddelanden, formulärdata, text-strängar, sociala medier foder och så vidare.