Software

Gemeenschappelijke mythen en misvattingen die zijn gekoppeld aan grote gegevens

Het is een nieuw ding:

Het kan niet worden ontkend dat grote gegevens een hot topic in de huidige tijd is. Maar zijn er bedrijven nog steeds moeite om het verschuiven van concept tot uitvoering. Laten we het zo zeggen, dat als een ondernemer uw problemen zijn nog steeds hetzelfde. Wat is er veranderd is de oplossing voor uw probleem, alleen omdat dit type gegevens geeft antwoorden op de bedrijfsvragen van uw op een betere en snellere manier met het potentieel om waardevolle zakelijke inzicht te verschaffen. Het feit van de zaak is dat er is niet een nieuwe ontdekking. Ondernemingen en bedrijven hebben gewerkt met de enorme hoeveelheid informatie voor decennia. Het enige nieuwe ding dat ons toelaat te maken zin van deze informatie is analytics. Het primaire doel van analytics is de exploratie of de toepassing van analytische technieken op grote hoeveelheden informatie in verschillende vormen, met inbegrip van ongestructureerde gegevens die uit tekenreeksen, geluid-en filmbestanden, documenten, afbeeldingen, geo-locatie gegevens en documenten bestaat.

Het gaat alleen om massale informatie:

Kwantitatieve analyse speelt een belangrijke rol voor elke organisatie waar terabytes aan informatie komt uit klant transacties, sociale media, bedrijfsstatistieken, en foto-uploads. Echter, definitie van dit soort grote gegevenssets strekt zich uit buiten petabytes van volume. Volume wordt het eerste element, de andere twee essentiële elementen kunnen verscheidenheid en snelheid van informatie. Verschillende soorten gegevens die verwijst naar het aantal soorten informatie en bestandstypen die meer grondig kunnen worden beheerd of geanalyseerd en snelheid betekent hoe snel de gegevens in real-time kunnen worden opgehaald. Traditionele technologieën en relationele databases zijn niet geschikt voor dit soort informatie en dat is hoe de grote gegevens in beeld komt.

Het betekent slechts Hadoop:

Hadoop is synoniem met grote gegevens geworden. Hadoop is een Apache software open-source raamwerk geschreven in Java programmeertaal die het mogelijk het werken met grote hoeveelheden gegevens maakt. Het is ontworpen aan schaal omhoog vanuit een enkele server naar duizenden machines. Grote gegevens is niet gelijk aan Hadoop in zekere zin dat de meeste van de informatie voor dit type gegevens komt uit bronnen zoals evenementen, feeds, sociale media etc. in vorm van uitdagingen die door een technologie of product zoals Hadoop is voldaan.

Het betekent slechts ongestructureerde gegevens:

Ongestructureerde gegevens heeft geen duidelijke vorm. Het is niet ongestructureerde omdat we de gegevens niet in een model passen kunnen, maar zelfs na past binnen het model zal niet helpen. Ongestructureerde gegevens is een generiek etiket te beschrijven van alle informatie die is niet in de database. Het kan worden tekstueel of un-textual met inbegrip van audio en video bestanden, afbeeldingsbestanden, e-mailberichten, formuliergegevens, tekst-strings, sociale media feed, enzovoort.