Big Data

Wat is Big Data?

De term Big Data bestaat inmiddels al een tijdje. In 2012 was Big Data het buzzword voor technologische ontwikkelingen en werd het opgenomen in de Gartner Hype Cycle voor opkomende technologieën. Als we spreken over Big Data hebben we het meestal over grote hoeveelheden data en/of ongestructureerde data zoals tekst, audio, video, afbeeldingen en andere formaten die niet in een Excel-bestandje passen. Echter, de definitie van Big Data verschuift voortdurend. Waar je iPhone in 2007 nog maximaal 8GB opslagruimte bevatte, is deze in 2018 te koop met een harde schijf van 256GB. Hetzelfde geldt voor (computer-)processors, waar het aantal processorkernen toe is genomen van 1 naar wel 16 stuks per CPU. Data opslag wordt steeds goedkoper en de verwerking steeds sneller. Wanneer je spreekt van Big Data hang af van de data en de gebruikte methoden en technieken die gebruikt worden. Over het algemeen wordt Big Data gekenmerkt door de omvang (Data Volume), variatie (Data Variety) en de verwerkingssnelheid (Data Velocity).



Data Volume
Er wordt een grote hoeveelheid data gegenereerd en eventueel opgeslagen. Voor de opslag en verwerking van zulke grote hoeveelheden data is speciale infrastructuur en software nodig.

Data Variety
Het soort data en de afkomst van de data verschilt sterk. Tekst, beeld en geluid kunnen door elkaar heen worden gebruikt. 

Data Velocity
De data wordt op hoge snelheid gegenereerd. Denk aan data uit sensoren, of de data die gegenereerd wordt op social media. Vaak wordt data real-time (on the fly) verwerkt, in plaats van alles eerst keurig netjes te ordenen en op te slaan.

Wat kan ik met Big Data?

Big Data omvat een aantal aspecten binnen een organisatie op het gebied van IT. In het Big Data landschap besteden wij aandacht aan de infrastructuur, analysemogelijkheden, bedrijfs (business) toepassingen, cross-platform infrastructuur en analysemogelijkheden en het gebruik van open source data en andere databronnen.

Infrastructuur
Denk hierbij aan het inrichten van grote databases, het gebruik van Hadoop (computer-clusters), hardware, en cloud technologieën. Grote spelers op dit gebied zijn Microsoft Azure, Amazon Web Services en Google Cloud Platform.

Analysemogelijkheden
Onder de analysemogelijkheden wordt verstaan het analyseren van grote hoeveelheden data (zowel gestructureerd als ongestructureerd). Hiervoor kunnen verschillende Big Data platformen voor worden gebruikt, die grote hoeveelheden analysemogelijkheden bieden in combinatie met Machine Learning.

Business toepassingen
Onder business toepassingen worden oplossingen verstaan die ontwikkeld zijn door fabrikanten die een specifiek probleem oplossen. Voorbeelden van zulke oplossingen hebben betrekking op security, marketing en e-commerce.

Cross-platform infrastructuur/analysemogelijkheden
Big Data maakt het mogelijk om data op verschillende plekken te verspreiden (cloud), maar ook om gebruik te maken van externe servers en complete enterprise oplossingen met als bekend voorbeeld SAP.

Open source data
Omdat er zoveel data wordt verzameld, wordt het aanbod aan open source data ook steeds groter. Een bekend voorbeeld in Nederland is het CBS dat een grote hoeveelheid aan statistische data openbaar aanbiedt.

Andere data bronnen en API’s
Naast open data zijn er ook zogeheten API’s, waarmee je geautomatiseerd vragen kunt sturen om data te verkrijgen. Voorbeelden zijn Facebook en Twitter waar je met behulp van een API data kunt opvragen. Daarnaast zijn er natuurlijk partijen die als doel hebben data te verzamelen en tegen betaling te verstrekken.

Aanmelden
© Copyright Big Data Innovatiehub 2018
Contact
close slider