Zeven stappen in de omgang met Big Data
1 november 2012 [08:10], 8231 views
Auteur onbekend

Zeven stappen in de omgang met Big Data

De Big Data-trend betekent dat er een groeiende behoefte is om grote hoeveelheden gegevens te verwerken met een nieuw soort technologische oplossingen. onvergelijkbaar met de standaard vertrouwde database zijn. Dus wat moet een bedrijf overwegen voor het aan de slag gaat met Big Data?

Naarmate meer IT-afdelingen nadenken over big data-alternatieven,  gaat het al snel om hardware, verwerkingssnelheden en platforms. Voor zover IT-afdelingen wijs genoeg zijn om de beperkingen van hun gevestigde technologieën te begrijpen, kunnen velen de zakelijke waarde van deze alternatieve oplossingen niet zichtbaar maken, laat staan hoe ze de data zullen classificeren en prioriteren als ze deze eenmaal in beeld hebben. En dat is waar Big Data Governance om de hoek komt.

Ik zie zeven stappen die noodzakelijk zijn voor het realiseren van het volledige potentieel van big data:

    Verzamelen: Gegevens worden verzameld uit de gegevensbronnen en verdeeld over meerdere nodes - vaak een raster - die alle een deel van de gegevens parallel verwerken.

    Verwerken: Het systeem gebruikt vervolgens ditzelfde krachtige parallellisme om snel op elke node (knooppunt) met de gegevens berekeningen uit te voeren. Vervolgens reduceren  de knooppunten de resulterende bevindingen tot bruikbare gegevensverzamelingen voor ofwel een mens (bij analyse) ofwel een machine (in het geval van grootschalige interpretatie van resultaten).

    Beheren: Vaak is big data heterogeen, afkomstig uit verschillende transactionele systemen. Bijna al deze gegevens moeten worden begrepen, gedefinieerd, geannoteerde, gereinigd en gecontroleerd op veiligheid.

    Meten: Bedrijven zullen vaak de snelheid meten waarmee gegevens kunnen worden geïntegreerd met andere records, en of de snelheid van integratie of correctie toeneemt in de tijd. Zakelijke vereisten moet bepalen welk type meting en tracking wordt gebruikt.

  Consumeren: Het resulterende gebruik van de gegevens moet aansluiten bij de oorspronkelijke eis voor de verwerking. Als bijvoorbeeld het binnenhalen van een paar honderd terabyte aan social media-interacties aantoont of en hoe social media gegevens extra productaankopen oplevert, dan moeten er regels komen voor de manier waarop de social mediagegevens worden geopend en bijgewerkt.

   Opslaan: Nu de "data-as-a-service" trend vorm krijgt  blijven gegevens meer en meer op dezelfde locatie, terwijl de programma's die er toegang tot hebben degene zijn die zich verplaatsen. Of de data nu wordt opgeslagen voor korte termijn batch processing of wordt bewaard voor de de langere termijn, de opslagoplossingen moeten bewust worden aangepakt.

   Regelen: Data Governance omvat het beleid en het toezicht op de gegevens vanuit een zakelijk perspectief. Data governance geldt voor elk van de zes bovengenoemde stappen van big data delivery.

Het merendeel van de 'early adopters' belast met het onderzoek naar en de aanschaf van big data –oplossingen, concentreert zich op het verzamelen en opslaan van data. De vraag is impliciet: "Hoe kunnen we al deze petabytes aan gegevens verzamelen, en waar laten we ze allemaal als we ze eenmaal hebben?"

Maar de processen voor het definiëren van heldere business requirements voor big data gaan veel IT-afdelingen nog boven de pet. Businessmensen zien big data dan ook nog te vaak als een voorwendsel van de IT-afdeling om deze verder uit te bouwen, zonder helder doel.  Een dergelijk milieu van de wederzijdse cynisme is niet erg productief…

Zie ook:  http://www.sas.com/news/sascom/big-data-delivery.html

(Tijdens het seminar DataGovernance@SAS, 27 november a.s. in Huizen, presenteert Jill Dyché, Vice President Thought Leadership & Education SAS, een framework voor een bedrijfsdatastrategie in realtie tot big data.)



 

Reacties

Hoe bouw je een efficiënt data governance programma?
13 september 2018 [03:25], 4395 views

Hoe bouw je een efficiënt data governance programma?

Data governance is geen oud concept; bij SAS hebben we het al jaren over de voordelen van data governance. Het wordt echter vaak als een ‘nice to have’ gezien, ook a [...]

 

Lees meer  

SAS is benoemd tot leider in de Gartner Magic Quadrant voor data-integratie
6 september 2018 [11:55], 2141 views

SAS is benoemd tot leider in de Gartner Magic Quadrant voor data-integratie

Gartner heeft SAS voor het achtste jaar op rij uitgeroepen tot leider in data-integratie tools.

 

Lees meer  

Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’
13 augustus 2018 [10:30], 3631 views

Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’

Zijn data scientists in staat om nieuwe inzichten te halen uit genetische data van de patiënt, met als doel om kanker beter te begrijpen en behandelingen beter [...]

 

Lees meer  

Gepersonaliseerde zorg
28 mei 2018 [06:10], 1984 views

Gepersonaliseerde zorg

Gepersonaliseerde zorg is de focus van de huidige zoektocht in de zorg. Het Nederlandse zorgsysteem is dan wel wereldwijd één van de voorlopers, tegelijkertijd wille [...]

 

Lees meer  

De 5 belangrijkste data management trends in 2018
10 januari 2018 [11:49], 5673 views

De 5 belangrijkste data management trends in 2018

Wat brengt dit jaar ons op het gebied van data management? Vanuit mijn optiek zijn dit de vijf ontwikkelingen die in 2018 bepalend zullen zijn voor het vakgebied.

 

Lees meer  

Gebruik DevOps ook voor je analytische modellen
27 december 2017 [10:48], 5630 views

Gebruik DevOps ook voor je analytische modellen

Nu bedrijven zich realiseren dat er waarde zit in hun data, willen steeds meer afdelingen een analytisch model. Maar hoe kun je aan die vraag voldoen?

 

Lees meer  

De 5 componenten van een sterke datastrategie
7 december 2017 [11:18], 4491 views

De 5 componenten van een sterke datastrategie

Datagedreven organisaties kunnen sneller beslissingen nemen, sneller innoveren, de klantervaring verbeteren en hun efficiency verhogen door processen te optimalisere [...]

 

Lees meer  

Vieze data nog steeds het grootste knelpunt voor Data Scientists
27 november 2017 [11:15], 4980 views

Vieze data nog steeds het grootste knelpunt voor Data Scientists

Wie in Google de zoekterm ‘dirty data’ intikt krijgt binnen een halve seconde meer dan 8 miljoen resultaten waarvan ook veel van jaren geleden. Het probleem is dus b [...]

 

Lees meer  

Trends en uitdagingen in data management
14 november 2017 [03:36], 7900 views

Trends en uitdagingen in data management

Data management staat hoog op de agenda bij veel bedrijven. Ze moeten complexe data beheren, integreren en real-time omzetten in betekenisvolle informatie.

 

Lees meer  

Verhoog ROI op data en IT met governance
7 november 2017 [05:37], 4048 views

Verhoog ROI op data en IT met governance

Bedrijven met een effectieve data governance strategie halen een 40 procent hogere ROI op hun IT-investeringen dan hun concurrenten. Alle reden dus om data governanc [...]

 

Lees meer