Wat is de aantrekkingskracht van Hadoop?
1 april 2015 [09:28], 2523 views
Door Redactie

Wat is de aantrekkingskracht van Hadoop?

Hadoop is een veelbesproken onderwerp. Zo buigen legio bedrijven zich momenteel over vraagstukken als waar zij Hadoop kunnen inpassen naast de bestaande IT-architecturen, of waar het sommige componten kan vervangen. Maar waarom is Hadoop eigenlijk zo’n ‘hot topic’?

De belangrijkste redenen waarom bedrijven Hadoop omarmen zijn: kosten en flexibiliteit. Veel organisaties die het al geïmplementeerd hebben geven aan dat het gebruik van Hadoop als dataplatform economisch efficiënt is. De kosten van de software en support, per server-node of per processor (CPU), zijn aanzienlijk lager dan bijna elk ander relationeel database management systeem (RDBMS). Daarnaast is de standaardhardware (commodity hardware) waar Hadoop op draait een stuk goedkoper dan de hardware die aan organisaties geadviseerd wordt voor een RDBMS of een gespecialiseerde appliance. Een andere reden waarom Hadoop kosten kan besparen is dat redundancy is ingebouwd in het systeem, dus hoef je je geen zorgen te maken over zaken als redundant uitgevoerde voedingen (PSU’s) of harde schijven. Een uitgevallen node in Hadoop is helemaal niet erg.

Geen extra kosten
Verder noemen veel Hadoop-gebruikers als groot voordeel het feit dat je harde schijven en geheugen in nodes gewoon kunt upgraden onafhankelijk van softwarelicenties en andere formaliteiten. Hetzelfde geldt voor rekenkracht. Als een organisatie meer CPU’s wil gebruiken in een Hadoop-cluster om de verwerkingskracht te vergroten, dan leidt dat niet tot hoge extra RDBMS-licentiekosten. Omdat deze onnodige extra kosten niet aan de orde zijn, zorgen incrementele upgrades niet voor overschrijdingen van het IT-budget. De upgrades zijn behoorlijk goed voorspelbaar.

Door Hadoop als een dataplatform te omarmen hopen organisaties de RDBMS-groei af te remmen. Die groei begint nu een aanzienlijke kostenpost te worden. Sommige organisaties spelen zelfs met het idee om het RDBMS grotendeels weg te halen nu datavolumes sterk groeien. Hadoop wordt gezien als kosteneffectieve manier om een dataplatform te implementeren dat in staat is om te gaan met de huidige data-explosie en met de aanhoudende versnelling van data die wordt verwacht met het Internet of Things.

Naast de kosten voor opslag, software en hardware verlaagt Hadoop de kosten voor databeheer. Gebruikers claimen dat het makkelijker is om data in Hadoop te laden aangezien het onafhankelijk van bestandsformaat en structuur ingevoerd kan worden. De structurering vooraf is niet nodig en gebeurt pas bij het uitlezen. De gedachte hierbij is dat het geen vertraging geeft voor data modeling en ook niet voor ‘flow building’ om data beschikbaar te maken voor diegenen die het echt gaan gebruiken in een specifieke toepassing of business proces.  

Meer flexibiliteit
De tweede veelgenoemde reden om Hadoop te omarmen is flexibiliteit (agility). Hier zitten twee kanten aan: Hadoop biedt een startpunt voor gebruik van de enorme hoeveelheid ongestructureerde en semi-gestructureerde data. Velen menen dat het economisch niet zinnig is om die databergen aan te pakken in dure RDBMS’en. De mogelijkheid van schema on read is ook een kwestie van agility. Het doel van deze functionaliteit is het verschuiven van de inspanningen voor data modeling naar het punt van het uiteindelijke datagebruik (of: dataconsumptie). Dankzij schema on read is de IT-afdeling in staat samen te werken met gebruikers in de business om het datamodel te definiëren op het moment dat businesskwesties zich aandienen. De IT-afdeling hoeft hierdoor niet langer een groot centraal model te updaten en daar dan data-flows in te bouwen voordat ze op de behoeften van de business kunnen inspelen. Het gebruik van schema on read zorgt ervoor dat nieuwe data ingevoerd kan worden in Hadoop en beschikbaar gesteld aan de business zonder een te grote inspanning of een te lange vertraging qua doorvoertijd.

Meer weten over Hadoop? Lees dan hier de white paper of bezoek op 15 en 16 april de Hadoop Summit. 

 

 

Reacties

Sanoma verhoogt conversie marketingcampagnes door snellere beschikbaarheid data
1 december 2016 [03:22], 4162 views

Sanoma verhoogt conversie marketingcampagnes door snellere beschikbaarheid data

De juiste content op het perfecte moment. Hoe pakt Sanoma dat aan?

 

Lees meer  

Gartner maakt leiders in data-integratie bekend
18 augustus 2016 [01:46], 5491 views

Gartner maakt leiders in data-integratie bekend

Gartner heeft de positie van alle partijen op het gebied van data-integratie in kaart gebracht. SAS werd daarbij voor de zesde keer op rij tot leider uitgeroepen

 

Lees meer  

Onderzoek TDWI: adoptie van Hadoop neemt toe
14 maart 2016 [10:56], 7841 views

Onderzoek TDWI: adoptie van Hadoop neemt toe

Het aantal Hadoop-clusters in productie is in twee jaar met 60 procent is gestegen. Dit blijkt uit een onderzoek dat TDWI uitvoerde onder data management-professionals.

 

Lees meer  

Open Data Platform: samen maak je meer vaart dan alleen
20 april 2015 [08:53], 14855 views

Open Data Platform: samen maak je meer vaart dan alleen

Hadoop is in korte tijd erg populair geworden. Leveranciers bouwen hun oplossingen echter allemaal op basis van andere versies van Hadoop.  Dit maakt integratie tot een ui [...]

 

Lees meer  

DIY Hadoop, probeer het nu 3 maanden gratis
13 april 2015 [08:35], 7910 views

DIY Hadoop, probeer het nu 3 maanden gratis

Onafhankelijk van de IT-afdeling data die opgeslagen is in Hadoop gebruiken? DIY Hadoop is dichterbij dan je denkt.

 

Lees meer  

 3 Hadoop-scenario's voor náást je datawarehouse
10 april 2015 [08:55], 3969 views

3 Hadoop-scenario's voor náást je datawarehouse

Elke organisatie is anders, maar je komt in de praktijk toch een aantal algemene scenario’s voor Hadoop tegen. Over het algemeen komen deze voor wanneer organisaties [...]

 

Lees meer  

Wat is de aantrekkingskracht van Hadoop?
1 april 2015 [09:28], 2524 views

Wat is de aantrekkingskracht van Hadoop?

Hadoop is een veelbesproken onderwerp binnen (IT)-organisaties. Zo buigen legio bedrijven zich momenteel over vraagstukken als waar zij Hadoop kunnen inpassen naast [...]

 

Lees meer  

SAS vereenvoudigt bewerken big data met SAS Data Loader voor Hadoop
23 maart 2015 [11:49], 17019 views

SAS vereenvoudigt bewerken big data met SAS Data Loader voor Hadoop

Voor het gebruik van Hadoop zijn veilige toegang, eenvoudige data-integratie en goede datakwaliteit noodzakelijk. Om hieraan tegemoet te komen introduceert SAS de SAS Data [...]

 

Lees meer  

De 5 belangrijkste vragen over ‘The internet of things’
11 maart 2015 [09:52], 10985 views

De 5 belangrijkste vragen over ‘The internet of things’

Het aantal bronnen met streaming data neemt ieder jaar met 20 procent toe. Veel bedrijven zien de potentie van deze datastromen en stellen zichzelf vragen zoals: hoe [...]

 

Lees meer  

8 dingen die je moet weten over Hadoop
2 maart 2015 [09:49], 33849 views

8 dingen die je moet weten over Hadoop

Hadoop is een open-source software raamwerk waarmee applicaties data in een gedistribueerde omgeving kunnen verwerken. Het komt erop neer dat grote datasets in klein [...]

 

Lees meer