Gebruik DevOps ook voor je analytische modellen
27 december 2017 [10:48], 511 views
Door Rein Mertens

Gebruik DevOps ook voor je analytische modellen

Sales wil de vraag beter voorspellen, productie wil slimmere capaciteitsplanningen maken, marketing wil beter afgebakende doelgroepen definiëren en ga zo maar door. Er is maar een klein groepje data scientists dat in staat is deze modellen te bouwen, wat al snel leidt tot vertraging. En die vertraging wordt alleen maar groter als het analytische model door IT in productie moet worden genomen. Want zo’n model wordt vaak in een sandbox omgeving ontwikkeld. En iedereen weet dat de stap van sandbox naar een productieomgeving groot is.

De meeste bedrijven hebben nog veel legacy-applicaties die niet eenvoudig aanpasbaar zijn. Daar komt bij dat een traditionele IT-afdeling vaak met strak gedefinieerde processen werkt en compleet andere datastructuren en programmeertalen gebruikt dan waar de data scientists mee werken. Dat betekent dat IT een ontwikkeld statistisch model meestal niet gemakkelijk kan operationaliseren, maar het min of meer opnieuw moet ontwikkelen om het te laten passen in de bestaande omgeving/architectuur.

DevOps: Fabriek voor analytische modellen

Organisaties die agile werken, zijn massaal bezig het antwoord te vinden op deze uitdaging. Ze weten ook al waar ze dat moeten zoeken: bij DevOps. Vertaald naar analytics: bouw een ‘fabriek’ voor je analytische modellen die ervoor zorgt dat je model al tijdens de bouw wordt voorzien van de benodigde governance, beheermaatregelen en interfaces, zodat het analytische model flexibel op iedere plek is in te zetten. De fabriek kan ervoor zorgen dat alles wat nodig is om een sandbox model in productie te brengen onderdeel wordt van het ontwikkelproces van het model. Op die manier hoef je niet voor ieder model het wiel opnieuw uit te vinden, maar bouw je een proces dat je keer op keer hergebruikt. Lees hier uit welke componenten zo’n fabriek bestaat.

De fabriek bestaat uit de volgende componenten:

  1. Een dedicated ‘analytics data store’ waar de volledige levenscyclus van een model in wordt bewaakt 
    1. Gebruik bijvoorbeeld een Hadoop-platform in plaats van een relationele database. Je wilt namelijk snel nieuwe databronnen toevoegen, zonder de data eerst volledig opnieuw te structureren. Bovendien wil je dat het platform schaalbaar kan omgaan met veel data, en tabellen die uit veel verschillende kolommen bestaan.
    2. Automatische integratie van nieuwe databronnen en logica in je fabriek.
  2. Interfaces naar andere systemen die gebruik willen maken van de output van de analytische modellen.
  3. Testautomatisering waarmee de analytische modellen volgens vaste methoden grotendeels geautomatiseerd worden getest.
  4. Containers waarmee je de analytische modellen allemaal eenzelfde ‘uiterlijk’ geeft zodat ze makkelijk op verschillende plekken en processen zijn in te zetten. Vergelijk het met transportcontainers: de inhoud van iedere container is anders, maar doordat de afmetingen hetzelfde zijn en vrachtschepen, vrachtwagens en treinen hierop zijn aangepast, kan iedere container op ieder transportmiddel worden vervoerd.


Kortere time-to-market

Net als een gewone fabriek zorgt ook een fabriek voor analytische modellen voor kostenbesparingen en een kortere time-to-market. Door veel van het werk te automatiseren is ook nog eens snellere innovatie mogelijk. En last but not least: de fabriek doorbreekt de barrières tussen modelontwikkeling en implementatie, ofwel tussen de business en IT. Zie onderstaande figuur hoe dit in de praktijk werkt.

Plaatje artikel devops

Benieuwd naar de vijf stappen waarin je zo’n fabriek bouwt? Lees de whitepaper ‘Breaking down barriers between model development and deployment’.

Over de auteur

Rein Mertens is Senior Manager en werkt sinds 1995 bij SAS Nederland. Hij adviseert nieuwe en bestaande klanten over de toegevoegde waarde van de inzet van SAS oplossingen voor informatie management en business analytics vraagstukken. Rein is inhoudelijk betrokken bij de verschillende SAS User group events. Rein zit in internationale werkgroepen om op basis van klantinput mee te denken met de prioriteitsstelling en verbetering van de SAS-producten.

Reacties

De 5 belangrijkste data management trends in 2018
10 januari 2018 [11:49], 293 views

De 5 belangrijkste data management trends in 2018

Wat brengt dit jaar ons op het gebied van data management? Vanuit mijn optiek zijn dit de vijf ontwikkelingen die in 2018 bepalend zullen zijn voor het vakgebied. 

Lees meer  

Gebruik DevOps ook voor je analytische modellen
27 december 2017 [10:48], 512 views

Gebruik DevOps ook voor je analytische modellen

Nu bedrijven zich realiseren dat er waarde zit in hun data, willen steeds meer afdelingen een analytisch model. Maar hoe kun je aan die vraag voldoen?

 

Lees meer  

De 5 componenten van een sterke datastrategie
7 december 2017 [11:18], 933 views

De 5 componenten van een sterke datastrategie

Datagedreven organisaties kunnen sneller beslissingen nemen, sneller innoveren, de klantervaring verbeteren en hun efficiency verhogen door processen te optimalisere [...]

 

Lees meer  

Vieze data nog steeds het grootste knelpunt voor Data Scientists
27 november 2017 [11:15], 1094 views

Vieze data nog steeds het grootste knelpunt voor Data Scientists

Wie in Google de zoekterm ‘dirty data’ intikt krijgt binnen een halve seconde meer dan 8 miljoen resultaten waarvan ook veel van jaren geleden. Het probleem is dus b [...]

 

Lees meer  

UMC Utrecht verhoogt kwaliteit zorg met toegepaste data-analyse
21 november 2017 [03:45], 1015 views

UMC Utrecht verhoogt kwaliteit zorg met toegepaste data-analyse

Universitair Medisch Centrum Utrecht (UMC Utrecht) streeft de hoogste standaarden na als het gaat om patiëntenzorg, wetenschappelijk onderzoek en opleiding. Om dit v [...]

 

Lees meer  

Trends en uitdagingen in data management
14 november 2017 [03:36], 1660 views

Trends en uitdagingen in data management

Data management staat hoog op de agenda bij veel bedrijven. Ze moeten complexe data beheren, integreren en real-time omzetten in betekenisvolle informatie.

 

Lees meer  

Verhoog ROI op data en IT met governance
7 november 2017 [05:37], 1219 views

Verhoog ROI op data en IT met governance

Bedrijven met een effectieve data governance strategie halen een 40 procent hogere ROI op hun IT-investeringen dan hun concurrenten. Alle reden dus om data governanc [...]

 

Lees meer  

Dit zijn de hoogtepunten van de Analytics Experience
31 oktober 2017 [10:05], 1040 views

Dit zijn de hoogtepunten van de Analytics Experience

De oprichter en CEO van SAS, Jim Goodnight, was er duidelijk over tijdens de Analytics Experience: “We leven in een nieuwe democratie van analytics. De macht van dat [...]

 

Lees meer  

Hoe haal je businesswaarde uit de GDPR?
5 oktober 2017 [12:10], 1126 views

Hoe haal je businesswaarde uit de GDPR?

GDPR compliance is verre van eenvoudig. Welke maatregelen moet je treffen om de privacy van hun klanten en medewerkers te beschermen? En hoe haal je hier ook zakelij [...]

 

Lees meer  

Rampenbestrijding gebaat bij data-analyse over gedrag  donateurs
20 september 2017 [08:55], 2351 views

Rampenbestrijding gebaat bij data-analyse over gedrag donateurs

Amerika en de Caraïben zitten midden in het orkaanseizoen. Om te zorgen dat donaties aan slachtoffers goed terecht komen gebruikt Fidelity Charitable SAS Visual Anal [...]

 

Lees meer