Gebruik DevOps ook voor je analytische modellen
27 december 2017 [10:48], 2433 views
Door Rein Mertens

Gebruik DevOps ook voor je analytische modellen

Sales wil de vraag beter voorspellen, productie wil slimmere capaciteitsplanningen maken, marketing wil beter afgebakende doelgroepen definiëren en ga zo maar door. Er is maar een klein groepje data scientists dat in staat is deze modellen te bouwen, wat al snel leidt tot vertraging. En die vertraging wordt alleen maar groter als het analytische model door IT in productie moet worden genomen. Want zo’n model wordt vaak in een sandbox omgeving ontwikkeld. En iedereen weet dat de stap van sandbox naar een productieomgeving groot is.

De meeste bedrijven hebben nog veel legacy-applicaties die niet eenvoudig aanpasbaar zijn. Daar komt bij dat een traditionele IT-afdeling vaak met strak gedefinieerde processen werkt en compleet andere datastructuren en programmeertalen gebruikt dan waar de data scientists mee werken. Dat betekent dat IT een ontwikkeld statistisch model meestal niet gemakkelijk kan operationaliseren, maar het min of meer opnieuw moet ontwikkelen om het te laten passen in de bestaande omgeving/architectuur.

DevOps: Fabriek voor analytische modellen

Organisaties die agile werken, zijn massaal bezig het antwoord te vinden op deze uitdaging. Ze weten ook al waar ze dat moeten zoeken: bij DevOps. Vertaald naar analytics: bouw een ‘fabriek’ voor je analytische modellen die ervoor zorgt dat je model al tijdens de bouw wordt voorzien van de benodigde governance, beheermaatregelen en interfaces, zodat het analytische model flexibel op iedere plek is in te zetten. De fabriek kan ervoor zorgen dat alles wat nodig is om een sandbox model in productie te brengen onderdeel wordt van het ontwikkelproces van het model. Op die manier hoef je niet voor ieder model het wiel opnieuw uit te vinden, maar bouw je een proces dat je keer op keer hergebruikt. Lees hier uit welke componenten zo’n fabriek bestaat.

De fabriek bestaat uit de volgende componenten:

  1. Een dedicated ‘analytics data store’ waar de volledige levenscyclus van een model in wordt bewaakt 
    1. Gebruik bijvoorbeeld een Hadoop-platform in plaats van een relationele database. Je wilt namelijk snel nieuwe databronnen toevoegen, zonder de data eerst volledig opnieuw te structureren. Bovendien wil je dat het platform schaalbaar kan omgaan met veel data, en tabellen die uit veel verschillende kolommen bestaan.
    2. Automatische integratie van nieuwe databronnen en logica in je fabriek.
  2. Interfaces naar andere systemen die gebruik willen maken van de output van de analytische modellen.
  3. Testautomatisering waarmee de analytische modellen volgens vaste methoden grotendeels geautomatiseerd worden getest.
  4. Containers waarmee je de analytische modellen allemaal eenzelfde ‘uiterlijk’ geeft zodat ze makkelijk op verschillende plekken en processen zijn in te zetten. Vergelijk het met transportcontainers: de inhoud van iedere container is anders, maar doordat de afmetingen hetzelfde zijn en vrachtschepen, vrachtwagens en treinen hierop zijn aangepast, kan iedere container op ieder transportmiddel worden vervoerd.


Kortere time-to-market

Net als een gewone fabriek zorgt ook een fabriek voor analytische modellen voor kostenbesparingen en een kortere time-to-market. Door veel van het werk te automatiseren is ook nog eens snellere innovatie mogelijk. En last but not least: de fabriek doorbreekt de barrières tussen modelontwikkeling en implementatie, ofwel tussen de business en IT. Zie onderstaande figuur hoe dit in de praktijk werkt.

Plaatje artikel devops

Benieuwd naar de vijf stappen waarin je zo’n fabriek bouwt? Lees de whitepaper ‘Breaking down barriers between model development and deployment’.

Over de auteur

Rein Mertens is Senior Manager en werkt sinds 1995 bij SAS Nederland, momenteel in de rol van Head of Analytical Platform. Met zijn team pre-sales consultants en data scientists adviseert hij nieuwe en bestaande klanten over de toegevoegde waarde van de inzet van SAS oplossingen voor informatie management, business analytics en visualisatie, machine learning en AI vraagstukken. Als gecertificeerde Data Privacy Officer is Rein tevens nauw betrokken bij de impact van de nieuwe data privacy wetgeving per mei 2018 (AVG) op data management en data science projecten. Rein is inhoudelijk betrokken bij de verschillende SAS User group events en zit in internationale werkgroepen om op basis van klantinput mee te denken met de prioriteitsstelling en verbetering van de SAS-producten.

Reacties

Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’
13 augustus 2018 [10:30], 178 views

Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’

Zijn data scientists in staat om nieuwe inzichten te halen uit genetische data van de patiënt, met als doel om kanker beter te begrijpen en behandelingen beter [...]

 

Lees meer  

Innovaties in een data gedreven samenleving
13 juni 2018 [09:00], 890 views

Innovaties in een data gedreven samenleving

Innovaties in een data gedreven samenleving: van een grotere overlevingskans bij vroeggeboortes tot een leven lang genieten van voetbal. Op donderdag 31 mei vond de [...]

 

Lees meer  

Gepersonaliseerde zorg
28 mei 2018 [06:10], 609 views

Gepersonaliseerde zorg

Gepersonaliseerde zorg is de focus van de huidige zoektocht in de zorg. Het Nederlandse zorgsysteem is dan wel wereldwijd één van de voorlopers, tegelijkertijd wille [...]

 

Lees meer  

Hoe DHL meer grip krijgt op veranderende omstandigheden
8 mei 2018 [11:26], 861 views

Hoe DHL meer grip krijgt op veranderende omstandigheden

Logistiek dienstverlener DHL onderzoekt de mogelijkheden om data analytics toe te passen op operationeel niveau om direct in te kunnen spelen op veranderende omstand [...]

 

Lees meer  

SAS Data Science & Analytics Day op 31 mei
2 mei 2018 [09:01], 1334 views

SAS Data Science & Analytics Day op 31 mei

Innovatief gebruik van analytics verandert de wereld. De SAS Data Science and Analytics Day op 31 mei biedt organisaties nieuwe inzichten en ideeën die bijdragen aan de ‘a [...]

 

Lees meer  

Fraudebestrijding steeds succesvoller door data-analyse
30 april 2018 [11:16], 1006 views

Fraudebestrijding steeds succesvoller door data-analyse

Nieuwe SAS-divisie moet organisaties helpen om verlies van miljarden euro’s te voorkomen. De combinatie van geavanceerde analytics-oplossingen en AI helpt de steeds comple [...]

 

Lees meer  

Datavisualisatie brengt humanitaire problemen in beeld
10 april 2018 [06:59], 1141 views

Datavisualisatie brengt humanitaire problemen in beeld

SAS heeft de krachten gebundeld met Global GoalsCast om de ernstige problemen waarmee de mensheid wordt geconfronteerd in beeld te brengen met datavisualisaties.

 

Lees meer  

Belfius werkt samen met SAS aan innovatie met data
8 februari 2018 [05:20], 2173 views

Belfius werkt samen met SAS aan innovatie met data

Na jarenlange samenwerking gaat Belgische bank Belfius  nog ee [...]

 

Lees meer  

Wat krijg je als je liefde, wiskunde en AI combineert?
1 februari 2018 [03:12], 2213 views

Wat krijg je als je liefde, wiskunde en AI combineert?

Liefde en wiskunde. Je kunt bijna geen onderwerpen vinden die verder van elkaar afstaan. Toch bewees Hannah Fry dat wiskunde kan helpen om het geheim van een succesv [...]

 

Lees meer  

De 5 belangrijkste data management trends in 2018
10 januari 2018 [11:49], 2483 views

De 5 belangrijkste data management trends in 2018

Wat brengt dit jaar ons op het gebied van data management? Vanuit mijn optiek zijn dit de vijf ontwikkelingen die in 2018 bepalend zullen zijn voor het vakgebied.

 

Lees meer