Gebruik DevOps ook voor je analytische modellen
27 december 2017 [10:48], 3063 views
Door Rein Mertens

Gebruik DevOps ook voor je analytische modellen

Sales wil de vraag beter voorspellen, productie wil slimmere capaciteitsplanningen maken, marketing wil beter afgebakende doelgroepen definiëren en ga zo maar door. Er is maar een klein groepje data scientists dat in staat is deze modellen te bouwen, wat al snel leidt tot vertraging. En die vertraging wordt alleen maar groter als het analytische model door IT in productie moet worden genomen. Want zo’n model wordt vaak in een sandbox omgeving ontwikkeld. En iedereen weet dat de stap van sandbox naar een productieomgeving groot is.

De meeste bedrijven hebben nog veel legacy-applicaties die niet eenvoudig aanpasbaar zijn. Daar komt bij dat een traditionele IT-afdeling vaak met strak gedefinieerde processen werkt en compleet andere datastructuren en programmeertalen gebruikt dan waar de data scientists mee werken. Dat betekent dat IT een ontwikkeld statistisch model meestal niet gemakkelijk kan operationaliseren, maar het min of meer opnieuw moet ontwikkelen om het te laten passen in de bestaande omgeving/architectuur.

DevOps: Fabriek voor analytische modellen

Organisaties die agile werken, zijn massaal bezig het antwoord te vinden op deze uitdaging. Ze weten ook al waar ze dat moeten zoeken: bij DevOps. Vertaald naar analytics: bouw een ‘fabriek’ voor je analytische modellen die ervoor zorgt dat je model al tijdens de bouw wordt voorzien van de benodigde governance, beheermaatregelen en interfaces, zodat het analytische model flexibel op iedere plek is in te zetten. De fabriek kan ervoor zorgen dat alles wat nodig is om een sandbox model in productie te brengen onderdeel wordt van het ontwikkelproces van het model. Op die manier hoef je niet voor ieder model het wiel opnieuw uit te vinden, maar bouw je een proces dat je keer op keer hergebruikt. Lees hier uit welke componenten zo’n fabriek bestaat.

De fabriek bestaat uit de volgende componenten:

  1. Een dedicated ‘analytics data store’ waar de volledige levenscyclus van een model in wordt bewaakt 
    1. Gebruik bijvoorbeeld een Hadoop-platform in plaats van een relationele database. Je wilt namelijk snel nieuwe databronnen toevoegen, zonder de data eerst volledig opnieuw te structureren. Bovendien wil je dat het platform schaalbaar kan omgaan met veel data, en tabellen die uit veel verschillende kolommen bestaan.
    2. Automatische integratie van nieuwe databronnen en logica in je fabriek.
  2. Interfaces naar andere systemen die gebruik willen maken van de output van de analytische modellen.
  3. Testautomatisering waarmee de analytische modellen volgens vaste methoden grotendeels geautomatiseerd worden getest.
  4. Containers waarmee je de analytische modellen allemaal eenzelfde ‘uiterlijk’ geeft zodat ze makkelijk op verschillende plekken en processen zijn in te zetten. Vergelijk het met transportcontainers: de inhoud van iedere container is anders, maar doordat de afmetingen hetzelfde zijn en vrachtschepen, vrachtwagens en treinen hierop zijn aangepast, kan iedere container op ieder transportmiddel worden vervoerd.


Kortere time-to-market

Net als een gewone fabriek zorgt ook een fabriek voor analytische modellen voor kostenbesparingen en een kortere time-to-market. Door veel van het werk te automatiseren is ook nog eens snellere innovatie mogelijk. En last but not least: de fabriek doorbreekt de barrières tussen modelontwikkeling en implementatie, ofwel tussen de business en IT. Zie onderstaande figuur hoe dit in de praktijk werkt.

Plaatje artikel devops

Benieuwd naar de vijf stappen waarin je zo’n fabriek bouwt? Lees de whitepaper ‘Breaking down barriers between model development and deployment’.

Over de auteur

Rein Mertens is Senior Manager en werkt sinds 1995 bij SAS Nederland, momenteel in de rol van Head of Analytical Platform. Met zijn team pre-sales consultants en data scientists adviseert hij nieuwe en bestaande klanten over de toegevoegde waarde van de inzet van SAS oplossingen voor informatie management, business analytics en visualisatie, machine learning en AI vraagstukken. Als gecertificeerde Data Privacy Officer is Rein tevens nauw betrokken bij de impact van de nieuwe data privacy wetgeving per mei 2018 (AVG) op data management en data science projecten. Rein is inhoudelijk betrokken bij de verschillende SAS User group events en zit in internationale werkgroepen om op basis van klantinput mee te denken met de prioriteitsstelling en verbetering van de SAS-producten.

Reacties

Notilyze neemt SaasNow over
10 oktober 2018 [10:01], 323 views

Notilyze neemt SaasNow over

Met de overname van SaasNow kan Notilyze de ambitie om analytics binnen handbereik van ieder bedrijf en iedere business professional te brengen, verder vormgeven.

 

Lees meer  

Ethisch raamwerk rondom AI-gebruik
19 september 2018 [04:24], 597 views

Ethisch raamwerk rondom AI-gebruik

Organisaties werken aan een meer ethisch en verantwoordelijk gebruik van artificial intelligence Onderzoek van SAS, Accenture, Intel en Forbes Insights wijst uit dat [...]

 

Lees meer  

Hoe bouw je een efficiënt data governance programma?
13 september 2018 [03:25], 787 views

Hoe bouw je een efficiënt data governance programma?

Data governance is geen oud concept; bij SAS hebben we het al jaren over de voordelen van data governance. Het wordt echter vaak als een ‘nice to have’ gezien, ook a [...]

 

Lees meer  

SAS is benoemd tot leider in de Gartner Magic Quadrant voor data-integratie
6 september 2018 [11:55], 762 views

SAS is benoemd tot leider in de Gartner Magic Quadrant voor data-integratie

Gartner heeft SAS voor het achtste jaar op rij uitgeroepen tot leider in data-integratie tools.

 

Lees meer  

Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’
13 augustus 2018 [10:30], 1150 views

Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’

Zijn data scientists in staat om nieuwe inzichten te halen uit genetische data van de patiënt, met als doel om kanker beter te begrijpen en behandelingen beter [...]

 

Lees meer  

Innovaties in een data gedreven samenleving
13 juni 2018 [09:00], 1385 views

Innovaties in een data gedreven samenleving

Innovaties in een data gedreven samenleving: van een grotere overlevingskans bij vroeggeboortes tot een leven lang genieten van voetbal. Op donderdag 31 mei vond de [...]

 

Lees meer  

Gepersonaliseerde zorg
28 mei 2018 [06:10], 863 views

Gepersonaliseerde zorg

Gepersonaliseerde zorg is de focus van de huidige zoektocht in de zorg. Het Nederlandse zorgsysteem is dan wel wereldwijd één van de voorlopers, tegelijkertijd wille [...]

 

Lees meer  

Hoe DHL meer grip krijgt op veranderende omstandigheden
8 mei 2018 [11:26], 1300 views

Hoe DHL meer grip krijgt op veranderende omstandigheden

Logistiek dienstverlener DHL onderzoekt de mogelijkheden om data analytics toe te passen op operationeel niveau om direct in te kunnen spelen op veranderende omstand [...]

 

Lees meer  

SAS Data Science & Analytics Day op 31 mei
2 mei 2018 [09:01], 1953 views

SAS Data Science & Analytics Day op 31 mei

Innovatief gebruik van analytics verandert de wereld. De SAS Data Science and Analytics Day op 31 mei biedt organisaties nieuwe inzichten en ideeën die bijdragen aan de ‘a [...]

 

Lees meer  

Fraudebestrijding steeds succesvoller door data-analyse
30 april 2018 [11:16], 1440 views

Fraudebestrijding steeds succesvoller door data-analyse

Nieuwe SAS-divisie moet organisaties helpen om verlies van miljarden euro’s te voorkomen. De combinatie van geavanceerde analytics-oplossingen en AI helpt de steeds comple [...]

 

Lees meer