Gebruik DevOps ook voor je analytische modellen
27 december 2017 [10:48], 4930 views
Door Rein Mertens

Gebruik DevOps ook voor je analytische modellen

Sales wil de vraag beter voorspellen, productie wil slimmere capaciteitsplanningen maken, marketing wil beter afgebakende doelgroepen definiëren en ga zo maar door. Er is maar een klein groepje data scientists dat in staat is deze modellen te bouwen, wat al snel leidt tot vertraging. En die vertraging wordt alleen maar groter als het analytische model door IT in productie moet worden genomen. Want zo’n model wordt vaak in een sandbox omgeving ontwikkeld. En iedereen weet dat de stap van sandbox naar een productieomgeving groot is.

De meeste bedrijven hebben nog veel legacy-applicaties die niet eenvoudig aanpasbaar zijn. Daar komt bij dat een traditionele IT-afdeling vaak met strak gedefinieerde processen werkt en compleet andere datastructuren en programmeertalen gebruikt dan waar de data scientists mee werken. Dat betekent dat IT een ontwikkeld statistisch model meestal niet gemakkelijk kan operationaliseren, maar het min of meer opnieuw moet ontwikkelen om het te laten passen in de bestaande omgeving/architectuur.

DevOps: Fabriek voor analytische modellen

Organisaties die agile werken, zijn massaal bezig het antwoord te vinden op deze uitdaging. Ze weten ook al waar ze dat moeten zoeken: bij DevOps. Vertaald naar analytics: bouw een ‘fabriek’ voor je analytische modellen die ervoor zorgt dat je model al tijdens de bouw wordt voorzien van de benodigde governance, beheermaatregelen en interfaces, zodat het analytische model flexibel op iedere plek is in te zetten. De fabriek kan ervoor zorgen dat alles wat nodig is om een sandbox model in productie te brengen onderdeel wordt van het ontwikkelproces van het model. Op die manier hoef je niet voor ieder model het wiel opnieuw uit te vinden, maar bouw je een proces dat je keer op keer hergebruikt. Lees hier uit welke componenten zo’n fabriek bestaat.

De fabriek bestaat uit de volgende componenten:

  1. Een dedicated ‘analytics data store’ waar de volledige levenscyclus van een model in wordt bewaakt 
    1. Gebruik bijvoorbeeld een Hadoop-platform in plaats van een relationele database. Je wilt namelijk snel nieuwe databronnen toevoegen, zonder de data eerst volledig opnieuw te structureren. Bovendien wil je dat het platform schaalbaar kan omgaan met veel data, en tabellen die uit veel verschillende kolommen bestaan.
    2. Automatische integratie van nieuwe databronnen en logica in je fabriek.
  2. Interfaces naar andere systemen die gebruik willen maken van de output van de analytische modellen.
  3. Testautomatisering waarmee de analytische modellen volgens vaste methoden grotendeels geautomatiseerd worden getest.
  4. Containers waarmee je de analytische modellen allemaal eenzelfde ‘uiterlijk’ geeft zodat ze makkelijk op verschillende plekken en processen zijn in te zetten. Vergelijk het met transportcontainers: de inhoud van iedere container is anders, maar doordat de afmetingen hetzelfde zijn en vrachtschepen, vrachtwagens en treinen hierop zijn aangepast, kan iedere container op ieder transportmiddel worden vervoerd.


Kortere time-to-market

Net als een gewone fabriek zorgt ook een fabriek voor analytische modellen voor kostenbesparingen en een kortere time-to-market. Door veel van het werk te automatiseren is ook nog eens snellere innovatie mogelijk. En last but not least: de fabriek doorbreekt de barrières tussen modelontwikkeling en implementatie, ofwel tussen de business en IT. Zie onderstaande figuur hoe dit in de praktijk werkt.

Plaatje artikel devops

Benieuwd naar de vijf stappen waarin je zo’n fabriek bouwt? Lees de whitepaper ‘Breaking down barriers between model development and deployment’.

Over de auteur

Rein Mertens is Head of Customer Advisory SAS Platform en werkt sinds 1995 bij SAS Nederland, momenteel in de rol van Head of Analytical Platform. Met zijn team pre-sales consultants en data scientists adviseert hij nieuwe en bestaande klanten over de toegevoegde waarde van de inzet van SAS oplossingen voor informatie management, business analytics en visualisatie, machine learning en AI vraagstukken. Als gecertificeerde Data Privacy Officer is Rein tevens nauw betrokken bij de impact van de nieuwe data privacy wetgeving per mei 2018 (AVG) op data management en data science projecten. Rein is inhoudelijk betrokken bij de verschillende SAS User group events en zit in internationale werkgroepen om op basis van klantinput mee te denken met de prioriteitsstelling en verbetering van de SAS-producten.

Reacties

MWC19: van vouwbare mobieltjes en 5G tot AI
15 maart 2019 [12:21], 3478 views

MWC19: van vouwbare mobieltjes en 5G tot AI

Op het Mobile World Congress in Barcelona werden de laatste innovaties van de nog steeds zeer dynamische telecom industrie getoond.

 

Lees meer  

Kunnen organisaties met hun huidige Customer Data Platforms de juiste beslissingen nemen?
7 februari 2019 [10:09], 1264 views

Kunnen organisaties met hun huidige Customer Data Platforms de juiste beslissingen nemen?

Data stelt organisaties in staat betere beslissingen te nemen. Maar kunnen de organisaties met de Data Platforms die ze nu al gebruiken dit ook al doen?

 

Lees meer  

SAS benoemd tot leider in enterprise insight platforms door analistenbureau
24 januari 2019 [09:02], 2369 views

SAS benoemd tot leider in enterprise insight platforms door analistenbureau

SAS is door analistenbureau Forrester benoemd tot leider in Enterprise Insight Platforms. 

 

Lees meer  

Onze fitness-data delen met onze verzekeraar? Waarom ook niet?
2 januari 2019 [09:02], 1423 views

Onze fitness-data delen met onze verzekeraar? Waarom ook niet?

Een Amerikaanse verzekeraar beloont klanten die hun fitness-data delen. Daar komen praktische en privacygerelateerde bezwaren bij kijken, maar Mark Lambrecht ziet oo [...]

 

Lees meer  

SAS voor Containers:  snelheid, wendbaarheid en schaalbaarheid voor cloudimplementaties
29 november 2018 [12:22], 3104 views

SAS voor Containers: snelheid, wendbaarheid en schaalbaarheid voor cloudimplementaties

Er is een toenemende belangstelling voor op containers gebaseerde software.

 

Lees meer  

Hoe verandert de technologische ontwikkeling de strategie van toezicht en handhaving?
21 november 2018 [09:21], 2610 views

Hoe verandert de technologische ontwikkeling de strategie van toezicht en handhaving?

Big data, data analytics, Internet of Things, cryptomunten, blockchain, kunstmatige intelligentie, FinTech en robotisering spelen een steeds belangrijkere rol in het [...]

 

Lees meer  

De data-economie is geen all-you-can-eat-buffet meer
19 november 2018 [03:01], 2458 views

De data-economie is geen all-you-can-eat-buffet meer

Voorheen was er een beetje een all you can eat aanpak, waar je gewoon alle data gebruikte die je maar kon vinden. Nu moeten we effectief nadenk [...]

 

Lees meer  

Organisaties innovatiever door inzichten uit analytics
8 november 2018 [10:46], 3829 views

Organisaties innovatiever door inzichten uit analytics

72 procent erkent de voordelen van analytics, maar bij slechts 39 procent is het de kern van hun bedrijfsstrategie

 

Lees meer  

De Volksbank besteedt beheer SAS-analyseplatform uit aan OCS Consulting
30 oktober 2018 [10:18], 1891 views

De Volksbank besteedt beheer SAS-analyseplatform uit aan OCS Consulting

De Volksbank heeft het technisch beheer van haar SAS-analyseplatform uitbesteed aan OCS Consulting.

 

Lees meer  

Notilyze neemt SaasNow over
10 oktober 2018 [10:01], 2285 views

Notilyze neemt SaasNow over

Met de overname van SaasNow kan Notilyze de ambitie om analytics binnen handbereik van ieder bedrijf en iedere business professional te brengen, verder vormgeven.

 

Lees meer