Machine learning werpt een ander (dashboard) licht op de Paradise Papers
11 december 2017 [09:17], 2082 views
Door Edwin van Unen

Machine learning werpt een ander (dashboard) licht op de Paradise Papers

Maar liefst 380 journalisten hebben sinds begin dit jaar 13 miljoen documenten uit de Paradise Papers onderzocht. Het kostte bijna een jaar om deze documenten te doorzoeken op zoek naar de connectie tussen, onder andere, president Poetin en de Amerikaanse minister van handel Wilbur Ross. Een indrukwekkende prestatie, waarbij data science en machine learning-algoritmes een belangrijke rol kunnen spelen.  

Zoals sommige journalisten het uitdrukten leek het onderzoeken van de Paradise Papers op het zoeken naar een naald in een gigantische hooiberg. Vaak onderzochten ze een bepaald spoor lange tijd om er vervolgens achter te komen dat het een dood spoor was. Dit is nou precies waar data science kan helpen: om patronen efficiënt en effectief te zoeken in enorme hoeveelheden data.

Als tijdens dit onderzoek machine learning en data science waren gebruikt, zou dit waarschijnlijk veel sneller tot bruikbare resultaten hebben geleid, zelfs met een veel kleiner team dan de 380 journalisten die hier maanden mee bezig zijn geweest. Algoritmes voor data science en machine learning kunnen het onderzoeksproces ondersteunen door potentiële 'verdachte' patronen te laten zien. Machine learning kan de menselijke factor niet vervangen, maar zou het onderzoek aanzienlijk versnellen: in plaats van op zoek te gaan naar de interessante patronen in de berg data, kunnen de journalisten zich richten op het valideren van patronen die door de machine zijn ontdekt. 

Waar de computer het verschil maakt: snelheid

Een dergelijk gebruik van data science is verre van nieuw. Elke dag worden soortgelijke algoritmen voor ontelbare transacties gebruikt zonder dat we het merken. Denk alleen maar aan de financiële sector. De analyse van financiële transacties wordt niet langer uitgevoerd door menselijke experts, maar eerder door computers die algoritmes voor machine learning gebruiken om deze analyses supersnel uit te voeren. Voor elke transactie via een betaalterminal in een winkel moet de computer binnen zes seconden beslissen of de transactie geldig is of niet. Binnen dat korte tijdsbestek worden alle relevante gegevens verzameld, onderzocht op patronen en gemarkeerd als er een anomalie is gedetecteerd. Gedurende deze processen is er een continue leercurve om te begrijpen hoe fraudeurs werken. Met machine learning kunnen de computersystemen ook specifieke patronen identificeren en algoritmen daarop aanpassen.

Deze machine learning-technologie kan een grote bijdrage leveren aan het Paradise Papers onderzoek. Machines kunnen transacties tussen organisaties en mensen herkennen en analyseren in een fractie van de tijd die menselijke onderzoekers nodig hebben, wat tot veel snellere resultaten leidt.Netwerkanalyse, ook een toepassing van machine learning, onderzoekt automatisch alle verbindingen tussen ondernemingen, individuen en organisaties. Deze techniek levert een waardevolle bijdrage aan het analyseren en visualiseren van netwerken: wanneer deze taken handmatig worden uitgevoerd, kunnen deze enorm veel tijd in beslag nemen.

Waar de journalist het verschil maakt: interpretatie

Met behulp van tekstanalyse kun je automatisch personen, ondernemingen, relaties en andere interessante informatie uit een groot aantal documenten halen. Deze ongestructureerde documenten worden vervolgens omgezet in gestructureerde informatie. De computer zorgt voor alle voorbereidingen, de journalisten kunnen zich vervolgens richten op de verdere analyse.

Het detecteren van grootschalige, georganiseerde fraudenetwerken is niet beperkt tot science fiction. De krachtige combinatie van mens en machine maakt een snelle en effectieve ontmanteling van dergelijke netwerken mogelijk. Naarmate de gegevensverwerking volwassener wordt, zijn we hopelijk in staat dergelijke anomalieën te ontdekken en aan te pakken, zelfs zonder datalekken.

Eén enkele machine kan het handmatige werk van honderd personen vervangen. Maar uiteindelijk kun je alleen succesvol zijn met de juiste interactie tussen mens en machine. Een computer kan correlaties blootleggen, maar (nog) niet de causaliteit. Het kan heel veel routes heel snel ontdekken, maar het heeft nog steeds mensen nodig om de zoektocht te begeleiden en om de ontdekkingen te verwerken. Want uiteindelijk, zelfs als het wordt gedreven door machine learning, mist een computer nog steeds het vermogen van menselijke interpretatie.

Over de auteur

Edwin adviseert organisaties hoe zij met behulp van analytics kunnen optimaliseren en innoveren. Door het gebruiken van analytics kunnen klanten nieuwe inzichten verwerven om betere beslissingen te nemen. 

Reacties

SAS is nummer één op het gebied van advanced en predictive analytics volgens IDC
26 september 2018 [10:43], 939 views

SAS is nummer één op het gebied van advanced en predictive analytics volgens IDC

SAS overtreft opnieuw alle advanced en predictive analytics leveranciers, volgens het IDC-rapport.

 

Lees meer  

Ziekenhuis Gelderse Vallei zet stap in de wereld van zorginnovatie
17 september 2018 [10:00], 837 views

Ziekenhuis Gelderse Vallei zet stap in de wereld van zorginnovatie

Ziekenhuis Gelderse Vallei maakt al ruim twaalf jaar gebruik van de analytische software van SAS. SAS Visual Analytics helpt met geavanceerde analyses waarmee het ziekenhu [...]

 

Lees meer  

Democratiseer data, geef iedereen zijn eigen analytics
9 augustus 2018 [10:00], 990 views

Democratiseer data, geef iedereen zijn eigen analytics

Digitale transformatie, wat is dat nu eigenlijk? De woorden worden te pas en te onpas in de mond genomen zonder het concreet te maken.

 

Lees meer  

Hoe verschillende rollen elkaar ondersteunen in de analytics lifecycle
4 juli 2018 [03:53], 1086 views

Hoe verschillende rollen elkaar ondersteunen in de analytics lifecycle

We praten veel over vaardigheden, en met name over het belang van het ontwikkelen van nieuwe vaardigheden om breder en beter gebruik van analytics mogelijk te maken. [...]

 

Lees meer  

Hoogtepunten van de eerste SAS Data Science & Analytics Day
20 juni 2018 [11:37], 802 views

Hoogtepunten van de eerste SAS Data Science & Analytics Day

Tijdens de eerste SAS Data Science & Analytics Day met als thema ‘Welcome to the Analytics Economy’ werd duidelijk dat data inmiddels onmisbaar is in onze samenl [...]

 

Lees meer  

Solide basis voor innovatie
18 april 2018 [08:42], 1081 views

Solide basis voor innovatie

Om optimaal te kunnen inspelen op nieuwe technologieën zoals Artificial Intelligence (AI) en Machine Learning heeft elke organisatie een solide dataplatform nodig. Een pla [...]

 

Lees meer  

ABN AMRO kiest oplossingen Wolters Kluwer en SAS
8 maart 2018 [12:14], 1825 views

ABN AMRO kiest oplossingen Wolters Kluwer en SAS

Wolters Kluwer en SAS zijn geselecteerd door ABN AMRO om een volledig geïntegreerde software-oplossing voor finance, risk en rapportering aan toezichthouders te leve [...]

 

Lees meer  

Datavisualisatie helpt spoorbedrijven met slim asset management
24 januari 2018 [10:10], 2444 views

Datavisualisatie helpt spoorbedrijven met slim asset management

Slim en strategisch asset management inrichten bij spoorbedrijven? Lees hoe DEKRA Rail datavisualisatie toepast.  

 

Lees meer  

Suez, Euramax en Notilyze profiteren van vernieuwd SAS Platform
13 december 2017 [12:47], 1588 views

Suez, Euramax en Notilyze profiteren van vernieuwd SAS Platform

SAS heeft nieuwe functionaliteiten en producten toegevoegd aan het SAS Platform. Suez, Euramax en Notilyze delen de eerste ervaringen met h [...]

 

Lees meer  

Machine learning werpt een ander (dashboard) licht op de Paradise Papers
11 december 2017 [09:17], 2083 views

Machine learning werpt een ander (dashboard) licht op de Paradise Papers

Maar liefst 380 journalisten hebben sinds begin dit jaar 13 miljoen documenten uit de Paradise Papers onderzocht. Lees hoe de inzet van data science en machine learn [...]

 

Lees meer