Machine learning werpt een ander (dashboard) licht op de Paradise Papers
11 december 2017 [09:17], 2718 views
Door Edwin van Unen

Machine learning werpt een ander (dashboard) licht op de Paradise Papers

Maar liefst 380 journalisten hebben sinds begin dit jaar 13 miljoen documenten uit de Paradise Papers onderzocht. Het kostte bijna een jaar om deze documenten te doorzoeken op zoek naar de connectie tussen, onder andere, president Poetin en de Amerikaanse minister van handel Wilbur Ross. Een indrukwekkende prestatie, waarbij data science en machine learning-algoritmes een belangrijke rol kunnen spelen.  

Zoals sommige journalisten het uitdrukten leek het onderzoeken van de Paradise Papers op het zoeken naar een naald in een gigantische hooiberg. Vaak onderzochten ze een bepaald spoor lange tijd om er vervolgens achter te komen dat het een dood spoor was. Dit is nou precies waar data science kan helpen: om patronen efficiënt en effectief te zoeken in enorme hoeveelheden data.

Als tijdens dit onderzoek machine learning en data science waren gebruikt, zou dit waarschijnlijk veel sneller tot bruikbare resultaten hebben geleid, zelfs met een veel kleiner team dan de 380 journalisten die hier maanden mee bezig zijn geweest. Algoritmes voor data science en machine learning kunnen het onderzoeksproces ondersteunen door potentiële 'verdachte' patronen te laten zien. Machine learning kan de menselijke factor niet vervangen, maar zou het onderzoek aanzienlijk versnellen: in plaats van op zoek te gaan naar de interessante patronen in de berg data, kunnen de journalisten zich richten op het valideren van patronen die door de machine zijn ontdekt. 

Waar de computer het verschil maakt: snelheid

Een dergelijk gebruik van data science is verre van nieuw. Elke dag worden soortgelijke algoritmen voor ontelbare transacties gebruikt zonder dat we het merken. Denk alleen maar aan de financiële sector. De analyse van financiële transacties wordt niet langer uitgevoerd door menselijke experts, maar eerder door computers die algoritmes voor machine learning gebruiken om deze analyses supersnel uit te voeren. Voor elke transactie via een betaalterminal in een winkel moet de computer binnen zes seconden beslissen of de transactie geldig is of niet. Binnen dat korte tijdsbestek worden alle relevante gegevens verzameld, onderzocht op patronen en gemarkeerd als er een anomalie is gedetecteerd. Gedurende deze processen is er een continue leercurve om te begrijpen hoe fraudeurs werken. Met machine learning kunnen de computersystemen ook specifieke patronen identificeren en algoritmen daarop aanpassen.

Deze machine learning-technologie kan een grote bijdrage leveren aan het Paradise Papers onderzoek. Machines kunnen transacties tussen organisaties en mensen herkennen en analyseren in een fractie van de tijd die menselijke onderzoekers nodig hebben, wat tot veel snellere resultaten leidt.Netwerkanalyse, ook een toepassing van machine learning, onderzoekt automatisch alle verbindingen tussen ondernemingen, individuen en organisaties. Deze techniek levert een waardevolle bijdrage aan het analyseren en visualiseren van netwerken: wanneer deze taken handmatig worden uitgevoerd, kunnen deze enorm veel tijd in beslag nemen.

Waar de journalist het verschil maakt: interpretatie

Met behulp van tekstanalyse kun je automatisch personen, ondernemingen, relaties en andere interessante informatie uit een groot aantal documenten halen. Deze ongestructureerde documenten worden vervolgens omgezet in gestructureerde informatie. De computer zorgt voor alle voorbereidingen, de journalisten kunnen zich vervolgens richten op de verdere analyse.

Het detecteren van grootschalige, georganiseerde fraudenetwerken is niet beperkt tot science fiction. De krachtige combinatie van mens en machine maakt een snelle en effectieve ontmanteling van dergelijke netwerken mogelijk. Naarmate de gegevensverwerking volwassener wordt, zijn we hopelijk in staat dergelijke anomalieën te ontdekken en aan te pakken, zelfs zonder datalekken.

Eén enkele machine kan het handmatige werk van honderd personen vervangen. Maar uiteindelijk kun je alleen succesvol zijn met de juiste interactie tussen mens en machine. Een computer kan correlaties blootleggen, maar (nog) niet de causaliteit. Het kan heel veel routes heel snel ontdekken, maar het heeft nog steeds mensen nodig om de zoektocht te begeleiden en om de ontdekkingen te verwerken. Want uiteindelijk, zelfs als het wordt gedreven door machine learning, mist een computer nog steeds het vermogen van menselijke interpretatie.

Over de auteur

Edwin adviseert organisaties hoe zij met behulp van analytics kunnen optimaliseren en innoveren. Door het gebruiken van analytics kunnen klanten nieuwe inzichten verwerven om betere beslissingen te nemen. 

Reacties

Geek blog series - part 3
29 juli 2019 [04:07], 278 views

Geek blog series - part 3

In this ‘Geek blog series’ these ‘Geeks’ share their expertise and insights on the latest AI and Analytics topics. Read the third part of this series. 

Lees meer  

Geek blog series - part 2
22 juli 2019 [03:48], 281 views

Geek blog series - part 2

In this ‘Geek blog series’ these ‘Geeks’ share their expertise and insights on the latest AI and Analytics topics. Read now the blogs of the second part of this series.

 

Lees meer  

Geek blog series - part 1
15 juli 2019 [03:17], 393 views

Geek blog series - part 1

 In this ‘Geek blog series’ these ‘Geeks’ share their expertise and insights. A must-read for everyone who likes to learn more about data scien [...]

 

Lees meer  

Hoogtepunten van het SAS Analytics Forum ‘Be Curious’
24 juni 2019 [04:53], 666 views

Hoogtepunten van het SAS Analytics Forum ‘Be Curious’

Op 6 juni stond het NBC Congrescentrum in Nieuwegein bol van Analytics en AI. Met ruim 1.200 bezoekers kijken we terug op een succesvol SAS Analytics Forum 2019.

 

Lees meer  

Digitale transformatie stelt andere eisen aan een analytics platform
12 juni 2019 [10:38], 668 views

Digitale transformatie stelt andere eisen aan een analytics platform

Drie vragen aan Arno Klijnman, Technology Solution Consultant bij SAS, over digitale transformatie en de invloed die het heeft op de eisen die organisaties stellen aan een [...]

 

Lees meer  

Cassave Case van D[N]A Lab
2 mei 2019 [10:23], 1725 views

Cassave Case van D[N]A Lab

Het D[N]A Lab, geïnitieerd en ondersteund door SAS, heeft samen met voedseltechnoloog en ondernemer Bart van Schie de ‘Cassave Challenge’ aangedragen voor de Global Entrep [...]

 

Lees meer  

SAS Analytics Forum 2019: Be Curious
2 april 2019 [01:00], 5605 views

SAS Analytics Forum 2019: Be Curious

Tijdens het SAS Analytics Forum hoor je alles over de nieuwste ontwikkelingen en innovaties op het gebied van analytics, artificial int [...]

 

Lees meer  

SAS Roadshow 2019: van het voorspellen van betaalgedrag tot ons vertrouwen in AI
1 april 2019 [03:10], 5078 views

SAS Roadshow 2019: van het voorspellen van betaalgedrag tot ons vertrouwen in AI

Tijdens dit evenement werden een aantal inspirerende praktijkvoorbeelden van innovatieve AI-projecten gepresenteerd. Daarnaast werden handvatten aangereikt om AI-projecten [...]

 

Lees meer  

Online campagnes zijn ok, zolang ze maar transparant zijn!
20 december 2018 [11:32], 1843 views

Online campagnes zijn ok, zolang ze maar transparant zijn!

Artificiële Intelligentie (AI) en analytics worden door de politiek gebruikt om hun boodschap op een gerichte manier bij het juiste kiespubliek te krijgen. 

 

Lees meer  

SAS is nummer één op het gebied van advanced en predictive analytics volgens IDC
26 september 2018 [10:43], 1956 views

SAS is nummer één op het gebied van advanced en predictive analytics volgens IDC

SAS overtreft opnieuw alle advanced en predictive analytics leveranciers, volgens het IDC-rapport.

 

Lees meer