Data-analyse SAS voorspelt winnende tijd Kjeld Nuis
23 februari 2018 [04:49], 6104 views
Door Redactie

Data-analyse SAS voorspelt winnende tijd Kjeld Nuis

De winnende Olympische tijd van Kjeld Nuis op de 1000 meter was voor de data scientists van SAS geen verrassing. De winnende tijd van Nuis (1:07,95) was te voorspellen op basis van data-analyse. Ook zagen zij aankomen dat Sven Kramer op de 10 kilometer naast het goud zou grijpen. Om te komen tot deze en meer inzichten in de resultaten van de Nederlands Olympische schaatsers, analyseerden zij 2,4 miljoen wedstrijdresultaten van ruim 64 duizend schaatsers over de afgelopen 11 jaar. Uit de analyse kunnen ook lessen voor de toekomst worden getrokken, want nu is ook duidelijk tot welke leeftijd een wedstrijdschaatser zich nog kan verbeteren en wanneer deze beter zijn ijzers in het vet kan laten.

Algoritme

Om de tijd van Nijs te kunnen voorspellen, analyseerden de data scientists data van toernooien waarin Nuis de 1.000 en 1.500 meter heeft geschaatst. Voor de analyse gebruikten zij een algoritme dat aan de hand van een 1.500 meter tijd kan voorspellen wat het resultaat gaat worden op de 1.000 meter. Hieruit kwam een tijd van 1:07,7 met een marge van 0,2 seconden. De gereden tijd door Nuis van 1:07,95 bevestigt deze analyse. Ook voor de 1000 meter race van Kai Verbij deden de data scientists een voorspelling: dit was 1:08,4 met een marge van 0,4 seconden. Hij realiseerde een tijd van 1:08,61 waarmee ook deze voorspelling binnen de marge viel.


Figuur 1: Puntenplot met regressielijn van tijden 1000 meter (Y-as) en 1500 meter (X-as) Kjeld Nuis

Kramer weinig kans op goud

Een andere analyse van SAS laat zien dat Sven Kramer met zijn winst op de 5km statistisch gezien weinig kans had op goud op de 10km. Voor deze conclusie hebben de data scientists van SAS alle data van mannelijke schaatsers die in wedstrijdverband de 5km en de 10km hebben geschaatst in een dataset verzameld. Ook op deze 1.852 records is met behulp van machine learning-technieken een analyse uitgevoerd. Daaruit blijkt dat zelfs het Olympisch record op de 5km niet voldoende was voor Kramer om goud te pakken op de 10km. Zijn tijd op de 5km was namelijk 6.09,76 (369,76 seconden). Op basis van het algoritme is zijn voorspelde tijd voor de 10km dan 12:55 wat geen podiumplaats op zou leveren. Uiteindelijk rijdt Kramer 13:01,02.


Figuur 2: Puntenplot met regressielijn van tijden 5km en 10km Sven Kramer

Kramer geeft op na achtste ronde 

“Tijdens de wedstrijd zag je duidelijk dat Kramer het in de achtste ronde van de race opgeeft”, vertelt Jos van Dongen, senior data analyst bij SAS. “Kramer zei zelf ook in het interview na de 10km race: ‘als je naar mijn 5km kijkt dan zie je het wel. Ik wist die 10km gaat heel moeilijk worden’. Coach Jac Orie geeft in een reactie daarop aan dat hij het niet had zien aankomen op basis van de tijd op de 5km, maar voor ons was het glashelder toen we naar de data keken. Je had het inderdaad kunnen voorspellen.”

De analyses van SAS laten verder zien dat wereldrecordhouder Ted-Jan Bloemen zelfs iets beter presteert op de 10km dan dat je op basis van zijn tijd op de 5km had kunnen verwachten. Het blijft dus een voorspelling op basis van een statistisch model: de werkelijkheid kan altijd een beetje anders zijn.

Wanneer pieken schaatsers?

Niet alleen werd inzicht verkregen in de prestaties van de schaatsers tijdens deze Olympische Winterspelen, maar ook in wanneer schaatsers hun piek hebben bereikt. De analyse geeft aan dat de gemiddelde wedstrijdschaatser piekt op zijn 27ste. Daarna worden de tijden die worden gereden op de 10km alleen maar slechter. Van Dongen: “Dit geldt echter niet voor schaatsers die de Olympische Spelen halen. Daar zagen we dat Olympische sporters al eerder pieken en ook langer blijven presteren op dat niveau. Dit geldt ook voor Kramer. Zijn tijden op de 10km werden na zijn 25ste soms zelfs nog beter. Een veelbelovende wetenschap voor de spelen van 2022 in Beijing."


Figuur 3: Alle geschaatste tijden door mannelijke 10km schaatsers (oranje = uitslagen Sven Kramer)

Analyses

Voor de analyses is gebruikgemaakt van data van de site Speedskatingresults.com. Deze data werd geanalyseerd met behulp van SAS Visual Analytics en Visual Statistics, beide onderdeel van het SAS Viya-platform. Dit platform gebruikt de nieuwste technieken op het gebied van artificial intelligence en machine learning.

 

Reacties

EK 2020: snel, goedkoop of groen?
13 december 2019 [12:31], 1300 views

EK 2020: snel, goedkoop of groen?

Voetbalfans van over de hele wereld kijken uit naar het EK Voetbal 2020 dat wordt gehouden van 12 juni tot en met 12 juli 2020. De teams en de fans bereiden zich nu voor o [...]

 

Lees meer  

Nieuwe Data Science Escape Room van SAS en SciSports
17 april 2019 [01:23], 4595 views

Nieuwe Data Science Escape Room van SAS en SciSports

Hoe is het om de volgende grote voetbalster te rekruteren? Ontdek het in Data Science Escape Room van SAS en SciSports.

 

Lees meer  

SAS leider in Data Science en Machine Learning Platforms
11 februari 2019 [10:00], 2307 views

SAS leider in Data Science en Machine Learning Platforms

Gartner heeft SAS uitgeroepen tot leider in de 2019 Magic Quadrant for Data Science and Machine Learning Platforms.  Dit is het vijfde jaar dat SAS de leiderschapspositie [...]

 

Lees meer  

Sports Analytics met SAS
3 oktober 2018 [11:27], 2942 views

Sports Analytics met SAS

Wereldwijd wordt SAS bij vrijwel elke denkbare sport ingezet om trainings- en wedstrijdresultaten te analyseren. Nu richten we ons op een andere wereldsport: darts!< [...]

 

Lees meer  

Frankrijk of België - analyse van de halve finalisten
10 juli 2018 [10:03], 7170 views

Frankrijk of België - analyse van de halve finalisten

SAS heeft samen met zijn partner SciSports de sterke punten van de resterende vier teams van het WK voetbal geanalyseerd. Een analyse van de Franse en B [...]

 

Lees meer  

SAS en Procam genomineerd voor de Computable Awards 2018!
5 juli 2018 [11:57], 1522 views

SAS en Procam genomineerd voor de Computable Awards 2018!

ICT-vakblad Computable heeft SAS en Procam genomineerd voor de Computable Awards 2018, voor de categorie ICT-opleider van het jaar. 

 

Lees meer  

Het bereiken van 3,6 miljoen voetbalfans
28 juni 2018 [09:09], 4385 views

Het bereiken van 3,6 miljoen voetbalfans

KNVB beschikt over een database van 3,6 miljoen voetbalfans en -spelers. Het 'centrale klantbeeld' geeft de KNVB en zijn partners de inzichten die ze nodig hebben om de li [...]

 

Lees meer  

De wetenschap achter het mooie spel
27 juni 2018 [10:38], 4550 views

De wetenschap achter het mooie spel

De beste teams zijn niet degenen met de beste spelers, maar de beste combinatie van spelers. 

 

Lees meer  

SAS lanceert ‘s werelds eerste Data Science Escape Room
8 juni 2018 [12:28], 1069 views

SAS lanceert ‘s werelds eerste Data Science Escape Room

SAS lanceerde tijdens de Data Science & Analytics Day op donderdag 31 [...]

 

Lees meer  

Hoe analytics de sportwereld verandert
15 mei 2018 [04:44], 4413 views

Hoe analytics de sportwereld verandert

In de sportwereld worden steeds meer keuzes gemaakt op basis van analytics.

 

Lees meer