Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’
13 augustus 2018 [10:30], 575 views
Door Joran Roor

Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’

SAS & Finaps dragen bij aan kankeronderzoek tijdens de Beyond Banking Hackathon
Team: Joost Huiskens, Rik de Ruiter, Turan Bulmus, Michael van Elk en Joran Roor
Artikel door: Joran Roor & Michael van Elk

Beyond Banking Hackathon

Begin juni organiseerde ABN-AMRO de 48-uurs hackathon Beyond Banking in de Sugar City in Halfweg. Er waren acht cases waaraan deelgenomen kon worden, waaronder de healthcare case, welke tot stand is gekomen in samenwerking met het Erasmus MC en het UMC Groningen. Zij waren benieuwd of data scientists in staat zouden zijn om nieuwe inzichten te halen uit genetische data van de patiënt, met als doel om kanker beter te begrijpen en behandelingen beter aan te laten sluiten bij het genetisch profiel van de patiënt.

Zowel SAS als Finaps zijn al actief betrokken bij het invoeren van advanced analytics in de gezondheidszorg, met projecten zoals het CAESAR-Project en Big Data for Small Babies. SAS en Finaps hebben deze mogelijkheid om bij te dragen aan onderzoek naar kanker met enthousiasme aangegrepen, en hebben samen een team gevormd dat heeft deelgenomen aan deze case.

Accelerating Cancer Research

Onderzoek naar behandelingen voor kanker gebeurt momenteel door naar een groep patiënten te kijken, om zo te bepalen welke behandeling effectief is en welke niet. Het is bekend dat zowel de genetische opmaak van de patiënt als de specifieke mutaties in de tumor van grote invloed kunnen zijn op de effectiviteit van een therapie. Idealiter zou deze informatie meegenomen worden in de afweging tussen verschillende behandelingen.

Door vooruitgang in de technologie om genetische informatie van een patiënt te verwerven is deze informatie steeds goedkoper en gemakkelijker te verkrijgen. De hoop is dat deze gegevens niet alleen meer inzicht kunnen geven in de moleculaire basis van de ziekte, maar ook kan helpen bij het bepalen van de beste behandeling voor de individuele patiënt. Het ideaalbeeld is een nieuw tijdperk van gepersonaliseerde zorg, waarbij iedereen een behandeling op maat krijgt.

Er zijn veel verschillende soorten genetische informatie die we kunnen verkrijgen. De bekendste hiervan gaat over de volgorde van het DNA, ook wel genomics genoemd. Verder is er epigenomics (een vorm van regulatie van uitdrukking van DNA), transcriptomics (de uitdrukking van het DNA, op meerdere manieren gemeten), en proteomics (de uiteindelijke uitdrukking van eiwitten).

Vanwege de grote hoeveelheid informatie die op deze wijze per patiënt verkregen kan worden, blijkt het voor artsen en medisch onderzoekers een grote uitdaging om deze data in kaart te brengen of om er conclusies uit te trekken. De medische wereld heeft dus een grote behoefte aan data scientists die deze gegevens op een geïntegreerde manier kunnen analyseren om hier nieuwe inzichten uit te halen.

Onderzoeksvragen

Voor de Healthcare Challenge werden meerdere onderzoeksvragen geformuleerd. Deze dienden als richtlijnen, het was aan de teams om een aanpak te verzinnen die een of meerdere van deze vragen zo goed mogelijk zou beantwoorden. Deze vragen waren:

  • Is het mogelijk de correlaties tussen de verschillende datasets visualiseren?
  • Is het mogelijk om patiënten te verdelen in subtypes op basis van genetische informatie?
  • Is het mogelijk om overleving in te schatten op basis van genetische informatie?
  • Is het mogelijk om de respons op therapie te voorspellen op basis van de genetische informatie?

Aanpak

Voor het oplossen van deze problemen en het beantwoorden van de onderzoeksvragen is de volgende aanpak geformuleerd:

  • Inladen, schoonmaken en samenvoegen van de datasets.
  • Het reduceren van het aantal variabelen om tot een zogenaamde Personal Multi-omics Fingerprint te komen voor elke patiënt.
  • Het zoeken naar subtypes op basis van deze vingerafdruk.
  • Onderzoeken of deze subtypes verschillen in overleving of respons op chemotherapie.

De aanpak en de technische details van het onderzoek zullen worden behandeld in de volgende blog.

Voorlopige resultaten wijzen op onderscheidende methode

Op basis van enkel de Personal Multi-omics Fingerprint is onderstaande Kaplan-Meier overlevingsgrafiek gemaakt.

Er is duidelijk te zien dat er twee groepen zijn te onderscheiden die een sterk uiteenlopende overlevingsverwachting laten zien. Deze groepering is dus te maken door alleen informatie te gebruiken dat afkomstig is van de genetische informatie van de patiënt, zonder te kijken naar klinische variabelen zoals leeftijd, geslacht, stadium van de tumor etc. Sterker nog, tussen de klinische gegevens van de groepen blijkt geen significant verschil te bestaan. Dit betekent dus dat deze nieuwe methode van patiëntclassificatie op basis van de Personal Multi-omics Fingerprint niet mogelijk was op basis van enkel de klinische gegevens, waar artsen momenteel hun prognose op baseren. Dit is een sterke aanwijzing dat deze methode van toegevoegde waarde kan zijn in de klinische praktijk.

Dankwoord

Het team is dankbaar voor deze kans om een kleine bijdrage te hebben kunnen leveren aan kankeronderzoek. Specifieke dank gaat uit naar de organisatoren van de hackathon, Tjebbe Tauber van ABN-AMRO, en alle artsen en onderzoekers van het Erasmus MC en het UMC Groningen:

  • Prof. Dr. Ing. Peter van der Spek (Erasmus MC Rotterdam)
  • Prof. Dr. Harry Groen (UMCG, Groningen)
  • Prof. Dr. Joachim Aerts (Erasmus MC Rotterdam)
  • Daan Hurkmans (Erasmus MC Rotterdam)
  • Menno Tamminga (UMC Groningen)
  • Rogier van Wijck (Erasmus MC Rotterdam)

Wil je meer weten over toekomstige onderwerpen die een rol gaan spelen in de gezondheidszorg? Lees dan deze white paper: Emerging topics in health care.

Over de auteur

Joran Roor is data scientist en is in 2017 gaan werken bij SAS, direct nadat hij afstudeerde in de Econometrie. Joran adviseert bedrijven op het gebied van data analytics, zoals datavisualisatie, statistiek, machine learning en kunstmatige intelligentie.

Reacties

Ethisch raamwerk rondom AI-gebruik
19 september 2018 [04:24], 62 views

Ethisch raamwerk rondom AI-gebruik

Organisaties werken aan een meer ethisch en verantwoordelijk gebruik van artificial intelligence Onderzoek van SAS, Accenture, Intel en Forbes Insights wijst uit dat [...]

 

Lees meer  

Hoe bouw je een efficiënt data governance programma?
13 september 2018 [03:25], 187 views

Hoe bouw je een efficiënt data governance programma?

Data governance is geen oud concept; bij SAS hebben we het al jaren over de voordelen van data governance. Het wordt echter vaak als een ‘nice to have’ gezien, ook a [...]

 

Lees meer  

SAS is benoemd tot leider in de Gartner Magic Quadrant voor data-integratie
6 september 2018 [11:55], 304 views

SAS is benoemd tot leider in de Gartner Magic Quadrant voor data-integratie

Gartner heeft SAS voor het achtste jaar op rij uitgeroepen tot leider in data-integratie tools.

 

Lees meer  

Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’
13 augustus 2018 [10:30], 576 views

Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’

Zijn data scientists in staat om nieuwe inzichten te halen uit genetische data van de patiënt, met als doel om kanker beter te begrijpen en behandelingen beter [...]

 

Lees meer  

UMC Utrecht maakt gebruik van data-analyse om infecties bij premature baby's proactief te behandelen of voorkomen
23 juli 2018 [04:18], 1116 views

UMC Utrecht maakt gebruik van data-analyse om infecties bij premature baby's proactief te behandelen of voorkomen

Machine learning en kunstmatige intelligentie (AI) steeds belangrijker voor de gezondheidszorg. Daarom gebruikt het UMC Utrecht data-analyse om ervoor te zorgen dat zij di [...]

 

Lees meer  

Innovaties in een data gedreven samenleving
13 juni 2018 [09:00], 1084 views

Innovaties in een data gedreven samenleving

Innovaties in een data gedreven samenleving: van een grotere overlevingskans bij vroeggeboortes tot een leven lang genieten van voetbal. Op donderdag 31 mei vond de [...]

 

Lees meer  

Gezondheidszorg is early adopter in toepassen van AI
11 juni 2018 [10:17], 675 views

Gezondheidszorg is early adopter in toepassen van AI

Artificial Intelligence is waarschijnlijk het grootste buzzwoord van 2017 en 2018, en terecht! De gezondheidszorg lijkt echter een sector die, als early adopte [...]

 

Lees meer  

Gepersonaliseerde zorg
28 mei 2018 [06:10], 672 views

Gepersonaliseerde zorg

Gepersonaliseerde zorg is de focus van de huidige zoektocht in de zorg. Het Nederlandse zorgsysteem is dan wel wereldwijd één van de voorlopers, tegelijkertijd wille [...]

 

Lees meer  

Hoe DHL meer grip krijgt op veranderende omstandigheden
8 mei 2018 [11:26], 996 views

Hoe DHL meer grip krijgt op veranderende omstandigheden

Logistiek dienstverlener DHL onderzoekt de mogelijkheden om data analytics toe te passen op operationeel niveau om direct in te kunnen spelen op veranderende omstand [...]

 

Lees meer  

SAS Data Science & Analytics Day op 31 mei
2 mei 2018 [09:01], 1557 views

SAS Data Science & Analytics Day op 31 mei

Innovatief gebruik van analytics verandert de wereld. De SAS Data Science and Analytics Day op 31 mei biedt organisaties nieuwe inzichten en ideeën die bijdragen aan de ‘a [...]

 

Lees meer