Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’
13 augustus 2018 [10:30], 1666 views
Door Joran Roor

Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’

SAS & Finaps dragen bij aan kankeronderzoek tijdens de Beyond Banking Hackathon
Team: Joost Huiskens, Rik de Ruiter, Turan Bulmus, Michael van Elk en Joran Roor
Artikel door: Joran Roor & Michael van Elk

Beyond Banking Hackathon

Begin juni organiseerde ABN-AMRO de 48-uurs hackathon Beyond Banking in de Sugar City in Halfweg. Er waren acht cases waaraan deelgenomen kon worden, waaronder de healthcare case, welke tot stand is gekomen in samenwerking met het Erasmus MC en het UMC Groningen. Zij waren benieuwd of data scientists in staat zouden zijn om nieuwe inzichten te halen uit genetische data van de patiënt, met als doel om kanker beter te begrijpen en behandelingen beter aan te laten sluiten bij het genetisch profiel van de patiënt.

Zowel SAS als Finaps zijn al actief betrokken bij het invoeren van advanced analytics in de gezondheidszorg, met projecten zoals het CAESAR-Project en Big Data for Small Babies. SAS en Finaps hebben deze mogelijkheid om bij te dragen aan onderzoek naar kanker met enthousiasme aangegrepen, en hebben samen een team gevormd dat heeft deelgenomen aan deze case.

Accelerating Cancer Research

Onderzoek naar behandelingen voor kanker gebeurt momenteel door naar een groep patiënten te kijken, om zo te bepalen welke behandeling effectief is en welke niet. Het is bekend dat zowel de genetische opmaak van de patiënt als de specifieke mutaties in de tumor van grote invloed kunnen zijn op de effectiviteit van een therapie. Idealiter zou deze informatie meegenomen worden in de afweging tussen verschillende behandelingen.

Door vooruitgang in de technologie om genetische informatie van een patiënt te verwerven is deze informatie steeds goedkoper en gemakkelijker te verkrijgen. De hoop is dat deze gegevens niet alleen meer inzicht kunnen geven in de moleculaire basis van de ziekte, maar ook kan helpen bij het bepalen van de beste behandeling voor de individuele patiënt. Het ideaalbeeld is een nieuw tijdperk van gepersonaliseerde zorg, waarbij iedereen een behandeling op maat krijgt.

Er zijn veel verschillende soorten genetische informatie die we kunnen verkrijgen. De bekendste hiervan gaat over de volgorde van het DNA, ook wel genomics genoemd. Verder is er epigenomics (een vorm van regulatie van uitdrukking van DNA), transcriptomics (de uitdrukking van het DNA, op meerdere manieren gemeten), en proteomics (de uiteindelijke uitdrukking van eiwitten).

Vanwege de grote hoeveelheid informatie die op deze wijze per patiënt verkregen kan worden, blijkt het voor artsen en medisch onderzoekers een grote uitdaging om deze data in kaart te brengen of om er conclusies uit te trekken. De medische wereld heeft dus een grote behoefte aan data scientists die deze gegevens op een geïntegreerde manier kunnen analyseren om hier nieuwe inzichten uit te halen.

Onderzoeksvragen

Voor de Healthcare Challenge werden meerdere onderzoeksvragen geformuleerd. Deze dienden als richtlijnen, het was aan de teams om een aanpak te verzinnen die een of meerdere van deze vragen zo goed mogelijk zou beantwoorden. Deze vragen waren:

  • Is het mogelijk de correlaties tussen de verschillende datasets visualiseren?
  • Is het mogelijk om patiënten te verdelen in subtypes op basis van genetische informatie?
  • Is het mogelijk om overleving in te schatten op basis van genetische informatie?
  • Is het mogelijk om de respons op therapie te voorspellen op basis van de genetische informatie?

Aanpak

Voor het oplossen van deze problemen en het beantwoorden van de onderzoeksvragen is de volgende aanpak geformuleerd:

  • Inladen, schoonmaken en samenvoegen van de datasets.
  • Het reduceren van het aantal variabelen om tot een zogenaamde Personal Multi-omics Fingerprint te komen voor elke patiënt.
  • Het zoeken naar subtypes op basis van deze vingerafdruk.
  • Onderzoeken of deze subtypes verschillen in overleving of respons op chemotherapie.

De aanpak en de technische details van het onderzoek zullen worden behandeld in de volgende blog.

Voorlopige resultaten wijzen op onderscheidende methode

Op basis van enkel de Personal Multi-omics Fingerprint is onderstaande Kaplan-Meier overlevingsgrafiek gemaakt.

Er is duidelijk te zien dat er twee groepen zijn te onderscheiden die een sterk uiteenlopende overlevingsverwachting laten zien. Deze groepering is dus te maken door alleen informatie te gebruiken dat afkomstig is van de genetische informatie van de patiënt, zonder te kijken naar klinische variabelen zoals leeftijd, geslacht, stadium van de tumor etc. Sterker nog, tussen de klinische gegevens van de groepen blijkt geen significant verschil te bestaan. Dit betekent dus dat deze nieuwe methode van patiëntclassificatie op basis van de Personal Multi-omics Fingerprint niet mogelijk was op basis van enkel de klinische gegevens, waar artsen momenteel hun prognose op baseren. Dit is een sterke aanwijzing dat deze methode van toegevoegde waarde kan zijn in de klinische praktijk.

Dankwoord

Het team is dankbaar voor deze kans om een kleine bijdrage te hebben kunnen leveren aan kankeronderzoek. Specifieke dank gaat uit naar de organisatoren van de hackathon, Tjebbe Tauber van ABN-AMRO, en alle artsen en onderzoekers van het Erasmus MC en het UMC Groningen:

  • Prof. Dr. Ing. Peter van der Spek (Erasmus MC Rotterdam)
  • Prof. Dr. Harry Groen (UMCG, Groningen)
  • Prof. Dr. Joachim Aerts (Erasmus MC Rotterdam)
  • Daan Hurkmans (Erasmus MC Rotterdam)
  • Menno Tamminga (UMC Groningen)
  • Rogier van Wijck (Erasmus MC Rotterdam)

Wil je meer weten over toekomstige onderwerpen die een rol gaan spelen in de gezondheidszorg? Lees dan deze white paper: Emerging topics in health care.

Over de auteur

Joran Roor is data scientist en is in 2017 gaan werken bij SAS, direct nadat hij afstudeerde in de Econometrie. Joran adviseert bedrijven op het gebied van data analytics, zoals datavisualisatie, statistiek, machine learning en kunstmatige intelligentie.

Reacties

De data-economie is geen all-you-can-eat-buffet mee
19 november 2018 [03:01], 63 views

De data-economie is geen all-you-can-eat-buffet mee

Voorheen was er een beetje een all you can eat aanpak, waar je gewoon alle data gebruikte die je maar kon vinden. Nu moeten we effectief nadenk [...]

 

Lees meer  

Organisaties innovatiever door inzichten uit analytics
8 november 2018 [10:46], 301 views

Organisaties innovatiever door inzichten uit analytics

72 procent erkent de voordelen van analytics, maar bij slechts 39 procent is het de kern van hun bedrijfsstrategie

 

Lees meer  

De Volksbank besteedt beheer SAS-analyseplatform uit aan OCS Consulting
30 oktober 2018 [10:18], 371 views

De Volksbank besteedt beheer SAS-analyseplatform uit aan OCS Consulting

De Volksbank heeft het technisch beheer van haar SAS-analyseplatform uitbesteed aan OCS Consulting.

 

Lees meer  

Notilyze neemt SaasNow over
10 oktober 2018 [10:01], 775 views

Notilyze neemt SaasNow over

Met de overname van SaasNow kan Notilyze de ambitie om analytics binnen handbereik van ieder bedrijf en iedere business professional te brengen, verder vormgeven.

 

Lees meer  

Ethisch raamwerk rondom AI-gebruik
19 september 2018 [04:24], 1099 views

Ethisch raamwerk rondom AI-gebruik

Organisaties werken aan een meer ethisch en verantwoordelijk gebruik van artificial intelligence Onderzoek van SAS, Accenture, Intel en Forbes Insights wijst uit dat [...]

 

Lees meer  

Hoe bouw je een efficiënt data governance programma?
13 september 2018 [03:25], 1358 views

Hoe bouw je een efficiënt data governance programma?

Data governance is geen oud concept; bij SAS hebben we het al jaren over de voordelen van data governance. Het wordt echter vaak als een ‘nice to have’ gezien, ook a [...]

 

Lees meer  

SAS is benoemd tot leider in de Gartner Magic Quadrant voor data-integratie
6 september 2018 [11:55], 1121 views

SAS is benoemd tot leider in de Gartner Magic Quadrant voor data-integratie

Gartner heeft SAS voor het achtste jaar op rij uitgeroepen tot leider in data-integratie tools.

 

Lees meer  

Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’
13 augustus 2018 [10:30], 1667 views

Honderdduizenden variabelen naar een unieke DNA Fingerprint: een stap naar ‘personalized medicine’

Zijn data scientists in staat om nieuwe inzichten te halen uit genetische data van de patiënt, met als doel om kanker beter te begrijpen en behandelingen beter [...]

 

Lees meer  

UMC Utrecht maakt gebruik van data-analyse om infecties bij premature baby's proactief te behandelen of voorkomen
23 juli 2018 [04:18], 2110 views

UMC Utrecht maakt gebruik van data-analyse om infecties bij premature baby's proactief te behandelen of voorkomen

Machine learning en kunstmatige intelligentie (AI) steeds belangrijker voor de gezondheidszorg. Daarom gebruikt het UMC Utrecht data-analyse om ervoor te zorgen dat zij di [...]

 

Lees meer  

Innovaties in een data gedreven samenleving
13 juni 2018 [09:00], 1659 views

Innovaties in een data gedreven samenleving

Innovaties in een data gedreven samenleving: van een grotere overlevingskans bij vroeggeboortes tot een leven lang genieten van voetbal. Op donderdag 31 mei vond de [...]

 

Lees meer