Automatische segmentatie van organen in kankertherapie

Machine intelligence is the last invention that humanity will ever need to make.

Nick Bostrom.

Geneeskunde is één van de oudste disciplines van de mens. Al in de prehistorie gebruikte men planten en kruiden als natuurlijk medicijn. In de loop der jaren is de mens steeds beter geworden in het voorkomen en genezen van allerlei ziekten en kwalen. Daarnaast werkt men steeds meer interdisciplinair. Zo was het slechts een kwestie van tijd voor men een relatief nieuwe ontwikkeling in de informatica, zijnde het machinaal leren, zou inzetten bij één van de huidige dodelijkste ziekten: kanker.

Kanker

We dromen er allemaal van: the cure for cancer. Als we kijken naar figuur 1, dan weten we ook meteen waarom. Kanker is de belangrijkste doodsoorzaak bij mannen en de tweede belangrijkste doodsoorzaak bij vrouwen.

Figuur 1: Relatieve verdeling doodsoorzaken naar geslacht in het Vlaams Gewest in het jaar 2017.

 

Waarom is dit zo een belangrijke doodsoorzaak? Hier zijn twee grote redenen voor. De eerste is dat we steeds beter worden in het bestrijden van andere doodsoorzaken. Toen men in 1928 penicilline ontdekte was dit een revolutionair middel in het bestrijden van bacteriële infecties. Ook vaccinaties zorgen ervoor dat een hoop ziekten niet meer de onoverwinnelijke vijand zijn die ze vroeger waren. De tweede is dat we steeds ouder worden en kanker is nu eenmaal een ziekte die meer en meer voorkomt naarmate men ouder wordt. Dit kan men zien in figuur 2.

Figuur 2: Aantal sterftegevallen door kanker per leeftijdscategorie per 1000 personen in het Vlaams Gewest in het jaar 2017.

 

Dit alles maakt van kanker de meest recente en sterkste vijand van de mens in zijn eeuwige strijd tegen de dood. Gaan we ooit een universele oplossing vinden? Waarschijnlijk niet. Kanker is niet één ziekte maar een verzameling van meer dan 100 varianten. Elk van deze varianten kan een verschillende oorzaak hebben en afhankelijk van het type en de locatie van de kanker zijn andere behandelingen aangewezen. Wij zullen het hebben over één van deze type behandelingen: het bestralen van de tumor.

Radiotherapie

Concreet gebruikt men bij radiotherapie ioniserende straling om tumoren kapot te stralen. Hierbij wil men uiteraard niet (te veel) gezond weefsel en gezonde organen raken. Dit is men in staat te doen door de volgende twee pilaren:

  • Kankercellen en gezonde cellen zijn niet compleet hetzelfde. Gezonde cellen zijn beter in staat zichzelf te herstellen dan kankercellen. Vooral bij relatief lage stralingsdosissen is dit een sterk verschil. Daarom kiest men er vaak voor de tumor meerdere keren over meerdere dagen te bestralen. Op die manier wordt de tumor stukje voor stukje kapot gestraald, terwijl het gezonde weefsel tijd heeft gehad om te herstellen tussen twee bestralingen door. Idealiter wordt enkel de tumor en niet de organen bestraald. Dit is echter (vaak) niet mogelijk. Daarom is het belangrijk zo goed mogelijk de locatie van de tumor en de organen te kennen zodat men een stralingsplan kan opstellen dat de stralingsdosis in de tumor maximaliseert en in de organen minimaliseert.
  • Om de tumor en de organen zo accuraat mogelijk te weten liggen, voert men een CT-scan uit. Zo een CT-scan kan uit 250 foto’s bestaan. Daarna zijn de clinici aan de beurt om zo accuraat mogelijk de organen en de tumor in te tekenen in gespecialiseerde software. Deze software kan dan met die informatie een stralingsplan opstellen in de hoop de gezonde organen zoveel mogelijk te sparen en de tumor voldoende te bestralen.

Het intekenen van de organen kan redelijk wat tijd innemen. Daarnaast is er ook een zekere variabiliteit tussen wie ze intekent. Als laatste is deze intekening niet permanent; de patiënt kan wat afgevallen zijn of de tumor kan gekrompen zijn tussen twee behandelingen door. Indien er een methode bestond die de organen automatisch intekende zou men veel sneller kunnen starten aan de behandeling. Daarnaast zou men ook de stralingsplannen kunnen aanpassen tussen twee behandelingen door. Daardoor zou de ontvangen dosis verder geoptimaliseerd worden.

Machine learning

Hoe leert een baby wandelen? We proberen recht te staan, vallen om en proberen opnieuw. Elke poging leren we wat meer. Hoe houd ik mijn balans? Hoe kan ik de ene voet voor de andere zetten zonder om te vallen? Elke keer leren we van onze vorige actie en worden we beter. Wat als we een machine zouden maken die hetzelfde leerproces heeft? Dan zouden we geen gesofisticeerde algoritmes en diepgaande programma’s moeten schrijven. Slechts een algemene structuur die eender welke taak kan leren door deze taak keer op keer uit te voeren en zichzelf te verbeteren door de gekregen feedback. Dit is de basis van machine learning. We geven het computermodel een doel, definiëren een metriek dat ons model vertelt hoe goed het de taak kan uitvoeren en zorgen ervoor dat het model zichzelf kan verfijnen aan de hand van deze feedback. Er bestaan al verschillende soorten modellen, elk met hun eigen architectuur en eigenschappen. Een bekend model dat zichzelf al heeft bewezen in het segmenteren van afbeeldingen is U-Net, waarvan de architectuur te zien is in figuur 3.

Figuur 3: U-net architectuur voor een afbeelding van 572×572 pixels (Ronneberger, Fischer and Brox, 2020).

 

De naam “U-Net” komt van de vorm van het netwerk. Het bestaat eigenlijk uit twee delen of helften. De linkerhelft leert oppervlakkige zaken in de foto’s herkennen zoals “wat is een lijn” en “hoe vormen deze krommen een cirkel”. Dit deel van het netwerk zou gebruikt kunnen worden om een model te trainen om organen te herkennen. Zo zou het orgaan bijvoorbeeld kunnen zeggen of een bepaalde foto het hart, longen en een luchtpijp bevat. De rechterhelft gaat nog een stap verder en zorgt ervoor dat de organen ook worden aangeduid in de foto’s. Concreet willen we links een CT-beeld in het model steken, en rechts de locaties van de organen eruit laten komen. Dit doen we door het model CT-beelden te voeren en de autogesegmenteerde beelden te vergelijken met wat de clinici hadden ingetekend. Hoe goed of hoe slecht het model in staat was hetzelfde beeld te bekomen, wordt terug geleverd aan het model zodat het zichzelf kan aanpassen in de hoop de volgende keer beter te zijn. Het is belangrijk dat we dit niet te lang blijven doen. Anders riskeren we een model te hebben dat perfect al geziene CT-beelden kan segmenteren maar compleet de mist in gaat bij nieuwe CT-beelden. Indien we denken dat het model voldoende getraind is, testen we het op een apart gehouden groep CT-beelden en gebruiken we de voorspellingen om te oordelen of het model al dan niet geslaagd is in zijn opzet.

Mijn thesis

Ondertussen is het doel van de thesis hopelijk duidelijk. We willen een model trainen dat in staat is automatisch organen te segmenteren op CT-beelden. Hiermee hopen we het werk van de clinici te verlichten. Daarbij komend zal het model consistent zijn in de beslissingen die het neemt en lost men zo de variabiliteit tussen clinici onderling op. Eerdere onderzoeken lijken veelbelovend, maar blijven zeer technisch. Ze evalueren het model aan de hand van klassieke metrieken die ons vertellen hoe goed twee oppervlakken overeen komen. In ons geval is dat het oppervlak van de foto waar we op trainen en ons eigen gegenereerde oppervlak. Wij gaan nog een stap verder en laden de gegenereerde oppervlakken in in Raystation. Raystation is een computerprogramma waar het stralingsplan wordt in opgemaakt. Hierin segmenteren de clinici de CT-beelden, stelt men de optimale configuratie aan straling op en evalueert men de effecten op de organen en de tumor. Door onze resultaten in dit programma te vergelijken met de originele beelden bekomen we veel meer nuttige informatie. Het is namelijk niet dat ene technische metriek die zegt hoe goed twee oppervlakten overeenkomen dat praktisch relevant is. Het zijn de klinische gevolgen in de radiotherapie die finaal het meest vertellen of ons model al dan niet toegepast zou kunnen worden. Opmerkelijk is dat onze technische metrieken competitief waren met de variabiliteit tussen intekeningen van clinici onderling. Het is niet eenvoudig beter te worden dan de variabiliteit van je eigen data. We hebben ons model echt wel goed gepusht.

Onze gesegmenteerde beelden werden positief onthaald door een klinisch expert van het Universitair Ziekenhuis Gent. De expert oordeelde dat de segmentaties over de grote lijn in orde waren. Systematische fouten zoals het ruggenmerg al dan niet één mm te klein intekenen, konden technische metrieken leveren die misschien niet zo goed leken, maar speelden klinisch geen of nauwelijks een rol. De besturingsapparatuur is niet nauwkeurig tot op sub-millimeter niveau en daar bijkomend wordt er toch een buffer genomen voor bijvoorbeeld het ruggenmerg. Algemeen oordeelde de expert dat de segmentaties in orde waren met slechts hier en daar een grote segmentatiefout die vaak niet relevant was voor het volledige orgaan.

Deze grote segmentatiefouten deden zich vaak voor in een serie van enkele CT-beelden. Dit willen we graag opgelost zien in een volgend onderzoek door de segmentatie van een CT-beeld niet van enkel dat beeld te laten afhangen, maar ook van één à twee CT-beelden ervoor en erna. Zo hopen we het model wat meer 3D-informatie te geven bovenop de pure 2D-informatie die het nu krijgt. Als gevolg zal het model vermoedelijk geen sterke overgangen meer hebben van het ene CT-beeld naar het andere. Omdat de segmentatie van het model zo goed ontvangen werd, zouden we het ook graag uitbreiden naar nog meer organen en zouden we nog meer data willen gebruiken. We hebben namelijk slechts één derde van onze CT-beelden gebruikt en niet alle organen die erop geannoteerd stonden.

Jeffrey De Rycke 

Student Master of Science in de Fysica & Sterrenkunde

Promotor: Prof. Dr. ir. Barbara Vanderstraeten

Copromotor: Prof. Dr. Luc Van Hoorebeke

Begeleiders: Dr. ir. Jan Aelterman, Dr. Eva Vandersmissen

Deep learning voor autosegmentatie van computertomografie (CT) beelden in radiotherapie

Bronnen: