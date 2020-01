Alle norske kvinner mellom 50 og 69 år inviteres til mammografiscreening annet hvert år. Bildene tydes av radiologer og kan være vanskelig å klassifisere. Én av fem amerikanske brystkreftdiagnoser blir ikke fanget opp av screeningen, ifølge American Cancer Society.

Google er en av flere aktører som jobber med å forbedre bildetydningen ved hjelp av kunstig intelligens (artificial intelligence, AI). I en studie publisert i Nature hevder IT-giganten å ha utviklet AI som gjenkjenner brystkreft bedre enn motparten av kjøtt og blod.

Googles AI klassifiserte 9,4 og 2,7 prosent færre falske negative screeningundersøkelser på henholdsvis amerikanske og britiske kvinner, sammenliknet med radiologene. Når det gjaldt falske positive diagnoser var reduksjonen på henholdsvis 5,7 og 1,2 prosent.

Brystkreft Brystkreft er den vanligste kreftformen blant kvinner i Norge. Ifølge Kreftregisteret ble 3568 kvinner og 28 menn diagnostisert med brystkreft i Norge i 2018. I 2017 døde 586 kvinner og åtte menn av denne kreftformen. Alle norske kvinner mellom 50 og 69 år inviteres til mammografiscreening annet hvert år. Bildene tydes av to radiologer, uavhengig av hverandre. Tvilstilfeller (om lag 7 prosent) blir diskutert, før det blir tatt beslutning om kvinnene må kalles inn til etterundersøkelse. Om lag 3,5 prosent blir innkalt til etterundersøkelser, og blant om lag 20 prosent av de etterundersøkte blir det diagnostisert brystkreft.

– Dette er høyst sannsynlig fremtiden innen radiologi, sier Solveig Hofvind, leder for Mammografiprogrammet ved Kreftregisteret, som selv jobber med norsk kunstig intelligens for diagnostisering av brystkreft.

Google trente opp AI-en med bilder fra rundt 76.000 briter og omtrent 15.000 amerikanere og utviklet et AI-program. Deretter testet de programmet ferdigheter med bilder fra over 25.000 briter og rundt 3.000 amerikanere. Forskerne sammenliknet så AI-programmet og radiologenes prestasjoner med fasiten.

Like bra som to radiologer

I tillegg foretok forskerne en test hvor AI-programmet og seks amerikanske radiologer diagnostiserte 500 tilfeldig utvalgte mammografiundersøkelser av amerikanske kvinner. Her fikk radiologene tilleggsinformasjon om pasientene, for eksempel alder, brystkrefthistorie og tidligere mammografier. AI-programmet var bedre enn radiologene også her.

Google-studien Google Health og Alphabet-eide Deepmind utførte og finansierte studien i samarbeid med flere helseinstitusjoner.

Den kunstige intelligensen kom altså bedre ut enn radiologene, men dette gjaldt kun der bare én radiolog vurderte bildene. I Storbritannia (og i Norge) vurderer to radiologer mammografiundersøkelsene. Da forskerne målte AI-ens prestasjon opp mot den samlede vurderingen til de to britiske radiologene, presterte programmet omtrent like godt som menneskene.

Forskerne fant også flere enkelttilfeller hvor radiologene fant brystkreft som AI-en overså, og vise versa.

Norsk megaprosjekt

Hofvind i Kreftregisteret forteller at de jobber med Norsk Regnesentral på et liknende prosjekt med data fra 350.000 screeningundersøkelser utført i Norge. Formålet med prosjektet er å utvikle en metode som kombinerer automatisk billedanalyse med radiologisk ekspertise. Det er altså ikke snakk om å frata radiologene jobbene, men å utnytte ekspertisen bedre.

– Vi ser på flere modeller for hvordan vi kan kombinere dette. Blant annet har vi én modell hvor den kunstige intelligensen rangerer sannsynligheten for kreft fra én til ti. Da kan vi sjalte ut bildene som er entydig negative, og la radiologene jobbe med mammogrammer som viser suspekte funn og kvinner som kommer med symptomer, sier Hofvind.

Hun forteller at de så langt har fått tilgang på et pilotsett med 15-20.000 undersøkelser og at regnesentralen har begynt å trene opp AI-en med dette.

Line Eikvil, forskningsleder for bildeanalyse og maskinlæring ved Norsk Regnesentral, sier at de trenger store mengder data med kjent utfall for å trene opp den kunstige intelligensen.

– Det er, heldigvis, svært lav andel krefttilfeller blant mammografiene. Det betyr at et en må samle inn bilder fra et stort antall undersøkelser for å få et tilstrekkelig stort antall med eksempler også på kreft, sier hun.

De sorte boksene

Eikvil forteller at de nevrale nettverkene lager mange sett med filtre som genererer egenskaper. Utfordringen er at nettverkene blir så avanserte at man til slutt ikke kan vite hva de har lagt vekt på. Dette er også kjent som de sorte boksene innen kunstig intelligens.

Den norske MIM-studien: Maskinlæring i Mammografiprogrammet Kreftregisteret og Norsk Regnesentral samarbeider om en studie om å lage en kunstig intelligens basert på over 350.000 norske mammografier. Prosjektet har fått åtte millioner kroner av Forskningsrådet og foregår frem til 2022.

Eikvil erkjenner utfordringer knyttet til de sorte boksene og sier at de jobber med metoder for å løse dem.

– Nettverkene lærer fra dataene, dermed må dataene være representative for det vi skal gjenkjenne, samt inneholde variasjon. Dette er svært viktig når du ikke vet akkurat hva de legger vekt på, sier Eikvil.

– Hvilke utfordringer representerer den sorte boksen når man skal ta steget fra å teste AI innen mammografi i en studie hvor man vet svarene, til å stole på AI i vanlig diagnostisering?

– Det er en lang vei fram dit, og det avhenger av hvilken metode du bruker. Vi gjør ikke screeningen helautomatisk, men vi ønsker å kombinere radiologer og kunstig intelligens, sier Eikvil.

– Før vi kan stole på metodene, må vi lære hva slags type feil de gjør sammenliknet med mennesker. De vil ikke kunne oppdage ting vi aldri har vist den, derfor er det avgjørende å mate dem med mye data, fortsetter Eikvil.

Trenger flere kilder til AI-opplæring

En annen, beslektet utfordring er å mate AI-en med data fra ulike leverandører.

Nesten alle bildene i Googles studie kom fra Hologic-maskiner, mens Norsk Regnesentral og Kreftregisteret vil i første omgang benytte mammogrammer fra Siemens i sin studie. De jobber imidlertid med å få tak i bilder fra flere leverandører.

– Rådataene behandles forskjellig av de ulike leverandørene, og den kunstige intelligensen må dermed tilpasses den enkelte leverandør, forteller Hofvind.

– Fordel med norske data

Google offentliggjør ikke koden som er brukt til å lære opp den kunstige intelligensen, som kjører på en del egenutviklede verktøy. Eikvil forteller at det til syvende og sist er dataene som avgjør hvor gode resultatene blir, og at man ikke nødvendigvis er avhengig av Googles datakraft for å lage medisinsk AI.

– Vi får tilgang til gode, norske data fra Mammografiprogrammet. Det er en fordel å ha norske data når vi skal bruke den på norske kvinner, sier Eikvil.

– Brystene til norske kvinner er annerledes enn brystene til amerikanske kvinner, supplerer Hofvind.

CAD-spøkelset

Det er ikke første gang liknende teknologi blir prøvd ut på mammografi. CAD (computer-aided detection) ble godkjent for medisinsk bruk i USA i 1998. CAD viste tidlig stort potensial og fikk stor utbredelse, skriver New York Times. Etterhvert kom flere studier som viste at teknologien ikke forbedrer diagnostiseringen.

– Den fant kreften, men den fant også mye som ikke var kreft, sier Hofvind.

Håpet er at rå datakraft og selvlærende algoritmer skal gjøre at man unngår samme feil i dag.

– Vi må være åpne for teknologiske nyvinninger og finne ut hvordan vi kan bruke kunstig intelligens for å få et enda bedre screeningprogram, sier Hofvind.

Vil teste i Norge neste år

Hofvind har ambisjoner om å teste ut den norske kunstige intelligensen i 2021, da i form av kliniske, praktiske studier.

Hun ser frem til å komme igang med studien, det siste halvannet året har hun brukt mye tid på å få avklart personvernspørsmål i forbindelse med databruken.

– GDPR gjør det mer krevende å drive forskning. Det er mye å sette seg inn i, særlig første gang man gjør det. Forhåpentligvis blir det lettere neste gang, sier hun.