Seksjonen Fra forskning består av saker som er skrevet av ansatte i Forskningsrådet, Sintef, NTNU, Cicero, Universitetet i Oslo og Universitetet i Tromsø.

Koronakrisen: Plutselig ble statistikk allemannseie

Har koronakrisen gitt deg behov for et krasjkurs i statistikk? Her forklarer statistiker Nils Lid Hjort noe av matematikken bak alle nyhetsoppslagene.

Plutselig er det allmennkunnskap med eksponentielle kurver, og vi gjemmer oss ikke bak sofaputa når vi hører om smitterater og dødelighetsprosenter.
Plutselig er det allmennkunnskap med eksponentielle kurver, og vi gjemmer oss ikke bak sofaputa når vi hører om smitterater og dødelighetsprosenter.

Har koronakrisen gitt deg behov for et krasjkurs i statistikk? Her forklarer statistiker Nils Lid Hjort noe av matematikken bak alle nyhetsoppslagene.

  • fra forskning

I løpet av de siste ukene er vi blitt vant til at matematikk og statistikk er helt naturlige innslag i nyhetene.

Plutselig er det allmennkunnskap med eksponentielle kurver, og vi gjemmer oss ikke bak sofaputa når vi hører om smitterater og dødelighetsprosenter.

– De grunnleggende problemstillinger som vi hører om i Dagsrevyen og leser i avisene i disse tider, er og blir statistiske, sier professor Nils Lid Hjort.

Han er statistiker på heltid ved Matematisk institutt ved Universitetet i Oslo. Hjort understreker at han ikke er ekspert på smittespredning, men statistikk kan han.

Og statistikk er komplisert, selv om ikke-matematikere nå også slenger rundt seg med fagbegreper derfra.

– Detaljene er vanskelige, selv for de flinkeste i feltet. Det ser vi når forskjellige eksperter, fra land til land, delvis kommer frem til forskjellige tall, prognoser og råd, sier Hjort til Titan.uio.no.

– Likevel er de grunnleggende tankene omtrent de samme, med begreper som modell, parametere, prognoser under ulike scenarier, samt usikkerhet rundt både nøkkelparametere og slike prognoser.

Normalfordeling

Og for dem som ønsker seg to streker under svaret, er ikke alltid matematikken slik. Hvorfor skal vi for eksempel holde oss inne selv om vi verken er syke eller har fått påvist smitte.

– Vi ser jo at forskjellige land, og til og med ulike fylker i Norge, tolker de generelle rådene på ulik måte. Altså er det ikke noe enkelt svar, sier Hjort.

Noen ord og uttrykk fra statistikken

  • Modell: Teoretisk fremstilling (ofte som formel eller skjema) av et forhold, en prosess eller lignende. Brukt som utgangspunkt for analyser og beregninger.
  • Normalfordeling: Statistisk sannsynlig spredning av bestemte egenskaper hos personer i et større utvalg.
  • Parameter: Størrelse som kan ha forskjellige verdier, men som i hvert enkelt tilfelle gis en bestemt verdi, og som påvirker utfallet av det man studerer
  • Prognose: Forutsigelse eller beregning av hvordan noe vil utvikle seg, ofte på grunnlag av foreliggende fakta
  • Rate: Antall eller mengde mengde per tidsenhet, for eksempel fødselsrate eller vekstrate.
  • Sannsynlighet: Matematisk uttrykk for hvor trolig det er at en bestemt hendelse inntreffer.
  • Scenario: Tenkt eller mulig fremtidig situasjon.

Kilde: Det Norske Akademis ordbok (NAOB)

Men her ligger det altså matematikk, sannsynlighetsteori og statistikk i bunnen. Og vi må en tur innom den mye omtalte normalfordelingen.

– 100.000 nordmenn har sine egne liv og sine ulikt utviklede kroppshøyder. Likevel er det et klart statistisk mønster, normalfordelingen, som flokken ikke kan unnslippe, så å si, forklarer Hjort.

Slik er det også med de samme nordmennene i det langt mer innviklede farvannet vi er i nå.

– Det er gode, generelle sannsynlighetsmodeller som greier å beskrive hvordan den store flokken oppfører seg.

Disse modellene beskriver hvordan veien går fra å være frisk til å bli eksponert for smitte, videre til faktisk å være smittet og å kunne smitte andre, før de til slutt blir friske igjen.

– Her er det mange modeller, mange varianter og mange måter å anslå de grunnleggende parametere på. Men hovedhistorien er likevel den samme, fra epidemi til epidemi, ifølge Hjort.

Det er disse modellene og innsiktene Folkehelseinstituttet og myndighetene baserer seg på når de innfører restriksjoner vi tidligere ikke har opplevd i fredstid. Modellene sier noe om risikoen for at du eller jeg skal gå fra den friske kategorien til de neste trinnene, eksponert for smitte og smittet.

R – hvor mange smitter hver av oss

For hver av overgangene fra én kategori til en annen er det rater, prosentvise sannsynligheter, som er forskjellige for ulike grupper. Ratene varierer blant annet etter hvor eksponert man er for smitte.

– Man bruker tall og erfaringer og ekspertkunnskap til å sette slike ratetall. For eksempel den berømte R, gjennomsnittsantallet nye mennesker som blir smittet av én enkeltperson, forklarer professoren.

I Kina har denne raten, R, vært omtrent 3,3. I Norge har det vært et mål at vi holder oss under 1,3 – det magiske tallet for å «flate ut kurven» – for å unngå at helsevesenet skal bli overbelastet.

– Med tid og stunder, og etter stort drama, vil R komme under 1,0. Da er i en viss folkehelsemessig forstand «faren over», sier Hjort.

Men hvor sikre er disse modellene? Ifølge Hjort holder modellene stort sett mål. Usikkerheten ligger først og fremst i de størrelsene og parameterne man putter inn i prognosene.

– For hver uke som går, oppdateres kunnskap og parametere. Dermed blir eksperter og myndigheter langsomt sikrere på de mest kritiske parameterne og på hva som fungerer og hva som ikke fungerer.

– Det forskes intenst på koronarelaterte spørsmål akkurat nå. Dermed kan vi håpe på bedre estimater relativt snart, sier Hjort.

Men selv om forskerne etter hvert får både gode modeller og gode estimater på de viktigste parameterne, så vil prognosene fortsatt ha betydelig usikkerhet.

Hjort sammenligner med terningkast. Triller du en terning, er det en sjettedels sjanse for at den stopper som en sekser. Sannsynligheten er derfor 0,167. Jo flere kast fremover du beregner sannsynligheten for, desto mindre presist blir det.

– Selv om man til sist kommer frem til at den spesialterningen Norge nå skal kaste har sannsynlighet på nøyaktig 0,234 for å få en sekser, er det grenser for hvor presist vi kan forutse resultatet av de neste 14 terningkastene.

Les også

Norsk-svenske forskjeller

Norge og Sverige har valgt ulike tilnærminger til koronakrisen. Det betyr ikke at de nødvendigvis er uenige om matematikken.

– Ekspertene i de to landene er neppe grunnleggende uenige om modeller og estimater, men velger to ulike sett av forsiktighetsregler, sier Hjort.

Fasiten får vi ikke før stormen har lagt seg.

– Selv ekspertene er flinke til å komme med de uvante ordene «dette vet vi faktisk ikke», og det gjelder også hovedspørsmålet om hvem som kanskje har vært «flinkest» av Norge og Sverige.

– Her er det mye på spill, fra helse og død til hele samfunnsmaskineriet. Jeg, som kanskje er ekspert på statistiske modeller og metode, lytter til ekspertene som står over meg i pandemifaget, sier Hjort.

Han følger for eksempel ivrig med på det kollegaene Solveig Engebretsen og Arnoldo Frigessi arbeider med, blant annet når det gjelder å utnytte mobildata.

– Når selv de sier «vi vet ikke helt», sier jeg det samme, sier Hjort.

Brukes på mange områder

Modellene og beregningene som nå går på høygir i land etter land, er fulle av detaljer og avanserte beregninger for å spå utviklingen de nærmeste ukene.

– Likevel er det riktig å peke på at modellenes grunnleggende trekk er kjente og ikke spesielt komplekse, sier Hjort.

– Det handler om mange individers gang fra tilstand 1 til 2 til 3 til 4 og om de rater som er involvert.

Tilstand 1 er, i koronasmittens tilfelle, de friske. I tilstand 2 blir man eksponert for smitte, mens i tilstand 3 er man smittet og kan smitte så og så mange andre. I tilstand 4 er man frisk igjen.

– Modeller som ligner disse, har også vært i bruk innenfor mange andre samfunnsområder, men ikke på dette høye og dramatiske nivået, sier Hjort.

Det store trykket for å skaffe mer og bedre statistikk, fra uke til uke og fra land til land, presser frem både metodiske og beregningsmessige nyvinninger, forklarer professoren.

– Det er behov for å kombinere svært ulike informasjonskilder på nye og effektive måter, og dette er vanskeligere enn i vanligere metaanalyser.

– Dessuten trenger både forskere og myndighetene bedre og sikrere metoder for det som heter nowcasting, eller straksprognoser, for eksempel for de neste par–tre ukene, der samfunnet og styresmaktene må velge mellom ulike grep, sier Hjort.

Artikkelen ble først publisert på titan.uio.no.

 

Les også

Kommentarer (8)

Kommentarer (8)

Eksklusivt for digitale abonnenter

På forsiden nå