Statistikk på sidelinjen

Statistikkfaget kan og bør spille en mer sentral rolle i samfunnet når det gjelder analyse og tolkning av store datamengder. I en tid med mye og lett tilgjengelig informasjon og derfor stort behov for systematisering, er det uheldig at statistikkfagets potensial ikke utnyttes bedre. Dette gjelder både innen industri, finans, forskning og forvaltning. Vi skal i denne artikkelen diskutere statistikkfagets stilling i dag og beskriver muligheter for å gjøre det mer nyttig og betydningsfullt.

Daglig mottar vi en mengde informasjon i form av bilder, lyd, tall og tekst. Privat gjelder dette særlig de nye mediene, mens det i yrkeslivet også dreier seg om en serie andre informasjonskilder. Eksempler er kjemiske og fysiske måleinstrumenter i industrien og datavarehus for samling og bearbeiding av kundeinformasjon i det økonomiske liv. For å nyttiggjøre oss all denne informasjonen effektivt trengs metodikk som reduserer og forenkler. På den måten skapes oversikt og forståelse, slik at fornuftige beslutninger kan tas. Dette er en av statistikkfagets viktigste oppgaver. Det er vår oppfatning at disse mulighetene verken har vært godt nok kjent eller utnyttet.

Modellklasser

Statistikk er en del av metodeapparatet i mange fag, men det er også en egen generisk disiplin. I virkeligheten dreier det seg om et sammensurium av teknikker med flere ulike retninger og skoler. Historisk var disse metodene numeriske approksimasjonsteknikker, nært forbundet med beregningsmatematikk, men dette endret seg da man i første halvdel av det tjuende århundre for alvor begynte å bygge på at det tilfeldige i datamaterialer kan beskrives matematisk ved hjelp av sannsynlighetsmodeller. Derved ble statistikkfaget gitt et veldefinert teoretisk grunnlag, og man kom etter hvert fram til effektive modellklasser som kunne håndtere mange problemer.

Samtidig ble den matematiske side ved statistikkfaget dyrket. Undervisning og metodisk forskning ble i mange land, for eksempel Norge, lagt i hendene på matematikere ved matematiske institutter. Mange av disse var mer interessert i metodikk for dens egen skyld enn i praktisk problemløsing, og det oppsto en kløft mellom metodeutviklingen innen statistikkfaget selv og behovet hos dem som skulle bruke det. Mens den teoretiske verden utviklet mer og mer sofistikerte teknikker, med liten praktisk gevinst, opererer brukerne ofte i en grov og uoversiktlig verden som bare i beskjeden grad er matematisk formaliserbar. Undervisningen i statistikk på tekniske og økonomiske høyskoler har vært preget av statistikkfagets egen teoridannelse snarere enn fagets motivering som praktisk hjelpedisiplin der andre matematiske modeller kommer til kort. Denne mangel på innordning i andre fagstudier har medført at statistikkundervisningen må ha virket uforståelig og demotiverende for mange studenter. Vi forestiller oss at lesere av TU vil kjenne seg igjen.

Teori og praksis

Det vakuum mellom teori og anvendelse vi har beskrevet ovenfor, måtte etter hvert bli fylt av andre, og det oppsto mer pragmatiske retninger som orienterer seg mot praktisk løsning av behov i industrien og andre deler av næringslivet. Fremtredende eksempler er dataanalyse (fra 1970-årene) og data mining (fra det siste tiåret). Grunnleggende er alle disse skoler en del av statistikkfaget, og alle forsøker å løse problemer som er for kompliserte til å kunne beskrives presist matematisk, samtidig som det finnes regelmessige, repeterbare mønstre som kan fanges opp ved omtrentlige modeller. Her er noen eksempler fra teknikk og økonomi der norske miljøer har gitt vesentlige bidrag.

Pragmatisk statistisk modellbygging har med stort hell blitt brukt innen de deler av anvendt kjemi der det foreligger målinger av mange korrelerte variable (kjemometri). Teknologien knyttet til nærinfrarød (NIR) spektroskopi er et typisk eksempel. De underliggende fysiske og kjemiske effekter er ofte for kompliserte til at de fanges opp via teoretiske modeller, men empirisk modellering via statistiske teknikker har vist seg effektive for tolkning og til bestemmelse av kjemiske komponenter.

Erfaringslæring

Et annet eksempel er beskrivelse av oljereservoarer. Ingen kan på lokal, fin skala gjengi geologiske og petrofysiske egenskaper ved en blokk som befinner seg langt under havoverflaten, men likevel er det et slikt detaljert bilde oljeselskapene trenger for å bedømme reservoarets størrelse og den fremtidige produksjonshastighet – som er avgjørende for lønnsomheten. Tilgjengelig informasjon fra målinger knyttet til brønner og seismikk sammen med annen geologisk kunnskap slås sammen ved hjelp av statistiske teknikker til et detaljert bilde på fin skala, riktignok ikke helt riktig, men det best oppnåelige.

Statistiske metoder anvendes også i finansindustrien og i forbindelse med markedsføring. Et eksempel er den såkalte CRM (customer relationship management) som sikter mot å forstå kundegrunnlaget bedre via systematiske empiriske undersøkelser. Herved forsøker bedrifter å beholde de kundene de har, og også skaffe seg nye gjennom effektive kampanjer og markedsføringstiltak.

Felles for all disse eksemplene er at det dreier seg om systematisk å lære av erfaring. Det er rom for store forbedringer i hvorledes disse metoder brukes og formidles, for eksempel:

*Mye bedre utnyttelse av moderne informasjonsteknologi. Mange nyttige statistiske teknikker er slik at de er beregningskrevende, og effektiv bruk av beregninger kan ofte forenkle modelleringsprosessen betydelig.

*Utvikling av større og mer anvendbare metodebokser. Dette vil kunne gi en mer overordnet undervisning/formidling av metode, renset for mange av de irrelevante detaljer som gjør mye av dagens metodiske apparatet tungrodd og uoversiktlig.

*Mer vekt på gode brukervennlige brukergrensesnitt og tolkningsverktøy. Uten gode verktøy som forenkler forståelse og tolkning blir metodene lett spesialverktøy for fagspesialisten.

*Fagstatistikere må i større grad fokusere på hele prosesser og kommunikasjon med brukere i alle faser, fra problemformulering, forsøksdesign, analyse og tolkning til konklusjon og eventuelt nye runder med undersøkelser.

Ved UiO er prosesser i gang som i løpet av kort tid vil forandre undervisningen i statistikkfaget på en slik måte at de ovenfor nevnte elementer blir tatt bedre vare på. Vi håper og tror dette vil bidra til en positiv utvikling av faget.