Komplisert genarbeid

Bioinformatikk-kappløpet startet for alvor under arbeidet med å kartlegge hele menneskets arvemateriale. Menneskets genom består trolig av 30.000-40.000 gener. Hvert gen koder kanskje for opptil 100 forskjellige proteiner som igjen styrer de ulike prosessene i organismen. Mennesket er bare én av bortimot 1000 organismer som er kartlagt til nå.

Nye biodata produseres med eksponentiell veksttakt. Offentlig tilgjengelige genbanker rommer viktig informasjon i jakten på sykdomsgener og nye behandlingsmetoder.

- Vi trenger dataverktøy til å utføre mer effektive søk og analyser i eksisterende gendatabaser og til å sortere de dataene som vi produserer selv, sier medisinsk direktør Olav Flaten i legemiddelselskapet GlaxoSmithKline.

Flaten forteller at bare én genbank i USA inneholder 15 millioner forskjellige gensekvenser og 17 milliarder beskrevne baser. Det er bare én av flere gendatabaser.

På Institutt for kreftforskning og molekylærbiologi ved NTNU startet jobben tidligere i laboratoriet, mens den nå begynner foran PC-en, forteller professor Hans Krokan. Han tror fremtidens molekylærbiologer vil ha langt større tyngde i informatikkfaget.

Bioinformatikken brukes til å gjennomgå DNA- og proteinsekvenser. Det kan være å identifisere genetiske mønstre som disponerer for ulike sykdommer, eller kartlegge og klassifisere ulike krefttyper. Det kan også dreie seg om å identifisere nye medlemmer av en genfamilie.

- Med dagens datamengde er hastigheten i analysen avgjørende, sier Krokan.

GlaxoSmithKline følger utviklingen av Interagon-teknologien med interesse, og har blant annet gitt knoppskytingsbedriften gratis kontorplass i sitt nye Innovasjonssenter i Oslo sammen med ytterligere to bioinformatikkselskap.