Universitetet i Oslo åpner i dag et nytt datalagringssenter med kapasitet på 7 petabyte. (Bilde: colourbox.com)

I dag åpner 7 petabyte ny datalagring

KRONIKK: Dataflommen er over oss, skriver UiO-rektoren.

  • forum
  • Av rektor Ole Petter Ottersen og dekan Morten Dæhlen, Universitetet i Oslo

I verden i dag produseres store mengder digitale data, og mye mer vil bli produsert i årene som kommer.

Denne dataflommen er en viktig kilde til ny kunnskap, men vi må også finne gode løsninger for lagring og forvaltning slik at riktige og viktige data gjøres tilgjengelig for forskning og utdanning langt inn i fremtiden.

Store mengder data

Avansert utstyr, enten det er maskiner som måler fenomener inne i kroppen, satellitter som fotograferer jorda, eller dataprogrammer som beregner hvordan klima utvikler seg, produserer enorme datamengder.

Verden utstyres med myriader av sensorer som måler ulike fenomener i naturen og i samfunnet forøvrig. Dette gir data – mye data. Tekst, lyd, bilder og film produseres på digital form og gjøres tilgjengelig over internett. 

Innen biologi og medisin brukes data fra avansert vitenskapelig utstyr til å forstå grunnleggende fenomener knyttet til liv og helse, og nye og skånsomme behandlingsmetoder ser dagens lys ved hjelp av omfattende analyser av store datamengder.

Vi oppnår stadig større forståelse for hvordan klima utvikler seg gjennom beregninger og dataanalyser, og energisystemer blir mer effektive ved bruk av kunnskap som fremkommer gjennom analyser av data fra sensorer og simuleringer.

Les også: Sprengt kapasitet bremser forskningsprosjekter

Nytt senter

I dag åpner statsråd Kristin Halvorsen et nytt nasjonalt anlegg for lagring og forvaltning av vitenskapelige data ved Universitetet i Oslo. Lagringskapasiteten i denne infrastrukturen er 7 petabyte.

Det er vanskelig å forestille seg hvor mye dette er, men det tilsvarer lagringsbehovet for 7 milliarder bilder av normal størrelse (1 megabyte).

I tillegg til å øke lagringskapasiteten setter dette anlegget oss i stand til å intensivere forskningen rundt forvaltning av sensitive data innen helse og samfunnsfag, samt utvikle bedre metoder for arkivering av data fra forskning.

Dette anlegget utgjør et solid løft, men er bare starten på utviklingen av fremtidens lagringssystemer for vitenskapelige data. Innen få år trenger vi systemer med kapasitet på flere tusen petabyte skal vi håndtere flommen av nye data. 

Les også: Dette endrer hele IT-landskapet

Delt infrastruktur

Det er viktig å understreke at disse lagringssystemene er og vil være distribuert over flere institusjoner og steder, både nasjonalt og internasjonalt. Systemene vil også være konstruert slik at vitenskapelige data kan utnyttes over hele verden uavhengig av hvor dataene faktisk er lagret.

Videre vil åpen, men kontrollert, tilgang til data («Open Access») være avgjørende for vitenskapelige fremskritt.

Dette krever store investeringer, og det er viktig at Forskningsrådet, som er en stor bidragsyter til det nye anlegget ved Universitetet i Oslo, fortsetter å investere i infrastruktur for lagring av store datamengder også i fremtiden.

Dette er ikke minst viktig for at Norge skal kunne ta del i de store investeringene som gjøres i denne type infrastruktur i Europa og resten av verden, og for at vi skal få tilgang til vitenskapelige data som samles inn og forvaltes av forskningsinstitusjoner i utlandet. 

Vi ser også at det oppstår helt nye forskningsområder drevet frem av tilgangen på store datamengder, og det utvikles stadig nye metoder og verktøy for å hente informasjon og kunnskap ut av disse datamengdene, herunder avanserte systemer for å kombinere data fra ulike kilder.

Verden er bare i startfasen når det gjelder datadreven forskning og utdanning, og denne inngangen til kunnskapsutvikling er noe som brer om seg til stadig flere fagområder og disipliner.

Utviklingen vil føre til at mange nye og overraskende forskningsresultater vil se dagens lys i årene som kommer.  Universitetet i Oslo har over flere år satset mye på studentaktiv forskning, f.eks. gjennom prosjektet «computing in science education» som nettopp har fokus på beregninger og bruk av data i utdanningen.

Den nye infrastrukturen for lagring av vitenskapelig data vil bidra til ytterligere å forsterke denne viktige satsingen ved Universitetet i Oslo.

Les også: Venter femtidobling av lagrede data

Utenfor veikryssene

Mulighetene i flommen av vitenskapelige data er mange, men det finnes også utfordringer som må tas alvorlig. Kravene til sikkerhet er høye, og særlig høye for data med sensitivt innhold.

Videre er det viktig å ta høyde for at lagringsteknologier endrer seg, bl.a. blir disse teknologiene stadig billigere og mer energieffektive.

Det er også viktig å etablere gode rutiner for avhending av data, og sist, men ikke minst, må det kontinuerlig utvikles systemer og verktøy for søk etter kunnskap og ny erkjennelse i den stadig økende flommen av data på digital form.

Universitetet i Oslo satser, men vi er helt avhengige av at myndighetene også tar dataflommen alvorlig!

Norge ligger utenfor de store veikryssene i Europa. Skal vi lykkes i vår internasjonalisering, må vi ligge i forkant når det gjelder forskningsinfrastruktur.

Forskningsinfrastrukturen er avgjørende for vår attraktivitet og er inngangsbilletten til internasjonalt samarbeid.