Willy Andersen digitaliserer musikk ved Nasjonalbiblioteket, Mo i Rana. (Bilde: Espen Zachariassen)
Omfattende. Datalageret ved Nasjonalbiblioteket kalles Digitalt sikringsmagasin. I tillegg til en omfattende samling harddisker har overingeniør Geir Dikvold hele tiden to kopier tilgjengelig på tape. (Bilde: Espen Zachariassen)
Manuelt. Noen bøker må produksjonskoordinator Arne Edvardsen skanne inn manuelt for at originalen ikke skal skades. (Bilde: Espen Zachariassen)
Automatisk. De fleste bøkene går gjennom en automatisk skanner, som så langt har foreviget 50.000 titler. (Bilde: Espen Zachariassen)
Ressurser. Store dataressurser må til når Tor Aarnæs Sæther legger Wesenlunds godbiter og andre TV-produksjoner på disk. (Bilde: Espen Zachariassen)
Evig. Direktør for IKT og digitalisering Svein Arne Solbakk jobber i et evighetsperspektiv: Bøker, film og musikk i digital form skal leve i 1000 år. (Bilde: Espen Zachariassen)
Verdifull. 40 meter inne i Mofjellet lagres data for store verdier. Nasjonalbiblioteket og rettighetshaverne er uenige om verdien av fri tilgang på nettet. (Bilde: Espen Zachariassen)

Hele Medie-Norge på harddisk

  • IT

Mye data for en milliard

1 petabyte er svimlende 1 kvadrillion bytes, 1000 terabytes eller 1 million gigabytes. Den forståelige beskrivelsen er lagringsplass tilsvarende 4000 datamaskiner av den rimeligste sorten i elektrokjedebutikken.

Med et foreløpig mål om et digitalt arkiv på 50 petabytes, må du stable 200.000 hjemmemaskiner oppå hverandre for å få et bilde av kapasiteten som skal til for å ta vare på historien vår i lyd, bilde, video, film og tekst.

Og dette må du i tillegg ta tregangen på, siden alt lagres på tre ulike disker og bånd samtidig.

Arbeidet skal pågå i opp til 25 år, før Nasjonalbiblioteket har klart å digitalisere alt som er arkivert opp gjennom årene.

Foreløpige beregninger fra i fjor høst peker i retning av at Nasjonalbibliotekets digitaliseringsprogram vil koste totalt ca. en milliard kroner.

Ca. 60 prosent av kostnadene vil gå til digitalt lager, innkjøp av digitaliseringsutstyr og programvare, utvikling og integrering av systemer som inngår i digitaliserings- og etterbehandlingsprosessen, samt til lønnsmidler til gjennomføring av selve digitali¬seringen og til en del oppdragsmidler.

De resterende 40 prosent av kostnadene vil gå med til registrering av materiale for å etablere nødvendige metadata for gjenfinning, samt til uthenting av materiale fra samlingene, nødvendig konservering og tilbakeføring av materiale til samlingene.





Aviser, tidsskrifter, film, musikk, tv-innslag og radiosendinger. Alle former for medieproduksjon her landet går inn i samlingen ved Nasjonalbiblioteket på Mo i Rana og i Oslo. Institusjonens største bit er i Nordland og har fire etasjer å boltre seg på inne i Mofjellet, og med årene er det blitt 40 hyllekilometer med lydbånd, film, musikk, aviser og bøker.

Men selv om det er trygt lagret, er det ikke veldig tilgjengelig for folk flest. Derfor har biblioteket de siste 18 månedene jobbet med å legge hele arkivet over på data. Alt skal digitaliseres, for å bruke nerdespråk.





Ikke noe småtteri

Og det er ikke småtteri som tatt vare på opp gjennom årene. Da blir det også dimensjoner over lagringsutstyret.

– Målet er å få alt over i digitalt format i løpet av 20 til 25 år. Så langt har vi en petabyte med digitalt innhold. Med det vi har i samlingen vår i dag, vil vi trenge mellom 30 og 50 petabytes med digital lagringsplass, forklarer Svein Arne Solbakk, direktør for IKT og digitalisering. I en egen ramme i denne reportasjen har vi satt av plass til en forklaring av begrepet, siden dimensjonene ennå befinner seg noen hakk over lagringsplassen på en vanlig PC.





Det aller helligste

Overingeniør Geir Dikvold skifter til antistatisk frakk og tresko når han skal vise oss lagrene inne i Mofjellet. Meter på meter med arkivreoler passeres i korridorene, før vi kommer inn i det aller helligste – Digitalt sikringsmagasin, DSM, 40 meter inne i berget.

– Her har vi harddisker i ulike størrelser, fra 250 til 750 gigabytes, forteller Dikvold og åpner varsomt dørene til et av utallige skap med summende disker. Og summende kjølevifter på grunn av all varmen som lagringsmediene produserer.

– Nei, vi har ikke noe system for gjenbruk av varmen herfra, beklager overingeniøren.

I hovedbygget på utsiden av Mofjellet foregår arbeidet med å digitalisere alle mediene som lagres i DSM. Under en glassplate ligger en gulnet bok av ikke nyere dato. Arne Edvardsen løfter glasset og blar om en side med varsomme hender.

– Dette er gamle utgivelser som må håndteres skånsomt, sier produksjonskoordinatoren. Skannerkameraet svisjer over glassplaten, og sekundet etter kommer et bilde av to boksider opp på flatskjermen ved siden av. Side for side blir bøkene på denne måten bevart for ettertiden.





Ti millioner

I et annet lokale går digitaliseringen av bøker langt kjappere enn i den manuelle skanneren. Hvis det finnes tre eller flere eksemplarer av en bok, blir ett ofret for evigheten: Eksemplaret plukkes fra hverandre og matet inn i en skanner som kan minne om en avansert kopimaskin som sluker to sider i sekundet.

– Her har vi digitalisert 10 millioner sider siden starten september 2006, sier en stolt IT-direktør. Det er 50.000 bøker, det.

– Hver bok blir samlet som en bildeserie. I tillegg kjører vi optisk tekstgjenkjenning av bildene, slik at innholdet blir søkbart, forteller IT-direktør Solbakk. Det vil si at bildene av boksidene også blir gjort om til tekst, som kan hentes frem i et ordinært tekstbehandlingsprogram som Microsoft Word. Dermed blir alt innholdet indeksert og gjort tilgjengelig sammen med såkalte metadata som vi har registrert manuelt – råvarer for databaser og digitale tjenester som egentlig bare fantasien setter grenser for.

– Så skolebøker kan hentes herfra i stedet for å kjøpe dem?

– Det kan jo tenkes – i samarbeid med rettighetshaverne. Men jeg heller mer til tanken om at kommersielle aktører bruker Nasjonalbibliotekets digitale kunnskapsbank som en råvareleverandør i sin utvikling av digitale læremidler, sier Solbakk.





Musikkskatter

Willy Andersen ser ut til å ha havnet på rett hylle med å bruke dagene til å ta vare på landets musikkskatter. For øyeblikket er den tidligere rockemusikeren i Taboo opptatt med en noe annen sjanger enn sin egen.

– Hele steinkakesamlingen fra NRK skal over på disk. Altså plater med avspillingshastighet 78, for dere som erindrer det formatet. Slett ikke verst å kunne jobbe med musikk på denne måten, mener Amdersen, som nylig hadde reuinon med sin gamle gruppe fra 1968.

I naborommet hører vi tydelig stemmen til Rolf Wesenlund og Harald Heide Steen junior. Telecineoperatør Tor Aarnær Sæther, med mastergrad i filmvitenskap, tar vare på alt av godbiter fra norsk film og TV, inkludert de klassiske sketsjene fra ”Wesensteen”.

– Film krever mye dataressurser. Vi mater rullene i digitaliseringsmaskinen Telecine, en investering på flere millioner kroner for noen år tilbake. Fra denne lagrer vi film i digitale formater med ulik kvalitet, fra 270 megabit i skundet ned til 1,5 megabit i sekundet, sier Tor Aarnæs Sæther. Til sammenligning holder vanlig TV over internett en kvalitet på ca 1 megabit i skundet.

Digital lagring av landets aviser har Nasjonalbiblioteket foreløpig valgt ikke å gjøre selv. Foreløpig er et utvalg aviser valgt ut, og det tyske selskapet CCS i Hamburg sikret seg anbudet på den jobben.

– I tillegg tar vi i mot nye utgaver som ferdige datafiler i pdf-format fra noen aviser, sier Solbakk.





Back up holder ikke

Inne i fjellet har Geir Dikevold kastet frakken og viser Teknisk Ukeblad veien en etasje ned til den ene av to såkalte tape-roboter med data lagret på bånd. De fungerer på den måten at en skinnegående båndplukker finner frem til den rette filen på det rette båndet når en bruker søker etter konkret informasjon.

– Her lagrer vi akkurat det samme som på diskene i etasjen over. I tillegg har vi en lik stasjon ute i hovedbygget, forklarer Dikevold. Årsaken er at det ikke nytter med tradisjonell back up når man lagrer så store datamengder som skal være tilgjengelig til enhver tid. Hvis diskene skulle feile, vil det ta flere måneder å gjenopprette informasjonen fra sikkerhetskopiene.

– Derfor lagres alt det digitaliserte materialet synkront på tre steder, sier overingeniøren.

Systemene er levert av Sun Microsystems. De har aldri hatt en større utfordring.

– Dette er et av de største oppdragene vi har hatt her i landet, sier Kai Aksnes. Forretningsutvikleren på lagring hos Sun har ansvaret for salg og tekniske løsninger ved lagringen i Nasjonalbiblioteket.

Løsningen benytter programvare med åpen kildekode og standard industrikomponenter som brukes ved slike institusjoner i andre land.

– Dette er viktig for denne type virksomheter som skal leve med løsningen i et langtidsperspektiv, sier Aksnes.

– Utfordringen har ligget på det praktiske planet, som å få det fysiske utstyret på plass inne fjellhallene, forteller han.





Levetid 1000 år

Intet mindre enn ett tusen år er tidsperspektivet for den digitale lagringen ved Nasjonalbiblioteket i Mo i Rana. Det byr på teknologiske utfordringer.

– Hva slags format som brukes til å bruke og lagre tekst, lyd og bilder endrer seg over tid. Da må vi sørge for at innholdet kan leses langt frem i tid. Én ting er å bytte format, det fungerer jo greit, men vi må samtidig være sikre på at innholdet ikke ødelegges eller endres i konverteringen eller over tid, sier IT-direktor Svein Arne Solbakk.





Kritisk

Nye formater kan ha problemer med å få med seg alle detaljer i informasjon som er lagret i eldre formater. Og forenklet forklart kan databit snu seg over tid og dermed endre innholdet i en digital fil.

– Og flytting av data over til nye generasjoner av lagringsteknologi er også en kritisk prosess hvor det kan skje feil, sier Solbakk.





Sikrer fremtiden

Nasjonalbiblioteket deltar i et prosjekt kalt Longrec sammen med Det norske Veritas, NTNU, Statoil Hydro, Fast og Bankenes Betalingssentral, der målet er å finne løsninger for å sikre at digitalt innhold forblir det samme og kan brukes i generasjon etter generasjon.





Krangler om nett-verdien

Det endelige målet er at alt innholdet skal bli søkbar på nettet, men det går ikke før Nasjonalbiblioteket er blitt enige med de mange rettighetshaverne om hva slags godtgjørelse de skal ha for åpen tilgang til bøker, film og musikk.





Upløyd mark

IT-direktøren opplever at det langt til mål med forhandlingene.

– Her er det fortsatt mye upløyd mark. Selv om vi har en god dialog med rettighetshaverne, kan det være en lang vei å gå, sier Svein Arne Solbakk.

– Vi er i gang med et pilotprosjekt med åpen tilgang på et utvalg bøker på internett. Det skal evalueres i løpet av 2009, sier IT-direktøren.





Piloter

Han betegner de foreløpige erfaringene som interessante for begge parter, men trafikken har ikke vært stor. Piloten tar for seg et knippe bøker om Nord-områdene.

– Tror du ikke musikkvideoer fra VG-lista vil gi en smule større etterspørsel enn slike bøker?

– Det er et poeng. Vi må nok kjøre flere typer piloter med både bredere utvalg og flere typer materiale for å få et klart inntrykk av hvordan bruken kan bli med åpen nettilgang, svarer Solbakk.