SISTE SKRIK: Hjemme-NAS er siste skrik. Denne NAS-boksen fra WesternDigital kan kommunisere gjennom en nettverkskabel og lagre filer for de andre PC-ene i huset. (Bilde: Fotograf: Western Digital)
STOREBROR: EMC er markedslederen innen SAN. Det nyeste Symetrix-systemet kan konfigureres til en rå kapasitet på rundt en PB ¿ petabyte. Det er tusen TB ¿ terabyte, som igjen er det samme som en million GB ¿ Gigiabyte (Bilde: Fotograf: EMC)
STORE TALLDette er det totale lagringsmarkedet for DAS, NAS og SAN for siste kvartal i 2004 og 2005 målt i millioner kroner. Her dominerer HP og IBM fordi de selger så mange servere. Når det gjelder bare ektern lagring i 4. kvartel 2005, det vil si NAS og SAN er det EMC som er størst med 20,6 prosent av markedet tett fulgt av HP med 18 prosent og IBM med 15,9 prosent. Alle tallene kommer fra analyseselskapet IDC.

Det digitale hvelv

RAID

RAID, eller Redundant Array of Inexpensive Disks, er en viktig teknologi som vi finner både i SAN- og i NAS-systemer, men også i DAS helt ned til den enkelte PC.

Det finnes mange former for RAID til ulike formål, men som det fremkommer av navnet er det teknologi for å koble sammen mange billige harddisker. I RAID 1 brukes to og to disker til såkalt speiling. Det betyr at den samme informasjonen skrives til to disker samtidig. Hvis en disk skulle ryke, er informasjonen tilgjengelig på en andre disken, og den kan brukes til å bygge opp en ny for å gjenetablere sikkerheten. I RAID 0 brukes to eller flere disker til såkalt striping. Her deles informasjonen som skal skrives opp i flere «striper», og så skrives de ulike bitene samtidig til hver av diskene som deltar. Resultatet er at både lesingen og skrivingen går mye raskere.

Ved å kombinere RAID 0 og RAID 1 til det som kalles RAID 10 (det vil si 1 og 0), får man høy hastighet med høy sikkerhet. Det brukes også en del andre varianter, RAID 5 gir f.eks. den samme sikkerheten med bruk av færre disker.

I svært kritiske tilfeller benyttes fjernspeiling hvor hele datalageret kopieres til et annet sted. Det kan være i en annen by, et annet land, eller til og med til en annen verdensdel.

Buffere

I både SAN og NAS er størrelsen og algoritmene som regulerer bufferlageret (cash) avgjørende for ytelsen. Slike store systemer har enorme bufferlagre i RAM koblet foran harddiskene. På samme måte som i en PC håndterer de informasjonen som går både inn i og ut fra harddiskene.

Fra Mega til Yotta

¿Megabyte = 1M bytes

¿5 MB kan lagre hele Shakespeares samlede verker

¿Gigabyte = 1000 Megabytes

¿50 Gigabytes vil kunne lagre tekstinnholdet i et stort norsk bibliotek

¿Terabyte = 1000 Gigabytes

¿65 Terrabytes for å lagre verdens årlige produksjon av musikk-CD-er

¿6 Terrabytes hvis den samme musikken er komprimert til MP3

¿Petabyte = 1000 Terabytes

¿410 Petabytes for å digitalt lagre alle fotografier som produseres i verden (pr. år)

¿Exabyte = 1000 Petabytes

¿5 Exabytes vil kunne lagre hvert ord som er uttalt i verden siden tidenes morgen

¿Zettabyte = 1000 Exabytes

¿Yottabyte = 1000 Zettabytes

¿(1,000,000,000,000,000,000,000,000 bytes)

Kilde: HP Norge

DAS er den mest velkjente lagringsmåten, selv om navnet er mindre kjent. DAS står for Direct Attached Storage, eller direktekoblet lagring, altså noe som er direkte koblet til en PC, en arbeidsstasjon eller en server. Svært utbredt altså.

Men DAS har et stort problem; slike lager inneholder informasjon som er mer eller mindre isolert fra andre brukere.

Prosessoren kommuniserer med harddisken eller harddiskene via en databuss slik som serie-, eller parallell-ATA eller SCSI.

Dessuten kan en server gjøre mye annet enn å ta vare på filer. Den kan kjøre programmer, databaser og mye annet som tar ytelsen bort fra det å ta imot og levere ut filer til brukerne.

Derfor er det utviklet andre lagringsteknologier som er enklere å dele mellom mange brukere.

NAS er den eldste og mest utbredte måten å flytte datalagringen ut fra serveren på er å bruke NAS.

Når datalageret kobles til som en del av nettverket, får vi NAS, eller Network Attached Storage. Et NAS-lager ser ut som en harddisk, mens den er en datamaskin som kan ha fra en til et stort antall disker.

Fordelen med denne typen lagring er at den kan deles av mange maskiner i nettverket som alle kommuniserer med NAS-lageret via TCP/IP og at lageret ikke gjør noe annet enn lagring. Det øker ytelsen.

NAS-systemer er i fred med å dukke opp i svært små utgaver, og det selges flere små systemer for hjemmebruk. Det kan være nyttig for mange i en familie som ønsker å dele bilder og andre mediefiler.

SAN eller Storage Area Network er når datalageret i seg selv er et spesialisert nettverk. SAN-systemer kan være små, men dette er først og fremst løsningen for de virkelig store behovene der det trengs en enorm båndbredde til og fra lageret.

I motsetning til i et NAS-lager, hvor det er brukerne som etterspør filer, så snakker ikke et SAN-lager direkte med brukerne.

Det henvender seg til en eller flere servere som nærmest fungerer som portvakter, og det er de som igjen snakker med SAN-lageret.

For lagringsserverne ser lageret ut som en gigantisk direktekoblet disk (DAS). I et tradisjonelt SAN-system kommuniserer serverne med lagringsnettverket på baksiden via FiberChannel og ikke via TCP/IP.

Det betyr at en forespørsel får en meget rask datakanal helt for seg selv uten å måtte dele med andre slik tilfellet er på et pakkesvitsjet nettverk.

I et SAN foregår kommunikasjonen på en svært forenklet nivå, ikke ulikt slik den interne kommunikasjonen i vanlige harddisker foregår. Poenget med det er høy hastighet.

Når det kommer en forespørsel om data fra en server, er det ikke en fil som etterspørres, men en blokk på et bestemt sted på disken. En fil kan være delt opp i mange blokker.

Når filen skal skrives tilbake, er det bare å nødvendig å skrive de blokkene som er endret i stedet for hele filen slik det gjøres i et NAS-lager.

Fordi NAS-lageret håndterer hele filer over TCP/IP, må det også konkurrere med all annen nettrafikk, noe som kan redusere ytelsen i forhold til SAN.

SAN er et viktig, men lite marked, først og fremst for de som trenger svært høy kommunikasjonshastighet til og fra lageret.

Et SAN trenger ikke bare bestå av disker. SAN-et er et helt lagringsnettverk som ofte består av mange komponenter, også båndstasjoner til langtidslagring eller backup.

I praksis er det liten forskjell på et NAS- og et SAN-lager. Begge teknologiene bruker mye av de samme komponentene og koster omtrent det samme når de konfigureres likt, selv om et SAN vanligvis vil være mer kostbart på grunn av bruken av Fiberchannel og svitsjer og kort basert på denne protokollen i stedet for mye billigere Ethernet.

Brukere som trenger rask filhåndtering, vil normalt velge et lager basert på NAS fremfor SAN. SAN er svært velegnet til alle slags transaksjonsdata som for eksempel e-post, databaser, CRM, ERP og datavarehus.