HD Voice illustrasjon (Bilde: colourbox.com / montasje)

HD VOICE

HD Voice: Den nye stemmen

De som synes det er god lyd i mobiltelefoner, mener sannsynligvis det fordi de ikke vet bedre. Akkurat som vi var fornøyd med tv-bildet før HD-tv kom. Nå banker HD Voice på teknologidøra.

Høna og egget

  • Det er ikke gjort i en håndvending å innføre en ny kodek.
  • For at alt skal virke som det skal, må den støttes fra terminalsiden, det vil si i mobiltelefonene og via nettverket som skal overføre bitstrømmen.
  • Alle de store utstyrsleverandørene har utviklet det som trengs for å oppgradere nettet.
  • Svært mange av de nye telefonene som er på markedet kan også håndtere HD Voice.
  • Nå er det opp til Telenor og Netcom å implementere kodeken.
  • Et stalltips er at det skjer i løpet av et års tid.

De siste årene har vært preget av HD. Spesielt på tv skal alt være i «høy definisjon». Selv mobiltelefoner kan ta opp video i HD. Men selv om mobiltelefoner er pakket full av ny teknologi, er det ikke alt som beveger seg like fort der i gården. Lyden har vært den samme i svært mange år. Og det hjelper bare litt hva mobilprodusenten gjør. Det er hvordan lyden fanges opp, kodes, sendes, dekodes og presenteres for mottakeren som er avgjørende for kvaliteten. Her har det ikke skjedd mye.

Lavdefinisjon

Selv om mobillyd er blitt litt bedre over årene, kan den ikke kalles høydefinert. På fastnettet, derimot, er lyden en helt annen. Den digitale i hvert fall. Den kan tilby et frekvensområde som gjør samtaleopplevelsen mye bedre. Det samme kan sies om lyden på videokonferanser og på Skype, når linjeforbindelsen mellom partene er god nok. Så hvorfor er lyden på mobiltelefonen så dårlig?

For å forstå det må vi tilbake til den gangen digital mobiltelefoni ble standardisert gjennom GSM i 1991. Man ønsket å beholde frekvensområdet for tale som ble brukt i analog telefoni og som var begrenset til 300 til 3400 HZ. Dette er de viktigste frekvensene som bærer stemme. Dessuten gjaldt det å begrense bruken av ressursene den enkelte samtale opptok. Kapasiteten til hver enkelt basestasjon skulle rekke til fleste mulig brukere. Det var gjort enorme investeringer i mobilnettene og operatørene ønsket å få mest mulig igjen før de investerte mer. Med en slik begrensing i frekvensområdet kan det av og til være vanskelig å høre tydelig forskjell på m og n og på s og f.

Kodeker

Når stemmen skal overføres til en liten bitstrøm, må den først gjennom en såkalt A/D, en analog til digitalomvandler. Deretter sendes bitstrømmen inn i en kodek som enkelt kan beskrives som en algoritme som regner om bitene slik at de får riktig format. Det innebærer først og fremst en reduksjon i bits per sekund, men også innlegging av kode som kan gjenopprette feil hos mottaker og andre kvalitetsfremmende tiltak.

Slike kodeker har sin analogi i musikkverdenen, mens cd-lyd er ukomprimert og har veldig høy bitrate. For at lyd skal få plass på minnekort og på nettet blir den bitredusert f. eks med mp3 og senere AAC.

De første kodekene som kom i mobilnettet var Fullrate og Halfrate; FR og HR. Den første benyttet en bitrate på 13 kbit/s, mens den siste presset bitforbruket ned til 5,5 kbit/s. Det normale var at samtalen ble satt opp med fullrate, men når basestasjonen ble hardt belastet, slik som ved store arrangementer, ble brukerne flyttet over til halvrate.

I 1997 ble kodekene forbedret og man fikk Enhanced-versjon. Disse kodekene hadde høyere lydkvalitet til tross for en litt lavere bitrate. EFR brukte bare 12,2 kbit/s. Dessuten ble feilkorreksjonen bedre, slik at samtalen tålte lenger avstand til basestasjonen og mer forstyrrelser. Ulempen var en mer kompleks algoritme som faktisk økte strømforbruket et par prosent under en samtale.

AMR

I 1998 ble Adaptive Multi-Rate audio codec antatt som standard av 3GPP som har ansvar for slikt. I praksis var dette en videreføring av EFR, men med variabel bitrate i mange trinn. Fordelen var at den var enda mer robust og kunne holde samtalen gående under enda vanskeligere forhold. Likevel tok det lang tid før kodekene ble tatt i bruk, og det var ikke før i 2006 at Netcom implementerte AMR.

I dag blir rundt 97 prosent av alle samtaler satt opp med AMR. Alle samtaler på 3G bruker denne kodeken, og de aller fleste på GSM.

HD Voice

Den virkelig store revolusjonen vil bli HD Voice. Her vil talekvaliteten bli så høy at mange vil sammenlikne det med at du er i samme rom som samtalepartneren. I noen tilfeller blir den faktisk bedre fordi denne kodeken vil kunne fjerne en del bakgrunnsstøy også.

MYE BEDRE: Det er flere årsaker til at HD Voice, eller AMR WB som kodeken kalles på fagspråket, er mye bedre enn den smalbåndutgaven dagens mobiler bruker. For det første tas det dobbelt så mange prøver av den analoge lyden per tidsenhet slik at selve kodingen gjøres på basis av et bedre materiale. Dessuten er kodingen mye mer avansert og klarer å bevare et mye bredere frekvensområde uten at bitraten øker særlig. I tillegg skjer det ingen transkoding i nettet når to mobiler med HD Voice snakker sammen.
Navnet HD Voice er egentlig bare en mer sexy betegnelse på en ikke helt ny teknologi som er videreføringen av AMR. Den kalles AMR-WB (Wide Band) som indikerer at den håndterer mye større båndbredde. Derfor omtales dagens versjon som AMR-NB (Narrow Band).

Mens vi tidligere har nøyd oss med lyden innen 300 til 3400 Hz, utvides nå frekvensområdet til 50 til 7000 Hz. Forskjellen er dramatisk. En god demonstrasjon finnes på: http://www.youtube.com/watch?v=bwVPkt6vwEw.

Gammel teknologi

HD Voice er et godt eksempel på at ting tar tid. AMR-WB ble tatt inn som en standard i 3GPP for ti år siden. De første forsøkene i nettverkene ble gjort av T-mobile i 2006, mens Orange har ledet an i utrullingen i svært mange av sine nett. Både Netcom og Telenor sier at denne kodeken vil få støtte i mobilnettene, men ingen vil si når det kommer.

Dobbelt antall lydprøver

I dagens mobiler brukes en såkalt samplingsfrekvens på 8 kHz. Det vil si at det tas 8000 lydprøver i sekundet. Med HD Voice øker dette til 16 kHz. Algoritmen for talekoding er blitt bedre, men også mer regnekraftkrevende. Det betyr at det trengs kraftigere prosessering for å kode. Når den er kodet trengs det en bitrate på 12.65 kbit/s til overføring. Det er bare ørlite mer enn dagens AMR-NB. Hvis det oppstår situasjoner med mye bakgrunnsstøy, vil bitraten øke. Bitraten kan også falle ned til 8,85 eller 6,6 kbit/s hvis kapasitetshensyn krever det, men da vil talekvaliten gå litt ned.

Det er også definert inn høyere bitrater i flere trinn helt opp til 23,85 kbit/s som kan brukes når kodeken benyttes til å filtrere ut masse bakgrunnsstøy.

I dag skjer det en masse såkalt transkoding i mobilnettet. Det vil si at talen overføres fra et digitalt format til et annet. Når en samtale overføres i dag, blir den sendt fra mobilen over radionettet med en bitrate på 12,2 kbit/s. I basestasjonen blir den kodet om til standardformatet for samtaler som overføres i fastnettet på 64 kbit/s. Hvis det er mobiler i begge ender, kodes den tilbake til 12,2 kbit/s i basestasjonen samtalemottakeren er koblet.

Enhver transkoding representerer en kvalitetsreduksjon. Med HD Voice overføres bitstrømmen akkurat slik den forlater mobiltelefonen, og blir ikke transkodet hvis samtalen foregår mellom to telefoner som kan dekode AMR-WB. Hvis samtalen går til en eldre mobiltelefon eller en fasttelefon, blir den transkodet og tilpasset de to terminaltypene.

Kilder: Produktsjef for mobildata i Netcom, Roy Nilssen og teknologisjef i Ericsson, Stian Solberg.

Les også:

Her mottar Odd Richard et anrop under vann

Slik får du bedre mottak på hytta

Telenor spår bompenger på mobilnettet  

Bedre mobildekning på kontoret  

Slik lager smarttelefonene trøbbel i mobilnettet