IT

– Talegjenkjenning kan redde det norske digitalspråket

Digital utryddelse: Kolbjørn Heggstad, tidligere fagansvarlig og utviklingssjef ved Norsk Språk­teknologi på Voss, frykter løpet er kjørt for norsk som digitalspråk. Bildet ble tatt i 2001, før den storstilte språkteknologisatsingen på Voss gikk konkurs. Heggstad er i dag pensjonert.   FOTO: Odd Mehus/Aftenposten
Digital utryddelse: Kolbjørn Heggstad, tidligere fagansvarlig og utviklingssjef ved Norsk Språk­teknologi på Voss, frykter løpet er kjørt for norsk som digitalspråk. Bildet ble tatt i 2001, før den storstilte språkteknologisatsingen på Voss gikk konkurs. Heggstad er i dag pensjonert. FOTO: Odd Mehus/Aftenposten

Språkdød har skjedd før

  • Språkdød har rammet Europa tidligere, ifølge rapporten.
  • Da trykketeknologien bidro til å øke informasjonsspredningen på kontinentet førte den også til språkdød, fordi regionale språk og minoritetsspråk sjelden ble trykket.
  • «Språk som kornisk og dalmatisk forble begrenset til muntlig overføring, noe som i sin tur begrenset bruksområdene. Vil internett ha samme virkning på språkene våre?» spørres det i rapporten gjengitt i Meta-Nets hvitebokserie.
  • Spansk og engelsk vil sannsynlig overleve i det nye digitale markedet. Men studien sier at mindre europeiske språk risikerer å bli irrelevante i et nettverksbasert samfunn.

 

De fleste europeiske språk, inkludert norsk, står i fare for å lide en digital død, ifølge en europeisk rapport utarbeidet av Meta-Net, ved hjelp av mer enn 200 eksperter på språkteknologi.

Ekspertene, deriblant et norsk ekspertpanel, gjorde opp status for 30 av Europas 80 språk i årene 2010–2012.

Den 30 bind store språkrapporten konkluderer med at den digitale støtten for 21 av språkene er «ikke-eksisterende» eller i beste fall svak. I denne gruppen havnet også det norske språket.

Les også: Avhengige av talegjenkjenning for å jobbe

Engelsk

– Norsk som dagligspråk står ikke i umiddelbar fare, men som digitalt språk står det norske språket i fare for å bli utryddet, sier medforfatter og datalingvist Gunn Inger Lyse ved Universitetet i Bergen.

Engelsk dominerer som bruksspråk i digitale brukergrensesnitt.

I praksis handler det om manglende gode verktøy for maskinoversettelse til og fra norsk, selv om teknologien finnes for større språk som engelsk. Dette påvirker kvaliteten på blant annet stavekontroll, gramatikkkontroll og interaktive personlige assistenter på smarttelefoner, som Iphones Siri og tale-til-tekst i GPS-systemer som brukes i biler.

– Vi kan ikke velge norsk språk fritt i digitale applikasjoner, slik som engelskmenn tar for gitt å kunne velge engelsk. Det skjer bare unntaksvis, og ofte er kvaliteten på de norske grensesnittene så dårlig at man velger engelsk likevel, sier Lyse Samdal.

Les også: Siri fikser ikke ingeniørenes spørsmål

Ikke lønnsomt

Det lønner seg å bygge ut språkteknologisk infrastruktur på engelsk, fordi millioner av mennesker snakker språket. Å utvikle produkter på mindre språk, som norsk, blir mindre lønnsomt, og disse blir derfor ikke prioritert.

– Vi så på taleteknologi, tekstanalyse og basisressurser, altså det vi trenger for å lage taleteknologisystemer. I alle kategorier står norsk i faresonen for å falle utenfor i den teknologiske utviklingen, sier Lyse, som var i kontakt med viktige aktører innen norsk språkteknologi i forbindelse med studien.

Kolbjørn Heggstad, nestor i datalingvistikk og tidligere fagsjef og utviklingsdirektør i den storstilte satsingen Norsk språkteknologi på Voss, mener situasjonen til det norske digitalspråket vil prege framtiden for hele det norske språket.

Les også: Språkteknologi kan spare to milliarder trygdekroner

Språkstrid

– Vi er inne i en verdensomspennende språkstrid. Hvis vi ser veldig langt framover, kan løpet dessverre være kjørt for småspråkene. Men det går an å bremse utviklingen, sier Kolbjørn Heggstad til Teknisk Ukeblad.

Amerikanske Nuance, et av verdens ledende selskaper på taleteknologi, har sagt seg villig til å lage en skandinavisk utgave av talegjenkjenningsprogrammet Dragon naturally speaking (DNS). Nav vil gjerne tilby programmet til sykmeldte, uføre og dyslektikere, men Arbeidsdepartementet avviste å dekke utviklingskostnadene på 13 millioner.

Etter Teknisk Ukeblads fokus på problemet, vurderer departementet nå saken på nytt.

Heggstad mener en norsk utgave av DNS kan bety et være eller ikke være for det norske digitale språket.

– Nuance kan være vår siste sjanse. I dag går utviklingen så fort. Dette er en strid som Norge må føre inn under kampen for å overleve som nasjonalspråk. Det dreier seg ikke bare om at funksjonshemmede skal kunne kommunisere digitalt, det er snakk om hele Norges situasjon som et språk i verden, sier Heggstad til Teknisk Ukeblad.

Les også: Dette endrer hele IT-landskapet

Nordiske stemmeprøver

Norsk språkteknologi AS samlet inn tusenvis av stemmeprøver på norske, svenske og danske dialekter gjennom satsingen på Voss rundt årtusen­skiftet.

Som Teknisk Ukeblad tidligere har fortalt, kan det innsamlede språkmaterialet brukes som talemotor i en nordisk utgave av DNS.

– Tenk om vi kunne bruke arkivet fra Voss og at norsk kunne bli et digitalt språk på linje med de store språkene. Da kunne vi puste lettet ut og si at vi er med. I dag er ikke Norge med, sier Heggstad til Teknisk Ukeblad.

Les også: Skal gjenkjenne alle språk

Les mer om: