IT

Programvaren skulle få tusenvis ut i jobb. Nå frykter brukerne at teknologien blir for dårlig

Brukere frykter norskutviklet taleprogram blir for dårlig.

Superbrukere av amerikansk talegjenkjenning frykter at 
ny programvare for talegjenkjenning på norsk blir for dårlig til at funksjonshemmede kan bruke den i jobb.
Superbrukere av amerikansk talegjenkjenning frykter at ny programvare for talegjenkjenning på norsk blir for dårlig til at funksjonshemmede kan bruke den i jobb. Bilde: Eirik Helland Urke
28. okt. 2015 - 09:36
Vis mer

– Teknologien ligger der. Jeg bruker talegjenkjenning hver dag på Iphone og Ipad, men nå skal norske Max Manus i løpet av kort tid matche det produktet Nuance leverer? Jeg fatter ikke at de må finne opp hjulet på nytt.

Britt Ormaasen er avhengig av å få skrivehjelp på norsk, og er en av mange som reagerer kraftig på Arbeids- og sosialdepartementets beslutning om å ikke velge den amerikanske taleteknologi-giganten Nuance til å lage en norsk oversettelse av talegjenkjenningsprogrammet Dragon naturally speaking.

I stedet valgte departementet norske Max Manus, som nå får 12,7 millioner kroner til å utvikle norsk programvare nærmest fra bunn.

Leverer til leger

Programmet som nå skal utvikles er langt mer avansert enn Siri-funksjonen på Iphone, og vil gjøre folk som ikke kan bruke tastatur og mus i stand til å skrive og styre pc'n håndfritt, kun gjennom norsk tale.

Max Manus leverer i dag talegjenkjenning til leger og andre grupper i helsevesenet, og må gjøre en betydelig jobb for å lage et produkt som kan brukes til norsk dagligtale, og ikke bare fagspråk.

Nuance står på sin side bak språkteknologien Siri, og har i tillegg solgt programvaren Dragon naturally speaking til tusenvis av brukere verden over siden 1997, på flere ulike språk. Men ikke norsk.

– Nøyaktighet tar tid

I 2012 var Ormaasen forfatter av en NAV-rapport som konkluderte med at det amerikanske programmet kan gjøre tusener av mennesker med dysleksi, svaksynthet, musearm eller andre funksjonshemminger i stand til å bruke pc, og unngå å falle utenfor arbeidslivet.

Mosken Bergh. Foto: Eirik Helland Urke
.Å få som ligner produktet til Nuance på norsk, vil ta mange, mange år, advarer Mosken Bergh. Foto: Eirik Helland Urke Eirik Helland Urke

– Vi snakker om programvare som skal gjøre det mulig for folk å fortsette å jobbe. Det vil ta tid å utvikle noe som vil være 100 prosent nøyaktig. Årsaken til Nuance-suksessen er at de har forbedret programmene hvert år de siste tiårene. Å få til noe som ligner på norsk, bygget fra bunn, vil selvsagt ikke være 99 prosent nøyaktig på mange, mange år, sier den uføre juristen Mosken Bergh, og en av "superbrukerne" som testet det det amerikanske programmet for Nav.

Arbeids- og sosialdepartementet vil ikke utdype hvorfor de valgte bort Nuance, men sier i en generell uttalelse at beslutningen ble tatt etter en totalvurdering av de ulike søknadene. Selskapene som leverte søknad kan anke avgjørelsen til 5. november.

"Vurderingen er basert på kriteriene som ble oppgitt i utlysningen av tilskuddet. Det er lagt vekt på kvalitet på tilbudt løsning, kompetanse og erfaring med liknende oppdrag, gjennomføringsevne, samt hvor raskt den tilbudte løsningen vil kunne ferdigstilles." skriver departementet i en epost til Teknisk Ukeblad.

– Nordmenn har prøvd å få til talegjenkjenning i 15 år uten å få det til, så jeg skjønner ikke hvordan Max Manus plutselig skal ta dette kvantespranget, kommenterer Ormåsen, og viser til den store innsatsen som ble lagt ned for å utvikle avansert taleteknologi i regi av nedlagte Nordisk Språkteknologi på Voss.

"Nuance er best"

For 2,5 år siden sa Kollbjørn Heggestad, datalingvist og tid­ligere utviklingssjef i Norsk språkteknologi på Voss at Nuance-miljøet er det eneste i verden å satse på, dersom man skal få talegjenkjenning på norsk innen rimelig tid.

– Tusener kan stå i jobb: Britt Ormåsen skrev rapport om bruk av talegjenkjenning i arbeidslivet for Nav i 2012. Hun venter fortsatt på en norskspråklig utgave. Foto: Eirik Helland Urke
Også Torbjørn Svendsen, professor i taleteknologi ved NTNU, mente at Dragon naturally speaking var det desidert beste talegjenkjenningsproduktet på markedet.

I etterkant ble Svendsen hentet inn til en arbeidsgruppe som lagde kravspesifikasjoner til den kommende leverandøren av tale-programvaren. Han er også kontaktet av Max Manus, og skal sammen med taleteknologi-miljøet ved NTNU samarbeide om å utvikle den norske programvaren.

Men hva mener professoren i dag?

– Nuance har en god "track record" med å lage talegjenkjenningssystemer for en rekke språk. Det har ikke Max Manus. Jeg har ikke sett anbudene, og kan derfor ikke sammenligne, men jeg ville i utgangspunktet ansett Nuance som favoritt til å få dette støttetilsagnet, sier Svendsen.

– Kan Max Manus lage like god programvare som Nuance?

– Det er vanskelig å spekulere. Det er klart, har du mange års erfaring, har du i utgangspunktet bedre forutsetninger. Men jeg håper at Max Manus klarer å levere et knallgodt tilbud til det norske markedet, sier Svendsen til Teknisk Ukeblad.

Kom ikke til finalen

Departementet vil ikke begrunne valget av Max Manus, men et dokument Teknisk Ukeblad har fått tilgang til viser at Nuance ikke engang var med i finalerunden.

– Er det noe i kravspesifikasjonene som tilsier at Nuance ikke skulle kunne få støtte fra departementet?

– Det er et krav om at tredjepartsutviklere skal få tilgang til selve motoren i talegjenkjenningsystemet som skal utvikles, slik at andre kan lage nye applikasjoner som benytter norsk talegjenkjenning. Det er ikke sikkert alle er glade for at det åpnes for konkurranse. Det blir spekulasjoner, men kravspesifikasjonen inneholder helt klart ting som går utover det rent tekniske.

– Er kravspesifikasjonene utformet på en måte som gjør at Nuance umulig kunne akseptere kravene?

– Det tror jeg ikke. Da vi lagde kravspesifikasjonene var vi oppmerksomme på at Nuance var en sannsynlig tilbyder, og var bevisst på å ikke lage krav som ville utestenge sterke kandidater. Samtidig som vi ville ha et best mulig produkt som sikret norske skattebetalere det de betaler for, sier Svendsen.

– Det tror jeg ikke. Da vi lagde kravspesifikasjonene var vi oppmerksomme på at Nuance var en sannsynlig tilbyder, og var bevisst på å ikke lage krav som ville utestenge sterke kandidater. Samtidig som vi ville ha et best mulig produkt som sikret norske skattebetalere det de betaler for, sier Svendsen.JOBBER UTEN TASTATUR OG MUS: Medin fullførte doktorgrad og fikk fast forskerjobb i Nupi takket være programvare for talegjenkjenning fra amerikanske Nuance. – Hvis du hele tiden skal gå tilbake og rette, blir det veldig tidkrevende, sier hun. Foto: Eirik Helland Urke

Den norske syke

Spesialrådgiver Per Morten Hoff i IKT Norge er glad for at språkarven fra Voss nå endelig ser ut til å bli tatt i bruk.

Over 6000 stemmeprøver fra over 3000 personer, på ulike dialekter, ligger og venter på å bli tatt i bruk etter den havarerte språkteknologi-satsingen. Prøvene ligger i Språkbanken i Nasjonalbiblioteket, til fri benyttelse.

Men Hoff er ikke veldig overrasket over departementets valg.

– Dette er den norske syke, vi skal helst finne opp hjulet på nytt. I offentlig sektor vil man gjerne utvikle alt fra bunnen av. Max Manus har et langt mer begrenset språkbibliotek, det kan være de får problemer. Men selskapet har også vist at de greier å levere i helsesektoren, der har de et godt omdømme, sier Hoff til Teknisk Ukeblad, som presiserer at han ikke kjenner til hvordan saksbehandlingen har foregått.

Max Manus selv sier de er overbevist om at de vil kunne levere et minst like godt produkt som Nuance og de andre aktørene som deltok i konkurransen - innenfor rammene som er satt av Arbeids- og sosialdepartementet.

Må rette 1-3 prosent

Ifølge daglig leder Martin Elster må brukere av Max Manus' programvare i helsevesenet rette tre prosent av tegnene i ordene de snakker inn. Selskapet antar det samme vil gjelde for det nye dagligtale-programmet.

– For dedikerte og høyt motiverte brukere i helsevesenet, ser vi ofte feilrate ned mot én prosent i snitt. I dagligvare-produktet vil hver bruker ha sin individuelle profil som kan trenes gjennom bruk. Denne forbedres gjennom at både språkmodeller og akustiske modeller tilpasses den individuelle bruker, sier Elster.

Siste versjon av Dragon naturally speaking skal ha en nøyaktighet på inntil 99 prosent, ifølge Bengt-Jarle Kjellså i Infoshare, som har agenturet på taleteknologiproduktene til Nuance i Norge.

– Tallet gjenspeiler at Nuance har jobbet en mannsalder med å få feilmarginene ned, sier Kjellså.

Ingen selvfølge

Taleteknologiproduktene til Max Manus brukes allerede av tusenvis av leger, påpeker Elster. Han mener det ikke er en selvfølge at Nuance, eller andre, vil levere et like godt talegjenkjenningspogram på norsk som på engelsk.

– Selv om man har et veldig godt produkt på engelsk er det ingen automatikk i at det blir et like godt produkt på norsk. Hvor godt et produkt for et enkelt språk blir handler om hvor mye tekst- og lydmateriale man har til å starte med, hvor godt man lager språkmodellene, og hvor gode folk man setter på oppgaven, sier Elster.

Max Manus investerer i tillegg rundt 8 millioner kroner av egne midler for å utvikle ny programvare for dagligtale. Motivasjonen for å lage et godt og effektivt sluttprodukt er dermed stor, påpeker han.

– Det er ikke til å legge skjul på at det er en stor oppgave som står foran oss. Hovedoppgaven i dette arbeidet er å bygge opp statistiske og akustiske modeller som sikrer god gjenkjenning, og dette må gjøres per språk, uavhengig av hva man har gjort på andre språk, utdyper han.

Leverte doktorgrad med "dragen"

Hege Medin fikk smerter i armer og nakke og ble sykmeldt på midten av 2000-tallet. I 2013 klarte hun å levere doktorgrad takket være Dragon naturally speaking, etter å ha vært ute av arbeidslivet i flere år.

Nå har hun fått fast jobb som forsker i Norsk utenrikspolitisk institutt (Nupi). Der bruker hun stort sett engelsk som arbeidsspråk.

Jeg hadde aldri greid å få fast jobb uten "Dragon". Du er avhengig av høy treffprosent for å kunne jobbe effektivt. Hvis du hele tiden skal gå tilbake og rette, blir det veldig tidkrevende, sier Medin, som i flere år har jobbet for å få talegjenkjenning på norsk.

I dårlige perioder kommer en assistent betalt av Nav og hjelper Medin med å skrive dokumenter som skrives på norsk.

Medin og andre brukere reagerer på det de mener har vært er unødvendig lukket prosess i Arbeids- og sosialdepartementet, og lurer på hva slags brukere de har lyttet til i arbeidet med å velge aktør.

"Ikke involvert"

Jeg synes det er hårreisende at vi som brukere ikke har vært involvert i prosessen. Vi har gjentatte ganger skrevet til departementet, vi har bedt om å få snakke med gruppen som utredet dette, uten å bli hørt, sier Medin. Brukerne vil nå avkreve svar fra departementet om hvilke brukere de involverte i prosessen.

Departementet viser til at saken dreier seg om å gi støtte til å utvikle et produkt, og at søkerne i prosessen må utdype forretningshemmeligheter. Derfor mener de vurderingene har vært lite egnet for å diskutere med ulike brukergrupper.

Utlysningsdokumentet der de ulike kravene til et framtidig produkt framgår er offentlig og har også vært sendt ut til de som har bedt om det. Vi har ikke mottatt tilbakemelding om at det er ytterligere forhold som burde vært tatt inn i kravspesifikasjonen, skriver departementet i en epost.

Nuance har foreløpig ikke svart Teknisk Ukeblad på om de kommer til å anke vedtaket, eller svart på andre spørsmål Teknisk Ukeblad har stilt. Deltagerne i konkurransen kan anke departementets avgjørelse til 5. november.

Del
Kommentarer:
Du kan kommentere under fullt navn eller med kallenavn. Bruk BankID for automatisk oppretting av brukerkonto.