Unik innhenting av forskningsdata

100.000 dansker skal samle inn lyden av Danmark

Forskningsprosjekt ber dansker om hjelp til å lage et helt nytt lydkart over Danmark.

Slik ser de første konturene av et lydkart over Danmark ut. Ambisjonen er mer enn 100.000 lydopptak fra hele landet. 
Slik ser de første konturene av et lydkart over Danmark ut. Ambisjonen er mer enn 100.000 lydopptak fra hele landet.  (Illustrasjon: Lyden af Danmark)

Forskningsprosjekt ber dansker om hjelp til å lage et helt nytt lydkart over Danmark.

  • Klima

Hele den danske befolkningen skal settes i arbeid for å hjelpe forskerne når det store forskningsprosjektet Lyden af Danmark settes i gang den 24. april.

Ved hjelp av mobiltelefoner skal danskene ta opp lyder når de ferdes utendørs. Det kan være på vei til jobb, i skolegården, på skogstur eller et helt annet sted. Det er første gang noensinne at lydene for et helt land kartlegges.

– Vi vet helt grunnleggende ikke hvilke lyder som omgir oss. Vi vet ikke hvordan natur- og menneskeskapte lyder er fordelt i Danmark, og vi har ingen forståelse av hvordan lydene påvirker oss. Det har vi behov for at Danmarks befolkning hjelper oss med å avsløre. Det er enkelt å delta – det krever bare en mobiltelefon og 30 sekunder av tiden din. Det er morsomt, og i tillegg har det stor betydning når vi skal ta stilling til hva slags lydmiljø vi ønsker oss i fremtiden, sier leder av forskningsprosjektet, Professor Carsten Rahbek fra Center for Makroøkologi ved Københavns Universitet.

Prosjektet er unikt på verdensplan, siden Danmark vil bli verdens første land med et nasjonalt lydkart. Målet med prosjektet er å innhente data til et bredt spekter av forskningsområder innen både natur, helse og miljøøkonomi. I tillegg til forskning er den kommende lyddatabasen også interessant for den danske lydbransjen, for eksempel høreapparatindustrien.

Lyden af Danmark er utviklet av Center for Makroøkologi, Evolution og Klimaet, Grundforskningscenter på Københavns Universitet i samarbeid med Institut for Matematik og Computer Science (DTU), SDU og Uddannelses- og Forskningsministeriet.

Lyd blir ofte glemt

De siste tiårene har man begynt å snakke om en ny tidsalder i jordklodens historie: Antropocen. Men siden lyder er flyktige, har ikke lyd spilt noen stor rolle i de faglige debattene om hva som definerer og preger den antropocene tidsalder. Samtidig har utviklingen i lydlandskapene avspeilet mange av de prosessene og utviklingene som definerer Antropocen.

Mennesker har for eksempel satt lydspor ved skogrydding og jordbruk, og da byene ble bygd kom lyden av håndverk, kommunikasjon og industri.

Derfor er det mye som tyder på at naturens lyder har blitt trengt i fortrengte. For de artene som kommuniserer eller holder øye med rovdyr ved hjelp av hørelsen, er menneskelyder et stort problem som kan være med på å avgjøre utbredelsen og overlevelsen deres.

Kunstig intelligens skal kjøres i gang

Lydene som danskene tar opp, samles i en database hvor programvare sorterer alle lyddata.

Programvaren vil analysere lydene og med tiden lære seg å skille mellom natur- og menneskeskapte lyder.

– Nettverket er implementert i Python med bruk av TensorFlow-frameworket fra Google. Det er basert på en jobb som er foretatt av en gruppe fra Google. De har tatt en VGG-modell, som egentlig er konstruert for bildegjenkjenning, og tilpasset den til å se på spektrogrammer av lyder i stedet for, og på den måten få den til å klassifisere lyder, forteller spesialkonsulent Martin Ordell Sørensen hos DTU Compute, som står for dataanalysen av de mange lydopptakene.

Det krever en del jobb å håndtere opptakene fra kommersielle smarttelefoner.

– Nettverket er for tiden trent på litt mer «rene» opptak, men når man går over til en telefon, finnes det noen nye støykilder som man må håndtere. Det er blant annet vindstøy, som er en ganske dominerende støykilde på veldig mange utendørsopptak. Avhengig av telefonmodell/nettleser, vil kvaliteten av opptaket også variere. Der kan være forskjeller i maskinvaren, siden noen telefoner har flere mikrofoner som blant annet blir brukt til støyreduksjon. I tillegg kan det være algoritmer som AGC (automatic gain control), som også går inn og påvirker resultatet. Til slutt kan nettleseren komprimere lyden og redusere bitraten med for eksempel OPUS- eller AAC-formatene, og det ser vi også påvirker gjenkjennelsen, sier Martin Ordell Sørensen.

Men programvaren er likevel ikke mer intelligent enn at den gjerne vil ha en hjelpende hånd fra de menneskene som har tatt opp lyden, særlig til å begynne med når datamengdene er små.

Deltakerne skal også være med på å utvikle de algoritmene som kan merke forskjell og sortere lydene.

– Vi satser på å få 30 sekunders opptak fra opptil 100.000 dansker. I starten er den kunstige intelligensen stokk dum, og derfor ber vi samtidig innbyggerne om å hjelpe til med å beskrive hva det faktisk er man kan høre på lydopptakene deres, sier Carsten Rahbek.

Carsten Rahbek håper at blant annet folkeskoleelever vil bidra til innsamlingen av lydbiter fra Danmark.

Når man ber vanlige mennesker om å bidra med forskningsdata tatt opp på vanlige smarttelefoner, vil det oppstå feil og unøyaktigheter.

– I gamle dager satset man på å optimere kvaliteten til det enkelte datapunktet, men når vi jobber med de store linjene, kan vi ikke forlange perfekte data, for det er alle mulige slags lydkilder som påvirker omgivelsene. Med store datasett vil vi kunne sortere bort de feilene som unektelig vil oppstå. En del av min egen forskning handler om hvordan man kan få god informasjon ut av skitne data, forteller Carsten Rahbek.

Brukes til høreapparater

Det er for eksempel skitne data når 10 innbyggere tar opp en fuglelyd og ni opplyser om at det er snakk om fuglesang, mens den siste sier at det er en gravemaskin. Her vil algoritmene kunne trenes opp til å skille mellom hva som er riktig, og hva som er en feilaktig angivelse.

Siden lydene også blir kartlagt geografisk, kan opptakenes posisjon også brukes til å finne feil. Slik at man kan avsløre feilen hvis en innbygger opplyser om at det er lyden av landbruksmaskiner, mens opptaket stammer fra sentrum av København. Ifølge Carsten Rahbek blir kvaliteten av prosjektet bare bedre av at det er stor geografisk spredning i de innsamlede dataene, og av at det blir samlet inn veldig mye lyddata.

– Akkurat nå fokuserer vi på de opptakene som mennesker kan høre og oppfatte. Men vi får en enorm infrastrukturdatabase som er unik i hele verden. Alle andre lyddatabaser er laget ett sted på ett tidspunkt, mens vi her får en geografisk og tidsmessig variasjon som ikke eksisterer i dag. På sikt håper vi at for eksempel høreapparatprodusenter kan utnytte lyddatabasen til å filtrere bort de unødvendige lydene, og fokusere på de lydene som er viktige for høreapparatbrukere, sier Carsten Rahbek.

På lang sikt vil lyddata danne grunnlag for forskjellige forskningsprosjekter om lyd. For eksempel menneskets innflytelse på lydbildet i danske landskap og miljøer, effekter på naturen og helseeffekter.

Kartlegger fiskebestander

Lyden af Danmark er et nasjonalt citizen science-prosjekt, bedre kjent på norsk som borgervitenskap. Det er et begrep som brukes når mennesker som ikke nødvendigvis har en vitenskapelig utdannelse, er med i forskningsprosjekter, for eksempel ved innsamling og bearbeiding av data.

I Danmark finnes det flere lignende citizen science-prosjekter, blant annet DTU’s Fangstjournal, hvor sportsfiskere enkelt kan registrere hva de fanger, eller ikke fanger, på en fisketur. Disse opplysningene kan forskere fra DTU Aqua bruke når de skal kartlegge fiskebestandene i danske farvann. I dag har fangstjournalen tett oppunder 10.000 brukere.

Engelske klimaforskere har nettopp bedt private om hjelp til å digitalisere millioner av historiske værdata om temperatur og lufttrykk. Målet er bedre å kunne forutsi klimaendringer.

Prosjektet, som går under navnet Operation Weather Rescue ble valgt ut som citizen science-prosjekt under British Science Week 2019 i mars i år.

Denne artikkelen ble først publisert på ing.dk.

Kommentarer (1)

Kommentarer (1)

Eksklusivt for digitale abonnenter

På forsiden nå