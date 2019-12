Facebook avslørte under sitt Oculus-event i september at de jobber med å lage AR-briller (augmented reality), der virkeligheten blandes med digital informasjon. Slike briller finnes det flere av allerede, og er sånn sett ingen stor overraskelse eller revolusjon. Men de sa noe annet også:

Facebook vil lage Livemaps, en lagvis digital 3D-kopi av hele verden.

Det er flere selskaper og utviklingstrekk som går i samme retning, om enn ikke like uttalt som Facebook. Datamaskiner vil nemlig umiddelbart kunne forstå en digital kopi av virkeligheten, der hvert element har et navn og en funksjon. En kunstig intelligens som alltid vet hvor du er og hva du ser på, kan gi deg perfekt tilpasset informasjon til enhver tid. Hvis systemet forstår at du løper til bussen, kan den si hvor fort du må løpe for å rekke den - eller når neste buss går. Det kan alltid vise deg veien til neste avtale, eller forklare hva du ser på. Og det er bare den spede begynnelsen.

Mange bruksområder

Det er ikke bare Facebook som vil få bruk for en digital kopi av verden. Selvkjørende farkoster og roboter vil ha det samme behovet, i likhet med andre hjelpemidler som styres av en kunstig intelligens. Da er det ikke bare snakk om å gi tilpasset informasjon, men for den kunstige intelligensen å forstå situasjoner og ta riktige beslutninger. En selvkjørende bil vil for eksempel ha nytte av å forstå at et barn leker ved siden av veibanen, at personen med hvit stokk har redusert syn eller hva den midlertidige sperringen i veien betyr.

Facebook jobber med å rekonstruere punktskyer i 3D, basert på bilder brukerne laster opp. Foto: Facebook

Prinsippet med digitale kopier benyttes allerede i større byggeprosjekter, for eksempel oljerigger. Det nyetablerte Johan Sverdrup-anlegget står fysisk i Nordsjøen, men det finnes også en digital kopi i Equinors datasystemer. Dette ble benyttet i konstruksjonen av anlegget, men får også et liv etterpå til blant annet feilsøking og opplæring. Slike kopier er bygget manuelt helt fra bunnen av, med 3D-modeller som i sin tid dannet grunnlaget for konstruksjon og bygging.

For eksisterende bygg må dette gjøres i motsatt rekkefølge, slik at det lages en 3D-modell basert på et eksisterende bygg. Operaen i Oslo ble for eksempel bygget med tradisjonelle tegninger, men i etterkant digitalisert med laserscanner i en omfattende prosess.

Teknikkene brukes også i økende grad for å bevare kulturminner, slik man nå gjør med det nedlagte gruvesamfunnet Svea på Svalbard.

Gruvesamfunnet Svea på Svalbard er scannet for ettertiden. Her er et interaktivt utdrag fra modellen.

Millioner av sensorer

Digitale kopier lages altså hele tiden. Men hvordan kan dette skaleres til å omfatte bortimot hele den befolkede verden, med en digital kopi som alltid er noenlunde oppdatert?

Da trengs det langt flere sensorer, som vi i prinsippet har rundt oss hele tiden. Dette er noen av metodene som kan brukes for å lage digitale kopier av verden:

Selvkjørende biler. Disse trenger allerede avanserte sensorer for å danne seg et bilde av omgivelsene, og ved å dele denne informasjonen kan det lages digitale kopier. AR-briller. Briller for utvidet virkelighet (augmented reality) trenger et avansert kamerasystem og dybdesensorer for å identifisere omgivelsene slik at den digitale informasjonen kan tilpasses. Hvis folk går med slike briller overalt, vil enorme områder scannes og danne grunnlag for digitale kopier. Robotstøvsugere, robotplenklippere og andre roboter. Disse bruker ofte avansert laserteknologi for å forstå og navigere i området de skal være i. Dette er i prinsippet også en digital kopi. Vanlige bilder. Facebook jobber i flere prosjekter med å bruke kunstig intelligens til å lage 3D-modeller basert på vanlig 2D-bilder. Én innfallsvinkel er å bruke store mengder overlappende bilder til å lage såkalt fotogrammetri, der bildene samlet har nok informasjon om geometrien til å lage 3D-modeller. Mer avanserte systemer begynner nå å forstå geometrien i enkeltbilder. Videoer. Teknisk sett er video bare en strøm av enkeltbilder, som samlet vil kunne gi langt mer informasjon om et sted enn bare et enkelt bilde. Wifi-systemer, alarmsystemer og andre signaler. Også mer perifere signaler kan etter hvert utnyttes til å danne et bilde av steder, sammen med øvrige kilder.

Facebook-bilder blir 3D-modeller

Det er altså mulig å se for seg at Facebook lykkes med sitt mål om å lage en digital og oppdatert kopi av hele verden, gitt at de klarer å få tilgang til nok data. Det meste vil de faktisk være i stand til gjennom egne plattformer, ettersom bilder og informasjon deles over en lav sko hele tiden.

Disse teknologiene må for øvrig ikke sammenblandes med det som nå kalles 3D-bilder på Facebook, der enkeltbilder kobles til et dybdekart og får en "falsk" 3D-effekt. Det skapes en såkalt parallakseeffekt der de nærmeste objektene rører seg når du beveger på mobilen, men du kan ikke se bak dem som i virkeligheten.

TU fikk i 2018 demonstrert et konsept for å hente ut digitale punktskyer fra vanlige Facebook-bilder, som de kalte Pointclouds. Det ble presentert slik:

Det er rimelig å anta at Goggle og Apple er på noenlunde samme spor, med lignende teknologier. Alle disse aktørene har tilgang på store datamengder og brukermasser, som til sammen kan danne grunnlag for digitale kopier. Google har for eksempel samlet inn bilder og data i årevis fra sine Street View-biler.

Gjenkjenning

Hele poenget med å lage digitale kopier er å koble dem med nok informasjon til at datasystemer forstår hva de ser - såkalte semantiske data. Teknologien er allerede kommet langt når det gjelder bilder i 2D, der kunstig intelligens fra Facebook, Google og Apple langt på vei klarer å forstå innholdet i bildene som publiseres. Her læres den kunstige intelligensen opp gjennom å øve seg på enorme mengder bilder, slik at den etter hvert kan gjenkjenne hva den ser på. Allerede kan disse systemene gjenkjenne enkeltpersoner og gjenstander. I et tredimensjonalt rom er dette en langt mer komplisert prosess, men også her gjøres det stadige fremskritt.

Det er ikke nok at den kunstige intelligensen gjenkjenner objekter og levende vesener. Den bør etter hvert også forstå samspillet mellom objekter, intensjoner og følelser. Også her forskes det bredt, med spennende resultater.

Blinde og svaksynte vil kunne ha spesiell nytte av en teknologi som er intelligent nok til å forstå hva som skjer rundt deg til enhver tid. TU har nylig vist fram hvordan blant andre svaksynte kan bruke Orcam, et kamera som festes til brillene og fortelle hva den ser eller leser tekst du peker på.

Laserscanning

En av de mest avanserte metodene for å kopiere virkeligheten er bruk av laserscanning med LiDAR ("light radar")-teknologi. Prinsippet er likevel ganske enkelt: Man sender ut pulserende laserlys og måler tiden den bruker på å reflektere tilbake. Avstanden er lik lyshastigheten ganget med tiden, delt på to. Ved å pulsere tusenvis av ganger i sekundet kan man dermed bygge opp en digital punktsky, som igjen danner grunnlaget for 3D-modeller. Dersom laserscanneren er i bevegelse, for eksempel fra fly eller biler, trengs det ytterligere data om høyde, retning og posisjon for å nyttiggjøre seg informasjonen som samles inn.

Laserscannere har hittil vært en kostbar teknologi, men det kommer stadig billigere og mer portable løsningen. En av de siste tilskuddene er Leica BLK2Go, som er en fullstendig håndholdt laserscanner. Slik presenteres løsningen av Leica:

Fotogrammetri

Fotogrammetri er en teknikk som bruker en mengde vanlige fotografier fra ulike vinkler til å beregne geometrien i objektene som fotograferes. En kan for eksempel fotografere et enkeltobjekt fra alle kanter, og dermed få nok informasjon til å lage en 3D-modell ved hjelp av spesiell programvare. En kan også gjøre dette med store landskaper og i prinsippet hele verden, slik Facebook antyder i sitt Livemaps-prosjekt.

Landskapskart er et opplagt bruksområde for denne teknikken, der fly- og satelittbilder settes sammen i stor skala.

Det er mulig å bruke enkelt enkelt fotoutstyr til fotogrammetri, til og med mobiltelefoner. For høyest mulig kvalitet ønsker man som regel størst mulig dybdeskarphet, høy oppløsning og mange bilder fra ulike vinkler. Dermed vil det som også kreves stor datakraft for å beregne de ferdige modellene.

Fortsatt er ikke fotogrammetri like nøyaktig som laserscanning, men vil som regel framstå med større fotorealisme. Det kan derfor være hensiktsmessig å bruke begge teknikkene samtidig, for å få nøyaktigheten til laserscanningen kombinert med realismen fra fotogrammetrien.

Neste generasjon AR

Når den neste generasjonen AR-briller kommer for forbrukermarkedet, kan vi forvente svært avanserte kamerasystemer og avstandsmålere integrert i brillene. Disse vil ventelig sende store mengder data til "moderskipet", enten det er Facebook, Google, Apple eller andre aktører. Her vil alt analyseres i sanntid, og antakelig også lagres og deles på måter vi ikke har oversikt over i dag.

Personvernet vil med andre ord bli utfordret det neste tiåret også.