"The Document Company". Xerox har laget seg et talende slagord som også dekker digitale dokumenter. Ved forskningssenteret i Grenoble, Frankrike, har det amerikanske selskapet kommet fram til et nytt verktøy for gjenfinning av informasjon i dokumenter. (Bilde: Dag Yngve Dahle)
Frederique Segond, leder for semantikk og syntaktisk analyse ved Xerox Research Center Europe. (Bilde: Dag Yngve Dahle)

Tekstkikkert slår ut Google

  • datatele

GRENOBLE: Selskapet lanserte nyheten FactSpotter under et presseseminar ved Xerox' europeiske forskningssenter i Grenoble i Frankrike onsdag.

Budskapet var tydelig:

Presist

- Dette er fremtidens søke- og analyseverktøy for elektronisk tekst på Internett og andre steder. Det gir mye bedre resultater enn for eksempel Google. I Google kan du taste inn ulike nøkkelord uten å finne det du er på jakt etter, sier Frederique Segond, leder for semantikk og syntaktisk analyse ved Xerox Research Center Europe.

Google leverer ofte et virvar av ikke-relevant treff i form av sider som inneholder ordet eller ordene du søkte etter. FactSpotter er mer presis og leverer kun de delene av teksten som er relevante i forholdet til søket, ifølge Segond.

Hun viser til følgende eksempel: Hvis du spør stiller Google et direkte spørsmål om hvem som er toppsjef i Shell, får du et virvar av treff som ikke har noe med saken å gjøre. Xerox' nye verktøy gir svaret: Jeroen van der Veer.

Ikke enkelt

Ifølge Xerox er FactSpotter også et sjumilssteg fremover i forhold til eksisterende tekstanalyse og -gjenkjenningsprogrammer, som ofte gir varierende resultater.

- Våre lingvister og programmere har jobbet i flere år med programmet. Det analyserer meningen med ord og tolker oppbyggingen av setninger og sitater. Det som gjør vår teknologi treffsikker er at den lenker ord og uttrykk sammen i stedet for kun å søke etter enkeltord, sier Segond.

Hvor godt det egentlig fungerer? Teknisk Ukeblad har ikke testet programmet, så det gjenstår å se. Xerox nekter ikke for at utfordringene er mange.

- Ord med flere betydninger, sammensatte ord og svært kompliserte setninger gjør at det å konstruere et slikt program er vanskelig. Men nå har vi lykkes med å skape et verktøy er bedre enn alle liknende verktøy på markedet, sier Segond.

Marked

Programmet vil komme i versjoner for engelsk, fransk, spansk, italiensk, portugisisk, japansk, arabisk og flere andre språk. Det at disse språkene har ulik syntaks er en annen utfordring.

- Vi vil fremover jobbe med å finjustere programmet, som antagelig kommer på markedet innen et år, sier Segond.

Selskapet vil markedsføre løsningen mot business-to-business-markedet, og selge det som en del av komplette businessløsninger til bedrifter og organisasjoner.

- I løpet av svært kort tid finner FactSpotter informasjon som andre verktøy ikke finner. Det vil være av interesse for rettsystemet, forsikringsselskaper, finansinstitusjoner, store bedrifter og offentlige instanser, sier Monica Beltrametti, visepresident ved Xerox' forskningssenter i Grenoble.