Nasjonalbiblioteket: Kunstig intelligens gir nye muligheter
En omfattende samling gir Nasjonalbiblioteket en helt spesiell mulighet til å eksperimentere med og ta i bruk kunstig intelligens.
– Jeg tør si at som fagmiljø innenfor vår kontekst, det vil si arkiv, bibliotek og museum, er vi i fremste rekke både i volum, kvalitet og resultat. Det tør jeg å stille meg på en stol og rope ut, sier Svein Arne Brygfjeld.
Han er leder for AI-laben på Nasjonalbiblioteket, som har fire ansatte og tidvis også gjesteforskere. AI-laben ble etablert da Nasjonalbiblioteket for noen år siden så at utviklingen innenfor kunstig intelligens kunne være relevant for dem. De har også tatt en lederrolle i det internasjonale kunstig intelligens-nettverket AI4lam sammen med amerikanske Stanford Libraries. Laben jobber eksperimentelt og forskningsbasert, og alle resultatene deles ut fritt tilgjengelig.
– Vi har som formål å lage ny kunnskap og belyse relevante områder samt bidra med kunnskap til både egen og andre organisasjoner for at vi skal kunne føre en fornuftig samtale om kunstig intelligens innenfor vår kontekst, sier Brygfjeld.
Kunstig intelligens omfavner et bredt felt, men på Nasjonalbiblioteket har de konsentrert seg om underkategorien maskinlæring. Det er to ting som kreves når man skal jobbe med maskinlæring: Teknologi, altså programvare, og innhold i form av data. Programvaren får de gratis fra aktører som Google. Dataene sitter de på selv, eller hentes fra åpne kilder på Internett.
– Vi ser at det er en del ting vi kan gjøre innenfor rammen av vår lab som veldig få har muligheten til. Vi har en uvanlig stor og variert digital samling. Vi har tekst og lyd, fotografi og levende film, alt i digital form og store mengder. Det er en fantastisk plattform å stå på, når en skal jobbe med maskinlæring.
Nye måter å beskrive
De jobber med kunstig intelligens for å forbedre arbeidsflyten internt, men også med sikte på å tilby bedre tjenester til brukerne. Nasjonalbiblioteket har for eksempel en stor samling med fotografier som skal beskrives, og de er allerede der at kunstig intelligens gjør denne jobben like bra eller bedre enn mennesker innenfor dagens standarder. Så eksperimenterer de med nye måter å beskrive bilder, tekst og bøker på. Et eksempel er bruk av vektorer, som gjør at kunstig intelligens kan finne fotografier og tekster som ligner på hverandre. Der man kan benytte tre vektorer, høyde, lengde og bredde til å beskrive et tredimensjonalt rom, kan et fotografi typisk beskrives med noen tusen slike tall.
– Da kan du regne ut avstanden mellom dem akkurat som du gjør det i et tredimensjonalt rom. Så er teorien at hvis avstanden er kort, så ligner bildene på hverandre.
De har utviklet en eksperimentell tjeneste som tar i bruk denne teknologien, som heter Maken. Der kan man velge for eksempel en bok, og så vil kunstig intelligens komme med forslag til lignende bøker. En fordel med denne teknologien kontra tagging med metadata, mener han, er at man ikke trenger arbeidskraft for å gjøre det. I tillegg sikrer man at innholdet kan gjenfinnes også når nye ting oppstår.
– En stund nå har vi ikke hatt muligheten til å tagge all informasjon med Covid-19. Og det oppstår stadig nye ting, som krigen i Ukraina. Det er klart at du ikke kan retrospektivt gå igjennom alt vi har av innhold og tagge materialet. Det er rett og slett for arbeidskrevende. Til det trenger vi andre metoder, ogher er en metode. Den gir andre muligheter til brukeren for å navigere i store mengder med informasjon.
Forenkler og støtter
Et annet eksempel hvor kunstig intelligens utvikles for å gjøre arbeidet for de ansatte enklere, er med den samiske bibliografien.
– Vi har et kontor som katalogiserer og gjør en vurdering av det som publiseres av bøker og tidsskrift for å se om det er ting som er relevant for den samiske kulturen, det samiske folket og samisk historie. De sitter og blar gjennom materialet og vurderer og leser. Og der har vi trent en modell til å gjøre den samme vurderingen.
Det betyr at den kunstige intelligensen leser gjennom materialet og gjør grovarbeidet.
– De som sitter og gjør det faktiske arbeidet, den endelige vurderingen, får forslag til kandidater til den samiske bibliografien. I stedet for at de har en vogn full av bøker, får de en ordnet eller prioritert liste på skjermen sin, slik at de kan gå inn i vårt digitale bibliotek og se om det er så relevant som vår modell påstår at det er.
Brygfjeld forteller at det er vanskelig å måle om den gjør jobben like bra eller bedre enn mennesker, men at de har konkludert med at det er godt nok.
For tiden jobber AI-laben mye med tale til tekst. Det innebærer blant annet å transkribere flere hundre tusen timer med radio. Det gjør det mulig blant annet å søke i et radioarkiv. Også denne tjenesten fungerer bra, men foreløpig best på bokmål og nynorsk.
Mange etiske problemstillinger
Det er altså mye positivt kunstig intelligens kan bidra med, men Brygfjeld legger ikke skjul på at det også finnes etiske problemstillinger.
– Det er mange utfordringer med den type teknologi, og her trenger vi ikke å snakke om de opplagte som autonome krigsroboter og den type ting. Selv om det er høyst relevant, for det er den andre siden av samme saken.
Det vi bør snakke om, er desinformasjon og påvirkning, mener han og nevner et eksempel: Hvis du spør Google «Hvor dyp er Suezkanalen?», får du svaret 24 meter.
– Og sånt har vi brukere på internett en tendens til å tro på. Hvis vi begynner å tenke oss litt mer avanserte problemstillinger som besvares av denne type teknologi, er det en sånn kraft i den teknologiske plattformen at du kan få mange folk til å få en bestemt mening som ikke nødvendigvis er korrekt.
– Det er jo sånn at hvis vi trener en modell på etisk problematisk stoff, så får du akkurat det du kan forvente av resultatet. Du får en modell som ikke er særlig behagelig.
En modell blir ikke bedre enn materialet den er trent med. For eksempel, trener man en modell på norske bøker fra 1800-tallet, så blir den dansk. Fordi skriftspråket den gang var dansk.
– Og på den måten, hvis vi har valgt et innhold med hovedvekt på en spesiell politisk retning eller hatefulle ytringer, så vil vi lett produsere en modell som yter sånn.
Her mener han Nasjonalbiblioteket vil være en motvekt. Fordi samlingen baserer seg i stor grad på trykte kilder som har vært vurdert, vil sjansen for at modellen blir ubehagelig, være mindre.
Det tredje store
Med så mange muligheter, bør vi være redd for jobbene våre? Både ja og nei, mener han.
– Veldig mange rutinepregede oppgaver kan utføres av kunstig intelligens. Ofte vil det være billigere, mer effektivt og mer pålitelig. Derfor vil mange slike arbeidsoppgaver bli utført av maskiner i stedet for folk. Men erfaring med teknologiskifter er som regel at folk må gjøre andre og kanskje mer interessante ting, at vi får flere hender til å utføre viktigere oppgaver.
Brygfjeld er ikke i tvil om hvor stort det som foregår nå er.
– Jeg har jobbet med teknologi siden jeg gikk ut av universitetet i 1989. Siden da har det skjedd tre virkelig store ting: Først ble internett tilgjengelig for alle. Noen år etterpå kom World Wide Web. Og det tredje skjer nå, det er AI.
Denne saken ble først publisert i Bibliotekaren 4/2022