Wikidata-praksis med rom for refleksjon

Hun er førsteårsstudent i bibliotek- og informasjonsvitenskap ved OsloMet. Hun liker å kode og redigere. Hun bidrar gjerne i det frivillige miljøet som arbeider for fri informasjon og kunnskapsdeling. Kort sagt: Her er Anettes beretning om sin praksisperiode i Wikimedia Norge.

Anette har jobbet med forfatterinformasjon i Wikidata under sin praksisperiode som bibliotekstudent. (Foto: Astrid Kristine Andreassen)

Hva Wikidata er

Wikidata er en fri, samarbeidsbasert, flerspråklig andrehåndsdatabase som samler strukturerte data for å kunne støtte Wikipedia, mediedatabasen Wikimedia Commons og andre Wikimedia-prosjekter som er til for alle og blir publisert under Creative Commons Fristatus-erklæring. Datamodellen i Wikidata er en åpen modell basert på utsagn om entiteter, og passer fint inn i RDF.

Noe av det spennende er at hvilke typer utsagn og begrensninger det skal være mulig å lage ikke er lagt opp på forhånd, men utvikles fortløpende av fellesskapet av brukere. For å beskrive mennesker, som jeg har jobbet en del med, er det vanlig å legge inn utsagn som beskriver kjønn, fødselsdato, nasjonalitet/statsborgerskap (alle utsagn kan kvalifiseres med kvalifikatorer som for eksempel starttidspunkt og sluttidspunkt), men også mer inngående data som kan være relevant kan legges inn, alt fra (fritt lisensiert) bilde til utmerkelser, doktorgradsveileder, dødsårsak, sentrale verk og institusjonen som innehar personens arkiver også videre.

Hvordan jeg havnet i  Wikimedia Norge

Wikimedia Norge var høyt oppe på mitt ønske om praksisplass da jeg skulle søke. Jeg har alltid hatt en stor interesse for hvilken nytte en datamaskin har og hvilken nytte den kan ha for meg som person. Jeg har alltid likt å drive rundt på datamaskinen hvor jeg har likt å kode, programmere og å redigere ulike ting i ulike programmer, og så videre. Liker også nytten jeg kan gi til andre ved å gi informasjon videre – man både lærer og lærer bort kan man si! Et av Wikimedia Norges strategimål for 2016–2020 står jo akkurat inne for nettopp det: Støtte opp om aktiviteten til det frivillige miljøet som arbeider for fri informasjon og kunnskapsdeling!

Hva mitt arbeid består av i praksisperioden

Jeg jobber hovedsakelig med et prosjekt og en liste Wikimedia har fått fra Nasjonalbiblioteket over forfattere. Da jobber jeg i Wikidata der jeg legger inn informasjon som er tilgjengelig om forfattere via datasettet «BIBSYS Authors» i verktøyet «Mix’n’Match». Informasjonen jeg legger til i Wikidata blir for eksempel tilgjengeliggjort i Wikipedia om det blir opprettet artikler om forfatter X – da kan det gjerne bli opprettet en infoboks på høyre side og lenker helt nederst i artikkelen.

Det som har vært mest i fokus har vært katalogisering av nordsamiske forfattere, da Wikimedia har et prosjekt gående til Wikipedia på nordsamisk. Da har jeg gått gjennom x antall XML-filer for å finne ut hvem de ulike forfatterne er, og når jeg har funnet det ut, søker jeg de opp på nevnte verktøy for å sjekke om Nasjonalbiblioteket har lagt inn element i Wikidata på forfatter X som jeg kan jobbe videre med. Hvis Nasjonalbiblioteket ikke har gjort det, må jeg opprette et nytt element på forfatterne manuelt. For å få mer informasjon går jeg inn på VIAF, som er den virtuelle internasjonale autorisasjonsfilen som kobler sammen nasjonale og regionale autoritetsregistre, hvor de lager klyngeoppføringer under hvert enkelt navn med unik VIAF-ID med lenker til andre databaser. Deretter oppretter jeg ulike utsagn ut i fra informasjonen jeg har fått oppgitt i de ulike databasene.

Jeg har også vært med på å legge til ontologien til verk. Det som har blitt gjort da er å se på de forskjellige bibliografiske egenskapene til boka, samtidig som at jeg har vært med på å opprette samisk bibliografi.

Wikidata er en enorm samling av strukturerte data, blant annet om forfattere. Her er artikkelforfatter Anette Faksnes på befaring i en noe mindre samling, et døgnåpent telefonkioskbibliotek i Ringebu. (Foto: Privat)

Hvem kan ha nytte av tjenesten og i hvilke situasjoner kan den være nyttig?

Wikidata er allerede en enorm samling av strukturerte data som alle kan bruke. Det kan for eksempel være forskere eller bedrifter som trenger data til entitetsgjenkjenning eller til harmonisering eller berikelse av datasett, eller som kanskje trenger en ontologi uten å ha ressurser til å utvikle den selv. En utfordring med Wikidata er at dataene der ikke nødvendigvis er komplette. Data legges inn og kureres jevnt og trutt av brukere og av institusjoner som donerer datasett, men det er ikke sikkert noen har lagt inn akkurat de dataene du trenger enda. Kanskje du må legge dem inn selv.

For bibliotekarer er Wikidata interessant på mange plan. Det å beskrive elementer på Wikidata er ikke så ulikt det å katalogisere, og det gir derfor rom for å reflektere rundt katalogiseringsprosessene våre. Rent praktisk burde det også gå an å se for seg tett integrasjon mellom Wikidata og biblioteksystemer, i hvert fall i fremtiden når alle snakker lenkede data.

Eller så kan det være interessant å vite hvor mange som er biografert på Wikipedia – da kan en bruke et spørrespråk som er tilgjengelig på Wikidata som kalles SPARQL for å finne ut denne informasjonen med allerede registrerte Wikidata-utsagn. SPARQL er et RDF-spørrespråk for databaser som kan hente og manipulere data i RDF-format.

Mange bibliotekarer har nok vært borti RDF før, men mange studenter nå er i alle fall borti det. RDF står for «Resource Description Framework» – altså et rammeverk for metadata-beskrivelser som igjen har en nær tilknytning til utviklingen til den semantiske veven som også gjør at ikke bare mennesker har nytte av det, men også maskiner. Kort og enkelt – veldig mange kan ha nytte av tjenesten, men spesielt bibliotekarer vil jeg si kan ha spesielt nytte av den om de interesserer seg for den digitale utviklingen vi allerede møter og kommer til å få mer av i fremtiden.

Hva som gjør dette praksisstedet relevant for meg som bibliotekarstudent

I og med at informasjons- og kommunikasjonsteknologiske emner inngår i rundt halvparten av bibliotekarstudiet, og med tanke på mine interesser fra før av, fant jeg det relevant å søke på Wikimedia Norge som praksisplass, og gleden ble ekstra stor da jeg fikk et prosjekt som har med Wikidata å gjøre. Jeg setter stor pris på alt jeg lærer her og har spissede ører for mer informasjon. Jeg kan se for meg at jeg senere når jeg er ferdig med bibliotekarstudiet vil finne på å søke jobb på relevante steder som innehar denne graden av mangfoldige muligheter for meg som person som stadig oppdager nye ting som jeg vil finne ut mer av! Og med mange «wikipedianere» (brukere som bruker mye tid til redigering og oppretting) som er rundt om i hele verden blir hjelpen enda større.

Jeg vil takke Astrid Carlsen umåtelig mye som tok meg imot som praktikant og satt meg inn i Wikidata-prosjekter med tanke på interessene mine og at hun satt meg i kontakt med Dan Michael Heggø som jeg også ønsker å takke. Han har hjulpet meg enormt mye med artikkelen og annen relevant informasjon jeg kommer til å støte på i studiet! Også vil jeg takke Jon Harald Søby som har hjulpet meg i Wikidata-verdenen.