Hvorfor fysiske data aldri kan digitaliseres fullstendig

Digitale data vil aldri kunne erstatte et fysisk objekt. Å sørge for at Norge tar vare på de fysiske dataene sine må være del av en nasjonal satsning, med museene i lederrollen.

SKATTER: I museenes samlinger skjuler det seg uante skatter for fremtidens forskere. Her fra et av magasinene til Naturhistorisk museum, UiO, hvor en del av de totalt 6,2 millioner objektene oppbevares. FOTO: privat

Mer og mer av forskningen er på vei inn i den digitale verdenen, og det snakkes mye om hvordan man kan digitalisere objekter for å kunne bevare dem, dele dem eller inkludere dem i større studier. Dette er utvilsomt viktig, men noen ganger kan det virke som om man glemmer at digitalisering av fysiske objekter i hovedsak er lagring av data man allerede har.

Bare én versjon

Flere fag dreier seg om fysiske objekter: for eksempel kunst, arkitektur, arkeologi, biologi og landskapsforskning. Bruken varierer mellom fagfeltene, men felles for mange felt er at de er helt avhengige av de fysiske objektene. Det kan være beinrester av dinosaurer, romerske tekstiler, moderne skulpturer eller bruksgjenstander fra vikingtiden. Ofte er de knust i biter, flattrykt eller kun et avtrykk av noe som råtnet bort for lenge siden, men allikevel: det finnes bare én versjon av dette objektet i hele verden, og det gjør det unikt. Museer har tre hovedfunksjoner ifølge ICOM; de skal være et sted for 1) forskning, 2) undervisning og formidling og 3) ivaretagelse av samlingsmateriale. Det som gjør museene enestående er samlingene; forskning, undervisning og formidling gjøres mange andre steder også.

De siste årene har det blitt et stadig økende fokus på digitalisering av samlinger. Samtidig mister museene støtte til vanlig vedlikehold. I Kulturdepartementets strategi for åpne data og Forskningsrådets strategi for datahåndtering og FAIR-prinsippene står det mye bra om digitale data, men knapt noen ting om hvordan man kan tilgjengeliggjøre og ivareta kvaliteten til de fysiske dataene.

Mørke data

Det er to store problemer når samlingsmateriale blir borte: 1) man kan aldri benytte hittil ukjente metoder for å lære mer om objektet i fremtiden, og 2) alt som tidligere har vært sagt og skrevet om et objekt blir stående for all ettertid som en ikke-etterprøvbar sannhet. Punkt 1 gjelder også selv om man har digitalisert all tilgjengelig kunnskap om objektet. Tap av objekter hindrer alle muligheter for å teste ut frem- tidige forskningsmetoder. Eller bare å undersøke objektene med dagens metoder. Nylig ble for eksempel en fjær fra en fjærkledd dinosaur oppdaget da man gjorde nye analyser av et gammelt fossil i samlingene i Berlin (Steiner, 2019). Museumssamlinger er store, og deler av dem vil naturlig nok være samlet inn av nå avdøde forskere uten at det er en forsker som har nøyaktig samme interessefelt like etterpå. Dermed kan store deler av materialet kanskje ikke engang ha blitt studert med de siste 100 årenes teknologi. Det er ikke engang sikkert materialet har blitt registrert i en database ennå, såkalte «mørke data» (Marshall, 2018).

Punkt 2 er det som skiller vitenskap fra pseudo-vitenskap. God forskning skal kunne testes, man skal alltid kunne teste nøyaktig det samme en annen forsker har gjort og komme frem til samme svar. Det er dette som kalles etterprøvbarhet. Når man ikke kan etterprøve en studie, vil man aldri kunne vurdere om kvaliteten av det tidligere arbeidet. For en del forskningsdisipliner som ikke kan kjøre repeterende forsøk er det gjenstandene som er våre data. Vi kan ikke gjenskape vikingtiden fullstendig, men studere vikingskipets håndverk.

En versjon av sannheten

Det finnes heller ikke én løsning for tilgjengeliggjøring og bevaring av alle typer objekter, og arbeidet med å digitalisere data er ofte tid- og ressurskrevende arbeid som ikke genererer publikasjonspoeng i tellekantsystemet. Ved å digitalisere data er det mindre sannsynlig at ting blir glemt. Allikevel, digitale data forteller kun en versjon av sannheten om et objekt, et tidsbilde av den på det tidspunktet tilgjengelige kunnskapen. Disse dataene vil kontinuerlig måtte revideres, og det kan man kun gjøre via de faktiske objektene. Om man vil ha digitale forskningsdata må man derfor satse på kontinuerlig vedlikehold av de fysiske samlingene. Man trenger dessverre ikke se lenger enn til Danmark og Statens Naturhistoriske Museum for å se at underskudd brukes som et argument for å legge ned forskningsdelen av museet (Benner, 2018). Museet skal reduseres til å kun bestå av utstillinger, enda studier viser at museer bidrar med mange ganger verdien av hva de mottar i statsstøtte (Heltoft, 2019) og at nytteverdien for samfunnet strekker seg langt utover grunnforskningen (Suarez og Sutzui, 2004).

Sårbare digitale data

I samfunnet digitaliseres det nå enorme mengder offentlige dokumenter, nyheter, biodata om befolkningen og stadig mer forskningsdata. Samtidig er det en voksende uro for hvordan vi skal kunne bevare disse dataene (Sample, 2015). Man kan bruke skyløsninger og databaser, men i hvilket filformat? Selv visepresidenten i Google, Vint Cerf (ofte omtalt som «internetts far»), har advart om hvor sårbare de digitale dataene våre er. Vår tid risikerer å bli husket som en digital mørkealder («Digital dark age») – for hvem er det som sørger for at dataene våre er lesbare i framtiden? Hvor lenge kommer samfunnet til å bruke Excel-filer, Word-dokumenter eller PDF-er? Hvem kan lese en Floppy Disk i dag? Hvilke analysemetoder for informasjonen vår kan vi med sikkerhet vite at forskere vil bruke om 400 år, annet enn øyne og hender? Museene er en av de få institusjonene i samfunnet med et evighetsperspektiv, det må dataene ha også.

Sentre for framtidig forskning

Det er en farlig tid for museene. Museer skal ikke være rene utstillingslokaler, eller måtte si nei til nytt materiale fordi man ikke kan ta vare på det man allerede har. Vi kan ikke stole på at politikere og meningsbærere har den nødvendige forståelsen av hva et museum er: evighetsperspektiv og neste valgperiode stemmer ikke over ens. Man kan ikke drive et museum med fireårshorisonter når samlinger har hundreårshorisonter. Museer råtner på rot, samtidig sies det at Norge skal bli en kunnskapsnasjon og at det er hjernekraft vi skal leve av i fremtiden. Er det da bare innenfor fag som benytter digitale data? Vi som jobber på museer har et ansvar for å formidle vår rolle. At museene ikke bare er levende historiebøker. De er skattekamre for mastergrader, doktorgrader og internasjonale forskningsprosjekter for hundrevis av år fremover, i form av sine fysiske objekter.


Victoria Sjøholt Engelschiøn er stipendiat i paleontologi ved Naturhistorisk museum i Oslo


Denne kronikken er hentet fra papirutgaven av Museumsnytt – nr. 1-2019. Kontakt redaksjonen for abonnement (kr. 300,- i året).


Litteraturliste:

Benner, T. (2018) «Statens Naturhistoriske Museum mister sin forskning», Politiken, 5. november 2018. Tilgjengelig fra: https://politiken.dk/kultur/art6820579/Statens-Naturhistoriske-Museum-mister-sin-forskning.

Heltoft, N. (2019) «Ny analyse: Når staten giver 1 krone til et museum, får samfundet pengene flere gange igjen», Politiken, 9. januar 2019.

Marshall, C. (2018) «Digitizing the vast ‘dark data’ in museum fossil collections», The Conversation, 17. september 2018.

Sample, I (2015) «Google boss warns of ‘forgotten century’ with email and photos at risk», The Guardian,15. februar 2019.

Steiner, G. (2019) «Mystery of the missing quill solved», Museum für Naturkunde Berlin, 4. februar 2019.

Suarez A.V. og Tsutsui, N. D. (2004) «The Value of Museum Collections for Research and Society», BioScience, volum 54, utgave 1, s. 66–74



Join the Conversation