Underverk, flettverk og kraftverk : bibliotekkatalogen som verksted

FRBR-modellen ble lansert allerede for 15 år siden, for å tilføre bibliografiske data informasjon om relasjoner mellom kulturelle uttrykk på forskjellige plan. Fortsatt ikke realisert

Flere av prosjektene vi har gjennomført på Deichman de siste årene har basert seg på bibliotekets katalogdata og på det å ta disse i bruk på nye måter. Vi har da ikke brukt MARC-poster direkte, men en konvertert og behandlet versjon av katalogen i RDF-format. En av de viktigste tingene vi på denne måten har kunnet tilføre dataene, er egne ID-er for verk på et overordnet nivå, slik at vi kan identifisere hvilke utgivelser i samlingen som er utgaver av samme verk. Denne muligheten er avgjørende for digital formidling av bibliotekets samling. En base for bokanbefalinger ville vært langt mindre verdt hvis hver anbefaling bare kunne knyttes til én bestemt utgave av den omtalte boka. På samme måte ville funksjoner som «Flere bøker av forfatteren» på de aktive hyllene være meningsløse hvis de foreslo en rekke andre utgaver av den boka du allerede hadde sett på.

Det samme kan sies om de digitale versjonene av mer tradisjonelle bibliotektjenester, som muligheten til å bestille og reservere materiale hjemmefra. Hvorfor skal en bruker som vil lese Victoria av Knut Hamsun måtte velge mellom titalls ulike utgaver for å få plassert en reservering? Selvfølgelig må det være mulig å velge utgave for de lånerne som av en eller annen grunn har spesielle preferanser, men hvorfor skal alle andre tvinges til å velge? Er man uheldig, kan man komme i skade for å reservere en utgave uten ledige eksemplarer, eller en hvor det ledige eksemplaret ikke er på plass, noe som vil medføre at låneren må vente, selv om det finnes ledige eksemplarer av andre utgaver av samme bok.

Problemstillingen er godt kjent i biblioteksverdenen, og FRBR-modellen (Functional Requirements for Bibliographic Records) ble lansert allerede på 1990-tallet som en løsning på nettopp slike spørsmål. Men modellen er dessverre fortsatt ikke kommet til uttrykk gjennom bibliotekenes katalogiseringsregler og metadataformater. Det betyr i praksis at bibliotekene per i dag ikke har beskrivelser av sine samlinger som er egnet for digital formidling og presentasjon på web.

For tiden venter bibliotekene på nye standarder som skal dekke disse behovene, samtidig som de ivaretar alt eldre standarder har tatt hånd om, og som derfor nødvendigvis må bli omfattende, komplekse og tidkrevende å utvikle. Samtidig ser vi at enklere FRBR-lignende modeller blir tatt i bruk hos kommersielle web-baserte formidlingstjenester utenfor biblioteket, rett og slett fordi de er helt nødvendige for kvaliteten på tjenestene. Sosiale litteratur-websider som Bokelskere, LibraryThing og GoodReads, har alle måttet komme opp med konkrete og praktiske løsninger på slike problemer, fordi tjenestene deres ville vært verdiløse uten dem. Hvem ville gå til LibraryThing for å finne leservurderinger av «Huckleberry Finns eventyr», hvis vurderingene var fordelt mellom de mange tusen ulike utgavene denne romanen er kommet ut i? Hvem ville ha gått til filmdatabasen IMDb hvis man ved å søke på en filmtittel, ikke fikk opp informasjon om filmen i seg selv, men om alle de forskjellige utgivelsene av DVD-er og videokassetter?

 

Skjult potensial i katalogpostene

Når jeg søker etter «Victoria» av Knut Hamsun og får 23 treff i bibliotekskatalogen, trekker jeg ikke den slutningen at Knut Hamsun har skrevet 23 bøker med denne tittelen. Jeg skjønner at det er snakk om ulike utgaver av én og samme bok. Dette skjønner jeg fordi jeg kan supplere opplysningene i katalogen med kunnskap og logikk jeg selv besitter. Informasjon om verk finnes ikke eksplisitt i katalogen, men vi kan trekke slik informasjon ut av de opplysningene som ligger der, ved å anvende regler som tilfører nettopp denne kunnskapen og logikken. Alle utgaver av én bok vil for eksempel ha samme forfatter. De vil ikke nødvendigvis ha samme tittel, siden det kan være snakk om oversettelser eller utgaver med modernisert språk, men katalogpostene angir som regel originaltitler i slike tilfeller. Ved hjelp av opphavspersoner, titler og originaltitler, kan vi avdekke slektskapet mellom to manifestasjoner av samme verk på tre forskjellige måter:

 

  1. Dokumentene har samme opphavsperson og samme tittel. Ingen av dem har opplysning om originaltittel.
    • «Kruttårnet» av Jens Bjørneboe (1969)
    • «Kruttårnet» av Jens Bjørneboe (1974)
  2.  

  3. Dokumentene har samme opphavsperson og samme originaltittel.
    • «Powderhouse» av Jens Bjørneboe (2000). Originaltittel: «Kruttårnet»
    • «Der Pulverturm» av Jens Bjørneboe (1995). Originaltittel: «Kruttårnet»
  4.  

  5. Dokumentene har samme opphavsperson. Det ene dokumentet har originaltittel, og denne er identisk med det andre dokumentets tittel.
    • «Powderhouse» av Jens Bjørneboe (2000). Originaltittel: «Kruttårnet»
    • «Kruttårnet» av Jens Bjørneboe (1969)

Med andre ord: Har du to bøker som heter det samme og er skrevet av samme forfatter, er det sannsynligvis snakk om to manifestasjoner av samme verk. Dette er ikke noe blendende resonnement, snarere en selvfølgelighet. Men det er en selvfølgelighet som så langt dessverre har vært fullstendig fraværende i bibliotekkatalogene og i bibliotekenes web-baserte tjenester. Og om logikken er enkel, så er effekten av å få den eksplisitt uttrykt i katalogen stor.

 

Relasjoner mellom verk

I tillegg til å identifisere hvilke verk dokumentene i biblioteksamlinga er manifestasjoner av, gir behandling av katalogdata også mulighet til å finne og uttrykke relasjoner mellom forskjellige verk:

  • Fagboka «Nora Nora» av Margareta Wirmark handler om skuespillet «Et dukkehjem» av Henrik Ibsen
  • Spillefilmen «Ti kniver i hjertet» av Marius Holst er basert på romanen «Gutten som ville være en av gutta» av Lars Saabye Christensen
  • Barneboka «Flukten fra vikingene» av Torill Thorstad Hauger er en oppfølger til «Røvet av vikinger»
  • Romanen «Kransen» av Sigrid Undset er en del av trilogien «Kristin Lavransdatter»
  • Samlingen «Skjebneanekdoter» av Karen Blixen inneholder fortellingen «Babettes gjestebud»

Når relasjonene mellom verkene først er formalisert i katalogen, kan vi også la dem komme til uttrykk mellom manifestasjonene i samlingen. Bibliotekbrukeren som har lånt en DVD, kan få vite at vi har boka filmen er basert på, andre bøker av samme forfatter eller filmer basert på andre bøker av denne forfatteren.

 

Men: katalogpostene gir ikke alltid all nødvendig informasjon

Det er mye å tjene på å tilføre denne typen eksplisitt informasjon til bibliotekkatalogen. Problemet er at vi er begrenset av den informasjonen som ligger i MARC-postene, som strengt tatt ikke er laget for denne bruken. Postene danner et utmerket grunnlag i de tilfellene hvor én utgivelse svarer til ett verk, men vi merker raskt at informasjonen ikke strekker til for unntakene.

    • Manglende informasjon om hvorvidt en utgivelse har verkshøyde eller ikke
      Eksempel: Gabriel Scott. «Tante Pose ; Fant ; Josefa»
      Tre romaner samlet i ett bind. Hovedtittel er en sammenføyning av de tre verkstitlene, mens de enkelte romanene er registrert som analytiske biinnførsler. Men det framgår ikke på noen måte av katalogposten om samlingen i seg selv er å betrakte som et selvstendig verk. I dette tilfellet er sammenstillingen av de tre romanene gjort av utgiverne, lenge etter forfatterens død. Det blir derfor søkt å snakke om denne utgivelsen som et eget verk. Eksempler i retningslinjene for Normarc kan tyde på at indikatorene til felt for opplysninger om tittel og ansvarshavende kan brukes til å uttrykke slik informasjon, men det er ingen praksis for dette.

 

    • Opphavsperson og tittel identifiserer ikke verk entydig
      Eksempel: Ingvar Ambjørnsen. «Jesus står i porten»
      En novellesamling av Ambjørnsen, hvor de enkelte novellene er registrert med analytter. I dette tilfellet er novellene utgitt samlet av forfatteren selv, og det er derfor naturlig å betrakte både samlingen og den enkelte novelle som verk. En av novellene har tittelen «Jesus står i porten», samme tittel som samlingen den er en del av. Her er altså ikke opplysninger om forfatter og tittel tilstrekkelig til å skille mellom to ulike verk.

 

    • Originaltitler kan være ulike
      Eksempel: Daniel Defoe. «Moll Flanders»
      Noen ganger kommer bøker ut med ulike titler på originalspråket, og får også ulike opplysninger om originaltitel i oversatte utgaver. De fleste utgaver av denne romanen heter enkelt og greit «Moll Flanders». Andre utgaver har en lengre tittel: «The fortunes and misfortunes of the famous Moll Flanders». Men den opprinnelige tittelen fra 1722 er intet mindre enn:

      «The Fortunes and Misfortunes of the Famous Moll Flanders, &c. Who was Born in Newgate, and during a Life of continu’d Variety for Threescore Years, besides her Childhood, was Twelve Year a Whore, five times a Wife (whereof once to her own Brother), Twelve Year a Thief, Eight Year a Transported Felon in Virginia, at last grew Rich, liv’d Honest, and died a Penitent. Written from her own Memorandums.»

 

    • Manglende mulighet til å knytte bibliografisk informasjon til analytter
      Eksempel: Arne Garborg. «Læraren ; Den burtkomne faderen»
      Et skuespill og en roman, flere ganger utgitt samlet i ett bind. Katalogposten kan ved hjelp av analytiske biinnførsler uttrykke at bindet inneholder disse to verkene, og den kan også uttrykke at bindet inneholder både et skuespill og en roman. Men siden litterær form registreres på overordnet dokumentnivå, og ikke på den enkelte analytt, lar det seg ikke gjøre å få fram hvilket av verkene som er et skuespill og hvilket som er en roman.

 

    • Originaltitler mangler for deler av utgivelse
      Eksempel: Gunilla Bergström. «Albert Åberg : de tre første historiene»
      En samleutgave som inneholder de tre bøkene «Du er en luring, Albert Åberg», «God natt, Albert Åberg» og «Heng i, Albert Åberg», som alle er tidligere utgitt hver for seg. For de enkeltstående utgivelsene kan vi bruke de svenske originaltitlene til å identifisere verket. Men når historiene inngår som deler av en samlet utgivelse, er det ikke lenger rom i dataformatet til å knytte originaltittel til den enkelte delen.

 

    • Originaltittel mangler for relatert verk
      Eksempel: «The Three musketeers». Film av Stephen Herek
      Filmatisering av Alexandre Dumas’ roman «De tre musketerer». Relasjon til verket filmen er basert på er uttrykt med biinnførsel på forfatteren med romanens norske tittel. Men identifiseringen av romanen som verk avhenger av den franske originaltittelen «Les trois mousquetaires». Denne framgår ikke av katalogposten.

 

    • Utilstrekkelig informasjon om serier
      Eksempel: Ursula K. Le Guin. «Trollmannen fra Jordsjø» (Gyldendal, 2004)
      Her er det relevant å snakke om verk på to nivåer. På den ene siden er romanen et verk i seg selv, men den inngår også i en serie som samlet sett utgjør et mer omfattende verk. MARC-formatet lar oss registrere opplysninger om serier; i dette tilfellet har boka to serieangivelser: «Jordsjø-krøniken» og «Lunapocket». Den første sier noe om hvilken serie verket inngår i, mens den andre bare gjelder denne spesielle utgivelsen. Det finnes ingen måte å lese ut av posten hvorvidt en serieangivelse beskriver en reell verksserie eller en ren forlagsserie. En engelsk utgave av samme bok ville dessuten ha en helt annen angivelse av Jordsjø-serien, med engelsk serietittel. Vi kan altså ikke bruke MARC-feltet for serieangivelse til å etablere verks-IDer for serier. Det finnes riktignok rikere muligheter for å angi serietilhørighet i MARC, men disse er lite brukt i praksis.

 

Hva gjør vi?

Vi har sett at vi kan tilføre bibliotekkatalogen stor merverdi ved å etablere egne instanser for verk og relatere disse til hverandre og til de enkelte dokumentene i samlinga. Det å kunne identifisere verk og gruppere ulike manifestasjoner er en forutsetning for at vi skal kunne bruke katalogdata i digital formidling av biblioteksamlingen på en tilfredsstillende måte. Vi har videre sett at selv om bibliotekenes katalogdata er manifestasjonsorienterte, og ikke eksplisitt beskriver verk, så framgår ofte den nødvendige informasjonen implisitt. Ved å behandle katalogdataene etter visse logiske regler, kan vi konstruere verks-IDer og informasjon om verk fra dette utgangspunktet. Samtidig har vi sett at denne metoden har begrensninger. Den informasjonen som ikke går fram av katalogpostene må vi nødvendigvis gå glipp av. Behandling av data fra MARC-poster er derfor ikke tilfredsstillende som en endelig løsning når alt kommer til alt.

Fortsatt er mange av basistjenestene til biblioteket avhengige av katalogdata i MARC-format; samtidig ser vi klare fordeler ved å kunne basere nye tjenester på katalogdata i et mer fleksibelt format, som RDF. Men hvis vi enn så lenge må ha data i begge formater, virker det ikke uhensiktsmessig å ta utgangspunkt i det mest begrensede formatet for å produsere de mer uttrykksfulle beskrivelsene? Virker det ikke mer fornuftig å starte i den andre enden: å produsere data i det best egnete formatet, og så heller bruke disse som grunnlag for å opprette enklere poster for de tjenestene og grensesnittene som er fortsatt er avhengige av MARC-formatet? Det er krevende å produsere gode metadatabeskrivelser av f.eks. film eller musikk ved hjelp av et generelt metadataskjema som MARC, som egentlig er utviklet for å beskrive bøker. Og det er begrenset hvor godt de ferdige dataene kan tolkes tilbake til film- eller musikkspesifikk informasjon i etterkant. Da virker det mer hensiktsmessig å produsere gode og presise beskrivelser i metadataskjemaer som er spesielt tilpasset disse typene uttrykk, og så heller bruke dette som grunnlag til å produsere flatere beskrivelser i et mer generelt format. Man kan alltids behandle konverterte MARC-data og resonnere seg fram til informasjon som ikke framgår eksplisitt fra MARC-postene, slik vi har gjort for å identifisere og relatere verk. Men det er ikke til å unngå at man før eller siden vil havne i situasjoner hvor det mindre uttrykksfulle formatet blir en feilkilde eller forårsaker unødvendige begrensninger for hva som er mulig å få til. Det å lage flate avbildninger av en tredimensjonal gjenstand er en langt mer overkommelig oppgave enn å rekonstruere tredimensjonale gjenstander ut fra et todimensjonalt bilde.

I tillegg er tiden moden for en endring av fokuset i selve katalogiseringsprosessen. Katalogisering bør i mindre grad handle om å beskrive fysiske objekter, og i større grad om å beskrive de inneholdte verkene. Bibliotekkatalogen er ikke lenger bare et arbeidsredskap for bibliotekarene for å organisere og finne fram i en fysisk samling; den er en tjeneste som vi yter til sluttbrukerne. Da er det helt avgjørende at det går an å orientere seg og finne informasjon med en verksorientert tilnærming. Dette forutsetter at verkene representeres som egne instanser i bibliotekkatalogene, med egne unike identifikatorer. Data som beskriver verket på et overordnet plan hører hjemme her, i stedet for at vi registrerer de samme opplysningene i mange forskjellige katalogposter. Så kan man i neste omgang beskrive relasjoner mellom verk og knytte verk til de enkelte utgavene, for å gi sluttbrukere navigasjonmuligheter og tilgang til objektene i samlingen. Slik kan bibliotekkatalogen utgjøre et godt grunnlag for formidling og tilgjengeliggjøring av biblioteksamlingene i en digital tid.

 

Om Asgeir Rekkavik

Bibliotekar ved Deichmanske bibliotek. Avdeling for kunnskapsorganisering