Matchings- og sammenslåingsregler for import av MARC-poster

Denne delen inneholder informasjon om hvordan importerte MARC-poster håndteres under transformasjonen til koblede data.

  1. Innledning

  2. Eksempler på de vanligste feilene og de vanligste forklaringene på dem

  3. Matching og sammenslåing av verk, uttrykk og manifestasjoner

  4. Matching og sammenslåing av andre enheter

  5. Hvordan manifestasjonstyper opprettes

  6. Datastatus og spesialhåndtering av Libris -poster

1. Innledning

Når en MARC-post importeres til Quria, transformeres den til Quria koblet dataformat og matches mot dataene som allerede finnes i samlingene. Matchingsprosessen utføres i flere trinn.

Først sammenlignes den såkalte Ekstern identifikator. Ekstern identifikator er verdien som ofte kalles post-ID (MARC-felt 001) i kombinasjon med leverandøren av posten (for eksempel Libris, DNB, Bibbi). Dette brukes for å unngå duplikater for leverandører som sender oppdateringer på katalogoppføringer du allerede har, hvis du importerer poster manuelt for å få de nyeste versjonene av dem, eller hvis du ved et uhell importerer en post som du allerede har i samlingene. Til og med felt 035 regnes som en ekstern identifikator.

Deretter lages en full såkalt VerkUttrykkManifestasjon (WEM)-match. Denne rutinen skaper koblingene mellom verkene og deres uttrykk og manifestasjoner.

Lenger nede på denne siden finner du detaljert informasjon om hva som skjer under hvert trinn, samt dataene som kreves i postene for Quria for å opprette koblingene. Quria er avhengig av rådataene i MARC-postene, og hvis disse dataene er feil, kan matchingsprosessen mislykkes eller gi unøyaktige resultater.

2. Eksempler på de vanligste feilene og de vanligste forklaringene på dem

Det opprettes separate verk i tilfeller der de burde vært matchet

  • Originaltittel mangler

  • Forfatteren er stavet annerledes

  • Verktype er ukjent

  • Forfatter mangler

Separate uttrykk opprettes i tilfeller der burde vært matchet

  • Bidragsyter (oversetter, forteller osv.) mangler eller er ikke registrert i felt 700

  • Språk mangler

  • Uttrykkstypen er ukjent

Separate titler er slått sammen til ett verk

  • Dette skyldes ofte en katalogiseringspraksis der en serietittel skrives i feltet for hovedtittel (245 a) uten andre opplysninger som skiller verkene fra hverandre.

  • Dette kan også skje i tilfeller ved en oversettelse av en tittel der originalen er utgitt i ett bind og oversettelsene i flere bind. Verktittelen er da felles for flere bind. Disse feilene forekommer ofte i mangaserier og fantasy-romaner, men kan også påvirke annet materiale.

3. Matching og sammenslåing av verk, uttrykk og manifestasjoner

Trinn 1.  identifikatoren for manifestasjonen

Til å begynne med sammenlignes Eksterne identifikatorer i de innkommende postene med identifikatorer som allerede finnes i Quria. En manifestasjon kan ha flere identifikatorer. En Ekstern identifikator består av flere deler og er bygget opp fra MARC21-felt 001+003 og/eller 035.

Denne eksempelposten har 2 identifikatorer:

*00009459cam a22005537i 4500

*00119983205

*003SE-LIBR

*00520201116103129.0

*008170110s2016    gw a||||||||||001 0|ger|d

*020  $a9783110457964$q(hardbound)

*035  $a(OCoLC)ocn953768170

I Quria:

IdentifierValue: "19983205”

IdentifierAssigner: "SE-LIBR"

IdentifierValue: " ocn953768170”

IdentifierAssigner: " OCoLC”

Hvis en innkommende post matcher en Ekstern identifikator i en eksisterende manifestasjon, blir den nye posten betraktet som en oppdatering av den manifestasjonen.

Dette betyr at verket, uttrykket og manifestasjonen blir oppdatert med informasjon fra denne nye posten. Se informasjonen om sammenslåing for hvert nivå nedenfor.

Merknad:
Poster fra Libris (SE) har en spesiell sammenslåingslogikk. Se nedenfor.

Hvis den innkommende posten ikke matcher med en Ekstern identifikator i en eksisterende manifestasjon, utføres trinn 2.

Hvis det er en 001, men det ikke finnes noen 003 i en post, blir Quria manual satt til Assigner:

IdentifierValue: "12343434”

IdentifierAssigner: "Quria manual"

Quria manual anses ikke som en navngitt tilordner, og disse identifikatorene brukes ikke til matching.

Trinn 2.  WEM-match

Hvis ingen match på Identifikator for manifestasjonen er gjort, er neste trinn å utføre den såkalte WEM-matchen.

Viktig: Dette trinnet utføres ikke for poster uten forfatter (MARC -felt 100, 110 eller 111). For disse postene er trinn 3 nedenfor neste trinn.

Verk – Match

Først kontrollerer Quria om denne posten kan matches mot et eksisterende verk. Matchingskriteriene for verk er:

  1. Tittel (MARC: 240 a+p+m+r, hvis ikke 240 – bruk 245 a)

  2. Forfatter (MARC: 100 a/110 a/111 a)

  3. Verktype (basert på RDA innholdstype som kommer i MARC 336 b eller er beregnet fra MARC -leder (felt 000) posisjon 6.)

Alle tre elementer må samsvare. Dette betyr at de tre verdiene i et eksisterende verk i Quria må matche de tre verdiene i den innkommende posten.

Eksempel på to poster som regnes som samme VERK:

*00020875cam a2203721 i 4500

*00120750532

*008170426s2017    sw            000 f eng d

*020  $a978-0-09-951166-3

*08204$a813.54$223

*1001 $aAtwood, Margaret,$d1939-$4aut

*24510$aThe handmaid's tale/$cMargaret Atwood

*264 1$aLondon$b Vintage Classic$c 2010

*000

*00121689762

*008171011s2018    sw |||||||||||000 f|swe|c

*020  $a9789113082905$qpocket

*0411 $aswe$heng

*08204$a823$222 (machine generated)

*1001 $aAtwood, Margaret,$d1939-$4aut

*24014$aThe handmaid's tale.$lSvenska

*24510$aTjänarinnans berättelse /$cMargaret Atwood ; översättning: Maria Ekman.

*264 1$a[Stockholm] :$bNorstedts,$c2018

*300  $a363 sidor$c18 cm

*336  $atext$btxt$2rdacontent

*337  $aunmediated$bn$2rdamedia

*338  $avolume$bnc$2rdacarrier

*7001 $aEkman, Maria,$d1944-$4trl

Verk – Slå sammen

Hvis det blir funnet et matchende verk, slås de nye verkelementene sammen med det eksisterende verket på følgende måte:

  • DateOfWork oppdateres med tidligste DateOfWork

  • Repeterbare elementer legges til (hvis de ikke allerede eksisterer)

  • Eksisterende ikke-repeterbare elementer oppdateres

  • Ikke-repeterbare elementer legges til hvis de ikke eksisterer

Hvis et matchende verk ikke blir funnet, opprettes et nytt verk, uttrykk og manifestasjon.

Repeterbare verkelementer: Klassifiseringer, Emner (alle), Sjangre, Medium for oppføring, Relasjoner, Merknader til ressurs, Beskrivelser

Ikke-repeterbare verkelementer: Tittel, Verktype, Forfatter, Tidspunkt for verk.

Uttrykk – Match

Deretter kontroller Quria om denne posten kan matches mot et eksisterende uttrykk i det matchede verket. Samsvarskriteriene for uttrykk er:

  1. Uttrykkstype (beregnet fra type RDA -innhold)

  2. RDA Innholdstype (MARC: 336 b. Hvis 336 ikke finnes, brukes lederen 000/06 til å angi type RDA -innhold)

  3. Språk (MARC: 1. hånd 008/35-37, 2. 041$a)

  4. Bidragsyter(e): (MARC 700/710/711)

Alle de fire elementene må samsvare. Det betyr at hvis for eksempel språk mangler i den innkommende posten, vil det ikke være noen match, og den nye posten vil opprette et nytt uttrykk. Uttrykkene blir også matchet/slått sammen hvis en innkommende post har samme ISBN som en av de underliggende manifestasjonene.

Eksempel på to poster som regnes som samme uttrykk:

*00015739cam a2202785 i 4500

*00121689762

*008171011s2018    sw |||||||||||000 f|swe|c

*020  $a9789113082905$qpocket

*0411 $aswe$heng

*08204$a823$222 (machine generated)

*1001 $aAtwood, Margaret,$d1939-$4aut

*24014$aThe handmaid's tale.$lSvenska

*24510$aTjänarinnans berättelse /$cMargaret Atwood ; översättning: Maria Ekman.

*264 1$a[Stockholm] :$bNorstedts,$c2018

*300  $a363 sidor$c18 cm

*336  $atext$btxt$2rdacontent

*337  $aunmediated$bn$2rdamedia

*338  $avolume$bnc$2rdacarrier

*7001 $aEkman, Maria,$d1944-$4trl

*00020875cam a2203721 i 4500

*00120750532

*008170426s2017    sw            000 f swe d

*020  $a 9789113082905$qpocket

*0411 $aswe$heng

*08204$a813.54$223/swe

*1001 $aAtwood, Margaret,$d1939-$4aut

*24014$aThe handmaid's tale.$lSvenska

*24510$aTjänarinnans berättelse /$cMargaret Atwood ; översättning: Marie Ekman.

*264 1$aStockholm:$bNorstedts,$c2017

*7001 $aEkman, Maria,$d1944-$4trl

Uttrykk – Slå sammen

Hvis det blir funnet et matchende uttrykk, slås de nye uttrykkselementene sammen med det eksisterende uttrykket på følgende måte:

  • Opprettet år oppdateres med tidligste CreatedYear

  • Uttrykkstittel oppdateres med tittel fra 245

  • Repeterbare elementer legges til (hvis de ikke allerede eksisterer)

  • Eksisterende ikke-repeterbare elementer oppdateres

  • Ikke-repeterbare elementer legges til hvis de ikke eksisterer

Repeterbare uttrykkselementer: Bidragsyter, Andre språk, Tittelvariant for uttrykk, Merknader til ressurs

Ikke-repeterbare uttrykkselementer: Tittel, Type RDA -innhold, Uttrykkstype, Opprettet år

Manifestasjon – Match

Det siste trinnet i WEM-matchen er å matche manifestasjonen i det matchede verket og uttrykket. Matchingskriteriene for manifestasjoner er:

  1. Manifestasjonstype (se nedenfor for forklaring på hvordan disse opprettes)

  2. RDA Medietype

  3. RDA Bærertype

  4. Tittel (MARC: 245 a)

  5. Utgivelsesår (fra Utgivelsesinformasjon, felt År som kommer fra MARC 260 c/264 c) (unntatt periodikum)

  6. ISBN (hvis den importerte posten har mer enn ett ISBN -nummer, må minst ett av disse matche)

Alle elementer må matche. Dette betyr at hvis for eksempel utgivelsesår mangler i den innkommende posten, vil det ikke være noen match, og den nye posten vil opprette en ny manifestasjon.

Merknad:
ISBN matchen her sjekker kun for ISBN i det nåværende verket. I trinn 3 går vi tilbake og ser etter ISBN i andre verk som ikke har blitt matchet på ID eller WEM-match.

Manifestasjon – Slå sammen

Hvis en matchende manifestasjon blir funnet, slås de nye manifestasjonselementene sammen med den eksisterende manifestasjonen som følger:

  • Repeterbare elementer legges til (hvis de ikke allerede eksisterer)

  • Eksisterende ikke-repeterbare elementer oppdateres Ikke-repeterbare elementer legges til hvis de ikke eksisterer

Repeterbare manifestasjonselementer: Andre titler, Navn på del, Nummer på del, Varianttittel, Utgave, Utgaveinformasjon, Identifikator for manifestasjonen, URL-adresser, Serier, Merknader til ressurs, Tiltenkt målgruppe.

Ikke-repeterbare manifestasjonselementer:Tittel, Ansvarsangivelse, Hyllemerking, Målgruppe, Litterær form, RDA medietype, RDA bærertype, Omfang, Varighet, Spillertype, Tittel, Varighet, Tilslutningsdato.

 

Trinn 3. ISBN

Hvis en importert oppføring ikke finner en match under WEM-matchingen, sammenlignes ISBN med de eksisterende ISBN-ene i samlingene.

Når et treff blir funnet, sammenlignes manifestasjonstitlene, dvs. TitleKey, som er en aggregering av flere titteldetaljer: I Quria – Egentlig tittel, Annen tittelinformasjon, Tittel på del, Antall deler, i innkommende MARC-post - 245 a+b+n+p.

Hvis denne informasjonen er den samme i manifestasjonene, utføres en manifestasjonssammenslåing

Hvis manifestasjonstitlene er forskjellige, skapes et nytt verk med uttrykk og manifestasjon.

Sammenligningen av manifestasjonstittelen brukes for å hindre uønsket sammenslåing av titler med feil ISBN, eller tilfeller der ISBN-ene i enkeltdelene av en flerdelt monografi registreres i en felles oppføring som importeres til Quria.

4. Matching og sammenslåing av andre enheter

Person

Match

  • Hvis den innkommende PersonRef inneholder bare et navn:

    Match mot eksisterende PersonRef -oppføringer som også inneholder bare et navn.

    Hvis flere matcher:

    • Bruk den bare med et navn, hvis tilgjengelig.

    • Ellers bruker du hvilken som helst.

  • Hvis den innkommende PersonRef inneholder tilleggselementer (f.eks. tittel, dato):

    Match i følgende rekkefølge:

    1. Personlig navn + normalisert tittel + dato

    2. Personlig navn + normalisert tittel

    • Hvis det ikke finnes noen tittel, hopper du til trinn 3

    • Hvis match: slå sammen og legg til manglende elementer

    3. Personlig navn + dato

    • Hvis match: slå sammen og legg til manglende elementer

    • Hvis ingen match: fortsett til trinn 4

    4. Bare personlig navn

    • Match mot eksisterende oppføringer med bare navn

    • Hvis match: slå sammen og legg til manglende elementer

Slå sammen

Legg til eventuelle elementer fra den innkommende personen som ikke allerede finnes i den matchende personen.

 

Emner

Match på

  1. subject

  2. kilde

  3. underdivisjon, kronologisk

  4. underdivisjonsskjema

  5. underdivisjon, generelt

  6. underdivisjon, geografisk

Slå sammen

Repeterbare elementer legges til:

  • overordnet term

  • varierende termer

  • beslektede termer

  • diverse informasjon

  • ekstern identifikator

Arrangement

Match på

  1. NameKey

  2. Type

Slå sammen

Ikke-repeterbare elementer legges til hvis de ikke eksisterer.

 

Organisasjon

Match på

  1. NameKey (Enhet + underordnede enheter)

Slå sammen

Repeterbare elementer legges til:

  • varierende termer

  • beslektede termer

  • diverse informasjon

  • ekstern identifikator

Plats

Match på

  1. Stedsnøkkel

  2. Kilde

  3. Underdivisjoner, form

  4. Underdivisjoner, geografisk

  5. Underdivisjoner, generelt

Slå sammen

Følgende repeterbare elementer legges til:

  • varierende termer

  • beslektede termer

  • diverse informasjon

  • ekstern identifikator

Klassifisering

Match på

  1. Nummer

  2. Plan

Slå sammen

Ingenting å slå sammen

Tiltenkt målgruppe

Match på

  1. Term

  2. Kilde

Slå sammen

Ingenting å slå sammen

Sjanger

Match på

  1. Sjanger

  2. Kilde

Slå sammen

Ingenting å slå sammen

Serie

Match på

  1. Navn

Slå sammen

Ingenting å slå sammen

 

5. Hvordan manifestasjonstyper opprettes

Manifestasjonstypene er basert på en kombinasjon av Verktype, Uttrykkstype og RDA -innhold, RDA -medier og RDA -bærer. RDA -innhold, RDA -media og RDA -bærer hentes fra MARC21-feltene 336 b, 337 b og 338 b. Hvis disse feltene ikke finnes, beregner Quria dem fra MARC21 -kontrollfeltene 000 og 007.

Eksempel 1 (RDA -katalogisert MARC-post)

336  = spw blir:

Verktype: Ord

RDA Innholdstype: Tale (spw)

Denne kombinasjonen resulterer i uttrykkstypen: Lytt til den

337 = lyd eller s - blir RDA Medietype «Lyd»

338 = lydplate eller SD - blir RDA Bærertype «Lydplate».

Sammen resulterer alt dette i en manifestasjonstype Lydbok – CD

 

Eksempel 2 (ikke RDA -katalogisert MARC-post)

leder (000) posisjon 6 = i (Ikke-musikalsk lydopptak) blir

Verktype: Ord

Type RDA-innhold "Tale (spw)"

Denne kombinasjonen resulterer i uttrykkstypen: Lytt til den

007 posisjon 0 = s (Lydopptak) blir RDA Medietype «Lyd»

007 posisjon 1 = d (Lydplate) blir RDA, bærertype «Lydplate».

Sammen resulterer alt dette i en manifestasjonstype Lydbok – CD

6. Datastatus og spesialhåndtering av Libris-poster

Quria bruker bestemte regler ved matching og sammenslåing av MARC -poster fra Libris  (Sveriges nasjonale bibliotekkatalog), basert på datastatusen til metadataene. Dette sikrer at poster med metadata av høyere kvalitet prioriteres og at foreløpige data ikke overskriver mer pålitelig informasjon.

For tiden brukes håndtering av Datastatus bare på poster fra Libris. Etter en valideringsperiode kan denne logikken utvides til å omfatte poster fra andre kilder.

Kategorier for datastatus

Hvert verk, uttrykk og manifestasjon er tildelt en Datastatus, avledet fra MARC -lederfeltet, posisjon 17. Statusen gjenspeiler nivået av fullstendighet og pålitelighet til metadataene.

Kartlegging:

MARC Lederposisjon 17Datastatus

_, #, 1 eller tom

Fullt etablert
7, 8, 2, 3, 4Foreløpig
z, u, 5Forberedende

Disse kategoriene er basert på definisjoner fra RDA Toolkit.

Slå sammen logikk basert på Datastatus

Når en Libris -post matches med ID, gjelder følgende regler:

  • Hvis den innkommende posten har en høyere Datastatus enn det eksisterende verket/uttrykket/manifestasjonen (W/E/M), erstatter den eksisterende data (unntatt beskyttede felt og eksterne identifikatorer).

  • Hvis den innkommende posten har en lavere Datastatus, utføres ingen sammenslåing.

  • Hvis Datastatus er lik:

    • Foreløpig → Foreløpig: sammenslåing utføres.

    • Fullt etablert → Fullt etablert: sammenslåing utføres.

  • Forberedende poster slås aldri sammen, uavhengig av statusen til de eksisterende dataene.

Merknad:
Disse reglene gjelder bare for verk som inneholder en enkelt manifestasjon og bare når de matches avLibris-ID (SE-LIBR).

 

Manuell redigering av Datastatus

Brukere kan justere Datastatus manuelt i grensesnittet Rediger arbeid/uttrykk/manifestasjon. En endring på ett nivå gjelder automatisk for de andre. Dette påvirker imidlertid bare fremtidige sammenslåinger fra Libris , og bare hvis det bare er ett uttrykk og én manifestasjon av verket. Det påvirker ikke oppdateringer fra andre leverandører (f.eks. EKZ eller Melinda).

Standardstatus for eksisterende data

Poster importert før håndtering av Datastatus ble innført (juni 2025) behandles som Foreløpig som standard.