Abgleich- und Zusammenführungsregeln für den Import von MARC Datensätzen

Dieser Abschnitt enthält Informationen zur Verarbeitung importierter MARC Datensätze während ihrer Umwandlung in verknüpfte Daten.

  1. Einführung

  2. Beispiele für die häufigsten Fehler und die häufigsten Erklärungen hierzu

  3. Abgleich und Zusammenführung von Werken, Expressionen und Manifestationen

  4. Abgleich und Zusammenführen von anderen Einheiten

  5. Vorgehensweise zur Erstellung von Manifestationsarten

  6. Datenstatus und besondere Verarbeitung von Libris Datensätzen

1. Einführung

Wenn ein MARCDatensatz inQuria importiert wird, wird er in das Format von Quria umgewandelt und mit den bereits in den Sammlungen vorhandenen Daten abgeglichen. Der Abgleich wird in mehreren Schritten durchgeführt.

Zunächst wird die sogenannte Externe Kennung verglichen. Die externe Kennung ist der Wert, der oft als Datensatz-ID (MARC-Feld 001) bezeichnet und mit dem Anbieter des Datensatzes (zum Beispiel Libris, DNB, Bibbi) kombiniert wird. Dies dient der Vermeidung von Duplikaten, wenn Sie einen Anbieter haben, der Ihnen Aktualisierungen zu bereits vorhandenen Katalogdatensätzen schickt, wenn Sie Datensätze manuell importieren, um die neuesten Versionen davon zu erhalten, oder wenn Sie versehentlich einen Datensatz importieren, den Sie bereits in den Sammlungen haben. Auch das Feld 035 wird als externe Kennung betrachtet.

Anschließend wird ein vollständiger sogenannter Werk-Expression-Manifestation (WEM)-Abgleich durchgeführt. Diese Routine schafft die Verbindung zwischen den Werken und ihren Expressionen und Manifestationen.

Weiter unten auf dieser Seite finden Sie detaillierte Informationen über die einzelnen Schritte sowie über die Daten, die in den Datensätzen erforderlich sind, damit Quria die Verknüpfungen erfolgreich erstellen kann. Quria verlässt sich auf die Rohdaten in den MARC Datensätzen, und wenn diese Daten nicht korrekt sind, kann der Abgleich fehlschlagen oder ungenaue Ergebnisse liefern.

2. Beispiele für die häufigsten Fehler und die häufigsten Erklärungen hierzu

In Fällen, in denen Werke hätten zusammengeführt werden sollen, werden getrennte Werke erstellt

  • Originaltitel fehlt

  • Geistiger Schöpfer wird anders buchstabiert

  • Art des Werks ist unbekannt

  • Geistiger Schöpfer fehlt

Getrennte Expressionen werden in den Fällen erstellt, in denen sie hätten abgeglichen werden müssen

  • MitwirkendeR (ÜbersetzerIn, ErzählerIn usw.) fehlt oder ist nicht in Feld 700 erfasst

  • Sprache fehlt

  • Expressionsart ist unbekannt

Getrennte Titel werden zu einem Werk zusammengeführt

  • Dies ist häufig auf eine Katalogisierungspraxis zurückzuführen, bei der ein Reihentitel in das Feld für den Haupttitel (245 a) geschrieben wird, ohne sonstige Informationen, die die Werke voneinander unterscheiden.

  • Dies kann auch bei der Übersetzung eines Titels der Fall sein, wenn das Original in einem Band und die Übersetzungen in mehreren Bänden veröffentlicht werden. Der Titel des Werks ist dann für mehrere Bände gleich. Diese Fehler treten häufig in Manga-Serien und Fantasy-Romanen auf, können aber auch sonstiges Material betreffen.

3. Abgleich und Zusammenführung von Werken, Expressionen und Manifestationen

Schritt 1.  Kennung für die Manifestation

Zunächst werden die externen Kennungen in den eingehenden Datensätzen mit den bereits in Quria vorhandenen Kennungen verglichen. Eine Manifestation kann mehrere Kennungen haben. Eine externe Kennung besteht aus mehreren Teilen und setzt sich aus MARC21-Feld 001+003 und/oder 035 zusammen.

Dieser Beispieldatensatz hat 2 Kennungen:

*00009459cam a22005537i 4500

*00119983205

*003SE-LIBR

*00520201116103129.0

*008170110s2016    gw a||||||||||001 0|ger|d

*020  $a9783110457964$q(hardbound)

*035  $a(OCoLC)ocn953768170

In Quria:

IdentifierValue: "19983205”

IdentifierAssigner: "SE-LIBR"

IdentifierValue: " ocn953768170”

IdentifierAssigner: " OCoLC”

Stimmt ein eingehender Datensatz mit einem der externen Kennungen einer bestehenden Manifestation überein, wird der neue Datensatz als Aktualisierung dieser Manifestation betrachtet.

Dies bedeutet, dass das Werk, die Expression und die Manifestation mit Informationen aus diesem neuen Datensatz aktualisiert werden. Nachfolgend finden Sie Informationen zu den Zusammenführungen der einzelnen Ebenen.

Anmerkung:
Für Datensätze von Libris (SE) gilt eine besondere Zusammenführungslogik. Siehe unten.

Wenn der eingehende Datensatz nicht mit einem der externen Kennungen einer bestehenden Manifestation übereinstimmt, wird Schritt 2 ausgeführt.

Wenn in einem Datensatz eine 001, aber keine 003 vorhanden ist, wird Quria manual auf Assigner gesetzt:

IdentifierValue: "12343434”

IdentifierAssigner: "Quria manual"

Quria manual wird nicht als definierter Zuweiser betrachtet, und diese Kennungen werden nicht für den Abgleich verwendet.

Schritt 2.  WEM-Abgleich

Wenn keine Übereinstimmung mit der Kennung für die Manifestation besteht, ist der nächste Schritt die Durchführung des sogenannten WEM-Abgleichs.

Wichtig: Dieser Schritt wird nicht für Datensätze ohne geistigen Schöpfer (MARC Feld 100, 110 oder 111) durchgeführt. Für diese Datensätze ist Schritt 3 unten der nächste Schritt.

Werk – Abgleich

Zunächst prüft Quria, ob dieser Datensatz mit einem bestehenden Werk abgeglichen werden kann. Die Kriterien für die Übereinstimmung für das Werk sind:

  1. Titel (MARC: 240 a+p+m+r, wenn kein 240 vorhanden – 245 a verwenden)

  2. Geistiger Schöpfer (MARC: 100 a/110 a/111 a)

  3. Art des Werks (basierend auf dem RDA Inhaltstyp, der in MARC 336 b enthalten ist oder aus dem MARC Leader (Feld 000) Position 6 berechnet wird).

Alle drei Elemente müssen übereinstimmen. Das bedeutet, dass die drei Werte in einem bestehenden Werk in Quria mit den drei Werten im eingehenden Datensatz übereinstimmen müssen.

Beispiel für zwei Datensätze, die als dasselbe WERK angesehen werden:

*00020875cam a2203721 i 4500

*00120750532

*008170426s2017    sw            000 f eng d

*020  $a978-0-09-951166-3

*08204$a813.54$223

*1001 $aAtwood, Margaret,$d1939-$4aut

*24510$aThe handmaid's tale/$cMargaret Atwood

*264 1$aLondon$b Vintage Classic$c 2010

*000

*00121689762

*008171011s2018    sw |||||||||||000 f|swe|c

*020  $a9789113082905$qpocket

*0411 $aswe$heng

*08204$a823$222 (machine generated)

*1001 $aAtwood, Margaret,$d1939-$4aut

*24014$aThe handmaid's tale.$lSvenska

*24510$aTjänarinnans berättelse /$cMargaret Atwood ; översättning: Maria Ekman.

*264 1$a[Stockholm] :$bNorstedts,$c2018

*300  $a363 sidor$c18 cm

*336  $atext$btxt$2rdacontent

*337  $aunmediated$bn$2rdamedia

*338  $avolume$bnc$2rdacarrier

*7001 $aEkman, Maria,$d1944-$4trl

Werk – Zusammenführen

Wenn ein übereinstimmendes Werk gefunden wird, werden die neuen Werkelemente wie folgt mit dem bestehenden Werk zusammengeführt:

  • DateOfWork wird mit dem frühesten DateOfWork aktualisiert

  • Wiederholbare Elemente werden hinzugefügt (sofern sie nicht bereits vorhanden sind)

  • Bestehende nicht wiederholbare Elemente werden aktualisiert

  • Nicht wiederholbare Elemente werden hinzugefügt, wenn sie nicht vorhanden sind

Wird kein passendes Werk gefunden, werden ein neues Werk, eine neue Expression und eine neue Manifestation erstellt.

Wiederholbare Werkelemente: Klassifikationen, Themen (alle), Genres, Besetzung, Beziehungen, Anmerkungen zur Ressource, Beschreibungen

Nicht wiederholbare Werkelemente: Titel, Art des Werks, geistiger Schöpfer, Datum eines Werkes.

Expression – Abgleich

Anschließend prüft Quria, ob dieser Datensatz mit einer bestehenden Expression im abgeglichenen Werk übereinstimmt. Die Kriterien für die Übereinstimmung von Expressionen sind:

  1. Expressionsart (berechnet aus dem RDA Inhaltstyp)

  2. RDA Inhaltstyp (MARC: 336 b. Wenn 336 nicht vorhanden ist, wird Leader 000/06 verwendet, um den RDA Inhaltstyp festzulegen.)

  3. Sprache (MARC: 1. Hand 008/35-37, 2. 041$a)

  4. MitwirkendeR: (MARC 700/710/711)

Alle vier Elemente müssen übereinstimmen. Das bedeutet, dass, wenn z. B. die Sprache im eingehenden Datensatz fehlt, es keine Übereinstimmung gibt und der neue Datensatz eine neue Expression erzeugt. Die Expressionen werden auch abgeglichen/zusammengeführt, wenn ein eingehender Datensatz dieselbe ISBN wie eine der zugrunde liegenden Manifestationen hat.

Beispiel für zwei Datensätze, die als dieselbe Expression betrachtet werden:

*00015739cam a2202785 i 4500

*00121689762

*008171011s2018    sw |||||||||||000 f|swe|c

*020  $a9789113082905$qpocket

*0411 $aswe$heng

*08204$a823$222 (machine generated)

*1001 $aAtwood, Margaret,$d1939-$4aut

*24014$aThe handmaid's tale.$lSvenska

*24510$aTjänarinnans berättelse /$cMargaret Atwood ; översättning: Maria Ekman.

*264 1$a[Stockholm] :$bNorstedts,$c2018

*300  $a363 sidor$c18 cm

*336  $atext$btxt$2rdacontent

*337  $aunmediated$bn$2rdamedia

*338  $avolume$bnc$2rdacarrier

*7001 $aEkman, Maria,$d1944-$4trl

*00020875cam a2203721 i 4500

*00120750532

*008170426s2017    sw            000 f swe d

*020  $a 9789113082905$qpocket

*0411 $aswe$heng

*08204$a813.54$223/swe

*1001 $aAtwood, Margaret,$d1939-$4aut

*24014$aThe handmaid's tale.$lSvenska

*24510$aTjänarinnans berättelse /$cMargaret Atwood ; översättning: Marie Ekman.

*264 1$aStockholm:$bNorstedts,$c2017

*7001 $aEkman, Maria,$d1944-$4trl

Expression – Zusammenführen

Wird eine übereinstimmende Expression gefunden, werden die neuen Expressionselemente wie folgt mit der bestehenden Expression zusammengeführt:

  • Das Erscheinungsjahr wird mit dem frühesten CreatedYear aktualisiert

  • Der Titel der Expression wird mit dem Titel aus 245 aktualisiert

  • Wiederholbare Elemente werden hinzugefügt (sofern sie nicht bereits vorhanden sind)

  • Bestehende nicht wiederholbare Elemente werden aktualisiert

  • Nicht wiederholbare Elemente werden hinzugefügt, wenn sie nicht vorhanden sind

Wiederholbare Expressionselemente: MitwirkendeR, Weitere Sprachen, Abweichende Titel der Expression, Anmerkungen zur Ressource

Nicht wiederholbare Expressionselemente: Titel, RDA Inhaltstyp, Expressionsart, Erscheinungsjahr

Manifestation – Abgleich

Der letzte Schritt des WEM-Abgleichs besteht darin, die Manifestation innerhalb des abgeglichenen Werks und der abgeglichenen Expression abzugleichen. Die Kriterien für die Übereinstimmung für Manifestationen sind:

  1. Manifestationsart (siehe die Erklärung unten, wie diese erstellt werden)

  2. RDA Medientyp

  3. RDA Datenträgertyp

  4. Titel (MARC: 245 a)

  5. Erscheinungsjahr (aus dem Publikationsvermerk, Feld Jahr, das aus MARC 260 c/264 c stammt) (außer bei Zeitschriften)

  6. ISBN (wenn der importierte Datensatz mehr als eine ISBN hat, muss mindestens eine übereinstimmen)

Alle Elemente müssen übereinstimmen. Das bedeutet, dass, wenn z. B. das Erscheinungsjahr im eingehenden Datensatz fehlt, es keine Übereinstimmung gibt und der neue Datensatz eine neue Manifestation erstellt.

Anmerkung:
Der ISBN Abgleich prüft hier nur auf ISBN im aktuellen Werk. In Schritt 3 gehen wir zurück und suchen nach ISBN in anderen Werken, die nicht über ID oder WEM-Abgleich abgeglichen wurden.

Manifestation – Zusammenführen

Wenn eine übereinstimmende Manifestation gefunden wird, werden die neuen Manifestationselemente wie folgt mit der bestehenden Manifestation zusammengeführt:

  • Wiederholbare Elemente werden hinzugefügt (sofern sie nicht bereits vorhanden sind)

  • Bestehende nicht wiederholbare Elemente werden aktualisiert. Nicht wiederholbare Elemente werden hinzugefügt, wenn sie nicht vorhanden sind

Wiederholbare Manifestationselemente: Zusatz zum Sachtitel, Name des Teils, Nummer des Teils, Abweichender Titel, Ausgabe, Publikationsvermerk, Internationale Standardbuchnummern, URLs, Reihen, Anmerkungen zur Ressource, Zielgruppen.

Nicht wiederholbare Manifestationselemente:Titel, Verfasserangabe, Regal, Zielgruppe, literarische Form, RDA Manifestationsart, RDA Datenträgertyp, Umfang, Dauer, Ausgabemedium, Überschrift, Dauer, Beitrittsdatum.

 

Schritt 3. ISBN

Wenn ein importierter Datensatz beim WEM-Abgleich keine Übereinstimmung findet, wird ISBN mit den bestehenden ISBN in den Sammlungen verglichen.

Wenn ein Abgleich gefunden wird, werden die Haupttitel verglichen, d. h. TitleKey, was eine Anhäufung mehrerer Einzelheiten zum Titel ist: In Quria – Eigener Titel, Zusatz zum Sachtitel, Titel des Teils, Nummer des Teils, im eingehenden MARC-Datensatz - 245 a+b+n+p.

Wenn diese Informationen in den Manifestationen übereinstimmen, wird eine Zusammenführung der Manifestationen durchgeführt

Wenn die Haupttitel unterschiedlich sind, wird ein neues Werk mit Expression und Manifestation erstellt.

Der Abgleich des Haupttitels dient dazu, unerwünschte Zusammenführungen von Titeln mit falscher ISBN zu verhindern, oder Fälle, in denen die ISBN der einzelnen Teile einer mehrteiligen Monografie in einem gemeinsamen Eintrag registriert werden, der in Quria importiert wird.

4. Abgleich und Zusammenführen von anderen Einheiten

Person

Abgleich

  • Wenn die eingehende PersonRef Folgendes enthält: nur einen Namen:

    Abgleich mit bestehenden PersonRef Einträgen, die ebenfalls nur einen Namen enthalten.

    Bei mehreren Übereinstimmungen:

    • Verwenden Sie diejenige, die nur einen Namen enthält, falls vorhanden.

    • Verwenden Sie andernfalls eine beliebige.

  • Wenn die eingehende PersonRef zusätzliche Elemente enthält (z. B. Titel, Datum):

    Führen Sie den Abgleich in der folgenden Reihenfolge durch:

    1. Persönlicher Name + Normalisierter Titel + Datum

    2. Persönlicher Name + Normalisierter Titel

    • Wenn kein Titel vorhanden ist, fahren Sie mit Schritt 3 fort.

    • Bei Übereinstimmung: Zusammenführen und Hinzufügen fehlender Elemente

    3. Persönlicher Name + Datum

    • Bei Übereinstimmung: Zusammenführen und Hinzufügen fehlender Elemente

    • Wenn keine Übereinstimmung: weiter zu Schritt 4

    4. Nur persönlicher Name

    • Abgleich mit vorhandenen Einträgen nur mit dem Namen

    • Bei Übereinstimmung: Zusammenführen und Hinzufügen fehlender Elemente

Zusammenführen

Fügen Sie alle Elemente der eingehenden Person hinzu, die nicht bereits bei der übereinstimmenden Person vorhanden sind.

 

Themen

Übereinstimmung bei

  1. subject

  2. Quelle

  3. Untergliederung chronologisch

  4. Untergliederungsform

  5. Untergliederung allgemein

  6. geografische Untergliederung

Zusammenführen

Wiederholbare Elemente werden hinzugefügt:

  • Übergeordnete Begriffe

  • Abweichende Begriffe

  • Verwandte Begriffe

  • Sonstige Informationen

  • externe Kennung

Veranstaltung

Übereinstimmung bei

  1. NameKey

  2. Typ

Zusammenführen

Nicht wiederholbare Elemente werden hinzugefügt, wenn sie nicht vorhanden sind.

 

Organisation

Übereinstimmung bei

  1. NameKey (Einheit + untergeordnete Einheiten)

Zusammenführen

Wiederholbare Elemente werden hinzugefügt:

  • Abweichende Begriffe

  • Verwandte Begriffe

  • Sonstige Informationen

  • externe Kennung

Platz

Übereinstimmung bei

  1. Ortsschlüssel

  2. Quelle

  3. Untergliederungen, Form

  4. Untergliederungen, geografisch

  5. Untergliederungen, allgemein

Zusammenführen

Folgende wiederholbare Elemente werden hinzugefügt:

  • Abweichende Begriffe

  • Verwandte Begriffe

  • Sonstige Informationen

  • externe Kennung

Formschlagwort

Übereinstimmung bei

  1. Zahl

  2. Schema

Zusammenführen

Nichts zusammenzuführen

Angestrebte Zielgruppe

Übereinstimmung bei

  1. Begriff

  2. Quelle

Zusammenführen

Nichts zusammenzuführen

Genre

Übereinstimmung bei

  1. Genre

  2. Quelle

Zusammenführen

Nichts zusammenzuführen

Serie

Übereinstimmung bei

  1. Name

Zusammenführen

Nichts zusammenzuführen

 

5. Vorgehensweise zur Erstellung von Manifestationsarten

Die Manifestationsarten basieren auf einer Kombination aus Art des Werks, Expressionsart und RDA Inhalt, RDA Medien und RDA Datenträger. RDA Inhalt, RDA Medien und RDA Datenträger werden aus den MARC21-Feldern 336 b, 337 b und 338 b übernommen. Wenn diese Felder nicht vorhanden sind, werden sie von Quria aus den MARC21 -Kontrollfeldern 000 und 007 berechnet.

Beispiel 1 (RDA -katalogisierter MARC-Datensatz)

336  = spw ergibt:

Art des Werks: Wörter

RDA Inhaltstyp: Gesprochenes Wort

Diese Kombination ergibt die Expressionsart: Werk anhören

337 = Audio oder s – ergibt RDA Manifestationsart „Audio (s)“

338 = Audiodisk oder sd – ergibt RDA Datenträgertyp „Audiodisk (sd)“.

All dies zusammen ergibt eine Manifestationsart Hörbuch – CD

 

Beispiel 2 (nicht RDA -katalogisierter MARC-Datensatz)

Leader(000) Position 6 = i (Nicht-musikalische Tonaufzeichnung) ergibt

Art des Werks: Wörter

RDA Inhaltstyp „Gesprochenes Wort“

Diese Kombination ergibt die Expressionsart: Werk anhören

007 Position 0 = s (Tonaufzeichnung) ergibt die RDA Manifestationsart „Audio (s)“

007 Position 1 = d (Audiodisk (sd)) wird zum RDA Datenträgertyp „Audiodisk (sd)“.

All dies zusammen ergibt eine Manifestationsart Hörbuch – CD

6. Datenstatus und besondere Behandlung von Libris-Datensätzen

Quria wendet beim Abgleich und der Zusammenführung von MARC Datensätzen ausLibris (Schwedens landesweitem Bibliothekskatalog) spezifische Regeln an, die auf dem Datenstatus der Datensatzdetails basieren. Auf diese Weise wird sichergestellt, dass Datensätze mit höherwertigen Datensatzdetails vorrangig behandelt werden und dass vorläufige Daten nicht zuverlässigere Informationen überschreiben.

Derzeit wird der Datenstatus nur auf Datensätze von Libris angewendet. Nach einer Validierungsphase kann diese Logik auch auf Datensätze aus anderen Quellen ausgeweitet werden.

Kategorien von Datenstatus

Jedem Werk, jeder Expression und Manifestation wird ein Datenstatus zugewiesen, der aus dem MARC Leader-Feld, Position 17, abgeleitet wird. Der Status spiegelt den Grad der Vollständigkeit und Zuverlässigkeit der Datensatzdetails wider.

Kartierung:

MARC -Leader, Position 17Datenstatus

_, #, 1, oder leer

Vollständig eingerichtet
7, 8, 2, 3, 4Vorläufig
z, u, 5Vorübergehend

Diese Kategorien beruhen auf den Definitionen von RDA Toolkit.

Zusammenführungslogik basierend auf dem Datenstatus

Wenn ein Libris Datensatz nach ID abgeglichen wird, gelten die folgenden Regeln:

  • Wenn der eingehende Datensatz einen höheren Datenstatus hat als das vorhandene Werk/die vorhandene Expression/die vorhandene Manifestation (W/E/M), ersetzt er die vorhandenen Daten (mit Ausnahme geschützter Felder und externer Kennungen).

  • Wenn der eingehende Datensatz einen niedrigeren Datenstatus hat, erfolgt keine Zusammenführung.

  • Wenn der Datenstatus gleich ist:

    • Vorläufig → Vorläufig: Die Zusammenführung wird durchgeführt.

    • Vollständig eingerichtet → Vollständig eingerichtet: Die Zusammenführung wird durchgeführt.

  • Vorübergehende Datensätze werden nie zusammengeführt, unabhängig vom Status der vorhandenen Daten.

Anmerkung:
Diese Regeln gelten nur für Werke, die eine einzige Manifestation enthalten, und nur, wenn sie mit Libris-ID (SE-LIBR) übereinstimmen.

 

Manuelle Bearbeitung des Datenstatus

Benutzer können den Datenstatus in der Schnittstelle Werk/Expression/Manifestation bearbeiten manuell anpassen. Eine Änderung auf einer Ebene wirkt sich automatisch auf die anderen Ebenen aus. Dies betrifft jedoch nur künftige Zusammenführungen von Libris und nur, wenn es nur eine Expression und eine Manifestation des Werks gibt. Die Änderung hat keinen Einfluss auf Aktualisierungen von anderen Anbietern (z. B. EKZ oder Melinda).

Standardstatus für vorhandene Daten

Datensätze, die vor der Einführung der Datenstatus-Bearbeitung (Juni 2025) importiert wurden, werden standardmäßig als vorläufig verarbeitet.