Normdaten einspielen (GND)
Import von Normdaten (DNB)
Im Folgenden erhalten Sie Informationen zum Import von Normdaten. Wenn Sie Normdaten für Schlagworte, Personen oder Körperschaften erhalten, können Sie diese in BIBLIOTHECAnext einspielen.
Die Deutsche Nationalbibliothek (DNB) wird ab Mitte April 2012 die Normdaten in Form der „Gemeinsamen Normdatei“ (GND) im MARC-Format zur Verfügung stellen.
Die Gemeinsame Normdatei (GND) wird von der DNB erstellt. Sowohl das Format als auch die Aufgliederung der Normdaten (Personen-, Körperschaften- und Schlagwortansetzungen) werden von der DNB bestimmt. Die Normdaten werden als zip-Dateien zur Verfügung gestellt und haben entpackt die Endung *.mrc. Der Import der Normdaten (GND) erfolgt über eine Schnittstelle (Datei swdimp.exe).
Zweck des Normdatenimports in BIBLIOTHECAnext ist die Bereitstellung dieser Daten in den Registern Personen, Körperschaften > Orchester und Schlagworte im Katalogmodul.
Hinweise:
- Die Datenbanken sollten angesichts der großen Datenbestände regelmäßig auf Fehler überprüft werden. Statistiken sollten aktuell gehalten werden. Dies kann die Performance bei der Verarbeitung verbessern.
- Beim Einsatz einer SQLBase-Datenbank sollte die Datenbank nach größeren Änderungen reorganisiert werden. Wenden Sie sich an Ihren Systemadministrator oder den OCLC-Support, sofern Ihnen die Datenbank-Reorganisation nicht vertraut ist.
- Initial-Import / Änderungsdienst: Der gesamte Datenbestand wird zunächst vollständig in Form von sieben Dateien, getrennt nach Entitäten, zur Verfügung gestellt. Später wird beim wöchentlichen Änderungsdienst eine komplette Datei der geänderten Daten geliefert.
Voraussetzungen
Beachten Sie folgende Voraussetzungen und Empfehlungen:
- Da die GND insgesamt etwa 9 Millionen Einzeldatensätze enthält, empfehlen wir dringend, die Normdaten in eine eigene Datenbank („Normdatenpool“) einzuspielen. Diese Datenbank enthält keine Titelsätze oder Ausleihvorgänge, sondern wird ausschließlich für die Bereitstellung der Register genutzt. Auf gewohnte Weise kann in der Produktivdatenbank der Zugriff auf diesen Normdatenpool eingerichtet werden, so dass die Normdaten während der Katalogisierung direkt genutzt werden können. Für die Übernahme der Normdaten in die Register der Produktivdatenbank gilt die Beschreibung in der Hilfe-Funktion des Systems.
- Während des Einspielens der Normdaten dürfen keine Katalogisierungen im BIBLIOTHECAnext-System vorgenommen werden.
- Die Normdaten müssen im MARC-Format vorliegen.
- BIBLIOTHECAnext unterstützt Personen-, Körperschafts- und Schlagwortdaten sowie zugehörige Synonyme bis zu einer maximalen Länge von 230 Zeichen. In der MARC-Datei eventuell vorhandene längere Daten werden beim Import auf diese Länge gekürzt.
Achtung: Beachten Sie, dass das initiale Einspielen der GND-Daten sehr lange dauern kann. Planen Sie hierfür mehrere Arbeitstage ein.
GND-Daten importieren
Gehen Sie für einen Import wie folgt vor:
-
Starten Sie das Programm swdimp.exe, das sich im Verzeichnis ..\BIBLIO_CLIENT\BIN befindet.
-
Wählen Sie die Registerkarte MARC21-Import. Sie ist standardmäßig aktiviert.
-
Relevant sind innerhalb des MARC21-Imports folgende Registerkarten:
- Allgemeines
- Optionen
- Datenbankoptionen
Machen Sie alle relevanten Angaben auf diesen Registerkarten. Weitere Informationen: Details zu den Optionen finden Sie in den folgenden Unterkapiteln.
-
Klicken Sie auf Start, um den Import zu starten.
Registerkarte Allgemeines
Im Folgenden erfahren Sie Hinweise zu den Bereichen dieser Registerkarte.
Bereich Konfiguration
Machen Sie Ihre Angaben:
- Datenbank: Eintrag des Namens der Datenbank, in die die Normdatensätze importiert werden sollen.
Wir empfehlen dringend das Anlegen einer (leeren) Datenbank, in die ausschließlich die Normdatensätze importiert werden.
In das Eingabefeld Datenbank muss der Wert eingetragen werden, der sich in der Datei winoeb.ini im Parameter DBNAMEX= befindet und auf Ihre Normdatenbank verweist.
Beispiele:
-
norm
-
gnd@oracle1
-
HUSER1#SERVER1
Wenden Sie sich an Ihren Systemverwalter oder den OCLC-Support, wenn es um das grundsätzliche Einrichten einer neuen, leeren Datenbank geht. Nach dem Import der Normdatensätze in diese Normdatenbank können die Personen-, Körperschafts- oder Schlagwortansetzungen je nach Bedarf in die Produktivdatenbank übernommen werden. Mit Produktivdatenbank ist die Datenbank gemeint, in der der eigene Medienbestand Ihrer Bibliothek katalogisiert wird und z. B. die Ausleihen verbucht werden. Meist trägt diese den Namen „BIBLIO“.
-
Unicode-Datei: Über die Schaltfläche … (Bezeichnung: drei Punkte) kann die Unicode-Datei, deren Inhalt importiert werden soll, ausgewählt werden. Die DNB stellt für die verschiedenen Normdatensätze getrennte Dateien zur Verfügung. Es gibt folgende Dateien:
-
Tb*: Körperschaften (Import in Körperschafts- und Schlagwortregister)
-
Tf*: Kongresse (Import in Körperschafts- und Schlagwortregister)
-
Tg*: Geografika (Import in Körperschafts- und Schlagwortregister)
-
Tn*: Personennamen = nicht individualisierte Personen (Import in Personen- und Schlagwortregister)
-
Tp*: Personen (Import in Personen- und Schlagwortregister)
-
Ts*: Sachbegriffe (Import in Schlagwortregister)
-
Tu*: Werke (Import in Schlagwortregister)
-
Achtung: Die Dateien sind sehr groß. Insgesamt stellt die DNB mehr als 9 Millionen Einträge zur Verfügung.
Da es keine eigene Unicode-Datei für Synonyme mehr gibt, werden in das Schlagwortregister Synonyme aus den zur Verfügung stehenden Datensätzen generiert. Als Grundlage hierfür dienen die Inhalte der MARC-Felder:
-
400 bei Person(individualisiert)
-
400 bei Person (nicht individualisiert)
-
410 bei Werken
-
450 bei Sachbegriffen
-
451 bei Geografikas / Gebietskörperschaften
-
411 bei Kongressen
-
410 bei Körperschaften
-
Optionen: Die GND wird von der DNB in Einzeldateien geliefert (siehe Abschnitt „Unicode-Datei“). Sie entscheiden durch das Kontrollkästchen, in welches BIBLIOTHECAnext-Register importiert werden soll. Aktivieren Sie dazu das entsprechende Kontrollkästchen.
Bei Personen importieren werden Personennormdaten verarbeitet. Wenn Sie versehentlich beim Personenimport auf eine Körperschaftsdatei zurückgreifen, wird dies beim Import erkannt.
Beispiel: Sie aktivieren das Kontrollkästchen Personen importieren, wählen aber als zu importierende Datei versehentlich die Datei TB*.* (Körperschaften). Da bei einem Import alle Einträge auch im Schlagwortregister landen sollen, werden in diesem Beispiel die Körperschaftsansetzungen korrekt ins Schlagwortregister übertragen, aber das Personen- und Körperschaftsregister füllt sich nicht. Die BIBLIOTHECAnext-Register Personen und Körperschaften würden sich nur dann füllen, wenn aktiviertes Kontrollkästchen und ausgewählte Datei jeweils zusammenpassen.
Bereich Verarbeitungsinformationen
Die Felder werden nach Auslösen des Imports mit Klick auf die Schaltfläche Start automatisch befüllt und dokumentieren den Verlauf des Imports.
-
Felder
-
Verarbeite Satz: aktuelle Zeile der Datei
-
von: Gesamtanzahl der Zeilen
-
Anzahl Fehler: Anzahl der Fehler, die während der Verarbeitung aufgetreten sind.
-
Dubletten: Anzahl der Registereinträge, die zum Zeitpunkt des Imports bereits vorhanden waren.
-
Satzstatus (C,D,N,X): Anzahl der jeweiligen Sätze
-
C = Der Datensatz wurde korrigiert und revidiert.
-
D = Der Datensatz wurde gelöscht.
-
N = Der Datensatz ist neu.
-
X = Der Datensatz wurde korrigiert und auf einen anderen umgelenkt.
-
-
Personen- / Körperschafts- / Schlagwortzähler: Anzahl der jeweiligen Sätze
-
Startzeit / aktuelle Zeit / verstrichen: Startzeit, aktuelle Uhrzeit und die seit dem Start vergangene Zeit
-
Endzeit/ Pro Minute / ung. Restzeit: Endzeit, durchschnittl. Anzahl von Datensätzen pro Minute und geschätzte Restzeit. Diese werden ca. alle 3 Sekunden aktualisiert. Die Werte können auf Grund der Daten aus der Datei stark schwanken.
-
Schaltfläche Einstellungen speichern
-
Das Programm kann die Konfiguration über die Schaltfläche Einst. speichern in der Datei winoeb.ini speichern. Dies bedeutet, dass die von Ihnen getroffene Konfiguration beim nächsten Aufruf der Datei swdimp.exe wieder angezeigt wird.
Die Parameter befinden sich im Abschnitt [IMPORT] der Datei winoeb.ini.
Beispiel:
GNDLoggingEnabled=1
GNDLogFile=c:\temp\prot.txt
GNDErrorLoggingEnabled=1
GNDErrorLogFile=c:\temp\error.txt
GNDMARCDatei=C:\Temp\Import\_gnd_testdaten_1-1gnd.mrc
GNDBName=base115
GNDPerson=1
GNDKoerperschaft=1
GNDSchlagwort=1
GNDImportNurUpdate=0
GNDImportAlles=1
GNDImportPool=1
GNDImportDublettenCheckOff=1
GNDImportDublettenCheckNameOnInsertOn=0
GNDImportDublettenCheckReplace=0
GNDCommitCount=100
Registerkarte Optionen
Folgende Optionen stehen Ihnen zur Verfügung:
-
Neue Datensätze einfügen bzw. vorhandene Datensätze aktualisieren: Neue Datensätze werden eingefügt bzw. vorhandene aktualisiert, wenn sich die ID des Datensatzes aus der Datei geändert hat. „ID“ steht für eine eindeutige Identifikationsnummer, die je Normdatensatz von der DNB vergeben wurde.
-
Nur vorhandene Datensätze aktualisieren: Es werden keine neuen Datensätze eingefügt. Bereits vorhandene werden aktualisiert.
-
Gesamte Datei verarbeiten: Ist dieses Kontrollkästchen aktiviert, wird die konvertierte Datei vollständig importiert. Sie können die zu importierenden Zeilen z.B. für Testzwecke auch eingrenzen. Nutzen Sie hierfür die Eingabefelder Start bei Zeile bzw. Anzahl Zeilen verarbeiten.
-
Start bei Zeile: Geben Sie den gewünschten Startpunkts des Importvorgangs ein.
-
Anzahl Zeilen verarbeiten: Geben Sie die Anzahl der Zeilen an, nach der der Import enden soll. Es wird also nur eine bestimmte Anzahl von Zeilen der Eingabedatei verarbeitet.
-
Bereich Logging
Das Programm kann Protokolldateien anlegen, die einerseits die Verarbeitungsinformationen, andererseits auftretende Fehler beinhalten.
-
Protokoll aktivieren: Es werden Verarbeitungsinformationen in eine Datei geschrieben, die an dieser Stelle angegeben wird, einschließlich Pfadangabe, z.B. C:\biblio\gnd.log.
Achtung: Diese Datei kann, je nach Anzahl der zu importierenden Zeilen, sehr groß werden (im Gigabyte-Bereich). -
Fehlerprotokoll aktiv: Es werden Fehlerinformationen in eine Datei geschrieben, die an dieser Stelle angegeben wird, einschließlich Pfadangabe, z.B. C:\biblio\error.log.
Achtung: Diese Datei kann, je nach Anzahl der zu importierenden Zeilen, sehr groß werden.
-
Bereich Dublettenkontrolle
Eine Dublettenkontrolle kann ausgeführt werden, wenn Sie nicht in einen Normdatenpool, sondern in Ihre Hauptdatendank importieren. Die Dublettenkontrolle wird auf Basis von exakter Namensgleichheit der Normdateneinträge durchgeführt. -
Ich importiere in einen Datenpool (nicht Hauptdatenbank):
Die Daten werden in einen gesonderten Datenpool (Datenbank / Instanz) importiert, der nicht der Hauptdatenbank (Produktivdatenbank) der Bibliothek entspricht. Dieser Datenpool wird auch als Normdatenpool bezeichnet. Der Begriff „Datenpool“ bedeutet, dass eine zweite Datenbank für den Import der Normdaten verwendet wird.Achtung! Wir empfehlen dringend diese Vorgehensweise, aus den bereits in den vorherigen Kapiteln beschriebenen Gründen.
In der Produktivdatenbank wird im Einstellungsmodul unter Konfiguration (Sys) > Direkteinstellung > Katalog über die Parameter RegDBPers, RegDBUrh bzw. RegDBSchlag der Name des Normdatenpools hinterlegt. Während des Katalogisierungsvorgangs in der Produktivdatenbank kann dann auf die Normdaten zurückgegriffen werden.
Die folgenden Optionen sind nur relevant, wenn Sie nicht in einen Normdatenpool, sondern in Ihre Produktivdatendank importieren. Diese Vorgehensweise wird allerdings nicht von uns empfohlen.
-
Keinen Dublettencheck ausführen: Es wird keine Dublettenkontrolle durchgeführt.
-
Dublettenprüfung über den Namen (es werden keine neuen Sätze mit dem gleichen Namen eingespielt): Die Dublettenkontrolle wird auf Basis von exakter Namensgleichheit der Normdateneinträge durchgeführt.
-
Die Option Vorhandene Dubletten ersetzen bewirkt, dass selbst erfasste Registereinträge durch jene der Datei ersetzt werden. Die Bezeichnung muss dabei gleich sein. Wenn zusätzlich die Option Nur vorhandene Datensätze aktualisieren aktiviert ist, werden die selbst erfassten Registereinträge dennoch aktualisiert.
Hinweis: Suchtabellen müssen über das Einstellungsmodul unter Systempflege > Suchtabellen aktualisieren angepasst werden.
-
Bereich Importdatei splitten
Ein Klick auf die Schaltfläche Datei splitten bewirkt, dass die Eingabedatei, die unter Dateiname eingetragen oder ausgewählt wurde, in mehrere Dateien aufgeteilt wird. Die Anzahl der Zeilen je Datei kann eingegeben werden. Die Funktion ist sinnvoll, wenn Sie eine Originaldatei der DNB nicht sofort vollständig konvertieren und importieren möchten, sondern zunächst kleinere Datenpakete z.B. zu Testzwecken in den Normdatenpool einspielen möchten.
Registerkarte Datenbankoptionen
In dieser Registerkarte können Sie Datenbankeinstellungen für die Verarbeitung vornehmen.
-
Bereich Allgemein
Die Option Commit nach [n] Zeilen durchführen bewirkt, dass die Daten erst nach der Anzahl von [n]-Zeilen tatsächlich in der Datenbank gespeichert werden. Diese Einstellung kann die Verarbeitungsgeschwindigkeit stark beeinflussen. Empfohlen wird ein Wert zwischen 1 und 100 (1 = Verarbeitung wird langsamer / 100= Verarbeitung wird schneller).
-
Bereich SqlBase (ggf. sind Systemrechte erforderlich)
Nehmen Sie die Einstellungen für SQLBase vor: -
Schaltfläche Statistiken aktualisieren: Es werden die Datenbankstatistiken aktualisiert, die für die Verarbeitung von der Datenbank verwendet werden. Die Ausführung kann je nach Datenbankgröße entsprechend lange dauern.
-
Schaltfläche Datenbank prüfen: Die Datenbank wird auf Fehler geprüft. Die Ausführung kann je nach Datenbankgröße entsprechend lange dauern.
-
Optionen Datenbank entsperren bzw. Datenbank exklusiv sperren: Während der Verarbeitung kann sich sonst niemand an die Datenbank anmelden. Das kann die Performance verbessern. Nach Programmende wird die Sperre wieder aufgehoben.