Nachschlagewerke-Export für Goobi

Aus Allegro
Wechseln zu: Navigation, Suche

1 Umfang des Projekts[Bearbeiten | Quelltext bearbeiten]

  • 24 Nachschlagewerke
  • 66 Bände
  • ca. 25.637 Artikel

1.1 Zu importierende Nachschlagewerke[Bearbeiten | Quelltext bearbeiten]

siehe Übersichtsartikel: SPO-Lexikadaten_-_XML_Export

2 Vorab Korrekturen in Allegro[Bearbeiten | Quelltext bearbeiten]

3 Lexikonartikel in Tabellenübersicht[Bearbeiten | Quelltext bearbeiten]

  • Goobi-Lexikonartikel_20111104-1623.xlsx
  • Goobi-Lexikonartikel_20111104-1623_Aufbereitet.xlsx (zur Fehlersuche geeignet)
Suchmuster für Tabellenaufbereitung: RegEx Nachschlagewerke Tabelle
  • die Suchanfrage in Allegro #8z + #84 ergab 25.638 Treffer
  • Hinweis zur Feldbelegung: Feld #42 nicht vorhanden, Feld #41 nur einmal belegt, Feld #43 nur achtmal belegt
  • 123 Datensätze enthalten im Titelfeld #20 Nichtsortierzeichen

4 Nachschlagewerke und Mapping Metadatenfelder und Allegro-C-Kategorien[Bearbeiten | Quelltext bearbeiten]

siehe: Nachschlagewerke und Mapping Metadatenfelder und Allegro-C-Kategorien

5 Planung des Importers[Bearbeiten | Quelltext bearbeiten]

5.1 Initialimport[Bearbeiten | Quelltext bearbeiten]

Der InitialImport ist diesmal kein eigenständiges Script, sondern ein Goobi-Plugin (wie auch das AllegroUpdatePlugin). D.h. Sie wählen in Goobi unter Produktionsvorlagen beim entsprechenden Vorgang die Aktion "Massenimport" aus, und anschließend den Reiter "Dateiupload-Import". Hier können Sie das Plugin "DIPF Nachschlag - Initial Import" in der Drop-Down Liste auswählen, und die zu importierende Allegro-Datei in das Feld Dateiupload-Import eintragen. Dann auf "Datei hochladen" und schließlich "Speichern". Es kann einige Zeit dauern, bis der Vorgang vollständig bearbeitet ist (aber nicht mehr als 5-10min, denke ich). Am Ende taucht in jedem Fall eine Erfolgs- /Misserfolgsmeldung auf.

Der Import erwartet die zum Werk gehörigen Bilddateien in dem in der "config_dipf_nachschlag_import_export.xml"-Datei unter <imageRoot> [bei uns /opt/digiverso/goobi/metadata/] definierten Pfad (evtl. in Unterordnern). Die Bilder müssen vorhanden sein, damit der Import erfolgreich ist. Also am besten noch einmal diese Datei anschauen, um sicherzustellen, dass der korrekte Pfad eintragen wurde. Die config-Datei liegt im Ordner "/opt/digiverso/goobi/config/").

5.1.1 CollectedEdition (Sammelwerk)[Bearbeiten | Quelltext bearbeiten]

Bei einbändigen Nachschlagewerken macht Goobi eine Monographie draus. Das muß in der XML-Datei nochmal manuell geändert werden. Statt "Monograph" soll dort "CollectedEdition" stehen. Dieser Begriff wirde im Viewer in "Sammelwerk" übersetzt.

Anleitung

In den meta.xml Dateien der importierten Bände muss in der Sektion mets:structMap TYPE="LOGICAL" im ersten mets:div TYPE="Monograph" in TYPE="CollectedEdition" geändert werden.

5.2 UpdateImport[Bearbeiten | Quelltext bearbeiten]

Funktioniert genau so die der InitialImport. Als Plugin wählen Sie jetzt "DIPF Nachschlag - UPDATE". Der vorhandene Goobi-Vorgang wird mit den neuen Daten ersetzt (und die alten Daten in einer Backup-Datei gespeichert). Bilder sind hierfür natürlich nicht nötig.

5.3 GoobiExport für Allegro[Bearbeiten | Quelltext bearbeiten]

Sollte genau so wie der DIPFAllegroExport.jar bei den Zeitschriften funktionieren. Was auf jeden Fall geht, ist, auf dem Goobi-Server die Datei "/opt/digiverso/goobi/metadata/exportNachschlag.sh" ausführen, und zwar entweder mit dem Parameter "ALL", um alle Goobi-Prozesse zu exportieren, also so:

/opt/digiverso/goobi/metadata/exportNachschlag.sh ALL

oder mit dem Parameter "goobiids.txt", wobei goobiids.txt eine Datei im selben Ordner sein muss, die die IDs der gewünschten Prozesse enthält.

/opt/digiverso/goobi/metadata/exportNachschlag.sh goobiids.txt

Die exportierten Allegro-Dateien werden dann in dem Ordner abgelegt, der in "config_dipf_nachschlag_import_export.xml" unter <outputfolder> festgelegt wurde.

MaWü: ist füge dem Befehl noch eine Ausgabeumlenkung in eine Logdatei an.

./exportNachschlag.sh goobiids.txt > exportNachschlag-xyz-20120320.log 2>&1

5.4 Regelsatz für Nachschlagewerke[Bearbeiten | Quelltext bearbeiten]

Es ist die Verwendung des Regelsatz „allegro.xml“ festgelegt.

6 Datensatztypen für Programmierung[Bearbeiten | Quelltext bearbeiten]

6.1 Hauptsatz (Gesamtwerk)[Bearbeiten | Quelltext bearbeiten]

nachschlagewerkhauptsatz_20111123.jpg

6.2 Untersatz (Bandsatz)[Bearbeiten | Quelltext bearbeiten]

nachschlagewerkuntersatz_20111123.jpg

6.3 Artikel[Bearbeiten | Quelltext bearbeiten]

nachschlagewerkartikel_20111123.jpg

7 Sonstige Planungen[Bearbeiten | Quelltext bearbeiten]

7.1 Planung der Banderkennung über Allegro-feld: 8z[Bearbeiten | Quelltext bearbeiten]

<feld nr="8z" lb="Speicheradresse">\89171201\00000017.gif - 00000018.gif</feld> Im Ordnernamen sind die beiden letzten Ziffern 01 die Codierung der Bandnummer.

7.2 Planung der Paginiererkennung über Allegro-feld: 708[Bearbeiten | Quelltext bearbeiten]

Wir verweisen auf diese Erkennungsmuster-Regelung Allegro-Export_für_Goobi#Strukturinformation_.C3.BCber_allegro-feld:_708_Paginierung. Die gilt noch.

7.3 Planung der Importer-Konfigurationsdatei[Bearbeiten | Quelltext bearbeiten]

config_dipf_nachschlag_import_export.xml

7.4 Planung des Regelsatzes[Bearbeiten | Quelltext bearbeiten]

Wir benutzen erstmal den Regelsatz allegro.xml, der für die Zeitschriftenartikel der SPO-Migrationsdaten gilt. Dieser muss eigentlich nicht kopiert werden. Die Regeln können auch für die Nachschlagewerke gelten.

8 Bespieldatensätze Allegro-C[Bearbeiten | Quelltext bearbeiten]

8.1 Beispieldatensatz Band[Bearbeiten | Quelltext bearbeiten]

siehe Nachschlagewerke_und_Mapping_Metadatenfelder_und_Allegro-C-Kategorien#Band
wie sieht die SRU Datenbankabfrage aus?

Hinweis: Klicken Sie auf Bandübersicht für die Anzeige der Bände Bandübersicht

8.2 Beispieldatensatz Artikel[Bearbeiten | Quelltext bearbeiten]

siehe Nachschlagewerke_und_Mapping_Metadatenfelder_und_Allegro-C-Kategorien#Artikel

9 XML-Exporte aus Allegro-C[Bearbeiten | Quelltext bearbeiten]

Nachschlagewerke XML-Export aus Allegro

9.1 Anleitung Export aus Allegro[Bearbeiten | Quelltext bearbeiten]

Beispiel für Signatur 1a05

Im Register 10 ALT+0135\1a05 ? eingeben(= Export der Artikel und der Bände bzw. wenn keine Bände vorhanden dann nur das Gesamtwerk z.B.\t4729601=1226728281 nehmen). Sind Bände vorhanden muß zusätzlich über das Register 9 Identnummer des Gesamtwerkes, der Datensatz "Gesamtwerk" zur Ergebnismenge gepackt werden. Bei dem Focus auf der Identnummer im Registerausschnitt auf den ODER-Schalter klicken. Nicht auf den Registereintrag klicken, sonst nimmt der ODER-Schalter die nächste Identnummer.

Ergebnismenge ist dann fertig. Export starten mit X xmlexp. Die Frage "Satznummern ersetzen durch Text (V14)?" immer mit "nein" beantworten.

Bitte darauf achten, dass in der Exportdatei beim Datensatz zum Gesamtwerk in Feld 16 auch "Gesamtwerk" drin steht.

9.1.1 Bei Nachschlagewerken[Bearbeiten | Quelltext bearbeiten]

a. Es liegt vor: #8z \1a2101\00000013.gif - 00000017.gif

b. Im Register 10 ALT+0135\1a2101 ? eingeben. 287 Objekte in Treffermenge

c. Mit Titel aus #84 Encyklopädie des gesammten Erziehungs- und Unterrichtswesens im Register 4 die [Elektronische Ressource] auswählen

d. Identnummer #00 vom Gesamtwerk kopieren: 101688679

e. Ergebnismenge nochmal herholen

f. Register 9 101688679 mit ODER der Ergebnismenge zufügen und den gewünscht Band, der darunter aufgelistet ist.

g. Export der Ergebnismenge X xmlexp

10 Zulieferungen zu intranda[Bearbeiten | Quelltext bearbeiten]

  • 22.12.2011 Komplettes Bildset und XML-Export von Nachschlagewerk ID: 101688679 - Encyklopädie des gesammten Erziehungs- und Unterrichtswesens nach Göttingen übermittelt.
10.196 Bilder
1.342 Datensätze inkl. Datensatz vom Gesamtwerk

11 Fehlersuche und Auftragsabnahme[Bearbeiten | Quelltext bearbeiten]

Nachschlagewerke Fehlersuche 20120302

12 Arbeitsschritte Migration Nachschlagewerke[Bearbeiten | Quelltext bearbeiten]

  1. Allegro-C Ergebnismenge bilden
  2. Exportdatei auf C:\temp umbenennen
  3. "Band" und "Gesamtwerk" in Allegro-feld: 15 prüfen
  4. Codierung in Allegro-feld: 09 prüfen; siehe Initialimport Nachschlagewerk Anpassung XML-Datei
  5. Initialimport ausführen
  6. Neuen Vorgang in GoobiDigi GUI heranholen
  7. Tiff-Kopier- und Tiff-Komprimierschritt ausführen
  8. Bildordner im Homeverzeichnis mounten
  9. Bildstapel überprüfen ; siehe auch Problem Bildstapelkorrektur
  10. XML-Editor ggf. "Monograph" in "CollectedEdition" ändern (das gilt bei einbändigen Werken)
  11. goobiids.txt bearbeiten
  12. URN-Skript in shell starten
  13. Protokollausgabe prüfen
  14. AllegroExport in shell starten
  15. Protokollausgabe prüfen
  16. Excel-Tabelle editieren
  17. Wiki editieren
  18. GoobiWeb Indexer ggf. stoppen
  19. DMSExport ausführen
  20. GoobiWeb Indexer ggf. starten
  21. GoobiWeb Anzeige im Viewer prüfen
  22. GoobiWorkflow ggf. sofort vervollständigen oder IDNs sammeln und später als Stapel abarbeiten
  23. robocopy: XML-Datei aus C:\temp in die Ablage verschieben

12.1 Arbeitsschritte Allegro-Datensatz in Goobi teilweile fehlerhaft[Bearbeiten | Quelltext bearbeiten]

13 Themen die nicht so dringend sind[Bearbeiten | Quelltext bearbeiten]

13.1 Nachschlagewerke und Regelung in der projects.xml[Bearbeiten | Quelltext bearbeiten]

siehe Nachschlagewerke und Regelung in der projects.xml