Goobi-Projekt Schuljahresberichte

Aus Allegro
Wechseln zu: Navigation, Suche

1 Beispiele[Bearbeiten | Quelltext bearbeiten]

2 Dazugehörige Artikel[Bearbeiten | Quelltext bearbeiten]

2.1 Intern[Bearbeiten | Quelltext bearbeiten]

2.2 Extern[Bearbeiten | Quelltext bearbeiten]

3 Neue Vorgänge in Goobi[Bearbeiten | Quelltext bearbeiten]

3.1 Geschäftsgang neue Vorgänge[Bearbeiten | Quelltext bearbeiten]

  • Titelaufnahme der Druckausgabe in der ZDB
  • Titelaufnahme (provisorisch) der elektronischen Ressource in der ZDB
  • Vorgang in Goobi anlegen
  • Scannen (300 dpi Farbe Zeutschel-Scanner)
  • Einspielen der Scans in die entsprechenden metadata-Verzeichnisse (Vorgänge)
  • Fortsetzung nach Goobi-Workflow
  • Andrea Ribbschläger: Fertigstellen der Titelaufnahme in ZDB: elektronische Adresse (URL) nachtragen.

3.2 Workflowgestaltung[Bearbeiten | Quelltext bearbeiten]

4 Goobi-Import aus Allegro-C[Bearbeiten | Quelltext bearbeiten]

  • CatalogIDAllegro: Datensätze aus der SP-Datendank haben einen lokalen Identifier, mit Präfix DIG. Datensätze der einzelnen Schuljahresberichte kommen ohnehin nicht nach Allegro zurück.

Die Datei Jahrgaenge_2asp_20140505.xml in O:\Abteilung-BBF\Bibliothek\Digitalisierung_OAI_DFG-Viewer_DigiBib\Schulprogramme\Migration-to-Goobi\Finale-Dateien_20140509\ beinhaltet alle 1.876 Datensätze.

  • GND-Identifier für Schlagwort "Jungenschule", "Mädchenschule", "Schulprogramm" aus Allegro-feld: 31s
  • GND-Identifier für geografisches Schlagwort des Erscheinungsortes aus Allegro-feld: 74

5 Kollektionen[Bearbeiten | Quelltext bearbeiten]

5.1 Taxonomie als Kollektionen in Goobi[Bearbeiten | Quelltext bearbeiten]

Schulprogramme werden als Zeitschriften bei der ZDB geführt. Die BBF gliedert die Schulen (Körperschaften) wie auch die UB Giessen die Schulprogramme in die geschachtelten Gebietskörperschaften (z.B. Preußen → Sachsen → Schönebeck, Elbe ⇒ Städtisches Lyzeum <Schönebeck>) ein und realisiert diese Taxonomie über die Digitalen Kollektionen, insbesondere über DigitalCollections.xml und den Eingaben per Metadateneditor in den Metadaten des Jahrgangsbandes.

In DigitalCollections.xml enthalten:

<project>
  <name>Schuljahresberichte</name>
  <DigitalCollection>Schulprogramme</DigitalCollection>
</project>

Im Metadateneditor bei "Digitale Kollektion" (Notation ggf. nur gültig für Intranda Viewer):

schulprogramme#preussen#sachsen#schoenebeck_elbe

Rückwandlung der Literale in Klartext für den Intranda Viewer über die Datei messages_de.properties:

schulprogramme=Schulprogramme
schulprogramme.preussen=Preu\u00DFen
schulprogramme.preussen.sachsen=Sachsen
schulprogramme.preussen.sachsen.schoenebeckelbe=Sch\u00F6nebeck, Elbe

Der Unterstrich bei schoenebeck_elbe wird automatisch vom Intranda Viewer entfernt und dementsprechend muss in messages_de.properties die gekürzte Variante als Suchmuster eingetragen werden. Im Metadateneditor ist jedoch ein Trennzeichen wegen der Lesbarkeit und Fehlervermeidung gewünscht.

5.2 Auflistung der Orte[Bearbeiten | Quelltext bearbeiten]

Siehe O:\Abteilung-BBF\Bibliothek\Digitalisierung_OAI_DFG-Viewer_DigiBib\Schulprogramme\Migration-to-Goobi\Finale-Dateien_20140509 dort: Schulprogramme_Kollektionen_Tabelle_Goobi.xlsx

5.3 Taxonomische Variationen[Bearbeiten | Quelltext bearbeiten]

Schulprogramme → Ort (Provinz, Land) → Schule → momentaner Schulname ⇒ zugehörige Jahrgänge

5.4 Goobi-Wiki[Bearbeiten | Quelltext bearbeiten]

6 Metadaten[Bearbeiten | Quelltext bearbeiten]

6.1 Signatur der Druckausgabe[Bearbeiten | Quelltext bearbeiten]

Die Signatur der Druckausgabe in Goobi shelfmarksource ist im Allegro-feld: 8z codiert. Die Signatur ist in jedem Datensatz vorhanden, weil darüber auch der Dateipfad definiert wird.

Die Signatur beginnt ab dem ersten Schrägstrich und endet vor dem Trennzeichen "-".

Beispiel <feld nr="8z" lb="Speicheradresse">\2asp072-084\00000038.gif - 00000060.gif</feld> ist Signatur 2asp072

6.2 CatalogIDDigital[Bearbeiten | Quelltext bearbeiten]

Die CatalogIDDigital der Zeitschrift (Periodical) wird im Viewer auf den OPAC verweisen. Bisher ist dieser Identifier immer so aufgebaut und auch in der Bibliotheksdatenbank hinterlegt:

[Präfix "ZDB"][ ZDB-IDN ] -> so sollte "CatalogIDDigital" sein.

Die Vorgänge haben dann als Vorgangstitel:

TSL_["ZDB"][ZDB-IDN]_[ PublicationYear ]

oder

TSL_["ZDB"][ZDB-IDN]_[ CurrentNoSorting ]

Das weiß ich gerade nicht genau, wie es bei den anderen Skripten ist.

7 Übergeordnetes Werk - Zeitschriftenstammsatz[Bearbeiten | Quelltext bearbeiten]

Der Identifier für die übergeordnete Zeitschrift ist hier eingetragen:

<feld nr="70" lb="Quelle">!2603321</feld>



7.1 Metadatum Körperschaft[Bearbeiten | Quelltext bearbeiten]

Primärkörperschaft soll dazu : http://www.zeitschriftendatenbank.de/erschliessung/arbeitsunterlagen/zeta/3100/

<Metadata>
<Name>OriginatorCorporate</Name>
<picaMainTag>029A</picaMainTag>
<picaSubTag>a</picaSubTag>
</Metadata>

SPO-Beispiel in ZDB:

  • IDN: 1010956256
  • Titel: Bericht über das Schuljahr ... / Städtisches Lyzeum und Frauenschule Aschersleben [Elektronische Ressource]
  • Körperschaft: Städtisches Lyzeum und Frauenschule <Aschersleben>

Regelsatz:

<MetadataType>
<Name>OriginatorCorporate</Name>
<language name="en">Originator corporate</language>
<language name="de">Urheber-Körperschaft</language>
<language name="es">Urheber-Körperschaft</language>
</MetadataType>

7.2 Metadatum Provinz[Bearbeiten | Quelltext bearbeiten]


Eingescannt wird Schulprogramme Provinz Sachsen im Haus. Jeder Schule läuft mit einer ZDB-Nummer. Beim Scannen wird beim Abarbeiten des Bandes von einem Vorgang in den nächsten gewechselt.

7.3 SizeSourcePrint[Bearbeiten | Quelltext bearbeiten]

20140519 MetadataTypeNotAllowedException: Periodical - SizeSourcePrint - Online-Ressource Metadata of type ’SizeSourcePrint’ not allowed for DocStruct ‘Periodical’→ Änderung im Regelsatz bbfspo.xml notwendig.

7.4 singleDigCollection[Bearbeiten | Quelltext bearbeiten]

Die Angabe der Provinz ist in den Datensätzen nicht vollständig. Von 1.876 sind nur 1.792 mit Allegro-feld: 81. Davon sind 1.736 mit einem Provinzbegriff beginnend [Berlin, Hannover, Rheinprovinz, Sachsen]. 56 Datensätze haben im Allegro-feld: 81 andere Angaben.

Um automatisch die singleDigCollection zu beschreiben, wird eine externe Tabelle bereit gestellt:

Provinz GND-Nummer
rheinprovinz http://d-nb.info/gnd/4000003-5
westfalen http://d-nb.info/gnd/4000801-0
westfalen http://d-nb.info/gnd/4000804-6
rheinprovinz http://d-nb.info/gnd/4001919-6
sachsen http://d-nb.info/gnd/4086015-2
rheinprovinz http://d-nb.info/gnd/4104205-0
westfalen http://d-nb.info/gnd/4003450-1
rheinprovinz http://d-nb.info/gnd/4071914-5
hannover http://d-nb.info/gnd/4047920-1
sachsen http://d-nb.info/gnd/4051169-8
sachsen http://d-nb.info/gnd/4472730-6
berlin http://d-nb.info/gnd/4005728-8
[...] [...]

Anhand der GND-Nummer aus dem Allegro-feld: 74 als Repräsentant des Ortes kann die Provinz herangezogen werden und der String für singleDigCollection gebildet werden.

7.5 PublicationRun[Bearbeiten | Quelltext bearbeiten]

Erscheinungsverlauf (Goobi: PublicationRun) soll dazu : http://www.zeitschriftendatenbank.de/erschliessung/arbeitsunterlagen/zeta/4025/

In Maske vorhanden, wird aber nicht ausgefüllt bei Katalogabfrage (20140205)

7.6 Vorgänger und Nachfolger[Bearbeiten | Quelltext bearbeiten]


8 Externe Beschreibungen[Bearbeiten | Quelltext bearbeiten]

9 Goobi_projects.xml[Bearbeiten | Quelltext bearbeiten]

<item docstruct="topstruct" from="werk" isnotdoctype="periodical" metadata="TSL_ATS" ughbinding="false">ATS</item>
<item docstruct="topstruct" from="werk" isdoctype="periodical" metadata="TSL_ATS" ughbinding="false">TSL</item>
<item docstruct="topstruct" from="vorlage" isdoctype="multivolume" metadata="CatalogIDSource" required="true" ughbinding="true"> PPN analog c-Satz </item>
<item docstruct="topstruct" from="werk" isdoctype="multivolume" metadata="CatalogIDDigital" required="true" ughbinding="true"> PPN digital c-Satz</item>
<item docstruct="topstruct" from="vorlage" isdoctype="monograph" metadata="CatalogIDSource" required="true" ughbinding="true"> PPN analog a-Satz </item>
<item docstruct="topstruct" from="werk" isdoctype="monograph" metadata="CatalogIDDigital" required="true" ughbinding="true"> IDN digital a-Satz</item>
<item docstruct="topstruct" from="vorlage" isdoctype="periodical" metadata="CatalogIDSource" required="true" ughbinding="true"> IDN analog Druckausgabe </item>
<item docstruct="topstruct" from="werk" isdoctype="periodical" metadata="CatalogIDDigital" required="true" ughbinding="true"> IDN Online-Ausgabe </item>
<item docstruct="topstruct" from="werk" isdoctype="periodical" metadata="ISSN" required="true" ughbinding="true"> ISSN </item>
<item docstruct="firstchild" from="vorlage" isdoctype="periodical" metadata="CatalogIDSource" required="true" ughbinding="true"> IDN analog Beilage </item>
<item docstruct="firstchild" from="werk" isdoctype="periodical" metadata="CatalogIDDigital" required="true" ughbinding="true"> IDN digital Beilage </item>
<item docstruct="topstruct" from="werk" isdoctype="periodical" metadata="CatalogIDPeriodicalDB" required="false" ughbinding="true"> ZDB-ID </item>
<item docstruct="firstchild" from="vorlage" isdoctype="multivolume|periodical" metadata="TitleDocMain" required="true" ughbinding="true"> Titel (Band)</item>
<item docstruct="firstchild" from="vorlage" isdoctype="multivolume|periodical" metadata="TitleDocMainShort" required="true" ughbinding="true"> Titel (Band) (Sortierung)</item>
<item docstruct="firstchild" from="vorlage" isdoctype="multivolume" metadata="ListOfCreators" ughbinding="true"> Autoren (Band)</item>
<item docstruct="firstchild" from="vorlage" isnotdoctype="monograph" metadata="CurrentNo" ughbinding="true"> Jahrgang </item>
<item docstruct="firstchild" from="vorlage" isnotdoctype="monograph" metadata="CurrentNoSorting" ughbinding="true"> Nummer (Sortierung) </item>
<item from="vorlage" isdoctype="multivolume|periodical" required="true"> Nummer (Benennung) </item>
<item docstruct="firstchild" from="vorlage" isdoctype="multivolume" metadata="CatalogIDSource" required="true" ughbinding="true"> IDN analog f-Satz </item>
<item docstruct="firstchild" from="werk" isdoctype="multivolume" metadata="CatalogIDDigital" required="true" ughbinding="true"> IDN digital f-Satz </item>

10 Briefing intranda[Bearbeiten | Quelltext bearbeiten]

Wir möchten 1.876 Datensätze von Allegro nach Goobi migrieren und somit 1.876 Vorgänge im Verfahren des Massenimports in Goobi erhalten. Dazu brauchen wir einen neuen Importer. Nennen wir in "DipfSchulproInitialImport.jar"?

Jeder Datensatz ist ein Schuljahresbericht bzw. Schulprogramm und repräsentiert einen Jahrgang einer Zeitschrift, die in der ZDB als E-Ressource notiert ist.

In den Metadaten der Bandelemente wird keine "CatalogIDAllegro" und kein Link zum Katalog benötigt. Wir löschen nach der Migration die Datensätze in Allegro-C vielmehr und belassen alles in Goobi bzw. im Viewer. Lediglich das übergeordnete Zeitschriftenwerk (anchor-Datei) soll den Link zum Katalog beinhalten. Die Zeitschriftenstammsätze sind im OPAC der BBF aufrufbar.

Für die Schulprogramme habe ich eine gesonderte, abgespeckte Datei "config_allegro_schulpr_import.xml" angelegt.

10.1 Zeitschriftenstammsatz in Allegro-C[Bearbeiten | Quelltext bearbeiten]

Der URL-Prefix ist: http://bbf.dipf.de/kataloge/bibliothekskatalog/catalog.pl?db=catalog&t_allegro=x&f_PPN=

Der URL-Vollender ist der String "BBF" verbunden mit der ZDB-IDN der Zeitschrift

Beispiel: ZDB027083918

Ergibt: http://bbf.dipf.de/kataloge/bibliothekskatalog/catalog.pl?db=catalog&t_allegro=x&f_PPN=ZDB027083918

ZDB-IDN ist Pica+_Feld @3a Unterfeld 0

Ermittlung der Stammsatz-URL:

Im Jahrgangsdatensatz ist in Feld "70" die ZDB-ID, mit der die ZDB abgefragt werden kann. Die ermittelte ZDB-IDN ist dann für den Stammsatz-URL-Bau herzunehmen.

10.2 Identifier des Allegrodatensatz nicht nötig[Bearbeiten | Quelltext bearbeiten]

Wegen des unnötigen Identifiers ist in dieser "Config.xml" der Abschnitt

<articleIdentifierMDType>CatalogIDAllegro</articleIdentifierMDType>
<articleIdentifierLuceneField>ALLEGROID</articleIdentifierLuceneField>

und das Feld

<feld nr="00" lb="IdNr">
<goobiMetadata>CatalogIDAllegro</goobiMetadata>
</feld>

wegzunehmen oder zu ändern. Ich kenne mich da nicht aus. Das wisst ihr besser.

10.3 GND-Nummern in Metadaten[Bearbeiten | Quelltext bearbeiten]

In den Feldern "31s" und "74" haben Einträge mit GND-Nummer. "31s" kann mehrfach vorhanden sein (Beispiele):

Keyword:

<feld nr="31s" valueURI="http://d-nb.info/gnd/4077211-1">Schulprogramm</feld>
<feld nr="31s" valueURI="http://d-nb.info/gnd/4253453-7">Mädchenschule</feld>

PlaceOfPublication:

<feld nr="74" valueURI="http://d-nb.info/gnd/4015240-6">Erfurt</feld>

Die Syntax der GND-Eintragung in den XML-Dateien ist immer gleich. Diese Daten mögen bitte den Vorgaben des Standards folgend nach MODS transferiert werden. Wie das geht, wisst ihr besser als ich.

10.4 Paginierung[Bearbeiten | Quelltext bearbeiten]

Die Angaben in Feld "708" sind wieder stark variierend. Wir schlagen deshalb vor, dass alles als "uncounted" importiert wird. Es werden ohnehin nochmal alle Bände im MDE überarbeitet und dann manuell paginiert.

Es ist hoffentlich nicht aufwändig, den Algorithmus für die Paginierung aus dem bisherigen Importprogramm "DipfAllegroInitialImport.jar" abzuschalten?

10.5 SingleDigitalCollection[Bearbeiten | Quelltext bearbeiten]

Die Kollektionen sind nach diesem Schema beschrieben:

schulprogramme#sachsen#halberstadt
schulprogramme#berlin#berlin
schulprogramme#berlin#berlin-mitte
Schema:
["Schulpogramme"]#[Preußische Provinz]#[Stadt]

Das "schulprogramme" kommt kategorisch. Die Provinz ist das erste Wort im Feld "81". Die Stadt ist in Feld "74".

Variationen:

<feld nr="81" lb="Fussnote">Berlin</feld>
<feld nr="81" lb="Fussnote">Brandenburg</feld> 
<feld nr="81" lb="Fussnote">Hannover</feld>
<feld nr="81" lb="Fussnote">Hessen-Nassau</feld>
<feld nr="81" lb="Fussnote">Ostpreussen</feld> 
<feld nr="81" lb="Fussnote">Rheinprovinz</feld>
<feld nr="81" lb="Fussnote">Sachsen</feld>
<feld nr="81" lb="Fussnote">Schlesien</feld> 

10.6 Seitenumfang der Strukturelemente[Bearbeiten | Quelltext bearbeiten]

Wie bisher sind die Images in "8z" als ein Dateiintervall angegeben. Ich habe geprüft, dass alle Angaben und auch die zugehörigen Dateien 8-stellig sind und "gif" als Suffix haben. Müßte alles korrekt sein.

10.7 Beispieldatensatz[Bearbeiten | Quelltext bearbeiten]

 <allegro>
 <record inr="21645">
 <feld nr="00" lb="IdNr">BBF1108513</feld>
 <feld nr="20" lb="Titel">Bericht über das Schuljahr 1924(1925)</feld>
 <feld nr="31f" lb="FormalSW">Online-Publikation</feld>
 <feld nr="31s" valueURI="h‍ttp://d-nb.info/gnd/4077211-1">Schulprogramm</feld>
 <feld nr="31s" valueURI="h‍ttp://d-nb.info/gnd/4253453-7">Mädchenschule</feld>
 <feld nr="37" lb="Sprache">ger</feld>
 <feld nr="60" lb="Urh">Städtisches Lyzeum <Bitterfeld></feld>
 <feld nr="70" lb="Quelle">2602339-8</feld>
 <feld nr="708" lb="Seiten">1 - 19</feld>
 <feld nr="74" valueURI="h‍ttp://d-nb.info/gnd/4088405-3">Bitterfeld</feld>
 <feld nr="76" lb="EJahr">1925</feld>
 <feld nr="77d" lb="Techn.Beschreibung">TIFF, Vers.6.0, 600 dpi, 1 bit (s/w),ITU group; Digitalisierungsvorlage: Original</feld>
 <feld nr="81" lb="Fussnote">Sachsen Band 72</feld>
 <feld nr="8e" lb="URL">h‍ttp://www.bbf.dipf.de/cgi-shl/digibert.pl?id=BBF1108513</feld>
 <feld nr="8z" lb="Speicheradresse">\2asp072-084\00000019.gif - 00000037.gif</feld>
 </record>

11 Entfernen nach Migration in Altdatenbank und retro-digit-Verzeichnisse[Bearbeiten | Quelltext bearbeiten]

56 Konvolut-Bände werden nach der Migration entfernt.

2asp013a-081
2asp013b-081
2asp013c-081
2asp028d-082
2asp031-082
2asp040-083
2asp048a-083
2asp061-084
2asp072-084
2asp079-085
2asp088-085
2asp100-086
2asp112-086
2asp125-087
2asp138-087
2asp151-088
2asp174a-089
2asp174b-089
2asp187-089
2asp200a-090
2asp200b-090
2asp212-090
2asp226a-091
2asp226b-091
2asp226c-091
2asp239-091
2asp253a-092
2asp253b-092
2asp266-092
2asp280a-093
2asp280b-093
2asp292-093
2asp306a-094
2asp306b-094
2asp332a-095
2asp332b-095
2asp344-095
2asp358a-096
2asp358b-096
2asp383a-097
2asp383b-097
2asp395-097
2asp408a-098
2asp408b-098
2asp417a-099
2asp417b-099
2asp420-098
2asp420-099
2asp432a-099
2asp432b-099
2asp434b-099
2asp441a-099
2asp441b-099
2asp444-099
2asp449a-099
2asp450-099