Was
sind und was sollen Bibliothekarische Datenformate. 3. Aufl. 1999
Kapitel 10.4
Pica
|
Illustrierte Beispiele |
|
|
|
|
|
|
|
|
Kurzübersicht und
Architektur
Das externe Format Pica3 läßt in seinen
vierstelligen Nummern viel deutlicher eine "Architektur" erkennen als das
interne Pica+, dessen Nummern jeweils mit angegeben sind, auf das
aber hier nicht eingegangen wird. Hier werden nur
die wichtigsten Felder aufgelistet! Pica hat insgesamt 1.300 (eintausenddreihundert)
verschiedene Feldnummern.
Pica3 hat vierstellige Nummern. Die Feldnummern bilden
folgende Gruppen:
Titeldaten
0 Verarbeitungsangaben (Datum, Uhrzeit, interne Satznummer)
(I2) 0100 003@ PICA-Produktionsnummer
(E2) 0200 001A Erfassungsdatum
(E2) 0210 001B Änderungsdatum
(E2) 0230 001D Datum des Aufnahmeabschlusses
(C) 0500 002@ Gattung und Status (Der
erste Buchstabe bestimmt den Typ des Satzes)
1 Codierte Angaben, incl. Erscheinungsjahr
(D1) 1100 011@ Erscheinungsjahr
(D1) 1101 016A AV-Medien, codierte Angaben
(D1) 1103 016C Musikalien, codierte Angaben
(D1) 1104 016D Allgemeine codierte Angaben
(D1) 1105 016E Physikalische Form, codierte Angaben
(D1) 1107 016G Kartographische Materialien, codierte Angaben
(C) 1110 013@ Dokumenttyp
(C) 1500 010@ Sprachen des Textes
(C) 1700 019@ Erscheinungsland (DIN/ISO 3166)
(G2) 1800 018@ Erscheinungsfrequenz
2 Identifikationsnummern aller Art
(I1) 2000 004A ISBN
(I1) 2010 005A ISSN
(I2) 2030 006B BNB-Nummer
(I2) 2040 006A LoC-Nummer
(I2) 2065 006G DB-Nummer
(I2) 2110 006Z ZDB-Nummer
30 Personennamen
(D2) 3000 028A Erster Verfasser
(D2) 300x 028B 2. u. weitere Verfasser
(A2) 301x 028C weitere beteil. Personen
(A1) 303x 028E Interpret (Person)
(A1) 304x 028F Gefeierte Person
(A2) 305x 028G Personenname im Sachtitel
(A2) 306x 028L Widmungsempfänger
(A2) 307x 028M Literarischer/künstlerischer Beiträger
(A2) 309x 028Z Verweisungsformen Personnenamen
31 Körperschaftsnamen
(A) 310x 029A Primärkörperschaft
(A2) 312x 029F Sekundärkörperschaft
(A) 314x 029E Körperschaft als Interpret
(A2) 316x 030F Veranstaltung (Kongreß etc.)
32 Sachtitel für Nebeneintragungen
(A2) 3200 022S Sammlungsvermerk
(A) 321x 022A Einheitssachtitel
(A2) 3220 025@ Ansetzungssachtitel
(A2) 326x 027A Parallelsachtitel
(A2) 326x 027A Nebensachtitel
4 Titelbeschreibung incl. Fußnoten
(A2) 4000 021A Hauptsachtitel mit Zusätzen und Verf.Angabe
(A2) 4004 021B Titel von Bänden
(D2) 4020 032@ Ausgabevermerk
(D2) 4025 031@ Erscheinungsverlauf
(D1) 4030 033A Erscheinungsort : Verleger
(D2) 4060 034D Umfangsangabe
(D2) 4061 034M Illustrationsangabe
(D2) 4062 034I Formatangabe
(D2) 4063 034K Begleitmaterial
(A) 4083 009P Angaben zum elektronischen
Zugriff, u.a. URL
(D1) 417x 036E Übergeordnete Gesamtheit
(D2) 4201 037A Fußnote unaufgegliedert
(D2) 4204 037C Hochschulschriftenvermerk
(V1) 4244 039C Früherer/Späterer Titel
5 Sacherschließung
(K1) 5010 045F Dewey Klassifikation
(K1) 5030 045A Library of Congress Classification
(K1) 5040 045C National Library of Medicine Classification
(K2) 5050 045E Sachgruppen der Deutschen Bibliothek
(K2) 5055 045S Fächerstatistik; Deutsche Bibliotheksstatistik
(S1) 51xx 041A Schlagwortkettenglied
(K1) 530x 045Q Basisklassifikation
(S2) 5500 044K Schlagwort
(S1) 5510 044C Medical subject headings
(S1) 5520 044E PRECIS
(S1) 5540 044G British-Library-Subject-Headings
(C) 5560 044N Formschlagwort
6 Lokaldaten (lokale Sacherschließung etc.)
7+8 Exemplardaten (bilden intern eigene Datensätze)
(E2) 70xx 208@ Datum und Selektionsschlüssel (Exemplar)
(B2) 7100 209A Signatur
(B2) 7109 209B Magazinsignatur
(B1) 7120 231@ Bestandsangaben
(B3) 4801 237A Exemplarbezogener Kommentar
(G2) 8100 209C Zugangsnummer
(G1) 8200 209G Verbuchungsnummer
(T3) 9000 047I Inhaltliche Zusammenfassung
Die Gruppen 6 und 7 enthalten jedoch nicht sämtliche Lokal- bzw. Exemplardaten, sondern es gibt in den anderen Gruppen noch etliche Nummern, die in diese Bereiche gehören.
Man erkennt, daß hier ganz anders als bei MARC und
noch konsequenter als bei MAB die Daten nach logischen Kriterien gruppiert
sind. Das Bild der Katalogkarte ist hier überhaupt nicht mehr zu erkennen.
Normdaten
Die Pica3-Nummern sind 3stellig,
im Gegensatz zu den 4stelligen Nummern der Titeldaten. Pica+ ist jedoch
das eigentliche Speicherformat, und hier gibt es keine solche Diskrepanz.
(E2) 001 001A Erfassungsdatum
(E2) 002 001B Änderungsdatum
(E3) 003 003D Datum des Aufnahmeabschlusses
(C) 005 002@ Gattung und Status
(C) 007 019@ /1Land1/1Land2
(C) 008 010@ Sprachcode für Normsatz
(C) 009 009B Körperschaftstyp
(I2) 020 007P Identnummer GKD
(I2) 021 007P Identnummer SWD
(A1) 100 028A Personenname Hauptansetzungsform
(A1) 150 029A Körperschaftsname - Hauptansetzungsform
(A2) 151 029B Abkürzung des Körperschaftsnamens
(A1) 170 045A Notation der Basisklassifikation
(A1) 20x 028@ Personenname Verweisungsformen
(A1) 250 029@ Körperschaftsname - Verweisungsform
(D1) 270 045B siehe-Verweisung Basisklassifikation
(A1) 300 032A Körperschaft: Lebensdaten
(D2) 310 032B Sonstige identifizierende Angaben zum Normsatz
(A1) 400 038A Pseudonym
(A1) 410 038B Wirklicher Name
(V1) 440 038F Übergeordnete Körperschaft
(V1) 450 038C Körperschaft, Verknüpfungen
(A1) 500 044E Hauptbegriff zur Notation
(D1) 510 044F Synonyme Umschreibung für Notation
(D2) 530 037A Freie Umschreibung zur Notation
(A2) 54x 037B Begriffe zu einer Notation
(A1) 550 044G Schlagwort für eine Notation
(H2) 455 038I Pauschalverweisung Körperschaftsname
(H2) 600 041G Schlagwort-Pauschalverweisung, 1. Teil
(H2) 602 041H Pauschale siehe-Verweisung 2.Teil
(H2) 604 041I Pauschale siehe-auch-Verweisung 2.Teil
(A1) 800 041A Hauptschlagwort
(A1) 801 041B Unterschlagwort einer Ansetzungskette
(A1) 810 042A Systematik-Nummer der DB
(C) 811 042B Ländercode für SWD
(A1) 820 041D Alternativform zum Hauptschlagwort
(A1) 821 041E Unterschlagwort zur Alternativform
(A1) 830 041F Äquivalente Bezeichnung; Synonymes Schlagwort
(A2) 850 039C Übergeordnetes Schlagwort
(A1) 860 039D Verwandtes Schlagwort (assoziativer Begriff)
(A1) 870 039E Früheres Schlagwort
(A1) 880 039F Späteres Schlagwort
(A1) 890 039G Neuer Begriff
(A1) 891 039H Alter Begriff
(D2) 901 047A Kommentar zum Stammsatz
(D2) 95x Kommentar zur SWD
Entstehung
Im Jahre 1969 begannen die Königliche Bibliothek
und sechs Hochschulen mit einem Pilotprojekt für die Erfassung von
Katalogdaten (Pica = Project for Integrated Catalogue Automation). Man
wählte zunächst MARCII als Grundlage für ein Verarbeitungsformat.
Dem heutigen Pica-Format sieht man dies nicht sofort an. Die Entwicklungsgeschichte
ist über lange Zeit durch die Gegebenheiten spezieller Hardware und
Betriebssoftware geprägt worden, aber auch von Erfordernissen z.B.
der Nationalbibliographie (der sog. "Brinkman"-Katalog), die von Anfang
bis heute ein wichtiger Bestandteil der Datenbank ist.
Es überrascht jeden, der sich erstmals mit Pica befaßt,
daß es zwei Formate gibt: das Internformat Pica+ (das nur die Programmierer
sehen) und das externe Format Pica3, in dem die KatalogisiererInnen arbeiten.
Zwischen beiden besteht eine 1:1-Entsprechung, und die Software wandelt
tatsächlich ständig die Daten zwischen diesen zwei Formaten um!
Als wichtigstes Austauschformat gilt aber USMARC, das man sowohl importieren
als exportieren kann. Jedoch besteht keine leicht
erkennbare 1:1-Konkordanz zu USMARC, weder für Pica+ noch Pica3.
Grundsatzfragen
Online-Eignung
Schon sehr früh in der Entwicklungsphase wurde an
Online-Kataloge gedacht. Der Übergang von Pica2 auf Pica3 1992/93
war in dieser Hinsicht nochmals ein qualitativer Sprung, z.B. wurden die
Satzverknüpfungen für mehrbändige Werke neu eingeführt.
Wer noch Zettel drucken will, hat dafür ein paar Kategorien, in die
man Köpfe mit der gewünschten Kartenanzahl eintragen kann.
Objekte der Katalogisierung
Jeder Bestandteil einer Veröffentlichung wird als
eigenes Objekt angesehen und erhält einen eigenen Datensatz. Das Werk
als Ganzes bekommt einen Hauptsatz, jeder physische Bestandteil bekommt
einen Satz der niedrigsten Stufe, und dazwischen kann es für logische
Gliederungen ("Abteilungen") eines Werkes noch Zwischenstufen, auch mehrere
übereinanderliegende, geben, die gleichfalls als eigene Datensätze
dargestellt werden. Immerhin wird so jeder Titel recherchierbar. Verknüpfungsnummern
sind stets nur in den untergeordneten Stufen vorhanden und verweisen auf
den unmittelbar übergeordneten Stufensatz. Dies macht es schwierig,
eine Gesamtanzeige eines komplizierten mehrstufigen Werkes zu produzieren!
Ferner gilt jedes Exemplar als ein Objekt, das mit einem Exemplarsatz zu
bedenken ist, anzuhängen an die unterste bibliographische Satzstufe.
Zusammenhänge
Genau wie MARC arbeitet Pica ausgiebig mit Teilfeldern.
In Pica3 ist dies nicht direkt zu sehen, vielmehr sind darin die Teilfeldkennungen
ersetzt durch eine festgelegte Interpunktion, und zwar im allgemeinen die
in der ISBD definierte. Dies mag eine Arbeitserleichterung sein, erhöht
aber die Fehlergefahr bei der Eingabe.
Ein Beispiel soll diese Eigenheit verdeutlichen:
Pica3-Eingabe- und Anzeigeform (mit vorgeschriebener Interpunktion):
4000 Hauptsachtitel // Körp. Ergänzung : Zusatz / Verfasserangabe
Pica+ interne Speicherungsform (Teilfeldkennungen mit ¦ als Steuerzeichen statt Interpunktion):
021A ¦aHauptsachtitel¦eKörp. Ergänzung¦dZusatz¦hVerfasserangabe
Eindeutige Feldnummern
Weil Pica schon anders als MARC und MAB von vornherein
mit dem Ziel einer integrierten (d.h. alle Datentypen umfassenden) Online-Datenbank
entwickelt wurde, kam man wohl gar nicht erst auf den Gedanken, mit mehrdeutigen
Feldnummern zu arbeiten. So könnte man denken.
Unter der Oberfläche jedoch, im Internformat Pica+, gibt es sie: 028A
ist im Titelformat der Name des ersten Verfassers in Ansetzungsform, in
den Normdaten ist 028A die Hauptansetzung der Person, auf die sich der
Normsatz bezieht. Das mag noch angehen, denn diese zwei Elemente
haben Gemeinsamkeiten. jedoch ist z.B. 037A in den Titeldaten die "Unaufgegliederte
Fußnote", in den Normdaten aber die "Freie Umschreibung zur Notation".
Die Software muß bei allen Arbeiten den Inhalt der 0500 berücksichtigen:
aus deren erstem Buchstaben, und nur aus diesem, ergibt sich zweifelsfrei
der Typ des Datensatzes und damit die Bedeutung der Kategorien. Begeisternd
elegant ist also auch Pica nicht.
Redundanz
Wo es sinnvoll ist, wird mit Codierungen gearbeitet (Erscheinungsland,
Dokumenttyp, ...) . Eine Besonderheit ist die "Dollar-Verweisung": wenn
z.B. irgendwo innerhalb einer Kategorie "$3000"
steht, wird an der betreffenden Stelle bei einer Druckproduktion oder ISBD-Anzeige
der Text aus Kategorie 3000 (Erster Verfasser) eingesetzt. (Diese
Technik wird jedoch nicht für Neuerfassungen mehr propagiert)
Hierarchie
Hierarchische Sätze "alter Art" sind nicht möglich,
nur verknüpfte Sätze (wie oben beschrieben). Dies ist aber eine
Neuerung, die es im Vorläufermodell Pica2 noch nicht gab.
Normdaten
Die Verknüpfung mit Stammsätzen ist grundsätzlich
möglich und wird vom Retrieval sehr gut unterstützt. Verpflichtend
sind Normsätze im Göttinger System für Körperschaftsnamen
(GKD), Schlagwörter (SWD) und für die Notationen der Basisklassifikation,
fallweise werden Normsätze für Personen erstellt und verwendet.
Sonstige Eigenschaften
Feldbezeichnungen. Pica3 hat 4stellige numerische Kategorienummern 3stellige bei den Normdaten. Pica+ hat 4stellige Bezeichnungen, die jeweils aus drei Ziffern und einem Großbuchstaben bestehen. Indikatoren gibt es nicht. Die Teilfeldtechnik wurde bereits erwähnt.
Wiederholungsmethode. Uneinheitlich: es gibt Fälle, wo mehrere unterschiedliche Feldnummern verwendet werden müssen, aber auch solche, wo eine Feldnummer mehrfach auftreten kann. In einigen wenigen Fällen (z.B. Sprache des Dokuments) können Mehrfacheinträge innerhalb eines Feldes auftreten.
Daten fester Länge beschränken sich auf die Satznummer, einige Datumsangaben am Satzanfang, sowie sechs Bytes zur Kennzeichnung von Satztypen in der sehr wichtigen Kategorie 0500.
Satztypen. Es werden bibliographische Sätze und Normsätze unterschieden; die Normsätze unterscheiden sich in Pica3 (nicht in Pica+) auffällig dadurch, daß sie nur dreistellige Kategorienummern haben!
Kleinigkeiten. Es gibt kein Nichtsortierzeichen, sondern ein Sortierzeichen: Der '@' steht unmittelbar vor dem ersten Ordnungswort. (Somit kann man aber keine Teile innerhalb von Titeln von der Sortierung ausnehmen.) Personennamen werden in natürlicher Reihenfolge eingegeben, gleichfalls mit '@' vor dem Ordnungswort. Beispiel:
Arno@Schmidt statt Schmidt, Arno.
Das Pica-System hat einen eigenen Zeichensatz mit 183
Zeichen. Da als Endgeräte nur noch PCs mit VGA-Monitor verwendet werden,
ist dieser (auch für Windows realisierte) Zeichensatz
softwaremäßig eingerichtet und kann mit Mausunterstützung
eingegeben werden.