Kapitel 10.6
UNIMARC
|
Concise Bibliographic Format |
Full Format |
Concise Authority Format |
|
|
|
|
|
|
|
Kurzübersicht und Architektur
Die Feldbezeichnungen sind dreistellig und rein numerisch. Jedes Feld hat zwei Positionen für Indikatoren.
Da UNIMARC auf den Fundamenten reichhaltiger Erfahrung
errichtet wurde, hat es eine vergleichsweise abstrakte, aber logisch saubere
Einteilung der Felder in 10 Gruppen, die jedoch von den anderen MARC-Formaten
stark abweicht:
Vor den Feldnummern stehen Kennungen, z.B. (I2),
die den Typ des Elements kennzeichnen, siehe dazu Kap.5.
Titeldaten
0 Identification Block (Alle Arten von Identnummern)
(I2) 001 Record identifier
(E2) 005 Version identifier: Date of last transaction
(I1) 010 International Standard Book Number [ISBN]
(I1) 011 International Standard Serial Number [ISSN]
(I2) 020 National Bibliography number [Nationalbibliographische
Identnummer]
(I1) 040 CODEN
1 Coded Information Block (Felder mit fester Länge und genau definierten Positionen)
(C) 100 General processing data [Allgemeine codierte
Angaben]
(C) 101 Language of the item
(C) 102 Country of publication or production
(S) 122 Time period of item content
2 Descriptive Information Block (Alle zur ISBD gehörigen Elemente, d.h. die gesamte bibliogr. Beschreibung)
(D1) 200 Title and statement of responsibility
(D2) 205 Edition statement [Ausgabevermerk]
(D2) 207 Serials numbering
(D2) 210 Publication, distribution etc.; Imprint [Erscheinungsvermerk]
(D2) 215 Physical description [Physikalische Beschreibung]
(A2) 225 Series added entry - title [Serie - Nebeneintragung]
3 Notes Block (Fußnoten aller Art)
(D2) 300 General note
(D2) 324 Facsimile note
(T3) 327 Contents note [Angaben zum Inhalt]
(D2) 328 Dissertation note [Hochschulschriftenvermerk]
(T3) 330 Summary or abstract
4 Linking Entry Block (Verknüpfungen mit anderen Datensätzen)
(D1)410 Series linking entry field
... [etliche weitere Felder für übergeordnete
Gesamtwerke]
5 Related Title Block (Alle zusätzlichen Titel für Nebeneinträge)
(A) 500 Uniform title [Einheitssachtitel - Haupteintragung]
(A2)501 Collective title [Sammlungsvermerk]
(A2)517 Other variant titles
(A2)520 Former title
(A1)530 Key title (ISDN) [Keytitle]
6 Subject Analysis Block (Schlagwörter und Notationen aller Art)
(S1) 600 Personal name used as subject
(S1) 601 Corporate body name used as subject
(S) 602 Family name used as subject [Familie als Schlagwort]
(S1) 605 Title used as subject
(S2) 606 Topical name used as subject
(S2) 607 Geographical name used as subject
(S2) 610 Uncontrolled subject term [Freies Schlagwort]
(S) 661 Time period code
(S1) 670 PRECIS
(K1) 675 Universal Decimal Classification
(K1) 676 Dewey Decimal Classification Number [Dewey Klassifikation]
(K1) 680 Library of Congress Call Number [Library of Congress
Classification]
7 Intellectual Responsibility Block (Alle beteiligten Personen und Körperschaften)
(A) 700 Personal name - primary intellectual responsibility
(A2) 701 Personal name - alternative intellectual responsibility
(A2) 702 Personal name - secondary intellectual responsibility
(A) 710 Corporate body name - primary intellectual
responsibility
(A2) 711 Corporate body name - alternative intellectual
responsibility
(A2) 712 Corporate body name - secondary intellectual responsibility
(A) 720 Family name - primary intellectual responsibility
[Familie als Verfasser]
(A) 721 Family name - alternative intellectual responsibility
[Familie als Mitverfasser]
(A) 722 Family name - secondary intellectual responsibility
[Beteiligte Familie]
8 International Use Block (Angaben über die Verantwortlichkeit für die Daten)
9 National Use Block
(kann durch nationale Agenturen frei definiert werden)
Normdaten
(C) 150 Coded Data Field for Names
(C) 160 Geographic Area Code [Ländercode]
(A1) 200 Heading - Personal name [Personenname Hauptansetzungsform]
(A1) 210 Heading - Corporate name [Körperschaftsname
- Hauptansetzungsform]
(A1) 215 Heading - Territorial or Geographic name [Geographischer
Name, Stammsatz]
(A1) 220 Heading - Family Name [Familie als Schlagwort]
(A1) 230 Heading - Uniform title [Einheitssachtitel, Stammsatz]
(A2) 235 Heading - Collective Uniform Title [Einheitssachtitel
Sammlung]
(A1) 240 Heading - Name/Title [Name/Einheitssachtitel Stammsatz]
(A1) 245 Heading - Name/Collective Uniform Title [Name/Einheitssachtitel
Sammlung Stammsatz]
(A1) 250 Heading - Topical subject
(D2) 300 Information note [Kommentar zum Stammsatz]
(D2) 305 Textual See Also Reference Note
(D2) 310 Textual See Reference Note
(D2) 320 General Explanatory Reference Note
(D2) 330 General Scope Note
(A2) 400 See Reference Tracing - Personal Name
(A2) 410 See Reference Tracing - Corporate Body Name
(A2) 415 See Reference Tracing - Territorial or Geographic
name
(A2) 420 See Reference Tracing - Family Name
(A2) 430 See Reference Tracing - Uniform Title
(A2) 440 See Reference Tracing - Name/Title
(A2) 445 See Reference Tracing - Name/Collective Uniform
Title
(A2) 450 See Reference Tracing - Topical Subject
(H2) 500 See Also Reference Tracing - Personal Name
(H2) 510 See Also Reference Tracing - Corporate Body Name
(H2) 515 See Also Reference Tracing - Territorial or Geographic
name
(H2) 520 See Also Reference Tracing - Family Name
(H2) 530 See Also Reference Tracing - Uniform Title
(H2) 540 See Also Reference Tracing - Name/Title
(H2) 545 See Also Reference Tracing - Name/Collective Uniform
Title
(H2) 550 See Also Reference Tracing - Topical Subject
(K1) 675 Universal Decimal Classification
(K1) 676 Dewey Decimal Classification
(K1) 680 Library of Congress Classification
(K2) 686 Other Classification Numbers
(V2) 700 Linking Heading - Personal Name [Alternativform
zu 200]
(V2) 710 Linking Heading - Corporate Body Name
(V2) 715 Linking Heading - Territorial or Geographic name
(V2) 720 Linking Heading - Family Name
(V2) 730 Linking Heading - Uniform Title
(V2) 740 Linking Heading - Name/Title
(V2) 745 Linking Heading - Name/Collective Uniform Title
(V2) 750 Linking Heading - Topical Subject
(X) 801 Originating Source
(D2) 810 Source Data found
(D2) 815 Source Data not found
(H1) 820 Usage or Scope Information
(H1) 825 Example under note
(H1) 830 General Cataloguer's Note
Amtliche Dokumentation:
UNIMARC
manual / ed. by Brian P. Holt with the assistance of Sally H. McCallum
and A.B. Long; IFLA
UBCIM Programme.
- London: British Library, 1987. - 482 S. - ISBN 0-903043-44-0
(Enthält
Anhänge mit normierten Codelisten, u.a. für Sprachen, Länder,
Funktionsbezeichnungen,
geographische
Codes, Zeichensätze)
2. ed 1994,
K.G. Saur Verlag. - ISBN 3-598-11211-4, Ergänzungen 1996 und 1998,
3. ed. 1998
UNIMARC/Authorities
: Universal format for authorities / Recommended by the IFLA Steering Group
on a
UNIMARC format
for Authorities. - München : Saur, 1991. - 80 S. - (UBCIM publications
; N.F., Vol. 2)
ISBN 3-598-10986-5
(Universelles
Austauschformat für Normdaten aller Art, mit Ausnahme von Klassifikationsdaten.)
Aktuell: Unimarc and metadata / Alan Hopkinson. 1998 IFLA Annual Conference.
Entstehung
Unter Beteiligung von etwa 10 Nationalbibliotheken begann eine Arbeitsgruppe
der IFLA ("Working Group on Content Designators") schon in den 70er Jahren
mit der Zusammenstellung eines Formates UNIMARC, das als universelles oder
quasi "Super-Austauschformat" alle in den diversen existierenden Austauschformaten
vorkommenden Datenelemente transportieren können sollte. Die Vorstellung
stand am Anfang, daß dann jede Nationalbibliothek nur die Konvertierung
vom eigenen Format in UNIMARC und zurück programmieren müsse
und dadurch eine Menge gespart würde. Allerdings ist es dann so, daß
die gelieferten Daten je nach Herkunft qualitativ unterschiedlich sind
und in gewissem, wenn auch relativ geringem Umfang immer noch eine individuelle
Aufbereitung notwendig sein wird.
Im Jahre 1977 erschien eine erste Ausgabe. Nach verbesserten Versionen 1980 und 1983 erschien 1987 eine weitgehend abgeschlossene Version des Formates für Titeldaten, 1991 folgte ein zweites UNIMARC-Format, und zwar für "Authorities", also für Normdaten. Dieses ist darauf angelegt, alle Arten von Normdaten, Formal- und Sachdaten gleichermaßen, aufzunehmen.
Die Deutsche Bibliothek in Frankfurt beheimatet derzeit das UBCIM-Büro der IFLA zur Betreuung des Formats, welches als Dokumentations- und Clearingstelle dient. Die Deutsche Bibliothek hat ein Konvertierprogramm erstellt, mit dem sie ihre Daten in UNIMARC umwandelt, um sie dann auf Magnetband zu liefern. Natürlich werden nicht alle Möglichkeiten des Formats damit ausgeschöpft - das würde viele Änderungen und Erweiterungen der Aufnahmepraxis erforderlich machen. Ebenso verfährt die Library of Congress. Die französische Nationalbibliothek hat allerdings ihre Produktion konsequent auf UNIMARC umgestellt.
Mit UNIMARC ist es so ähnlich, um es einmal ganz respektlos auf
den Punkt zu bringen, als ob sich weltweit die Käsereien geeinigt
hätten, ihre Produkte in standardisierter Verpackung anzubieten. Vorteil
für den Handel und den Konsumenten: Transport-,
Lager- und Auspackvorgänge werden erleichtert. Beim Konsum aber hat
man die qualitativ unveränderten Produkte vor sich. "Gottlob", würde
man im Fall des Käses sagen, im Falle der bibliothekarischen Daten
aber möglicherweise "Was für'n Käse". Man fände nämlich
z.B. als Schlagwort oder Körperschaftsname "Munich" in US-Daten und
"Monaco" in italienischen Daten statt des erwarteten "München". Und
"Cheese" bzw. "Formaggio" statt "Käse".
Grundsätze
Zugriff
UNIMARC trennt vorbildlich genau zwischen Zugriffs- und Beschreibungsdaten.
Objekte
UNIMARC ermöglicht die differenzierende Erfassung jedes
bibliographischen Objekts, es schreibt dies aber nicht vor, denn
eine Agentur, die ihre Daten in UNIMARC anbieten will, soll nicht gezwungen
sein, die größtmögliche Differenzierung selber anzuwenden.
Wer UNIMARC als Internformat eines lokalen Systems anwenden will (ein bislang
noch sehr seltener Fall: in Slovenien und Portugal gibt es Beispiele),
der muß zunächst selber festlegen, welche Objekte in welcher
Weise zu behandeln sind.
HORIZON, das in einigen Verbünden jetzt
favorisierte Lokalsystem, soll UNMARC wenigstens an der Oberfläche
darstellen, obgleich es intern mit USMARC arbeitet.
Z39.50-Server sollen UNIMARC neben USMARC standardmäßig
liefern können, Z39.50-Clients sollen es verarbeiten können,
wenn ein Server es liefert.
Eine UNIMARC-Definition für Bestandsdaten (holdings) soll in Vorbereitung sein.
Zusammenhänge
Hier gilt alles, was über MARC gesagt wurde. Die Definition der
Teilfelder geht noch mehr ins Detail als bei USMARC. In der Praxis wird
es hier eine Bandbreite von Unterschieden geben: die einzelnen Lieferanten
können aus ihren jeweiligen nationalen Formaten nicht jedes Datail
herausholen, das in der UNIMARC-Definition darstellbar ist.
Es gibt Teilfelder, die spezifisch für die Aufgaben des UNIMARC sind: $7 Verwendeter Zeichensatz, $8 Sprache der Katalogisierung. Diese sind tatsächlich nur für den Austausch sinnvoll, nicht in einem Lokalsystem.
Ein Feld - eine Nummer
Wie bei USMARC und MAB sind auch bei UNIMARC die Formate für Titeldaten
und für Normdaten als getrennte Formate anzusehen, die nicht für
eine gleichzeitige Anwendung in einer Online-Datenbank konzipiert wurden.
Zahlreiche Feldnummern stimmen zwischen beiden Formaten überein (siehe
oben), haben jedoch ganz andere Bedeutungen. Die einfachste Lösung
wäre, in dem Format für Normdaten die erste Ziffer der Kategorienummern
durch einen Buchstaben zu ersetzen, etwa 0 durch A, 1 durch B, ... 9 durch
J. Die zweiteinfachste Lösung: eine vierte (oder
nullte) Ziffer der Kategorienummer voranzustellen: 0 bei den Titeldaten,
1 bei den Normdaten.
Eine Eigenheit des UNIMARC sind die eingebetteten Felder. In Kategorien mit gemischter Zusammensetzung (z.B. Name/Titel als Eintragungselement) werden die verschiedenen Bestandteile (also z.B. ein Name und ein Titel) so angegeben, daß in einem ersten Teilfeld $1 eine vollständige andere Kategorie (einschließlich Nummer!) angegeben wird, in einem zweiten Teilfeld $1 dann genauso eine weitere Kategorie. Angewendet wird eine solche Technik bislang nur von der französischen Nationalbibliographie.
Redundanz wird beschränkt und Normierung gefördert, indem ausgiebig von codierten Daten Gebrauch gemacht wird. In einer Anzahl von Anhängen findet man Listen für die Codierung von Sprachen, Ländern, geographischen Regionen, Zeiträumen u.a.
Hierarchie und Verknüpfung
Hierarchische Sätze sind nicht möglich, Verknüpfungen
aber sehr wohl. Eine eigene Gruppe von Kategorien (Gruppe 4 beim Titelformat,
Gruppe 7 beim Normdatenformat) ist für die Verknüpfungen vorgesehen.
In einer solchen Kategorie können die relevanten Kategorien des anderen
Satzes (z.B. Seriensatzes) "eingebettet" sein: Jede 4er-Kategorie bildet
ein eigenes Teilfeld $1 und steht dann dort komplett mit Kategorienummer
und Indikatoren. Eine 4er-Kategorie ist, mit anderen Worten, ein "Datensatz
im Datensatz". Diese Verfahrensweise kann von jeder Agentur in einem ihr
genehmen Modus betrieben werden. Wenn man UNIMARC-Daten übernehmen
will, muß man also besondere Aufmerksamkeit und besonderen Programmieraufwand
auf diese Kategorien verwenden. In einer konkreten Realisierung des Formats
kann es durchaus auch ganz anders aussehen, so z.B. in der Variante der
Bibliograpahie Francaise auf CD-ROM, die ohnehin etliche Eigenwilligkeiten
aufweist.
Wichtige Eigenschaften
Zeichensatz
Das Format definiert nur die Zeichencodierung für den Magnetbandaustausch.
Der immer gültige Basiszeichensatz ist US-ASCII (ISO 646). Wegen der
angepeilten Bandbreite der Anwendung wird mit mehreren Zeichentabellen
gearbeitet, zwischen denen mit Steuerzeichen umgeschaltet wird. Das Arbeiten
mit solchen gemischt codierten Daten ist für jede darauf nicht spezialisierte
Software schwierig bis unmöglich.
Die Kategorie 100 (Allgemeine Verarbeitungsangaben) enthält mehrere Bytes zur Spezifikation der im jeweiligen Satz verwendeten Codierung und der Schrift des Katalogisats. Jeder Datensatz kann folglich hier seine eigenen Codierungen aufweisen!
Wiederholung
Das Handbuch sagt genau, welche Kategorien wiederholbar sind, jedoch
nicht, wie oft! Wiederholbare Kategorien werden ohne unterscheidendes Zeichen
mehrfach angegeben - wie bei den anderen MARC-Formaten. Mehrfachangaben
innerhalb eines Feldes gibt es nur in der Form, als in vielen Kategorien
wiederholbare Teilfelder definiert sind.
Daten fester Länge
Jeder Satz hat einen festen Vorspann von 24 Bytes, der dem USMARC entspricht,
also der ISO-Norm 2709 (siehe 10.2 MAB).
Ferner sind die Kategorien der Gruppe 1 alle so definiert, daß sie eine Zeichenkette von fester Länge aufnehmen, in der jedes Zeichen eine festgelegte Bedeutung hat. Somit entsprechen diese Felder inhaltlich den USMARC-Feldern 007 und 008.
Kleinigkeiten
Für die Kennzeichnung von Nichtsortierungen werden
zwei unterschiedliche Zeichen verwendet, die einen zu übergehenden
Bestandteil einschließen. Man trifft jedoch auf Beispiele, die ohne
jede Nichtsortierkennzeichnung auskommen!