Kap. 10.6 Unimarc

Was sind und was sollen Bibliothekarische Datenformate. 3. Aufl. 1999

Kapitel 10.6

UNIMARC

Kategorieliste mit Konkordanz

Concise Bibliographic Format

UNIMARC BIBLIOGRAPHIC
Full Format

Concise Authority Format

Allgemeines

MARC

MAB

ZDB (+NZN)

Pica

allegro

UNIMARC

Kurzübersicht und Architektur

Die Feldbezeichnungen sind dreistellig und rein numerisch. Jedes Feld hat zwei Positionen für Indikatoren.

Da UNIMARC auf den Fundamenten reichhaltiger Erfahrung errichtet wurde, hat es eine vergleichsweise abstrakte, aber logisch saubere Einteilung der Felder in 10 Gruppen, die jedoch von den anderen MARC-Formaten stark abweicht:
Vor den Feldnummern stehen Kennungen, z.B. (I2), die den Typ des Elements kennzeichnen, siehe dazu Kap.5.

Titeldaten

0 Identification Block (Alle Arten von Identnummern)

(I2) 001 Record identifier
(E2) 005 Version identifier: Date of last transaction
(I1) 010 International Standard Book Number [ISBN]
(I1) 011 International Standard Serial Number [ISSN]
(I2) 020 National Bibliography number [Nationalbibliographische Identnummer]
(I1) 040 CODEN

1 Coded Information Block (Felder mit fester Länge und genau definierten Positionen)

(C) 100 General processing data [Allgemeine codierte Angaben]
(C) 101 Language of the item
(C) 102 Country of publication or production
(S) 122 Time period of item content

2 Descriptive Information Block (Alle zur ISBD gehörigen Elemente, d.h. die gesamte bibliogr. Beschreibung)

(D1) 200 Title and statement of responsibility
(D2) 205 Edition statement [Ausgabevermerk]
(D2) 207 Serials numbering
(D2) 210 Publication, distribution etc.; Imprint [Erscheinungsvermerk]
(D2) 215 Physical description [Physikalische Beschreibung]
(A2) 225 Series added entry - title [Serie - Nebeneintragung]

3 Notes Block (Fußnoten aller Art)

(D2) 300 General note
(D2) 324 Facsimile note
(T3) 327 Contents note [Angaben zum Inhalt]
(D2) 328 Dissertation note [Hochschulschriftenvermerk]
(T3) 330 Summary or abstract

4 Linking Entry Block (Verknüpfungen mit anderen Datensätzen)

(D1)410 Series linking entry field
... [etliche weitere Felder für übergeordnete Gesamtwerke]

5 Related Title Block (Alle zusätzlichen Titel für Nebeneinträge)

(A) 500 Uniform title [Einheitssachtitel - Haupteintragung]
(A2)501 Collective title [Sammlungsvermerk]
(A2)517 Other variant titles
(A2)520 Former title
(A1)530 Key title (ISDN) [Keytitle]

6 Subject Analysis Block (Schlagwörter und Notationen aller Art)

(S1) 600 Personal name used as subject
(S1) 601 Corporate body name used as subject
(S) 602 Family name used as subject [Familie als Schlagwort]
(S1) 605 Title used as subject
(S2) 606 Topical name used as subject
(S2) 607 Geographical name used as subject
(S2) 610 Uncontrolled subject term [Freies Schlagwort]
(S) 661 Time period code
(S1) 670 PRECIS
(K1) 675 Universal Decimal Classification
(K1) 676 Dewey Decimal Classification Number [Dewey Klassifikation]
(K1) 680 Library of Congress Call Number [Library of Congress Classification]

7 Intellectual Responsibility Block (Alle beteiligten Personen und Körperschaften)

(A) 700 Personal name - primary intellectual responsibility
(A2) 701 Personal name - alternative intellectual responsibility
(A2) 702 Personal name - secondary intellectual responsibility
(A) 710 Corporate body name - primary intellectual responsibility
(A2) 711 Corporate body name - alternative intellectual responsibility
(A2) 712 Corporate body name - secondary intellectual responsibility
(A) 720 Family name - primary intellectual responsibility [Familie als Verfasser]
(A) 721 Family name - alternative intellectual responsibility [Familie als Mitverfasser]
(A) 722 Family name - secondary intellectual responsibility [Beteiligte Familie]

8 International Use Block (Angaben über die Verantwortlichkeit für die Daten)

9 National Use Block (kann durch nationale Agenturen frei definiert werden)

Normdaten

(C) 150 Coded Data Field for Names
(C) 160 Geographic Area Code [Ländercode]
(A1) 200 Heading - Personal name [Personenname Hauptansetzungsform]
(A1) 210 Heading - Corporate name [Körperschaftsname - Hauptansetzungsform]
(A1) 215 Heading - Territorial or Geographic name [Geographischer Name, Stammsatz]
(A1) 220 Heading - Family Name [Familie als Schlagwort]
(A1) 230 Heading - Uniform title [Einheitssachtitel, Stammsatz]
(A2) 235 Heading - Collective Uniform Title [Einheitssachtitel Sammlung]
(A1) 240 Heading - Name/Title [Name/Einheitssachtitel Stammsatz]
(A1) 245 Heading - Name/Collective Uniform Title [Name/Einheitssachtitel Sammlung Stammsatz]
(A1) 250 Heading - Topical subject
(D2) 300 Information note [Kommentar zum Stammsatz]
(D2) 305 Textual See Also Reference Note
(D2) 310 Textual See Reference Note
(D2) 320 General Explanatory Reference Note
(D2) 330 General Scope Note
(A2) 400 See Reference Tracing - Personal Name
(A2) 410 See Reference Tracing - Corporate Body Name
(A2) 415 See Reference Tracing - Territorial or Geographic name
(A2) 420 See Reference Tracing - Family Name
(A2) 430 See Reference Tracing - Uniform Title
(A2) 440 See Reference Tracing - Name/Title
(A2) 445 See Reference Tracing - Name/Collective Uniform Title
(A2) 450 See Reference Tracing - Topical Subject
(H2) 500 See Also Reference Tracing - Personal Name
(H2) 510 See Also Reference Tracing - Corporate Body Name
(H2) 515 See Also Reference Tracing - Territorial or Geographic name
(H2) 520 See Also Reference Tracing - Family Name
(H2) 530 See Also Reference Tracing - Uniform Title
(H2) 540 See Also Reference Tracing - Name/Title
(H2) 545 See Also Reference Tracing - Name/Collective Uniform Title
(H2) 550 See Also Reference Tracing - Topical Subject
(K1) 675 Universal Decimal Classification
(K1) 676 Dewey Decimal Classification
(K1) 680 Library of Congress Classification
(K2) 686 Other Classification Numbers
(V2) 700 Linking Heading - Personal Name [Alternativform zu 200]
(V2) 710 Linking Heading - Corporate Body Name
(V2) 715 Linking Heading - Territorial or Geographic name
(V2) 720 Linking Heading - Family Name
(V2) 730 Linking Heading - Uniform Title
(V2) 740 Linking Heading - Name/Title
(V2) 745 Linking Heading - Name/Collective Uniform Title
(V2) 750 Linking Heading - Topical Subject
(X) 801 Originating Source
(D2) 810 Source Data found
(D2) 815 Source Data not found
(H1) 820 Usage or Scope Information
(H1) 825 Example under note
(H1) 830 General Cataloguer's Note

Amtliche Dokumentation:

UNIMARC manual / ed. by Brian P. Holt with the assistance of Sally H. McCallum and A.B. Long; IFLA
          UBCIM Programme. - London: British Library, 1987. - 482 S. - ISBN 0-903043-44-0
          (Enthält Anhänge mit normierten Codelisten, u.a. für Sprachen, Länder, Funktionsbezeichnungen,
          geographische Codes, Zeichensätze)
          2. ed 1994, K.G. Saur Verlag. - ISBN 3-598-11211-4, Ergänzungen 1996 und 1998, 3. ed. 1998

UNIMARC/Authorities : Universal format for authorities / Recommended by the IFLA Steering Group on a
          UNIMARC format for Authorities. - München : Saur, 1991. - 80 S. - (UBCIM publications ; N.F., Vol. 2)
          ISBN 3-598-10986-5
          (Universelles Austauschformat für Normdaten aller Art, mit Ausnahme von Klassifikationsdaten.)

Aktuell: Unimarc and metadata / Alan Hopkinson. 1998 IFLA Annual Conference.

Entstehung
Unter Beteiligung von etwa 10 Nationalbibliotheken begann eine Arbeitsgruppe der IFLA ("Working Group on Content Designators") schon in den 70er Jahren mit der Zusammenstellung eines Formates UNIMARC, das als universelles oder quasi "Super-Austauschformat" alle in den diversen existierenden Austauschformaten vorkommenden Datenelemente transportieren können sollte. Die Vorstellung stand am Anfang, daß dann jede Nationalbibliothek nur die Konvertierung vom eigenen Format in UNIMARC und zurück programmieren müsse und dadurch eine Menge gespart würde. Allerdings ist es dann so, daß die gelieferten Daten je nach Herkunft qualitativ unterschiedlich sind und in gewissem, wenn auch relativ geringem Umfang immer noch eine individuelle Aufbereitung notwendig sein wird.

Im Jahre 1977 erschien eine erste Ausgabe. Nach verbesserten Versionen 1980 und 1983 erschien 1987 eine weitgehend abgeschlossene Version des Formates für Titeldaten, 1991 folgte ein zweites UNIMARC-Format, und zwar für "Authorities", also für Normdaten. Dieses ist darauf angelegt, alle Arten von Normdaten, Formal- und Sachdaten gleichermaßen, aufzunehmen.

Die Deutsche Bibliothek in Frankfurt beheimatet derzeit das UBCIM-Büro der IFLA zur Betreuung des Formats, welches als Dokumentations- und Clearingstelle dient. Die Deutsche Bibliothek hat ein Konvertierprogramm erstellt, mit dem sie ihre Daten in UNIMARC umwandelt, um sie dann auf Magnetband zu liefern. Natürlich werden nicht alle Möglichkeiten des Formats damit ausgeschöpft - das würde viele Änderungen und Erweiterungen der Aufnahmepraxis erforderlich machen. Ebenso verfährt die Library of Congress. Die französische Nationalbibliothek hat allerdings ihre Produktion konsequent auf UNIMARC umgestellt.

Mit UNIMARC ist es so ähnlich, um es einmal ganz respektlos auf den Punkt zu bringen, als ob sich weltweit die Käsereien geeinigt hätten, ihre Produkte in standardisierter Verpackung anzubieten. Vorteil für den Handel und den Konsumenten: Transport-, Lager- und Auspackvorgänge werden erleichtert. Beim Konsum aber hat man die qualitativ unveränderten Produkte vor sich. "Gottlob", würde man im Fall des Käses sagen, im Falle der bibliothekarischen Daten aber möglicherweise "Was für'n Käse". Man fände nämlich z.B. als Schlagwort oder Körperschaftsname "Munich" in US-Daten und "Monaco" in italienischen Daten statt des erwarteten "München". Und "Cheese" bzw. "Formaggio" statt "Käse".

Grundsätze

Zugriff
UNIMARC trennt vorbildlich genau zwischen Zugriffs- und Beschreibungsdaten.

Objekte
UNIMARC ermöglicht die differenzierende Erfassung jedes bibliographischen Objekts, es schreibt dies aber nicht vor, denn eine Agentur, die ihre Daten in UNIMARC anbieten will, soll nicht gezwungen sein, die größtmögliche Differenzierung selber anzuwenden. Wer UNIMARC als Internformat eines lokalen Systems anwenden will (ein bislang noch sehr seltener Fall: in Slovenien und Portugal gibt es Beispiele), der muß zunächst selber festlegen, welche Objekte in welcher Weise zu behandeln sind.
HORIZON, das in einigen Verbünden jetzt favorisierte Lokalsystem, soll UNMARC wenigstens an der Oberfläche darstellen, obgleich es intern mit USMARC arbeitet.
Z39.50-Server sollen UNIMARC neben USMARC standardmäßig liefern können, Z39.50-Clients sollen es verarbeiten können, wenn ein Server es liefert.

Eine UNIMARC-Definition für Bestandsdaten (holdings) soll in Vorbereitung sein.

Zusammenhänge
Hier gilt alles, was über MARC gesagt wurde. Die Definition der Teilfelder geht noch mehr ins Detail als bei USMARC. In der Praxis wird es hier eine Bandbreite von Unterschieden geben: die einzelnen Lieferanten können aus ihren jeweiligen nationalen Formaten nicht jedes Datail herausholen, das in der UNIMARC-Definition darstellbar ist.

Es gibt Teilfelder, die spezifisch für die Aufgaben des UNIMARC sind: $7 Verwendeter Zeichensatz, $8 Sprache der Katalogisierung. Diese sind tatsächlich nur für den Austausch sinnvoll, nicht in einem Lokalsystem.

Ein Feld - eine Nummer
Wie bei USMARC und MAB sind auch bei UNIMARC die Formate für Titeldaten und für Normdaten als getrennte Formate anzusehen, die nicht für eine gleichzeitige Anwendung in einer Online-Datenbank konzipiert wurden. Zahlreiche Feldnummern stimmen zwischen beiden Formaten überein (siehe oben), haben jedoch ganz andere Bedeutungen. Die einfachste Lösung wäre, in dem Format für Normdaten die erste Ziffer der Kategorienummern durch einen Buchstaben zu ersetzen, etwa 0 durch A, 1 durch B, ... 9 durch J. Die zweiteinfachste Lösung: eine vierte (oder nullte) Ziffer der Kategorienummer voranzustellen: 0 bei den Titeldaten, 1 bei den Normdaten.

Eine Eigenheit des UNIMARC sind die eingebetteten Felder. In Kategorien mit gemischter Zusammensetzung (z.B. Name/Titel als Eintragungselement) werden die verschiedenen Bestandteile (also z.B. ein Name und ein Titel) so angegeben, daß in einem ersten Teilfeld $1 eine vollständige andere Kategorie (einschließlich Nummer!) angegeben wird, in einem zweiten Teilfeld $1 dann genauso eine weitere Kategorie. Angewendet wird eine solche Technik bislang nur von der französischen Nationalbibliographie.

Redundanz wird beschränkt und Normierung gefördert, indem ausgiebig von codierten Daten Gebrauch gemacht wird. In einer Anzahl von Anhängen findet man Listen für die Codierung von Sprachen, Ländern, geographischen Regionen, Zeiträumen u.a.

Hierarchie und Verknüpfung
Hierarchische Sätze sind nicht möglich, Verknüpfungen aber sehr wohl. Eine eigene Gruppe von Kategorien (Gruppe 4 beim Titelformat, Gruppe 7 beim Normdatenformat) ist für die Verknüpfungen vorgesehen. In einer solchen Kategorie können die relevanten Kategorien des anderen Satzes (z.B. Seriensatzes) "eingebettet" sein: Jede 4er-Kategorie bildet ein eigenes Teilfeld $1 und steht dann dort komplett mit Kategorienummer und Indikatoren. Eine 4er-Kategorie ist, mit anderen Worten, ein "Datensatz im Datensatz". Diese Verfahrensweise kann von jeder Agentur in einem ihr genehmen Modus betrieben werden. Wenn man UNIMARC-Daten übernehmen will, muß man also besondere Aufmerksamkeit und besonderen Programmieraufwand auf diese Kategorien verwenden. In einer konkreten Realisierung des Formats kann es durchaus auch ganz anders aussehen, so z.B. in der Variante der Bibliograpahie Francaise auf CD-ROM, die ohnehin etliche Eigenwilligkeiten aufweist.

Wichtige Eigenschaften

Zeichensatz
Das Format definiert nur die Zeichencodierung für den Magnetbandaustausch. Der immer gültige Basiszeichensatz ist US-ASCII (ISO 646). Wegen der angepeilten Bandbreite der Anwendung wird mit mehreren Zeichentabellen gearbeitet, zwischen denen mit Steuerzeichen umgeschaltet wird. Das Arbeiten mit solchen gemischt codierten Daten ist für jede darauf nicht spezialisierte Software schwierig bis unmöglich.

Die Kategorie 100 (Allgemeine Verarbeitungsangaben) enthält mehrere Bytes zur Spezifikation der im jeweiligen Satz verwendeten Codierung und der Schrift des Katalogisats. Jeder Datensatz kann folglich hier seine eigenen Codierungen aufweisen!

Wiederholung
Das Handbuch sagt genau, welche Kategorien wiederholbar sind, jedoch nicht, wie oft! Wiederholbare Kategorien werden ohne unterscheidendes Zeichen mehrfach angegeben - wie bei den anderen MARC-Formaten. Mehrfachangaben innerhalb eines Feldes gibt es nur in der Form, als in vielen Kategorien wiederholbare Teilfelder definiert sind.

Daten fester Länge
Jeder Satz hat einen festen Vorspann von 24 Bytes, der dem USMARC entspricht, also der ISO-Norm 2709 (siehe 10.2 MAB).

Ferner sind die Kategorien der Gruppe 1 alle so definiert, daß sie eine Zeichenkette von fester Länge aufnehmen, in der jedes Zeichen eine festgelegte Bedeutung hat. Somit entsprechen diese Felder inhaltlich den USMARC-Feldern 007 und 008.

Kleinigkeiten
Für die Kennzeichnung von Nichtsortierungen werden zwei unterschiedliche Zeichen verwendet, die einen zu übergehenden Bestandteil einschließen. Man trifft jedoch auf Beispiele, die ohne jede Nichtsortierkennzeichnung auskommen!