NAVIGARE NECESSE EST oder: Wie knüpft man die richtigen Beziehungen?


Zu den heute geforderten Funktionen von Katalogsystemen gehört das Navigieren. Auch wer dieses Wort nicht kennt, navigiert täglich, und zwar bei jedem Klick auf einen Hyperlink. Es tut somit not, dem Nutzer Hyperlinks zu präsentieren - damit er zu "Ressourcen" surfen kann, die mit dem vorher gefundenen Dokument irgendwie zusammenhängen.
Hyperlinks machen sich nicht von selbst, es muß etwas dahinterstecken, am besten ein Konzept, das die Beziehungen zwischen den Dokumenten in praktikabler, plausibler Weise abbildet. Wer keine oder die falschen Beziehungen hat, den bestraft das Leben - in Katalogen ist das nicht anders.

Schnell etwas zu den Begriffen: Statt des im Deutschen wenig passenden "Ressource" wird in dieser Darstellung Dokument bevorzugt. Damit sind auch Tondokumente, E-Publikationen, Filme usw. usf. eingeschlossen. Nicht jedoch Personen,  Körperschaften und Begriffe (s.u.). Dazu sagen wir gleichfalls nicht  "Ressourcen", sondern "Personen", "Körperschaften" und "Begriffe".


Hier wird beschrieben, wie im Neutralformat das Verknüpfen zwischen Datensätzen gelöst ist. In Dublin Core pauschal mit Relation bezeichnet und nicht weiter spezifiziert, fällt darunter die Beziehung eines Teils zum Ganzen, aber auch die der Bearbeitung oder Übersetzung zum Original, die zeitliche Aufeinanderfolge und einiges mehr. Letztlich ist auch das "Werkschlagwort" nichts anderes als die Angabe einer Beziehung des damit versehenen Dokuments zu einem anderen, genau wie der Einheitstitel. Jedoch: Nicht immer ist das Bezugswerk als solches, z.B. das Originalwerk, ebenfalls in der Sammlung bzw. in der Datenbank vertreten! Zumal dann, wenn man bedenkt: das "Werk" ist ein Abstraktum und kann als solches gar nicht Teil einer Sammlung sein...

Das trifft insbes. zu für die häufigste aller bibliographischen Beziehungen - die wir beim Katalogisieren gar nicht berücksichtigen: das Zitat. Ohne genau diese Beziehungen läuft ja nichts beim wissenschaftlichen Publizieren, auch das weiß jeder: Das Zitieren und besonders das Zitiertwerden gehört zu den Grundlagen des Erfolgs. Und folgerichtig war und ist der Science Citation Index ein erfolgreiches wie erfolgssicherndes Instrument (wir sagen nur "impact factor"!). Genauso folgerichtig beruht Googles Ranking und das erfolgreiche Suchen mit Google auf der Auswertung von Zitaten, hier in Form der URLs, die ja nichts anderes sind als E-Zitate. (Der Vorteil bei dieser Art Zitat ist, daß es sehr exakt sein muß, um überhaupt zu funktionieren! Nur deshalb kann Google überhaupt die Zahl der Zitate ermitteln, die auf eine gegebene Adresse zeigen. Bei gedruckten Zitaten ist das oder wäre das sehr viel schwieriger: beim SCI werden Zitate mit viel Personalaufwand sehr streng normiert.)

Normdaten
Es werden hier nur die Beziehungen zwischen bibliographischen Datensätzen behandelt, nicht die Verknüpfungen zwischen solchen und den Normsätzen für Personen, Körperschaften und Begriffe!
Dafür gibt es die einheitlichen Normsätze und die sog. "V14-Methode".

Der DC-Term "Relation" wird ganz knapp so definiert:
Relation
Definition: A reference to a related resource.
Comment:
Recommended best practice is to identify the referenced
resource by means of a string or number conforming to
a formal identification system.
DC (und auch FRBR) verstehen auch Personen, Körperschaften und
Begriffe als "Resources":
... an information resource is defined to be "anything that has identity".
Da wir für die Normdatenverknüpfung jedoch ein einheitliches und bewährtes Konzept haben, bleibt sie an dieser Stelle außen vor. Nur ganz kurz: Im Datensatz schreibt man z.B. _123456, dann wird die Ansetzungsform aus dem Normsatz mit der Nummer 123456 an dieser Stelle eingesetzt, z.B. beim Indexieren oder Anzeigen von Daten. Diese Technik hat sich seit Jahren bewährt - sie ist genau das, was DC als "recommended best practice" andeutet!

In den traditionellen Formaten finden Beziehungen an verschiedenen,  untereinander beziehungslosen und disparaten Stellen ihren Niederschlag: Serien-, Gesamt-, Einheits-, früherer/späterer Titel...
Verknüpfungen sind meistens nur textuell realisiert, in MARC21 sogar ausschließlich und nie mit IdNummer, wobei aber der Ansetzungstext eine eindeutige Zeichenfolge ist - genau wie eine IdNummer.
MAB, Pica und allegro kennen die Verknüpfung des Bandes zum Hauptdatensatz per IdNummer, aber eine Serie wird oft in Textform angegeben, die Beziehung eines Aufsatzes (als UW erfaßt) zur Zeitschrift kann auch per IdNr der Zeitschrift dargestellt werden, bei allegro auch mit einem praktischeren "Kürzel" statt IdNr. Es gibt also eine bunte Mischung von Methoden, die gleichwohl nicht alles abdecken, was man sich mit dem Ausdruck "Relation" in der DC-Bewegung gedacht haben mag.

Zwar wäre die IdNummer des Bezugssatzes das zuverlässigste Element für eine Verknüpfung, aber eine solche Nummer steht nun mal nicht immer zur Verfügung! Jedenfalls immer dann nicht, wenn der Bezugssatz gar nicht im System existiert. Ersatzweise braucht man eine textuelle Benennung des Gegenstands, auf den man sich beziehen will. Meistens ist dieser Bezugsgegenstand (engl. entity) ein Werk. Die Benennung dieses Werks (engl. in RDA: "citation") wird damit zu einem zentralen Problem der Katalogisierung! Wobei aber, nochmals, das "Werk" als Abstraktum (RAK: "geistige Schöpfung") gar keinen eigenen Datensatz besitzt, sondern immer nur irgendeine seiner Fassungen (expressions). Doch benannt muß es irgendwie werden, das Werk, und dazu gibt es bislang in der Formalkatalogisierung nur das Element "Einheitstitel". Diesen will man offenbar in RDA aufwerten und präzisieren - und ihn dann citation nennen (statt wie bisher "uniform title" - diesen will man den Nutzern nicht länger zumuten). Nach dem Stand vom Juni 2006 soll das RDA-Kapitel 13 beschreiben, wie eine citation auszusehen hat Erschienen ist erst das Kapitel 6, in dem die Arten von Beziehungen beschrieben werden, die man beim Katalogisieren berücksichtigen könnte.

Theoretische Darstellungen von "bibliographic relationships" gibt es einige: zu nennen ist an erster Stelle Barbara Tilletts Dissertation, aber auch Arbeiten von Sherry Vellucci im Bereich der Musik-Katalogisierung sind sehr bekannt. Letztere Autorin hat 1997 (anläßlich der AACR-Konferenz in Toronto) einmal vieles ordentlich zusammengefaßt:
Music Metadata and Authority Control in an International Context

Nebenbemerkung: Vielleicht vermutet mancher eine Beziehung zwischen  dem Begriff "Relation" und dem Konzept der Relationalen Datenbank. So ist es aber nicht gemeint. Ein überzeugendes, leistungsfähiges relationales Datenmodell für Katalog- oder Metadaten ist wohl auch noch nirgends entwickelt worden, wenngleich es an Versuchen sicher nicht gefehlt hat.

In den bekannten FRBR-Dokumenten, und daraus folgend in RDA, haben sich Tilletts Gedanken deutlich niedergeschlagen. Sowohl RDA wie auch FRBR stellen aber keine Anleitung bereit, wie die Beziehungen in einem Datenformat zu codieren seien. Die Traditionsformate gehen nicht weit genug, das allegro-Format hat mehrere unterschiedliche Techniken, Unimarc hat zwar das Segment 4 "Linking Entry Block", aber dort wird mit einem wiederholbaren Unterfeld $1 gearbeitet, das immer ein anderes Datenfeld mitsamt Kategorienummer, Indikatoren und Unterfeldern enthält. Ein Link-Feld kann also einen Mini-Datensatz mit allem Drum und Dran umfassen! In der Theorie mag das bestechend sein, leicht handhabbar ist es aber nicht.

Deshalb stand man bei dem Entwurf des sog. allegro-Neutralformats, obwohl dies ja kein alternatives Vollformat sein soll, vor der Frage, wie darin die diversen Beziehungen zwischen Datensätzen möglichst einfach, aber vielseitig anwendbar abzubilden seien, damit wirklich alle vorhersehbaren Beziehungswünsche abgedeckt werden können. Es führte kein Weg daran vorbei, hier einen neuen Ansatz zu wagen. Erst jetzt ist er soweit gediehen, daß man ihn vorstellen kann - was hier geschieht.
Es folgt der erweiterte Entwurf des Blocks 4 (es ist Zufall, daß dies dieselbe Nummer ist wie bei Unimarc, andere Ähnlichkeiten gibt es nicht!).
Das Format kann in zwei Varianten angewendet werden:
a) Einfach: Nur #400 mit den geeigneten Unterfeldern, insbes. $t (Typ)
b) Differenziert: #410 - #480. Hier kann man nochmals wählen, ob man für die Beziehung Teil<->Ganzes nur die 410 einsetzt (dann evtl. mit $t) oder aber die #411 - #410
Empfohlen wird die differenzierende Vorgehensweise.

allegro-Neutralformat : Abschnitt "Beziehungen"

Wenn man bei einem Projekt streng werkorientiert vorgehen will (FRBR-Konzept), kann man alle Beziehungen zwischen Datensätzen hier ansiedeln und die mehr traditionell-bibliothekarischen Felder #120 und #170 nicht benutzen.
Inhalt: In jedes dieser Felder kommt der Titel eines Bezugswerks. Diverse Unterfelder können hinzukommen, z.B. $c für den Verfasser des Bezugswerks und das Standard-Unterfeld $I für dessen IdNummer, falls vorhanden.
Wer nichts anderes will als DC-konform zu arbeiten, benutzt nur #400, hat aber darin die Möglichkeit, Typen von Beziehungen mit dem Unterfeld $t zu differenzieren. Wer die anderen Felder benutzt, weil dies übersichtlicher ist, kann dennoch bei einem Export alles auf die #400, also auf das eine DC-Element "Relation" abbilden (sog. dumbing down).

Beispiele in blauer Farbe. Unterfelder sind in den Beispielen mit dem Code markiert statt mit $, wie es den Daten entspricht.
#400 Bezugswerk Relation* Titel eines anderen Dokuments, zu dem eine Beziehung besteht  [Dublin Core]
Anwendbar hier auch die Unterfelder von #100 / #120
Die Unterfelder gelten auch für die anderen Felder dieser Gruppe:
$I FldId =RelatIdNr
$D FldDate -- Erscheinungsjahr des Bezugswerks
$U FldURL =RelatURL -- URL des Bezugswerks
$c Creator =RelatVerf -- Verfasser u.a. d. Bezugswerks, falls nicht in #200
$s VolumeSort =SortZlg -- normierte Sortierzählung des Bandes
$v Volume =Band -- Band- oder TeilNr
$x Excerpt =BestandTeil -- z.B. KapitelNr o.ä.
$o OrigLang =OrigSpr -- Originalsprache
$y Year =Jahrgang -- ErschJahr d. Orig.
$i Issue =Heft -- Zeitschriftenheft
$p Position =Position -- z.B. Seitenzahl innerhalb Bezugswerk
$t RelTyp =BezugsTyp --
Welcher Art ist dieses Werk in Bezug auf das Bezugswerk?
   p Part          -- 1 Teil der Gesamtheit
   x Expression    -- 2 Andere Fassung des Werks
   s Sequential    -- 4 Chronologischer Bezug (vorher-nachher)
   r Review        -- 5 Rezension, Kritik, Bewertung, Interpretation...
   u Used          -- 6 Verwendung (z.B. Musikstück in einem Film)

Empfehlung: statt dessen Verwendung der Felder (#411-#460):
[die Ziffern finden sich in den u.a. Feldnummern wieder!]
#400 Lecture notes in computer sciencetpsv3507I129300152 [Serienstück]
#400 Naturetpjv171i4356y1953p737-738 [Artikel]
#400 Zwischen Schreiben und Lesent
pcD1995p203-223 [FestschriftsBeitrag]
#400 Was können wir wissentpmcVollmer, Gerhardv2I654321
#410 Gesamtwerk Whole Angabe des Gesamttitels. Für selbständige Teile mehrteiliger Dokumente, wenn ein solcher
Teil einen eigenen Datensatz erhält (früher "Stücktitel" genannt)
$t RelTyp =BezugsTyp  [Welcher Art ist das Gesamtwerk?]
   s series     -- 1 Serie (Serienstück)
   m multipart  -- 2 mehrteilige Veröff. (Band, Suppl.)
   b book       -- 3 Einzelveröff. (Kapitel)
   j journal    -- 4 Zeitschrift (Aufsatz)
   c collection -- 5 Aufsatzsammlung (Beitrag) auch: Einzelstück auf einer CD

Empfehlung: statt dessen Verwendung der Felder #411-#415:
#410 Lecture notes in computer sciencetsv3507I129300152 [Serienstück]
#410 Nature
tjv171i4356y1953p737-738 [Artikel]
#410 Zwischen Schreiben und LesentcD1995p203-223
[FestschriftsBeitrag]
#411 SerienTitel Series Schriftenreihe
#411 Lecture notes in computer science
v3507I129300152 [Serienstück]
#412 GesamtTitel MultiPart Haupttitel eines mehrteiligen Dokuments
Kann entfallen, wenn Hauptsatz vorhanden und per #020 verknüpft. Redundant kann man also hier (wie in Pica) Titel und Verf.Angabe des Hauptdokuments einbringen:
#412 Was können wir wissencVollmer, Gerhardv2I654321
#413 BuchTitel Book Für Teile von Dokumenten (Kapitel o.a.)
#100 Tonio Kröger
#200 Mann, Thomas

#413 Erzählungen
p265-331 [Werk in einer Sammlung]
#414 ZeitschTitel Journal Für Aufsätze
#414 Naturev171i4356y1953p737-738 [Artikel]
#415 SammlungsTitel Collection Für Beiträge in Sammelwerken (Festschriften, Tagungen, ...)
#100 Im Zweifel das Bewährte : Quergedanken über Datenbanken
#415 Zwischen Schreiben und LesenD1995p203-223 [FestschriftsBeitrag]
---------------------------------------------------
#100 Sinfonia pastorale en re maggiore
#20c Manf#BE1E3Cini, Francesco

#415 Italian Christmas concertos
x1-3 [Stück auf Spur 1-3 einer CD]
#420 Werk Work Unterfelder wie in #100 und #120    Alternative zu #120
#440 ChronRelat
Chronologische Beziehung zu einem anderen Dokument
Empfehlung: 5 speziellere Felder, und zwar #441 - #445
#441 FruehererTitel EarlierTitle Früher u.d.T. ...  bei Zeitschriften u.ä.
#442 SpaetererTitel LaterTitle Später u.d.T. ...  bei Zeitschriften u.ä.
#443 VereinMit MergedWith Vereinigt mit ...
#444 HervorgAus SplitOff Hervorgegangen aus ...
#445 ParalleleAusg SimultEd Inhaltsgleiches, zugleich erscheinendes Dokument z.B. in anderer Sprache




#450 RezVon
ReviewOf Das Dokument ist eine Rezension, Beschreibung o.ä. von ...
#100 ¬Die¬ Deutschen - ein Volk von Tätern?
#450 Hitler's willing executioners
cGoldhagen, Daniel Jonah
#460 VerwendIn
UsedIn Das Dokument wird verwendet in ... [z.B. Musik in Film]
#100 Pomp and Circumstance March No. 1
#460 ¬A¬ Clockwork Orange
#470 WerkThema
WorkSubj Behandeltes Werk (Werkschlagwort)   Alternative zu #170
#470 ¬A¬ midsummer night's dreamcShakespeare, William
#480 BeziehungZu RelationOther Andere Beziehung zu einem anderen Werk
#490 free4
FREI f. weitere, anwendungsspezifische Gesamtheits-Angaben
$I RelId =IdNr des Gesamtwerks -- falls dieser vorhanden ist!
In jedem der Felder kann zum Gesamtsatz verknüpft werden:


V14-Methode des allegro-Systems
Für Normdaten aller Art gibt es im Neutralformat die Normsatz-Kategorien #n00 - #n99.
Die wichtigsten sind diese:
   #n00 Systemeigene NormNummer oder "Kürzel"
   #n10 Normsatztyp
   #n30 Ansetzungsform (Name, Schlagwort, ...)

ferner gibt es Spezialkategorien wie diese:
   #n4p Pseudonyme
   ...
Die Wirkungsweise ist schnell erklärt. Wenn man diesen Satz  hat:


#n00 tucho
#n10 p
#n30 Tucholsky, Kurt
#n4p Hauser, Kaspar|Tiger, Theobald|Panter, Peter|Wrobel, Ignaz

kann man in Datensätzen jederzeit und überall schreiben:  _tucho  und dieses Kürzel wird dann automatisch durch die Ansetzung aus #n30 ersetzt, wo immer es gebraucht wird.




[i] zuletzt aktualisiert: 17.01.2022
Email: b-eversberg@gmx..de