Katalogisieren?

Besonders schwer kann das doch nicht sein!

... denkt jeder, der zum ersten Mal von dieser Tätigkeit etwas hört. Aber warum man dazu ein dickes Regelbuch mit ein paar hundert Paragraphen brauchen sollte, das leuchtet auf Anhieb wirklich niemandem ein. Allerdings: anfangs denkt auch niemand, Klavierspielen z.B. könne besonders schwierig sein. Bis man es versucht...

"Aber Moment mal!" werden Sie jetzt, auf der Höhe der Zeit, einwerfen wollen: "Ist sowas überhaupt noch zeitgemäß? Suchmaschinen im Internet machen alles vollautomatisch, Katalogisieren ist doch wohl was von gestern!" Es wurde schon gestern oder vorgestern erfunden, das stimmt. Wenn alles online wäre, könnte man Suchmaschinensoftware drauf ansetzen und mal schauen, wie's dann geht. Es ist aber nicht alles online, und zwar beiweitem nicht. Noch immer kommt ständig Neues hinzu, in großen Massen, was alles nicht online ist. Qualitätsware, die auf Papier oder CD Geld bringt, die wird auch auf Papier oder CD rausgebracht und nicht online. Von allen existierenden Büchern sind vielleicht 1% der Texte online, viel mehr sicher nicht. Anzunehmen, das sei schon alles Wichtige und der Rest tauge nicht mehr viel, das wäre denn doch arg daneben. Es hilft also nichts, Katalogisierung ist noch nicht verzichtbar. Aber gut, wir checken mal ab, ob man nicht alles ganz ganz einfach machen kann...

Aktueller Hinweis: Die Suchmaschinenfirma Google hatte auch irgendwann den Eindruck, es sei wohl sehr vieles noch nicht online, und will dem abhelfen: man ist seit Ende 2004 dabei, Bücher mit einzubeziehen, und zwar sowohl alte (in Kooperation mit Bibliotheken) wie auch neue (in Kooperation mit Verlagen: Google Buchsuche). Viele Millionen werden investiert. Nach einer Anfangsphase, in der man völlig autark nur mit automatisierten Methoden arbeitete, werden inzwischen immer mehr echte Katalogdaten einbezogen. Aber wir wollen nicht abschweifen.
Schauen wir uns zuerst als Beispiele CD-Aufnahmen mit klassischer Musik an. Das ist interessanter, als wenn man irgendwelche Bücher hernimmt. Dieselben Probleme treten aber alle auch bei Büchern und anderen zu katalogisierenden Objekten auf, nur manche nicht ganz so oft. 

Zwei der berühmtesten Werke der E-Musik sind Mozarts "Kleine Nachtmusik" und Beethovens "Fünfte". So etwas Bekanntes sollte doch leicht zu katalogisieren sein?

Sofort kommt jetzt nochmal die Frage: Ist das überhaupt noch nötig? Man stellt sie ins Regal unter Beethoven und Mozart, und fertig. Da findet sie doch jeder.

Bei einer kleinen Sammlung mag das wohl so sein, doch gibt es auch dabei schon Probleme:

· Sowohl die "Nachtmusik" wie die "Fünfte" sind sehr oft nicht das einzige Werk auf der CD, denn dafür sind sie zu kurz. Wenn nun z.B. beide zusammen auf einer Platte sind - wo stellt man die dann hin?

· Außen auf der Platte steht nicht immer das, was zur Einordnung nötig wäre, sondern irgendein Titel, den der Produzent für attraktiv gehalten hat: "Klassische Serenaden" oder "Schicksals-Symphonie".
(Für beide Phänomene gibt es jede Menge extreme Beispiele!)

Für Sammlungen mit mehreren tausend Objekten wird es völlig unmöglich, ohne Katalog auszukommen, vor allem natürlich dann, wenn die Sammlung nicht offen aufgestellt werden kann, sondern in einem geschlossenen Magazin steht. Wichtig ist aber auch, gerade bei großen Sammlungen, ob man von außen (über das Internet) in den Katalog schauen kann - um schnell festzustellen, ob sich's lohnt, hinzugehen! 

Ums Katalogisieren kommt man also nicht herum; seufz. Aber kompliziert braucht's doch wohl nicht zu sein? 

Aufstellung unter dem Komponisten (oder dem Verfasser, bei Büchern), na ok, das geht wohl nicht. Das Einfachste wäre dann, jeder CD eine laufende Nummer zu geben und sie hintereinander aufzustellen. So spart man sich auch das dauernde Herumschieben in den Regalen, wenn irgendwo der Platz knapp wird, und das Einsortieren nach Nummer kann eine Hilfskraft machen. Man braucht dazu nichts weiter als eine Liste mit Komponist und Titel - und was noch? Ach ja, die laufende Nummer (oder was sagt man dafür, Signatur?) Damit reicht's doch!

Also katalogisieren wir frechweg so: 

 Beethoven: Fünfte. Nr. 1234, 2567

 Mozart: Nachtmusik. Nr. 2567, 4109

Dann kann jeder sofort diese Werke finden. Und man sieht auch gleich: jedes dieser beiden Stücke ist zweimal vorhanden; und: auf der Platte 2567 sind offenbar beide Stücke drauf – Problem gelöst.

Banalität
Jetzt kommt ein ganz wichtiges Aha-Erlebnis: große Sammlungen machen größere Probleme als kleine. Klingt banal, zugegeben. Man merkt das aber erst so richtig, wenn man mittendrin ist.

In großen Sammlungen hat man viele Namen und viele Titel, das ist natürlich banal. Aber was soll's? Wir haben Plattenspeicher ohne Ende! Darum geht's aber nicht:

Schauen wir uns Namen und Titel mal näher an!

Namen

Das Alltagsleben lehrt: es ist viel schwerer, im Telefonbuch einer Großstadt einen "Schmidt" oder "Müller" zu finden, wenn man den Vornamen nicht weiß, als einen "Beethoven"oder "Mozart". Das ist auch in Katalogen so. Nehmen wir mal an, wir haben 100.000 CDs (oder Bücher etc.) zu katalogisieren! Am Anfang weiß man gar nicht, welche Namen eigentlich oft und welche selten vorkommen werden. Und wenn schon Vornamen, denn schon einheitlich im ganzen Katalog. Man könnte ja keine Regel aufstellen wie "Seltene Namen ohne, häufige Namen mit Vornamen". Das heißt also, wir müssen so katalogisieren:

Beethoven, Ludwig van: Fünfte. Nr. 1234, 2567    (Oder "van Beethoven, Ludwig"?  Oder mal so, mal so?)

Mozart, Wolfgang Amadeus: Nachtmusik. Nr. 2567, 4109
Manche Namen machen's einem aber sauer, Tschaikowsky zum Beispiel. Den schreibt man in jedem Land anders. Hat man eine internationale Sammlung, kommt vieles zusammen: bei der Library of Congress fand man 38 verschiedene Schreibweisen für den Namen dieser Persönlichkeit. Das glauben Sie nicht? Schauen Sie selbst. Es fehlen dabei sogar noch zwei Formen: das russische Original in kyrillischer Schrift und dann diese: Čajkovskij, Pëtr I.  (das ist die vom Deutschen Musikarchiv, also die RAK-WB-Form).

Aber schon so einer wie Georg Friedrich Händel ist nicht ohne: In England schrieb er sich selber "Handel", ohne Pünktchen, und so tun es die Angelsachsen bis heute, und mit "George Frideric" als Vorname. Was bedeutet das für die Suche? Die deutschen Umlaute sind ein ganzes Kapitel für sich...

In Zettelkatalogen hat man früher für jede Schreibweise einen Verweisungszettel gemacht mit "... siehe Tschaikowsky".  In einer Datenbank ist die Lösung ein Normdatensatz, der die Liste dieser Formen enthält und dann irgendwie dafür sorgt, eine falsche Eingabe wie "Chaikovski" auf die richtige umzubiegen.
(Einen Unterschied sieht man nebenbei: In Washington tun sie immer noch die Lebensdaten hinzu, 1840-1893, damit der Name auch wirklich eindeutig wird - man weiß ja nie... Und noch was:  das Č , also C mit Haček, das ist vorhanden in Berlin, nur der Web-Katalog gibt's nicht her. Beim Suchen allerdings, da braucht man's nicht einzugeben - und wer weiß auch schon, wie das ginge?)

Titel

Die "Fünfte" taucht oft als "Schicksals-Symphonie" auf, wie man weiß. Auf den Platten findet man aber auch "Sinfonie op. 67 in c-moll" oder "Symphony no. 5 in C minor" oder "Destiny majeur" und viele andere Formulierungen. Weil sich unter "Beethoven" leicht mehrere hundert Einträge sammeln, wird es für den Endnutzer dann sehr unübersichtlich. Der erwartet nämlich, die vorhandenen Versionen der Fünften alle zusammen zur Auswahl angeboten zu bekommen. Er will nicht endlose Listen durchforsten müssen und bei jedem Titel nachdenken, ob das wohl eine weitere Version ist oder nicht. Der Katalog soll, anders gesagt, zusammenführen, was zusammengehört. Also müssen wir schon beim Katalogisieren aufpassen und merken, aha, "Destiny majeur" ist eine Aufzeichnung der Fünften! Aber ist dann "Fünfte" wirklich als Titel brauchbar? Es gibt auch eine fünfte Klaviersonate und eine fünfte Violinsonate, nicht zu reden vom berühmten fünften Klavierkonzert (welches oft als "Emperor" daherkommt - auch ein Name, den Beethoven nicht selber erfand, der aber auf manchen Platten steht). Bei Büchern hat man dieses Problem nicht ganz so oft. Denken Sie aber z.B. an Goethes "Faust", an die Bibel, an "Grimms Märchen" und ganz allgemein an Bücher, die in Übersetzungen erschienen sind: das sind alles Fälle, wo mehrere Titel für denselben Inhalt in der Welt herumschwirren. Es ist nicht vorhersehbar, mit welcher Titelversion ein Nutzer kommen und suchen wird! Aber meistens kennt er nur eine Version sucht genau nach dieser, das ist ganz normal. Er wird also nicht nach "Fünfte" suchen, sondern nach "Destiny majeur", wenn ihm der Titel so zitiert wurde. Überhaupt sollte man, was die Fragen der Nutzer angeht, mindestens drei Standardsituationen unterscheiden:
  1. Der Nutzer hat sich ein bestimmtes Zitat aufgeschrieben und möchte genau die damit gemeinte Ausgabe des Werkes. Er hat also einen konkreten Titel, z.B. "Sinfonie in c-moll, op. 67" mit Karajan als Dirigent, und will dann in der Lage sein, genau diesen flott zu finden.
  2. Der Nutzer hat nur vor, sich die Fünfte mal anzuhören, egal wie sie betitelt wurde. Er soll also unter "Beethoven, Ludwig van: Fünfte" tatsächlich was finden können. Einfach  alles  durchsehen, was unter Beethoven steht, das geht zu weit (in diesem und auch in den anderen beiden Fällen)!
  3. Der Nutzer ist wissenschaftlich interessiert und will Vergleiche zwischen verschiedenen Aufführungen anstellen. Er braucht dann eine Liste der vorhandenen Exemplare von Aufzeichnungen der "Fünften", egal wie deren konkrete Titel lauten.
Dieselben Situationen treffen auch für Bücher zu, überlegen Sie sich das mal als Übung.  (An sich kein schlechter Gedanke, oder? Sich auszumalen, was für Situationen es gibt bei der Katalogsuche ... behalten wir das mal im Hinterkopf !)
Aber wie erreicht man das alles? Bibliothekare haben dafür eine Erfindung gemacht: den  Einheitstitel. Man gibt jedem Werk einen genau festgelegten Titel (naja, dafür braucht's schon auch ein paar Regeln...) und tippt diesen Einheitstitel in jedem Fall mit ein, wenn es irgendeine sonstwie betitelte Ausgabe des Werkes zu erfassen gilt. Dann werden, eben über diesen einheitlichen Titel, Nutzer 2 und Nutzer 3 alle vorhandenen Versionen sofort auffinden können. Derjenige Titel aber, der auf dem konkreten Objekt wirklich draufsteht, der sog. Vorlagetitel, der ist in jedem Fall einzugeben, sonst kommt Nutzer 1 nicht zum Zuge – sein irgendwo gefundenes Zitat nennt sehr wahrscheinlich nur den Vorlagetitel, weil den der Schreiber des Zitats normalerweise einfach abgeschrieben hat und sonst nichts.
Für die "Fünfte" lautet der Einheitstitel (nach RAK-Musik) Sinfonien op. 67. Dies wäre demnach beim Katalogisieren zusätzlich einzugeben, und unter diesem Titel sammeln sich bei entsprechender Indexierung alle Einträge zu diesem Werk.  
Ein Problem ist dann freilich dieses: Nutzer 2 und 3 müssen den Einheitstitel "Sinfonien op. 67" zuerst kennen, bevor sie damit suchen können. Weil man das aber nicht voraussetzen kann, sollte der Katalog sofort einen Hinweis geben - wenn eine der Varianten gesucht und gefunden wird - was für andere Varianten gibt und wie man sie alle zusammen finden kann unter dem speziellen Titel "Sinfonien op. 67". Ein Online-Katalog kann sogar einen Hyperlink anbieten, der etwa lautet: "Liste der vorhandenen Ausgaben dieses Werkes". Wenn dieser Hyperlink bei jedem der konkreten Titel auftaucht, braucht der Nutzer gar nichts vom Einheitstitel zu wissen. Beim Zettelkatalog wurde er an eine bestimmte Stelle verwiesen, also auf den Weg geschickt zu einer anderen Schublade. Für die "Fünfte" sollte es somit einen Normdatensatz geben, in dem als Auffindehilfe "Die Fünfte" und "Schicksalssinfonie" als Verweisungstitel drin stehen, nicht nur "Sinfonien op. 67". Dann könnte das so gehen: er tippt "Beethoven Fünfte" ein, das Programm stellt fest: "aha, dazu haben wir den Einheitstitel Sinfonien op. 67, also zeigen wir ihm alle Einträge dazu. Oder fragen ihn "Meinten Sie vielleicht ...?"
Ach so, die Nachtmusik? Da lautet der Einheitstitel ganz naheliegend "Eine kleine Nachtmusik". Nicht "Serenaden KV 525", das wird da nur als Verweisung verwendet - und so kann's dann auch zwischen den anderen Serenaden gesucht und gefunden werden.

Wenn Ihnen das mit dem Einheitstitel jetzt betulich vorkommt, dann schauen Sie mal bei Amazon rein. Die Burschen und Mädels in der Klassik-Abteilung dort haben irgendwann auch gemerkt, wie nützlich sowas ist. Für die Fünfte haben sie sich diesen ausgedacht: 
Symphony No. 5 in C minor ("Fate") Op. 67. Bei der Library of Congress heißt es ganz ähnlich, aber nicht ganz genauso: Symphony no. 5, in C minor (op. 67). Wenn man sich eine grenzüberschreitende, katalogübergreifende Suche ("virtueller Katalog") vorstellt, erkennt man: eine höchst interessante Aufgabe, diese Dinge zusammenzubringen. Momentan klaffen sie auseinander. Und die Folge? Das Weiterleiten einer Anfage von einer Datenbank zur anderen kann nicht die erwünschten Resultate erbringen - was bei der einen klappt, bringt bei der anderen womöglich gar nichts.

Aber schon wenn man gar keinen Katalog macht, sondern nur eine simple Liste, sind Überlegungen zur Vereinheitlichung der Titel nützlich. Als Beispiel hätten wir eine Liste Klassische Musik im Film anzubieten: Geordnet nach Komponist und dann unter dem Komponisten nach Werktiteln sieht man darin, in welchen Filmen einzelne Werke verwendet worden sind. Diese Liste würde wie Kraut und Rüben aussehen, wenn in der Datenbank, aus der sie stammt, bei der "Fünften" mal "Fünfte" und mal "Schicksalssymphonie" und mal "Sinfonie op. 67" stünde.

Falsche Sparsamkeit

Nochmal zu der Frage, was denn alles für Einzelheiten einzugeben sind oder eben nicht. Wir wollen beim Katalogisieren nicht viel eintippen, denn das ist ja Arbeit. Aber etwas fällt einem spätestens nach einer Weile denn doch auf: Wenn wir unter "Beethoven: Fünfte" nichts anderes im Katalog sehen als die Nummern der Platten, zwingen wir den Nutzer, zu den Regalen zu gehen und sich diese Nummern alle herauszusuchen, um eine bestimmte auszuwählen. Das ist entnervend. Etwas mehr als nur "Beethoven: Fünfte" sollte deshalb der Katalog doch hergeben, d.h. ein paar mehr Einzelheiten sollte man eingeben. Aber was? Orchester, Dirigent, Solisten, Opusnummer, Instrumentierung (Stimmenbesetzung), Aufführungsdatum, Zeitdauer, ... da kann manches zusammenkommen, was im Einzelfall mal interessant sein könnte. Und wonach vielleicht mal jemand suchen will. Mal dies und mal jenes einzugeben, nach Gutdünken und momentaner Laune, das wäre wohl nicht so gut. Ein paar Vorschriften dafür könnten nicht schaden, dann braucht man nicht jedesmal nachzudenken. Solche Vorschriften nennt man Beschreibungsregeln. Was dadurch entsteht, nennt man bibliographische Beschreibung. Wenn die gut gemacht ist, kann die schnelle Auswahl unter den vorhandenen Ausgaben direkt am Katalog stattfinden, der Weg zu den Regalen also entfallen - das ist ihr Sinn und Zweck: schon am Katalog unterscheiden, was verschieden ist. (Und später, vor dem Bestellen und beim Katalogisieren neuer Ausgaben, sind wir natürlich auch froh, wenn im Katalog erkennbar ist, welche wir schon haben...)
Auch hier könnte man einen Blick über den Zaun zu Amazon riskieren. Erreichen die mehr mit weniger Arbeit? Keinesfalls, sondern da wird ganz offensichtlich katalogisiert, und zwar massiv, denn sie haben alle einzelnen Stücke auf den CDs eingegeben, nicht nur die CDs als solche, und bei jedem Stück den Komponisten und das Orchester dazu, und offenbar haben sie für alles dieses intern ihre Normdaten, sonst könnte man die Namen nicht anklicken und dazu respektable Ergebnismengen erhalten. Da passiert also entschieden mehr als Suchmaschinentechnik mit automatischem Einscannen der vorliegenden Titel oder sowas. Wäre hochinteressant, darüber mehr zu erfahren.
Bei den Dingen, die man zusätzlich eingibt, sind mit Sicherheit auch wieder welche, nach denen jemand dann suchen können will. So z.B. die Stimmenbesetzung - da sind praktizierende Musiker ausgesprochen scharf drauf! Besonders einfach ist dieses aber gerade nicht, und auch in den "RAK-Musik" ist das nicht so recht überlegt worden: an das Suchen hat man dabei nicht gedacht, nur ans Aufschreiben.

Die vierte Dimension
Von drei Standardsituationen war vorhin die Rede. Schlimm genug, aber es gibt noch eine: Der Nutzer sucht kein bestimmtes Werk von einem bestimmten Komponisten, sondern will mal schauen, was denn alles für Sinfonien vorhanden sind, oder Serenaden. Suchbefehl "find sinfonie" - fertig? Nicht ganz. Oft hat der Produzent "Symphonie" und nicht "Sinfonie" draufgedruckt. Wenn man nur "Symphonie" katalogisiert - findet's keiner, der "sinfonie" eintippt.
Und wenn man eingibt "find serenaden" - findet man die Titel nicht, in denen es "Serenades" heißt, und schon gar nicht, wenn nur "Kleine Nachtmusik" draufsteht und katalogisiert wurde. Alles ganz banal, aber wer denkt denn beim Suchen an sowas? Nicht jeder. Noch schlimmer: der Nutzer könnte "Alles von Beethoven" wollen, aber nicht die Orchesterwerke. Oder nur diese. Oder nur Trios. Wie soll sowas gehen? Wie macht Google das? Macht es gar nicht, obwohl's vielleicht so scheint. Die Nutzer können nur dies und das und jenes probieren und kriegen in jedem Fall irgendwelche, aber unterschiedliche und unvollständige Listen, ohne erkennen zu können, ob es noch viel mehr gibt oder ob das Wichtigste für den jeweiligen Zweck schon dabei ist. Etwas besser als das sollte ein Katalog denn doch sein. Dann müssen da aber mehr Dinge drinstehen als das und nur das, was auf den Publikationen draufsteht, denn offenbar reicht das nicht. Man braucht noch mehr: Begriffe oder Bezeichnungen für die Themen oder Inhalte - also was eben wirklich drin steckt, auch wenn's im Titel nicht genannt wird. Sowas nennt man Sacherschließung. Traditionell ist das in den Bibliotheken getrennt, früher waren es separate Zettelkataloge. Aber heute steht alles im selben Online-Katalog. Nur: das Eingeben dieser Dinge bleibt einem immer noch nicht erspart, auch in eine Datenbank kommt nichts von selber rein. Ist aber ein Riesenthema für sich, die Sacherschließung; diese Pandorabüchse bleibt heute mal zu. Dafür gibt's ein anderes Kapitel.

Darf's noch etwas mehr sein?

Das ist immer noch nicht alles, leider.  Wenn man anfängt zu katalogisieren, findet man ständig neue Probleme, das ist das Interessante an dem Job. Denn die Phantasie derer, die Bücher oder CDs usw. produzieren, ist grenzenlos. Nur an eins denken sie anscheinend selten: ob man die Produkte hinterher leicht auffinden kann. Im Internet sieht das nun aber anders aus! Da machen sich viele Leute Gedanken, wie sie ihre Website in Google ganz nach oben katapultieren könnten. Sie schreiben bestimmte Wörter zigmal rein, unsichtbar  - damit Google denkt, das sei was ganz wichtiges zu dem Thema. Solche Tricks werden sogar verkauft. Aber ob Bücher in Katalogen leicht gefunden werden können, wie gesagt, scheint Verlage wenig zu interessieren. Also müssen, ob sie wollen oder nicht, Bibliothekare dafür das Nachdenken übernehmen.
Aber nicht zuviel auf einmal! Lassen wir heute mal beiseite, was für Späße es sonst noch gibt: Mehrteilige Werke, wo jeder Teil einen eigenen Titel hat; Serien und Zeitschriften, die gerne den Titel ändern; Loseblattsammlungen; Neuauflagen mit neuem Titel; Bücher ohne Verfasser; Bücher, die von Vereinigungen (sog. Körperschaften) rausgebracht werden und nach denen vielleicht auch jemand suchen will - aber die ändern dann auch noch ihre Namen, oder sie haben mehrere, usw. usf.
Mit diesen Vorbemerkungen sind wir einigermaßen gerüstet, uns noch etwas mehr Katalogisierungs-Theorie zuzumuten. Das machen wir aber möglichst konkret, und zwar mit der Frage: Wie katalogisiert man ein Buch? Wir schauen genauer hin, in welchen Schritten das gemacht wird und was man sich dabei zu überlegen hat. Hier ist das alles mal übersichtlich aufgeschrieben:

http://www.allegro-c.de/regeln/rak-einf.htm

Und damit kommt man der Frage dann schon näher, ob man ein dickes Regelbuch wirklich braucht...
Wer schon die Regeln einigermaßen kennt und sich fragt, wie das alles weitergehen soll, für den gibt es ein Kapitel mit Überlegungen zur Zukunft der Katalogisierung, vorgetragen auf dem Österreichischen Bibliothekartag 2004 in Linz.

Und noch eine Zugabe: Was sind eigentlich Dateien?

Das Gerücht mag ja falsch sein, aber es soll Leute geben, die nicht so recht wissen, was denn Daten und Dateien eigentlich wirklich sind. Angeblich trauen sie sich nicht, mal zu fragen. Oder sie machen sich's bequem und meinen, das brauche man auch alles nicht zu wissen. (Die fallen aber dann ganz schön rein, wenn's mal drauf ankommt. Sie befinden sich, wie Kant es gesagt hätte, in "selbstverschuldeter Unmündigkeit".) OK, falls da was dran ist, und wo wir schon mal dabei sind, legen wir noch ein Extra-Kapitel bereit, das mal den Versuch macht, Licht in diese Materie zu bringen. Fundamente freizulegen, sozusagen, die Microsoft mit dicken Schichten von Oberflächen-Brimborium überbaut und zugekleistert hat. Selbst ein Buch wie "PCs für Dummies" enttäuscht leider an dieser Stelle: es macht einen Bogen um die Frage, was Dateien wirklich sind und aus was sie bestehen.
 


Bernhard Eversberg, 2003-07-10 / 2007-12-12