Rechtschreib-Debakel in den Katalogen
Beispiele und neue Vorschläge
B. Eversberg, UB Braunschweig, 2000-07-03 / 2004-07-20


[Überarbeitete Fassung einiger INETBIB-Beiträge vom Juli 1998, kurz nach dem Urteil des Bundesverfassungsgerichts zur Rechtschreibreform. Vorangegangen waren einige kürzere Äußerungen von verschiedenen Seiten.]
Anm. Juli 2004: Die inzwischen seit 1998 eingetretenen weiteren Veränderungen sind in diesem Text nicht berücksichtigt! Zu einer Verbesserung der Problemlage tragen sie eher nicht bei.

Gegen die Probleme, die in unseren Katalogdatenbanken durch die Rechtschreibreform zu erwarten sind, wurden schon mächtige Geschütze aufgefahren: Vorschläge wurden angedacht zur Konstruktion und Institutionalisierung von Konkordanzdateien, wobei dann auch Schreibvarianten von insbes. englischen Wörtern in die Überlegung einbezogen wurden.
... in diesem Beitrag geht es um die Substanz der Änderungen durch die Rechtschreibreform. Es wird sich zeigen, welche Probleme sich bei genauerem Hinsehen daraus für eine Wörterbuchlösung ergeben. Es wird sich auch zeigen, daß größere Mengen von Fällen auch ganz anders gelöst werden können, und zwar mit viel geringerem Aufwand. Am Schluß wird ein Drei-Komponenten-Verfahren vorgeschlagen, das mit relativ geringem Aufwand auskommt - im Vergleich zu den "schweren Geschützen" eher eine dreiläufige Schrotflinte.
Doch eine Tatsache bleibt bestehen: unsere Daten werden ab sofort weiter "verunreinigt" (d.h. die Inkonsistenz steigt stärker als bisher). Im Ausland wird man wohl keine der Lösungen, die wir uns ausdenken mögen, nachvollziehen. Das bedeutet, daß deutsche Bücher in der Welt (noch) schwieriger auffindbar werden als vor der Reform - spätestens dann, wenn die nachwachsende Generation das "neue" Deutsch gelernt hat und damit auf die Kataloge losgeht.
Die Rede ist hier nur von KATALOGsytemen. Über Suchmaschinen und Volltextsysteme mögen andere nachdenken, die dafür mehr Kompetenz besitzen. (Das Wortgut in Katalogen ist überwiegend Titel- und Schlagwortmaterial, und dieses besteht meistenteils aus Nominalphrasen und unterliegt einer gewissen intellektuellen Kontrolle! Bei Volltextdaten, auch schon bei Abstracts, ist das anders: es treten Satzkonstrukte auf und viel mehr unkontrolliertes, auch irrelevantes oder gar irreführendes Vokabular.)
Unkritisch für OPACs, weil nicht relevant oder algorithmisch sehr leicht zu lösen, sind Groß-/Kleinschreibung, Kommasetzung, Akzente, Silbentrennung, und auch ss statt ß.
Das Thema Umlaute, nebenbei bemerkt, wird durch die Reform nicht berührt. Man kann dazu auf ein von der Regelwerkskonferenz angenommenes Gutachten verweisen ("Zur Ordnung und Codierung der Umlautbuchstaben", Mai 1998). Es kann sein, daß rein zahlenmäßig die Umlaute ein viel größeres Problem darstellen, jedenfalls bei grenzüberschreitenden Abfragen, als die Auswirkungen der Rechtschreibreform, jedoch sind sie viel leichter zu beherrschen, es sind ja nur drei Sonderbuchstaben mit je zwei Alternativen!

Spürbare Effekte enstehen nur durch die Änderungen in den Bereichen

A. Zusammen-/Getrennt-/Bindestrichschreibungen
B. Wortstammänderungen
C. Dreifach- statt Doppelbuchstaben
D. Eindeutschung von Schreibweisen

Dazu folgt jeweils eine Liste mit Beispielen. Links ist die Anzahl Einträge angegeben [Mitte 1998], die im zentralen Katalog des GBV (Göttingen, ca. 12 Mio. Datensätze) bzw. im OPAC der UB Braunschweig (400.000 Einträge) zu den Wörtern zu finden sind. Für beide Datenbanken ist allerdings nicht bekannt, wieviele deutsche Titel sie enthalten. Es sind immer auch die flektierten Formen (Genitiv, Dativ, Plural...) mit berücksichtigt, ferner, soweit möglich, Zusammensetzungen mit anderen Wörtern, wobei die hier genannten den ersten Teil bilden. Die anderen, wo also die hier aufgeführten Wörter hinter einem anderen in einer Verbindung stehen, konnten nicht ermittelt werden! (Z.B. lungenkrebserregend, leichtmetallverarbeitend, Baustop, Zechenstillegung...)
Für Katalogisierungs-Laien: Die Listen bedeuten keinesfalls, daß nur diese Einträge alle zu ändern wären, und damit wär's dann getan! Man kann nicht davon sprechen, die Kataloge "auf die neue Rechtschreibung umzustellen." NICHTS darf geändert werden, denn die Wörter stehen so in den Büchern, sind deshalb auch in allen Bibliographien so zitiert, müssen daher so katalogisiert werden, damit sie auch so gefunden werden können. Dieses Prinzip heißt "Vorlagentreue" und ist ein Grundpfeiler der Katalogisierung. Ohne dieses Prinzip hätte man große Probleme mit dem Datenaustausch und der Verbundkatalogisierung, ganz besonders im Austausch mit dem Ausland. Die Daten, so wie sie jetzt sind, müssen so bleiben für alle voraussehbare Zeit. Und genau daraus erwächst das Debakel: neue Buchtitel werden neue Schreibweisen enthalten und müssen konsequent auch so erfasst werden. Damit entstehen neue Einträge an anderen Stellen in den Registern, also Inkonsistenzen, die sich progressiv immer häufiger auf die Suchergebnisse auswirken werden. Immer mehr wird man an diese Möglichkeit denken müssen, d.h. man wird die alte Rechtschreibung auf keinen Fall verlernen dürfen! Von Bibliothekaren kann man das vielleicht verlangen (obwohl sie dafür keine Erschwerniszulage bekommen werden), aber vom Publikum und von Ausländern? Die werden in wenigen Jahren fast nur noch die neuen Schreibungen als Suchwörter eingeben, also z.B. nach "nichtlinear" oder "andersdenkend" gar nicht erst suchen.

A. Zusammen-/Getrennt-/Bindestrichschreibungen
Kritisch sind nur die Fälle, die vorher zusammen und jetzt getrennt geschrieben werden oder umgekehrt, denn Bindestrichwörter konnten auch bisher schon doppelt indexiert werden, damit man sie als Ganzwort wie auch beide Teile einzeln finden kann.
Diese kritischen Fälle sind mit 'x' am linken Rand markiert.

              alt:                     neu:

     115   7  afro-amerikanisch        afroamerikanisch
x    215  22  alleinerziehend          allein erziehend
x    111  10  allgemeingültig          allgemein gültig
x    593  24  allgemeinverständlich    allgemein verständlich
      56   3  altberliner              alt-berliner
x     36  --  andersdenkend            anders denkend
     504  19  anglo-amerikanisch       angloamerikanisch
x    ~50   3  Cash flow                Cashflow
x     19   5  datenverarbeitend        Daten verarbeitend
x     14   4  duennbesiedelt           duenn besiedelt
x     17   1  eisenverarbeitend        Eisen verarbeitend
x     16   1  eislaufen                Eis laufen
x      8   1  erdölexportierend        Erdöl exportierend
x     39   2  ernstgemeint             ernst gemeint
x    ~50   1  Fast food                Fastfood
    ~200  11  Feedback                *Feed-back
x     36   1  fleischfressend          Fleisch fressend
x      9   2  getrenntlebend           getrennt lebend
x         --  gutunterrichtet          gut unterrichtet
x     17   1  hilfesuchend             Hilfe suchend
x     20   2  Joint-Venture            Joint Venture oder Jointventure
x     26  10  krebserregend            Krebs erregend
x    249  14  leichtverständlich       leicht verständlich
x    465  19  metallverarbeitend       Metall verarbeitend
      45   3  Midlife-crisis          *Midlifecrisis  [engl.: mid-life crisis!]
x     ??  20  New Age                 *Newage
x     28   6  nichtleitend             nicht leitend
x   3974 810  nichtlinear             *nicht linear
x    193  21  nichtrostend             nicht rostend
x      2  --  nichtssagend             nichts sagend
x     87   4  notleidend               Not leidend
x    222  26  radfahren                Rad fahren
x  8   2  rueckwärts...            rueckwärts ...
x 62   6  schwachbe...             schwach be...
x     49  --  Safer Sex               *Safersex
       5  --  Schnee-Eule              Schneeeule
     484  20  Science-fiction          Sciencefiction
x      1  --  vielbefahren             viel befahren
    1662  35  100jährig                100-jährig [gilt für alle Zahlen]
x      4   1  zulasten                 zu Lasten
x    524   9  zuviel                   zu viel
Die mit * gekennzeichneten Wörter dürfen auf beide Arten geschrieben werden. Einige dieser Beispiele stehen stellvertretend für viele andere Wörter, die in gleicher Weise verändert werden (leichtverderblich, kunststoffverarbeitend, ekelerregend, ...) Natürlich sind jeweils die flektierten Formen mit zu berücksichtigen. Will man dieser Problemgruppe mit einer Wörterbuchmethode begegnen, wird es schwierig: die neuen Schreibweisen bestehen oft aus zwei Wörtern, das ist ja gerade die Neuerung. Was der Mensch leicht aus dem Kontext als zusammengehörig erkennt, ist für den Computer sehr viel schwieriger als eine Einzelwortverarbeitung.
Ein Sonderproblem sind Verbindungen mit "nicht...", davon treten allein im Katalog der UB Braunschweig weit über 1000 auf, und nicht selten sind das hochsignifikante Wörter, die man doch gerne finden können würde. Die Neuregelung schreibt für "nicht"-Wörter vor: getrennt, wenn ein Partizip folgt (nicht rostend), aber beide Schreibungen sind zulässig, wenn ein Adjektiv folgt (nicht linear oder nichtlinear). Die Wörterbuchsoftware, wollte man sie denn entwickeln, dürfte sich also nicht auf einen Wortvergleich beschränken, sie müßte bei bestimmten Wörtern das nachfolgende mit heranziehen, besonders bei "nicht". Jede neue solche Kombination, und bei Dissertationen z.B. gibt es immer wieder neue, müßte intellektuell geprüft werden: ob es wirklich eine Wortkombination ist und ob sie wohl früher zusammen geschrieben worden wäre! Die "nicht"-Probleme sind jedoch nicht neu: wir haben schon jetzt manchmal alle drei möglichen Schreibungen, z.B. bei "nicht thermisch". Bindestrich-"nicht"-Wörter treten in Braunschweig 316mal auf. Ohne Wörterbuchsoftware könnte das Getrennschreibungsproblem am besten durch ein System gelöst werden, das einen "Nachbarschaftsoperator" hat oder mindestens in der Lage ist, Kombinationen von Wörtern aufzufinden, die direkt aufeinander folgen. Man muß dann nur beim Suchen daran denken, daß man diese Option benutzt UND daß es ältere, zusammengeschriebene Fälle geben kann.

B. Wortstamm-Anderungen

            alt:                     neu:

  11     2  aufgerauht               aufgeraut
 934    31  essentiell              *essenziell
1326   500+ differential/ell...     *differenzial/ell...
 179    23  existentiell            *existenziell
 179     4  Delphin                 *Delfin
 331    22  Facette                 *Fassette
  44     4  fritier...               frittier...
 229     1  Greuel                   Gräuel
 110     1  Joghurt                 *Jogurt
  20    --  Justitiar               *Justiziar
  94    --  Känguruh                 Känguru
  77     1  numerieren/ung...        nummerieren/ung...
 451    11  Panther                 *Panter
 127    21  Plazieren/ung            Platzieren/ung
3000+  300+ Potential/ell            potenzial/ell
1106    72  rauh...                  rau...
3016   115  selbständig...          *selbstständig...
 439    63  sequentiell...           sequenziell...
 100+   --  Spaghetti               *Spagetti
  80+    6  stengel                  Stängel
  10    --  Steptanz                 Stepptanz
  ??     2  Stop                     Stopp
 147     6  Stukkateur/tur           Stuckateur/tur
  39    --  substantiell            *substanziell
   9    --  Thunfisch               *Tunfisch
9999+  193  Tip/Tips                 Tipp/Tipps  [viele engl. Titel!]
 159     3  Trekking                *Trecking
 163    10  unselbständig           *unselbstständig
  87     8  verselbständigen        *verselbstständigen
  19     1  Zierat                   Zierrat
Gerade bei den hochfrequenten Wörtern Tipps und Potential gibt es auch noch zahlreiche Komposita, in denen sie den zweiten Teil bilden (Innovationspotential, Supertips, Geheimtips...)
 

C. Dreifach- statt Doppelbuchstaben

Den Löwenanteil stellt hier die oft zitierte Schiffahrt, zumal sie auch noch in Verbindungen vorkommt (Binnenschiffahrt, ...). Das gilt aber auch für andere: Leicht-, Hart-, Edelmetalllegierung.

           alt:                     neu:

     6  -- Atommuellager(ung)       Atommuelllager(ung)
    32  -- Ballettänzer/in/tage     Balletttänzer/in, Balletttage
   825  18 Binnenschiffahrt         Binnenschifffahrt
    94   6 Brennessel               Brennnessel
    28   2 Edelmetallegierung       Edelmetallegierung
     1   1 Flussediment             Flusssediment
    14  -- Kunststoffenster         Kunststofffenster
    41   5 Kunststoffolie           Kunststofffolie
     9   1 Kunststofform...         Kunststoffform...
    14  -- Kunststoffuellung..      Kunststofffuellung...
    50   1 Metallegierung           Metalllegierung
     5  -- Nullösung                Nulllösung
   222   2 Rheinschiffahrt          Rheinschifffahrt
    68   4 Rolladen/läden           Rollladen/läden
    14   4 Sauerstoffunktion..      Sauerstofffunktion..
    53   6 Schalleistung            Schallleistung
  3036  41 Schiffahrt...            Schifffahrt
   285   5 schnellauf.../läuf...    schnelllauf.../läuf..
     5  -- Schnellesen              Schnelllesen
     1  -- Schrittempo              Schritttempo
    38   1 Stalluft                 Stallluft
    12   1 Stammutter               Stammmutter
    36   8 Stickstoffixier...       Stickstofffixier...
    11  -- Stickstofform..          Stickstoffform...
   353  11 Stilleben                Stillleben
   246  18 Stillegung               Stilllegung
   104  21 Werkstofforschung        Werkstoffforschung
     8   2 Zellstoffaser            Zellstofffaser
     8   1 Zellstoffabrik..         Zellstofffabrik..
Für diese Gruppe gibt es eine Patentlösung! Sämtliche Fälle mit Dreifachbuchstaben könnten ohne Wörterbuchdatei erschlagen werden: man bräuchte nur beim Indexieren alle Dreifach- durch Doppelbuchstaben zu ersetzen, und dasselbe in der Nutzereingabe. Das würde sogar kaum auffallen, denn die Ergebnisse wären absolut korrekt: es gibt keine Fälle, wo beide Schreibungen mit unterschiedlicher Bedeutung vorkämen. Es gibt übrigens schon jetzt Einträge in unseren Registern mit Dreifachbuchstaben: sie entstehen aus Bindestrich-Schreibungen, also z.B. Kunststoff-Fabrikation, wenn das System die Bindestriche beim Indexieren entfernt (z.B. Pica). Auch diese Fälle wären dann erledigt: der Dreifach-Doppel-Ersatz muß nur NACH der Bindestrich-Entfernung geschehen!
 

D. Eindeutschung von Schreibweisen

Zum einen gibt es hier eine außerordentlich kleine Gruppe, die katalogmäßig kaum ins Gewicht fällt (Majonäse, Ketschup, Schikoree und andere unsägliche Neuschreibungen, die wir hoffentlich nie in Titeln sehen werden). In diese Gruppe gehört aber auch eine größere Menge von Wörtern, die die Silben "graph", "phon" oder "phot" enthalten. Diese dürfen in Zukunft durch "graf", "fon" bzw. "fot" ersetzt werden. Für ..graph.. gibt es die Regel: "Nur Wörter des sog. Bildungswortschatzes behalten die Originalschreibweise: Kalligraphie, Seismograph." Selbst wenn der Begriff "Bildungswortschatz" genauer definiert wäre (was nicht der Fall ist), könnte man für die Erkennung solcher Wörter keinen Algorithmus entwickeln. Also doch ein Lexikon aufbauen? Das Problem ist, es gibt unter diesen Wörtern zahlreiche ad-hoc-Neubildungen, wie z.B.

aerophotogrammetrisch
impulszytophotometrie
thermophotovoltaisch
Stereoorthophoto

und natürlich Flexionsformen solcher Wörter. Fallen diese alle unter "Bildungswortschatz" und behalten folglich das "ph"?
Wie auch immer, eine Wörterbuchdatei müßte für diesen Spezialbereich intensiv gepflegt werden, denn es können praktisch jeden Tag Neubildungen daherkommen. Daß die Wissenschaft beim "ph" bleiben werde, kann nicht pauschal angenommen werden: man findet schon Neologismen wie "Motografie". Eine Volltextsuche in 400.000 Titeldatensätzen ergab folgende Frequenzen:

  ..graph..   9.698     davon 1.600 am Wortanfang
  ..phot..    2.912           2.700
  ..phon..      920             243
Dabei sind die fremdsprachigen Wörter mitgezählt, die natürlich unbetroffen wären. Auch ist zu bemerken, daß die neuen Schreibweisen längst in der Realität vorkommen. Hier wird durch die Reform also nur die Praxis nachträglich sanktioniert, aber die Schreibung mit "f" wird quantitativ zunehmen.
Denkbar ist eine Lösung, die keine intellektuelle Arbeit und nur wenig Programmieraufwand verursachen würde: Jedes Wort, das eine der drei Zeichenkombinationen enthält, zweimal indexieren, beim zweiten das ph durch f ersetzen. Dasselbe mit der Nutzereingabe machen. Wenn dann jemand "thermophoto?" oder "thermofoto" eingibt, werden jeweils beide Schreibungen gefunden, egal wie die Schreibweise im Buch aussieht. Ansatzweise ist das eine phonetische Suche, eingeschränkt auf diese Problemfälle.
(Ansonsten ist eine phonetische Suche wegen des hohen Anteils von Fremdsprachen in Katalogen problematisch, vermutlich gar nicht realisierbar! In sprachlich homogenen Volltextdatenbanken sieht das anders aus.)

Summa summarum kann vermutlich eine 90%-Lösung, vorsichtig geschätzt, mit drei bis vier Komponenten erreicht werden (wobei wohl die erste die schwierigste ist):

  1. Retrievalsystem mit Nachbarschafts-Operator, um die Zweiwort/Einwort- Diskrepanzen in den Griff zu bekommen, insbes. die zahlreichen "nicht"-Wörter. (siehe A.)
  2. Ersetzungen bei Indexierungen und in der Benutzereingabe (s. C. und D.) (Vorschlag: um einen Begriff dafür zu haben, könnte man von "Bereinigenden Ersetzungen" sprechen, kurz "Methode BE".) Wohlgemerkt: die Ersetzungen sind nicht in den Daten vorzunehmen, nur in den Registern und in den Suchwörtern des Nutzers!!
  3. Ein Hilfesystem (hochtrabend könnte man von einem Expertensystem sprechen), das jede Benutzereingabe untersucht und mit einer Liste der Problemwörter der Gruppe B ausgestattet ist. Geeignete Hinweise könnten dann gegeben werden ("Versuchen Sie evtl. noch ..."), wenn der Nutzer ein Wort eingibt, das in der Liste vorkommt, oder das einen Bestandteil hat, der in der Liste vorkommt, z.B. eines, das mit "nicht" beginnt. Das kann sehr schnell gehen, denn diese Liste ist ja nicht lang. Noch ein Vorteil: Eingriffe in das Datenbanksystem oder die Daten selbst sind damit nicht verbunden.

  4. Für einige Systeme auch noch dieser Hinweis:
  5. Alphabetische Register zum Vor- und Rückblättern Noch nicht alle Kataloge (jedenfalls im WWW) haben solche Register! Unverständlich, wenn man bedenkt, welch große Hilfe sie sein können. Man sieht sofort, daß es flektierte Formen und Schreibfehler gibt und wird auf viele Probleme so überhaupt erst aufmerksam.
Beispiel für ein Register:
      3   fotograf
     10   fotografen
      2   fotografiai
     84   fotografie
      1   fotografie  SIEHE AUCH -> photographie
     11   fotografien
      1   fotografiere
     16   fotografieren
      1   fotografierenden
      1   fotografierens
      6   fotografiert
      1   fotografierter
      4   fotografii
      2   fotografik
      1   fotografin
     11   fotografische
      5   fotografischen
      1   fotografischer
      1   fotografisches
      2   fotogrametria
      5   fotogrametrico
      1   fotogramme
      2   fotogrammetria
      1   fotographie SIEHE AUCH -> photographie
      ...
Auch der Nutzen der SIEHE AUCH-Hinweise ist unmittelbar ersichtlich (diese hier sind aus dem SWD-Satz für "Photographie" entstanden).
Die letzten 10% sind ja immer mit Abstand schwieriger und teurer als die ersten 90, und bis 100 kommt man bei solchen Problemen nie. Ein wesentlicher Vorteil des Drei-Komponenten-Ansatzes ist ferner, daß damit ein Katalogsystem noch immer nachvollziehbar deterministisch bleibt! Jede umfangreichere Lösung auf Basis eines internen Wörterbuches hat den Nebeneffekt, daß die Ergebnisse nicht mehr immer nachvollziehbar sind (es sei denn, man kennt genau das Wörterbuch und die Algorithmen und hat viel Zeit). Skeptische, mitdenkende Benutzer müssen das irritierend finden. Andere würden schlicht sagen: "Der spinnt, der Computer".



Kollege Lothar Kalok (UB Gießen) schrieb darauf:

... Allerdings: Rechtschreibänderungen hat es im Deutschen wie auch in den meisten anderen Sprachen permanent gegeben, nur der Weg auf dem dies diesmal geschah ist neu. Über Änderungen, die die Duden-Redaktion durchgeführt hat, gab es halt keine öffentliche Diskussion. Verglichen mit der Reform von 1905, die drei bis dahin geltende offizielle unterschiedliche, korrekte, Standards ersetzt hat, sind die Veränderungen kaum bemerkbar. Damals wurde das "th" weitgehend abgeschafft, obwohl man dann den Ton in der Musik nicht mehr vom Material Thon (Lehm) unterscheiden konnte, das "c" wurde weitgehend durch "k" ersetzt. Die Erfinder der PI mußten auch damit klar kommen (und haben das dann so versucht, daß wir heute Probleme haben: Karl / Carl). Anscheinend war das Wilhelminische Deutschland immer noch reformfreudiger als das Nach-Wende-Deutschland (man denke nur an die Einführung des BGB, das viele alte Rechtsvorschriften ersetzt hat). Und: diese Probleme haben wir in allen alten Katalogen, die Bestände vor 1905 nachweisen, es wurde bisher eher am Rande als nur für ältere Literatur relevant thematisiert, etwa im Zusammenhang mit Normdaten für Verlagsorte.
Nur, um zum Thema zu kommen: wenn man schon Werkzeuge für die Abfederung der Rechtschreibreform entwickelt, sollte man dann nicht auch alle Reformen (die von 1905 und die schleichenden in der Folgezeit) einbeziehen? Weiter: Biologen haben auch immer wieder mit änderungen der Terminologie zu kämpfen: z.B. die Gräser haben die Bezeichnung von Graminae zu Poaceae geändert. Soll man dann auch so was in ein Wörterbuch aufnehmen? Wo ist die Grenze? ("In Hessen sagt man Gaul und schreibt Pferd" ;-) ) Was ist mit fremden Sprachen?: Das "arkiv för matematik, astronomi och fysik 1903 ff" will auch gefunden sein. Anscheinend hatte Schweden solch eine Reform schon des längeren hinter sich, ohne das die schwedische Literatur, Wissenschaft und Kultur oder gar das Bibliothekswesen größeren Schaden genommen hätte? Meine Meinung: Rechtschreibänderungen sind das normale, es ist "nice to have" wenn es Werkzeuge gibt, die Folgen abzumildern, aber mit Rechtschreibänderungen umgehen muß man schon seit Jahrzehnten (zumindest seit 1905 in Deutschland).
Ob die Hilfsmittel auf die Dauer nicht hinderlicher sind als der bewußte Umgang mit unterschiedlichen Schreibweisen? (Carl / Karl - Problem). Die neuere Schreibweise erleichtert eine zeitlich geschichtete Suche (pointiert formuliert). Zur Ästhetik: Und ob Ketschup hässlicher aussieht als Möbel (meuble), Büro (Bureau) und Direktion (Direction) - Ansichts-Sache. Man wird sich daran gewöhnen wie an die Ringe in der Nase, die von einigen als schrecklich, von anderen als "geil" empfunden werden.
Ein Rechtschreib-"Debakel" als solches kann ich nicht erkennen, beschränkt auf Kataloge war es seit Jahrzehnten unser Begleiter. Aber ich finde sehr gut, wenn aus diesem Anlass diese an sich langjährigen Probleme in den Katalogen konkret benannt werden und Lösungsmöglichkeiten gesucht werden.

Antwort zur Zuschrift von L. Kalok:

Lieber Herr Kalok,
zu Ihrer Zuschrift einige Bemerkungen:

> Anscheinend war das Wilhelminische Deutschland immer noch reformfreudiger
> als das Nach-Wende-Deutschland

Damals war aber wohl der Druck viel größer, weil es mehrere verschiedene "Standards" gab, die unvereinbar waren. Sicher haben wir mit den anwachsenden Daten alter Bücher eh schon wachsende Mengen von orthographisch uneinheitlichem Material. Deshalb rede ich bewußt von einem "Debakel", weil nun die ohnehin unbefriedigende Situation eigentlich ohne Not (im Vergleich zu 1905) verschärft wird, und gleich durch vier verschiedene Kategorien von Detailproblemen, die sich unterschiedlich auswirken und denen zum Teil nur schwer beizukommem ist (besonders dem Getrenntschreibungsproblem).
Vom theoretischen, akademischen Standpunkt KANN man allerdings auch ganz anders argumentieren: Titel sind problematische Elemente, jedenfalls ist die Art, wie wir damit umgehen, problematisch. Denn wir teilen ihnen eine Doppelfunktion zu:
1. Vorlagengetreue Beschreibung. Die ist unverzichtbar für das Suchen und Identifizieren von genau bekannten Werken - die wichtigste Aufgabe des Katalogs, und auch für den internationalen Austausch.
2. Zugriffskriterium. Titelwörter machen meistens Sachaussagen über den Inhalt des Buches und werden deshalb nicht nur für formale, sondern auch für thematische Zugriffe benutzt.
Zugriffskriterien verlangen nach Konsistenz, sonst sind sie unzuverlässig. Nur wenn man konsequent Ansetzungstitel in normierter Orthographie bilden würde, und das tun wir nicht, könnte man beide Funktionen zufriedenstellend bedienen, d.h. mit zwei verschiedenen Datenfeldern. Wir konzentrieren uns aus wohlerwogenen Gründen auf die erste Funktion, d.h. die zweite kommt notwendigerweise zu kurz. Unsere Beschreibungen SIND konsistent (naja, cum grano salis), deshalb KÖNNEN die Zugriffskriterien gar nicht konsistent sein, weil dafür dasselbe Datenfeld genutzt wird.
In den Anfangsjahren der bibliothekarischen DV wurde viel diskutiert, daß Titelstichwörter als sachliche Zugriffe ungeeignet seien. Wir haben wenig getan, diese Tatsache den Benutzern nahezubringen. Unaufgeklärt wie sie sind, erwarten sie vom Computer zuverlässige Antworten auf sachliche Fragen. Nach Lage der Dinge kann er die nicht geben, und in Zukunft noch weniger. Man könnte auch sagen, daß wir mit dem Angebot des Stichwortzugriffs allzulange die Misere der Sacherschließung verschleiert haben. Aber vertiefen wir das jetzt nicht, sonst wird die Diskussion uferlos. Sonst kommen wir auch noch in die Philosophie und erkennen im unauflösbaren Dilemma des Titelfeldes den Nachhall des scholastischen Universalienstreits oder gar das Aufeinanderprallen von platonischem Begriffsrealismus und aristotelisch-thomanischem Nominalismus, wie es auch noch in Goethes Schülerszene anklingt: "... doch ein Begriff muß bei dem Worte sein!" Doch Worte sind Schatten, zumal Titelworte, die für sich genommen und ohne Kenntnis des Inhalts manchmal gar keinen Sinn ergeben oder gar in die Irre führen. Als Sachzugriff ist und bleibt der "Sach"-Titel von begrenztem und zweifelhaftem Wert (er wird ja auch bald wieder nur noch "Titel" heißen, auch in den RAK), und auf diese lange verdrängte Erkenntnis werden wir nun erneut und jetzt wohl endgültig zurückgeworfen. Wenn wir die Dinge so sehen wollen, liegt das eigentliche Debakel nicht in der sich ändernden Orthographie, sondern in den praktischen Folgen der besagten Verdrängung. Überspitzt: das Kartenhaus wird endgültig baufällig. Über den Gartenzaun hinausblickend ist aber dennoch festzuhalten, daß immer mehr Retrievalsysteme (Suchmaschinen!) ganz ohne intellektuelle Erschließung auskommen müssen, und daß immer mehr Informationssuchende sich von solchen Instrumenten eine gewisse Verläßlichkeit wünschen. Hier müssen wir weiter vom "Debakel" reden, weil die Reform hier ganz unausweichlich die Qualität des Retrievals verschlechtern wird. Keine Entwarnung! Es war nicht zuletzt die lange Stabilität (seit 1905), die dem Sachtitel als Sachzugriff zugute gekommen ist, aber jetzt geht sie zu ende. Wenn die Reform uns zu höherer Einsicht und zu einer Aufwertung der Sacherschließung führt, hat sie insofern sogar ihr Gutes, obwohl man ja in der Schlagwortnormierung auch die neuen Schreibungen mindestens als Verweisungen einbringen muß. Wenn man die Dinge so sehen will, ist man fast versucht, zu einem bibliothekarischen Aschermittwoch aufzurufen. Mindestens müssen wir über kurz oder lang unseren Nutzern endlich reinen Wein einschenken... (wenn die nur zuhören würden!)


Auf den Beitrag "Rechtschreib-Debakel" kam ferner eine Zuschrift vom Geschäftsführer der Zwischenstaatlichen Kommission für deutsche Rechtschreibung:

Sehr geehrter Herr Eversberg!
Danke für Ihre Hinweise, die ich weiterreichen werde. Möglicherweise hat diesen Aspekt keiner so recht bedacht. Haben Sie das Problem nicht jetzt schon, wenn Sie Texte in anderer Schreibweise (alte Texte, literarische Texte, Texte in eigenwilliger Orthografie usw.) und auch Texte mit Variantenschreibungen (der alte Duden enthält ihrer ca. 6.000!) vercomputern? Sind Suchsystemen nicht immer irgendwelche Grenzen gesetzt? Ist die Verschlimmerung - abgesehen von der Zweigleisigkeit der Übergangszeit - wirklich so schlimm? Kann man nicht eine Liste der veränderten Stammschreibungen so in den Computer einbauen, daß er von sich aus beide Schreibweisen abfragt? Ist das nicht eher ein (computer-)technisches Problem?
Mit freundlichen Grüßen
Dr. Klaus Heller, Geschäftsführer der Zwischenstaatlichen Kommission für deutsche Rechtschreibung beim Institut für Deutsche Sprache (IDS) Postfach 10 16 21 D-68016 Mannheim Internet: http://www.ids-mannheim.de

*****************************************************************
... und die Antwort lautete:

Sehr geehrter Herr Dr. Heller,
vielen Dank für Ihre Zuschrift. Ich will gerne versuchen, auf Ihre Fragen zu antworten:
 

Das ist richtig, und nicht zu knapp. Deswegen ist ja schon jetzt das Suchen in Textdatenbanken, Katalogen und Suchmaschinen ein Problem. Dieses Problem tritt seit dem immensen Aufschwung des WWW immer stärker in Erscheinung, je mehr dort Suchsysteme der verschiedensten Art präsentiert werden, und das nimmt täglich zu. Immer mehr Texte, und eben nicht nur neue, werden indexiert und angeboten. Inkonsistenz der Daten wirkt sich immer negativ auf die Zuverlässigkeit von Suchergebnissen aus, deshalb sehen wir jede weitere Zunahme der Inkonsistenz mit Bedenken, und nicht etwa mit einer Haltung wie "darauf kommt's nun auch nicht mehr an". Und die Reform bringt einen noch gar nicht absehbaren Zuwachs an Inkonsistenz. Suchsysteme haben gewiss immer ihre Grenzen. Diese sind schon jetzt niedriger als der Laie denkt, durch die Reform werden sie noch niedriger. In der wissenschaftlichen Arbeit, aber immer mehr auch im Alltagsleben, ist man zunehmend auf einigermassen sicheres Funktionieren von Abfragesystemen angewiesen. Je größer aber ein Datenbestand ist (und sie wachsen ja alle ständig an!) umso wichtiger wird die Konsistenz, denn umso größer wird potenziell (alt: potentiell) die Menge der Nicht-Treffer, also der zwar relevanten, aber bei einer Suche nicht gefundenen Einträge. Ja, die Verschlimmerung ist aus eben diesem Grunde wirklich gravierend. Wir bräuchten mit dem Anwachsen der Datenbestände ja gerade eine Verbesserung der Konsistenz, aber wir bekommen eine Verschlechterung! Sicher kann man in einige Computer, in einige Softwaresysteme, solche Mechanismen einbauen. Es gibt aber schon jetzt eine unübersehbare Vielfalt von computerisierten Suchsystemen. Da ist es völlig illusorisch, dass diese das alle lösen können - wie beim Jahr-2000-Problem! Und noch mehr ist illusorisch, daß sie alle wirklich in gleicher Weise arbeiten würden. Die Verwirrung würde eher noch verschlimmert, weil man hier und da Erfolg mit der und der Abfragemethodik hätte, bei anderen Systemen wieder nicht. Man wüßte überhaupt nicht mehr, auf was man sich eigentlich verlassen kann, und wie gesagt, schon jetzt kann man sich auf weniger verlassen, als viele denken oder hoffen. Sie deuten richtig an, daß es mit den Stammschreibungen allein nicht getan ist: die Software muß erkennen können, ob ein Wortstamm innerhalb einer Zusammensetzung vorkommt! für einen Menschen eine leichte Aufgabe, für einen Computer nur unvollkommen lösbar und sehr schwierig. Aus dem Gesagten wird schon deutlich, daß diejenigen Aspekte des Problems, die sich wirklich technisch lösen lassen, schon alles andere als trivial sind. Aber man muß bedenken, daß die Sprache der NATÜRLICHEN Intelligenz entspringt und die KÜNSTLICHE auf lange Sicht, vielleicht für immer, dahinter zurückbleiben muß. Eine einigermaßen standardisierte Schriftsprache war bisher die Gewähr dafür, überhaupt brauchbare Suchsysteme produzieren zu können. Geht das verloren, d.h. verschlechtert sich die Konsistenz der Schriftsprache, wird die künstliche Intelligenz das nur unvollkommen ausgleichen können. Ergebnis: eine sinkende Zuverlässigkeit der Abfragesysteme, trotz noch so vieler technischer Bemühungen. Die hier vorliegenden Probleme sind jedenfalls weitaus komplexer als das sog. Jahr-2000-Problem, wo es ja nur um zwei fehlende Ziffern geht! Wenn selbst dieses sich als unerwartet harte Nuss entpuppt, ist dann ein unreflektiertes Vertrauen in die Softwaretechnik, mit den neuen Problemen fertig werden zu können, nicht blauäugig und leichtfertig? Die Komplexität von Retrievalsystemen ist schon jetzt sehr hoch. Man kann eine weitere, beträchtliche Erhöhung nicht bedenkenlos verlangen und nicht erwarten, daß alle dies überhaupt leisten können. Man muß ferner bedenken: sehr viele Suchsysteme indexieren nicht nur deutsche Texte, sondern ein Gemisch aus mindestens deutschen und englischen. In der Regel haben die zu indexierenden Texte oder Datensätze aber kein Sprachkennzeichen, und oft enthalten die Texte bzw. Datensätze in sich Bestandteile aus mehreren Sprachen. Das ist gerade in Bibliotheksdaten und Internet-Dokumenten typisch. Wir können nicht von einer übergangszeit reden, nach der sich schon alles wieder einpendeln wird! Denn die Datenbestände, die wir jetzt schon haben, sind schon immens gross und werden uns begleiten bis ans Ende unserer Tage. An eine Umstellung dieser Bestände auf neue Rechtschreibung ist aus mehreren Gründen überhaupt nicht zu denken. Und die Unternehmungen zur Digitalisierung vorhandener Bücher sind gerade erst angelaufen! ALLE Bücher, die wir bisher haben, viele Millionen!, entsprechen nicht der neuen Rechtschreibung. Die weitaus meisten sind gar nicht mehr im Handel, niemand wird sie umstellen können, es würde astronomische Summen kosten.
Aus dem zuletzt Gesagten ergibt sich ein anderes, skeptisches Argument zur Reform, welches ebenfalls noch selten zu hören war, wenn überhaupt: Rechtschreibung lernt der Mensch hauptsächlich durch Lesen, nicht durch das Pauken von Regeln. Beim Lesen prägen sich die Wörter optisch ein. Das braucht viele Jahre, bis ins Erwachsenenalter. Während dieser Zeit aber werden die jetzt Heranwachsenden zwangsläufig auch zu etwas älteren Büchern greifen, denn die meisten älteren werden nie neu überarbeitet in den Handel kommen, das wird m.E. ganz stark unterschätzt. Beim Lesen der älteren Texte werden sporadisch andere Schreibweisen wahrgenommen, aber oft nur unterhalb der Bewußtseinsschwelle, trotzdem hinterlassen auch diese eine Spur im Gedächtnis. Kann es nicht sein, daß das Ergebnis eine größere Unsicherheit sein wird als wir sie bisher hatten, folglich auch mehr Fehler trotz Vereinfachung der Regeln? Und das gilt natürlich nicht nur für Schüler, sondern auch für Ausländer, die unsere Spache lernen. Auch diese werden auf lange Sicht mit einer Mischung aus alten und neuen Texten umgehen müssen. Wird dies das Lernen nicht schwieriger statt leichter machen? Vielleicht entwickelt sich sogar ganz schnell eine neue Beliebigkeit oder Gleichgültigkeit, was die Absicht der Reform geradezu ins Gegenteil verkehren würde. Die Suchsystem-Problematik würde erneut verschärft, denn eine Klassifizierung von Texten in alte und neue wird dann nicht möglich sein. Ich stelle das mal in den Raum, weil ich es für plausibel halte, aber ich bin kein Lernpsychologe, sondern Datenverarbeiter. Das jedoch seit immerhin 25 Jahren, und das ist ein Zeitraum, nach dem sich denn doch eine nüchterne Einschätzung der Möglichkeiten und Grenzen des Computers einstellt.
Nun ist unversehens eine halbe Abhandlung entstanden. Ich hoffe aber, diese Ausführungen helfen Ihnen weiter. Auf jeden Fall wollte ich vermeiden, daß meine Argumente in die Ecke der rückwärtsgewandten Sektierer gedrängt werden. Lassen Sie mich deshalb noch erwähnen, daß ich die neuen Regeln persönlich gut finde, besser als die alten. Das ändert aber gar nichts an den Folgen. Betonen möchte ich auch, daß ich keinen Vorwurf an die Reformer richte. Die Reformbemühungen reichen weit zurück, in Zeiten, wo es noch gar keine Computer gab. Die jetzt sich abzeichnenden Folgen sind erst in den letzten drei Jahren so recht erkennbar geworden - da lagen die Reformdokumente schon fertig vor.
Mit freundlichen Grüßen, B. Eversberg.