8. Positionen des Wörterbuchartikels. I: das Lemma
8.1. Die Lemmatisierung
Der Zweck dieses Abschnitts besteht nicht darin, einen theoretischen Beitrag zum Status des Lemmas zu liefern, also zum Beispiel zu den Fragen, ob das Lemma eine Einheit der beschriebenen oder der beschreibenden Sprache ist, ob es als Name oder als erwähntes Zeichen für eine lexikalische Einheit steht, ob es auf die Ausdrucksseite (den Signifikanten) solcher Einheiten oder auf die Einheit als Verbindung von Ausdruck und Inhalt bezogen werden sollte, ob es zweckmäßiger als Synonym oder als Hyponym zu Stichwort zu verwenden ist6060. Dies alles ist in differenzierter Weise diskutiert von Herbert Ernst Wiegand, Was ist eigentlich ein Lemma? Ein Beitrag zur Theorie der lexikographischen Sprachbeschreibung. In: Studien zur neuhochdeutschen Lexikographie III, 1983, 401–474. Die in diesem Artikel vorgeschlagenen Lösungen werden im folgenden großenteils übernommen.. Der Zweck des Abschnitts ist vielmehr praktischer Art; er ergibt sich aus der Situation, daß alle zu lemmatisierenden Wörter auf den Belegzetteln in einer bestimmten Form begegnen. Die Gesamtheit dieser Formen soll hier unter dem Terminus Vorkommensformen zusammengefaßt werden. Darunter fallen mindestens
(1) alle syntaktisch bedingten flexionsmorphologischen Formen (z. B. abgötter, abgottes),
(2) wortbildungsmorphologisch bedingte Formen, darunter Volksetymologien, Kontaminationen, Agglutinationen aller Art (z. B. abgrund/abgründe, abau/abbau, achen/nachen, 2abzucht),
(3) alle auf unterschiedlicher Lautgrundlage beruhenden Formen, sei diese nun dialektaler (z. B. abenteuer/aubenteuer), historisch bedingter (z. B. aventiure/abenteuer) oder sonst irgendwie regelhafter Art, sei sie durch teilregelhafte Lautentwicklung zustande gekommen (viele Epithesen: mane/mond) oder sei sie durch einzelwortgebundene Lautentscheidungen von Sprachteilhabern, wie zum Beispiel durch Hyperkorrektur oder Lautspiele (z. B. abenteuer/affenteuer) bedingt,
(4) alle selbst bei gleicher flexions-, wortbildungsmorphologischer und lautlicher Form äußerst variablen Schreibformen.
Die Vielfalt der Vorkommensformen hängt wieder mit dem Faktum zusammen, daß es im Frühneuhochdeutschen lange Zeit keine allgemein gültige Leitvarietät gegeben hat, die das Spektrum der Formen auf das grammatisch notwendige Maß (Flexionsformen) reduziert hätte. Um einen Eindruck von der Vielfalt zu geben, seien im folgenden die in den betreffenden Wörterbuchartikeln berücksichtigten Vorkommensformen dreier Wörter aufgeführt. Die Reihenfolge der Formen entspricht ihrer Reihenfolge in den Belegen; Mehrfachbelegungen einer einzigen Schreibung wurden unterschlagen.
abbleuen begegnet belegt in den Varianten: abplewn, abpleuen, abbleyen, abblewen;
abgot in den Varianten: abgote, abgott, abgoͤtte, abtgot, abtgote, abgotten, aptgot, abgot, abgoͤtter, abgötter, ab got, Abgot, Abgott;
abkommen in den Varianten: abe qwam, kam abe, abkame, abkommet, ab kume, abekomen, abkomen, abkoͤmpt, afkompt, abkumet, abkombt, abkommen, abeqweme, abkumen, khum ab, abkem, kum̃ ab, abe kumen, Abkommen, abkumben, käm ab, abe kam, afqueme, kumen ab, abzukumben.
Die Beispiele sind keineswegs besonders ausgesucht. Mehrfachbelege bestimmter Vorkommensformen begegnen generell sehr selten; sie vermögen das Bild also kaum zu verzerren, führen im übrigen auch bei zufällig einmal hoher Frequenz aus prinzipiellen Gründen nicht auf die repräsentative Lemmaform.
Aus diesem Befund ergibt sich die Lemmatisierungsaufgabe. Sie untergliedert sich in mehrere Teilaufgaben, deren Lösung jeweils in zwei Teilschritten zu erfolgen hat.
8.1.1. Die Teilschritte der Lemmatisierung
8.1.1.1. Im ersten Teilschritt ist der Status der Einheiten, die bisher unproblematisch als Vorkommensformen bezeichnet wurden, zu prüfen, und zwar unter dem Gesichtspunkt der sogenannten Einheit des Wortes. Vorkommensformen werden nämlich erst dadurch zu Vorkommensformen, daß der Lexikograph sie auf Grund seines intuitivlingualen6161. Hier und im folgenden wird zwischen lingual ›sprachlich‹ und linguistisch ›sprachwissenschaftlich‹ unterschieden. Beides sind keine absoluten, sondern zueinander offenen Qualitäten. Wissens als solche konstituiert, das heißt sie als Varianten eines gleichen Wortes auffaßt. Gegenstandskonstituierungen dieser Art sind ihrer Qualität nach sprachreflexive Handlungen; sie haben eine kaum zu überschätzende Klassifizierungs- und damit Ordnungsfunktion, indem sie die zum Beispiel für einen Nichtkenner der betreffenden Sprachstufe geradezu chaotische Belegfülle erst einmal überschaubar machen. Sie tun dies in der Mehrzahl aller Fälle aus der normalsprachlichen Sicherheit des sprachreflexiv Urteilenden sogar in einem linguistischen Sinne „richtig“. Dennoch sollten immer auch linguistische Prüfungen erfolgen (ohne daß hiermit suggeriert werden soll, linguistische Prüfungen hätten gegenüber dem lingualen Urteil eine absolut andere und höhere Qualität). Prüfung heißt soviel wie Absicherung, ob und falls ja, wie weitgehend und unter welchen Aspekten die Vorkommensformen sich durch lautliche, flexions- und wortbildungsmorphologische Regeln sowie durch nachvollziehbare Regelabweichungen (zum Beispiel bei Volksetymologien) oder durch Nachweis falscher Regelanwendungen (zum Beispiel bei Hyperkorrekturen) in einen linguistischen Zusammenhang mit allen anderen Vorkommensformen bringen lassen, einen Zusammenhang übrigens, der nur unter Voraussetzung einer zugrundegelegten Bedeutungseinheit herstellbar ist.
8.1.1.2. Wenn diese Prüfung erfolgt ist, schließt sich der zweite Lemmatisierungsschritt an, nämlich die Festlegung einer ausgezeichneten Form6262. Zur genauen Begründung des Verfahrens: Anderson, Robert R./Goebel, Ulrich/Reichmann, Oskar, Ein idealisiertes Graphemsystem des Frühneuhochdeutschen als Grundlage für die Lemmatisierung frühneuhochdeutscher Wörter. In: Studien zur neuhochdeutschen Lexikographie I, 1981, 53–122., genau gesprochen einer ausgezeichneten Wortbildungsform in ausgezeichneter Lautung und ausgezeichneter Graphie. Diese Form muß alle Vorkommensformen in einem bestimmten Sinne repräsentieren.
Die ausgezeichnete Form ist theoretisch auf mannigfache Weise zu gewinnen. Hier wird darunter eine Idealform verstanden, die insbesondere seit der Reformation vorwiegend im Ostmittel- und Ostoberdeutschen in den literatur- und bildungssprachlichen Textsorten der sozialkulturell bestimmenden Schreibergruppen, vor allem natürlich der bedeutenden Drucker hätte verwendet werden können. Die Bestimmungen seit der Reformation und im Ostmittel- und Ostoberdeutschen sind dabei nicht im physikalistischen Sinne als reine Zeit- und Raumangaben zu verstehen, sondern nach Ausweis der Adverbien insbesondere und vorwiegend in einem sozialgeschichtlichen Sinne. Gemeint ist diejenige geschichtliche Epoche und derjenige Sozialraum des Frühneuhochdeutschen, in der bzw. in dem sich Ansätze einer Leitvarietät entwickeln, und zwar durch das sprachliche Handeln kulturell führender Schreibergruppen. Diese sozialsprachgeschichtliche Bestimmung von Zeit und Raum schließt nicht aus, daß eine ausgezeichnete Form auch zum Beispiel im Westmitteldeutschen bereits im 15. Jahrhundert hätte auftreten können, die Wahrscheinlichkeit spricht aber deshalb dagegen, weil die geschichtlich-sozialen Bedingungen dazu noch nicht gegeben waren. – Der mehrmals gebrauchte Konjunktiv hätte [...] können soll andeuten, daß die ausgezeichnete Form selbst in Drucktexten der späteren Zeit wegen der immer noch vorhandenen graphischen Variabilität nicht realisiert gewesen sein muß. Es ist vielmehr diejenige Form, von der hier behauptet wird, daß sie von den sprachsoziologisch ausschlaggebenden Schreibergruppen als beste aller Formen ausgezeichnet worden wäre, wenn man sie ihnen zusammen mit raumgebundenen, historisch überlebten oder sozial unterschichtig bestimmten Formen gleichsam zum wertenden Vergleich vorgelegt hätte. – Damit ist zugleich bestimmt, wie die oben angesprochene Repräsentationsfunktion des Lemmas zu verstehen ist. Am Beispiel erläutert: Alle Formen des Verbs abbleuen, die im Anlaut von bleuen ein /p/ schreiben, repräsentieren, obwohl sie bis 1560 belegt sind, eine sprachgeschichtlich überholte Tradition; ebenso verhält es sich mit der Diphthongschreibung /ew/; die Schreibung /ey/ ist eine als dialektal gewertete Entrundung. Das Beste aus dem Nebeneinander von /b/ und /p/ ist /b/; das Beste aus dem Nebeneinander von /ew/ und /ey/ ist sicher /ew/, aber dieses ist seinerseits weniger ausgezeichnet als ein hier gar nicht belegtes /eu/. Der Ansatz abbleuen ergibt sich also durch Aneinanderreihung des pro Phonem-/Graphemposition besten Phonems/Graphems; er ist Konstruktion einer Phonemfolge und damit verbunden einer Graphemfolge. Die Basis dieses Lemmatisierungsverfahrens ist ein sprachsoziologisch ausgezeichnetes ideales Phonem- und Graphemsystem, das von Linguisten aus Textbelegen abgeleitet wird und nun die Handhabe bietet, die Entwicklungstendenz gleichsam vom heutigen Kenntnisstand aus zu überholen und bessere Formen anzusetzen, als es im Frühneuhochdeutschen selbst üblich war. Im übrigen ist die Systematisierung nicht gegen einzelwortgebundene Entwicklungen anzuwenden. – Die hier auf die Phonem-/Graphemebene bezogene Argumentation gilt in entsprechender Weise für die Ebene der Wortbildung.
8.1.2. Die Teilaufgaben der Lemmatisierung
Die Lemmatisierungsaufgabe besteht aus folgenden Teilaufgaben:
(1') flexionsmorphologische Lemmatisierung
(2') wortbildungsmorphologische Lemmatisierung
(3') lautliche Lemmatisierung
(4') graphematische Lemmatisierung
(5') semantische Lemmatisierung.
Die Zahlen (1') bis (4') korrespondieren mit den Zahlen (1) bis (4), die für die Kennzeichnung der soeben aufgeführten Typen der Vorkommensformen verwendet wurden.
(1') Die flexionsmorphologische Lemmatisierung
Alle syntaktisch bedingten flexionsmorphologischen Formen sind auf sogenannte Grundformen zurückzuführen. Für Substantive und Pronomina ist dies der Nominativ Singular, für Verben der Infinitiv, für Adjektive die unflektierte starke Form des Nominativs Singular. Die Lösung dieser ersten Teilaufgabe der Lemmatisierung verläuft im allgemeinen für jeden der beiden Teilschritte ohne Probleme: Die Zuordnung zu einer repräsentativen Flexionsform fällt deshalb leicht, weil die Einheit des Wortes unter flexionsmorphologischen Aspekten problemlos ist; der Ansatz der Grundform als repräsentativer Form entspricht gängigen Lemmatisierungskonventionen für das Deutsche und alle bekannteren europäischen Sprachen. – Gewisse Schwierigkeiten ergeben sich allerdings für die Phraseme. Sie erscheinen in einer Form, die die morphologischen und syntaktischen Restriktionen, die sie gegenüber freien Verbindungen aufweisen, erkennen läßt oder explizit angibt. Der lexikographische Ort hierfür ist nur bei unikalen Einheiten des Typs klipp und klar das Lemma; in allen anderen Fällen ist es die Bedeutungsposition bzw. die dieser zugehörige Position Angabe der Syntagmen, unter der sie behandelt werden (vgl. 5.2.1. und 15.2.).
(2') Die wortbildungsmorphologische Lemmatisierung
Die wortbildungsmorphologisch bedingten Vorkommensformen sind durch die ausgezeichnete Form (im obigen Sinne) zu repräsentieren. Dies ist insofern problematisch, als nun durchgehend die Einheit des Wortes ins Spiel kommt, mithin in Frage steht, ob die nach dem sprachreflexiven Urteil zunächst als Varianten eines gleichen Wortes klassifizierten Bildungen auch linguistisch einem gleichen Wort oder ob sie mehreren Wörtern zuzuordnen sind. Eine entsprechende Frage stellt sich selbstverständlich auch dann, wenn die Zuordnung einer Wortbildung aus dem normalsprachlichen Wissen überhaupt nicht oder nur mit Unsicherheiten gelingt. Folgende Falltypen begegnen mit einiger Häufigkeit:
a) Nebeneinander einer nach Ausweis von Lesarten in frühneuhochdeutscher Zeit (zunehmend) undurchsichtigen Bildung (wie abau) und einer oder mehreren durchsichtigen Bildungen (wie abbau). Hierher gehören viele Fälle der Volksetymologie, insbesondere diejenigen zu fremdsprachiger Wortgrundlage (vgl. 2abzucht aus lat. aquaeductus),
b) Kontaminationen einschließlich aller die Einheit des Wortes berührenden Lautangleichungen (abspannen aus (ab)spannen ›ziehen, spannen‹ und (ab)spanen ›locken, reizen‹; 3aber 7 ›oder‹),
c) Verwischungen ursprünglich perfektivierender Bildungen mit der Bildungsgrundlage6363. Zu den Fachausdrücken der Wortbildungslehre vgl. man: Walter Henzen, Deutsche Wortbildung. (vgl. die Verben mit der anlautenden Morphemfolge ab | ge-),
d) Verwischungen ehemaliger Kausativbildungen mit der Ableitungsgrundlage (vgl. abschleifen),
e) Ableitungsvarianten aller Art (z. B. -heit/-keit/-igheit/-igkeit, auch -isch/-ig/-lich; Fortsetzungen ehemaliger a- und ja-Stämme wie abgrund/abgründe),
f) Konversionen (z. B. abnemen, V. und Subst.; 3aber, Konj. und lexikalisiertes Subst.); auch festgewordene Partizipien, vor allem solche des Perfekts (wie abgelegen, abgescheiden); lexikalisierte Substantivierungen von Partizipien (wie abgesandter); mehrfache Wortartzugehörigkeit (wie 1ab als Präp., Adv. und Adj.).
g) Adverbialbildungen auf -lich (oder Varianten) beziehungsweise solche mit den kombinatorischen Erscheinungen der althochdeutschen Bildungen auf -o (im Gegensatz zu dem -Ø- und -e-Morphem der a- beziehungsweise ja-stämmigen Adjektive) wie Nichtumlaut, Nichtgemination, -e-Auslaut.
Die Entscheidung über die Einheit des Wortes ist zugleich die Entscheidung darüber, ob ein einziges oder ob mehrere Lemmata angesetzt werden. Sie erfolgt unter Abwägung folgender Kriterien:
- sprachstrukturelle Erkennbarkeit der Wortbildungsmorpheme
- sprachgeschichtliche Zuordenbarkeit der Wortbildungsmorpheme
- semantische Äquivalenz bzw. Grad der Differenz der einzelnen Bildungen
- Frequenz der einzelnen Vorkommensformen
- Lemmatisierungskonventionen der Lexikographie des Deutschen, die zum Beispiel für die Nennwortarten eher darauf hinauslaufen, mehrere Lemmata anzusetzen als für die Partikeln.
Die Kriterien überlagern einander. Sie sind mithin zu gewichten und bei jeder Einzelentscheidung gegeneinander abzuwägen. Die Gewichtungen sehen wie folgt aus:
Für die Wörter der Nennwortarten gilt die Regel: Je erkennbares und/oder je sprachgeschichtlich zuordenbares Wortbildungsmorphem ein Lemma. Ausgenommen von dieser Regel werden diejenigen Wortbildungsmorpheme, die unter strukturell-synchronem Aspekt ähnlich und/oder funktional vergleichbar und/oder unter geschichtlichem Aspekt (partiell) auseinander herleitbar sind (z. B. -heit/-keit/-igheit/-igkeit) und die zusätzlich zu Stichwörtern führen würden, die semantisch nicht plausibel auseinandergehalten werden können. Deshalb wurden zum Beispiel abenteuerlich und abenteurig/-isch, ferner abgründlich und abgründig als eigene Lemmata angesetzt, nicht dagegen abenteurig und abenteurisch, abgrund und abgründe, abgründ(e)keit und abgründigkeit. Allerdings finden sich diese letzteren Bildungen nicht durch ein Einfachlemma, sondern jeweils durch ein Doppellemma als eine Form des ebenfalls begegnenden Mehrfachlemmas (vgl. 2abermal, -malen, -malig, -mals) repräsentiert. Mehrfachlemmata haben also die Funktion, darauf hinzuweisen, daß sich mindestens zwei Lemmatisierungskriterien überschneiden. Im übrigen wurde vom Ansatz von Mehrfachlemmata großzügiger Gebrauch gemacht; er ergibt sich aus dem Charakter des Frühneuhochdeutschen als einer Sprachstufe ohne anerkannte Leitvarietät. – Formuliert man das soeben Vorgetragene unter dem Aspekt ‚semantische Äquivalenz bzw. Grad semantischer Differenz‘ der in Frage stehenden Bildungen, so gilt: Je semantisch plausibel abgrenzbare Bildung ein Lemma, wobei die Abgrenzbarkeit auch dann als gegeben gilt, wenn die Polysemie quantitativ unterschiedlich ausgeprägt ist. Konversionen, perfektivierende Verben mit ge- werden also als je eigene Wörter aufgefaßt, nicht allerdings regelhafte Adverbialbildungen, da diese gegenüber dem Adjektiv keinen lexikalischen (sondern einen funktional-syntaktischen) Bedeutungsunterschied aufweisen. Ein besonderes Problem bilden die Verwischungen von Kausativa (alte -jan-Bildungen) gegenüber der Ableitungsgrundlage: Immer dann, wenn sie ausdrucksseitig an Umlaut, Gemination o. ä. erkennbar sind, erscheinen sie unter eigenem Lemma; ist die ausdrucksseitige Erkennbarkeit im Infinitiv nicht gegeben und gehen auch regelmäßige und unregelmäßige (also: schwache und starke) Flexion durcheinander, so wird dasjenige, was unter geschichtlichem Aspekt einmal zwei Wörter waren, zur Polysemie eines einzigen Wortes, die demnach unter einem einzigen Lemma abgehandelt wird, man vgl. abschleifen im Gegensatz zu abbrennen/abbrinnen.
Für die Partikeln wurde im Hinblick auf die Wortbildungsmorpheme genau so verfahren wie für die Lemmata. Lediglich bei Konversionen und dadurch bedingter mehrfacher Wortartenzugehörigkeit ging die Entscheidung den vorwiegenden Lemmatisierungsgepflogenheiten der deutschen Lexikographie entsprechend in Richtung auf einen einzigen Lemmaansatz; man vgl. 1ab, 3aber 4.
(3') Die lautliche Lemmatisierung
Die durch unterschiedliche Lautgrundlage bedingten Vorkommensformen sind auf die ausgezeichnete phonologische Form zurückzuführen. Diese Form beruht nach dem oben Vorgetragenen auf einem ebenfalls als ‚ausgezeichnet‘ zu verstehenden frühneuhochdeutschen Phonemsystem. Es wird im Zusammenhang mit der graphematischen Lemmatisierung aufgeführt. Die lautliche Lemmatisierung ist im übrigen eine Aufgabe, die sich in einer partiell ähnlichen Weise in der Lexikographie der Varietäten der Gegenwartssprache insbesondere der Dialekte stellt6464. Die Aufgabe wird am ausführlichsten diskutiert im Öst. Wb. 1, 1963, 2; vgl. ferner z. B. Schweiz. Id., 1, 1881, XII; Martin/Lienhart 1, 1899; Lüneb. Wb. 1942, XIV; Wfäl. Wb., Beibd. 1969, 62..
(4') Die graphematische Lemmatisierung
Setzt man einmal voraus, daß die flexions-, die wortbildungsmorphologische und lautliche Lemmatisierung zu der ausgezeichneten (Grund)form eines Wortes geführt haben, so ist diese Form in einer Graphie anzusetzen, die wiederum als ‚ausgezeichnet‘ charakterisiert werden soll. Am Beispiel erläutert: /arbeit/ ist graphematisch als ›arbeit‹ zu schreiben, nicht also zum Beispiel als [arbait] oder als [arrbait].
Im folgenden soll das unter (3') angesprochene ausgezeichnete Phonemsystem in Verbindung mit dem hier zur Debatte stehenden ausgezeichneten Graphemsystem vorgeführt werden, und zwar nacheinander für die Lang- und Kurzvokale, für die Diphthonge und für die Konsonanten. Inhaltlich beruhen die Systeme auf den Ausführungen der Herausgeber im Band 1 der Studien zur neuhochdeutschen Lexikographie.6565. Vgl. die genaue bibliographische Angabe unter Anm. 62. Die Anordnung der Schemata ist demgegenüber verändert, und zwar für die Vokalsysteme, um dem Leser einen Bezug auf die bekannte Größe ‚Vokaldreieck‘ nahezulegen, und für das Konsonantensystem, um einen entsprechenden Bezug auf das gängige Schema der Gliederung der Konsonanten nach Artikulationsart und -ort zu empfehlen.
| /i:/ | /ü:/ | /u:/ | | <ie> | <ü> | <u> | | /e:/ | /ö:/ | /o:/ | | <e; ä> | <ö> | <o> | | | /a:/ | | | | <a> | |
Abb. 10: Ideales System der Langvokalphoneme und der Langvokalgrapheme des Frühneuhochdeutschen
| /i/ | /ü/ | /u/ | | <i; i + Dk> | <ü; ü + Dk> | <u; u + Dk> | | /e/ | /ö/ | /o/ | | <e; e + Dk; ä; ä + Dk> | <ö; ö + Dk> | <o; o + Dk> | | | /a/ | | | | <a; a + Dk> | |
Abb. 11: Ideales System der Kurzvokalphoneme und der Kurzvokalgrapheme des Frühneuhochdeutschen
| /ei/ | /au/ | /eu/ | | <ei> | <au> | <eu; äu> |
Abb. 12: Ideales System der Diphthongphoneme und der Diphthonggrapheme des Frühneuhochdeutschen
| | Labial-/Labiodentalbereich | Dentalbereich | Velar-/Guttural-/Laryngalbereich | | Spiranten | stimmhaft | stimmlos | stimmhaft | stimmlos | stimmhaft | stimmlos | | | /v/ <w; u> | /f/ <f; ff; v> | /z/ <s> | /s/ /sch/ <s, ss> <sch; s> | /j/ <j> | /ch/ /h/ <ch> <h> | | Affrikaten | | /pf/ <pf> | | /ts/ <z; tz> | | | | Explosive | /b/ <b> | /p/ <p; pp; b> | /d/ <d> | /t/ <t; tt; d> | /g/ <g> | /k/ <k; ck; ch; q; g> | | Nasale | /m/ <m; mm> | | /n/ <n; nn> | | /n/ <ng; n> | | | Liquide | | | /l/ <l; ll> /r/ <r; rr> | | | |
Abb. 13: Ideales System der Konsonantenphoneme und Konsonantengrapheme des Frühneuhochdeutschen
Doppelte Querstriche innerhalb der Schemata (also z. B. /i:/) kennzeichnen den Phonemstatus der so notierten Einheit; Spitzklammern (also: <ie>) stehen für den Graphemstatus. Die Sigle Dk ist eine sprechende Abkürzung für Doppelkonsonant. Der Doppelpunkt hinter einzelnen Phonemzeichen kennzeichnet deren Länge. Im übrigen ist das Schema wie folgt zu lesen (an Beispielen erläutert): Dem Langvokalphonem /i:/ entspricht im Graphemsystem <ie>, dem Kurzvokal /e/ das Graphem <e; e + Dk; ä; ä + Dk>. Von der graphischen Realisierung her formuliert: Immer dann, wenn ein Wort das Phonem /i:/ enthält, findet sich in der Graphie ein [ie] (Beispiel: abbieten); immer dann, wenn ein Wort ein /e/ enthält, findet sich in der Graphie entweder ein [e] (Beispiel: aberben) oder ein [e + Dk] (Beispiel: abbetteln) oder ein [ä] (Beispiel: abkräftig) oder ein [ä + Dk] (Beispiel: abspännig). Im ersten Fall besteht also zwischen Graphem und Idealgraph ein 1:1-Verhältnis, im zweiten Fall ein 1:4-Verhältnis. Die eckigen Klammern in der Schreibweise deuten an, daß die so notierte Einheit keinen Graphemstatus, sondern den Status des Graphs hat. Die Schemata für das System der Diphthonge und der Konsonanten sind in entsprechender Weise zu lesen.
Die Herausgeber haben die vorgetragenen Systeme in o. g. Artikel begründet und auch die Kriterien für die Auswahl der Graphe, die ein Graphem bilden, angegeben. Die Ausführungen des Artikels sind relativ detailliert und kompliziert; sie ließen sich nur in toto wiederholen, was hier aber nicht geschehen soll. Um dem Leser dieser Einleitung dennoch eine gewisse Durchsicht durch die Begründungszusammenhänge, außerdem einen anschaulichen Eindruck der Lemmaansätze des Wörterbuches zu geben, werden im folgenden zu jedem Phonem und zugehörigen Graphem Beispiele mit stichwortartigen Erläuterungen gegeben, und zwar in der Reihenfolge der Schemata und ihrer Einheiten.
Langvokale:
| Phonem | Graphem | Beispiele und stichwortartige Erläuterungen | | --- | --- | --- | | /i:/ | <ie> | abbieten; <ie> als graphische Fortsetzung von mhd. <ie> für /ie/; nur für das Langvokalphonem /i:/ eigenes Graphem. | | /e:/ | <e;ä> | abbeten; abmähen; [ä]-Zeichen stehen ausschließlich dann, wenn der Zusammenhang der betreffenden Wortbildung mit nicht umgelauteten Bildungen (vgl. mhd. mât) den Schreibern des Frühneuhochdeutschen nach Ausweis ihrer Graphie durchschaubar gewesen sein muß. Dies gilt auch für die Schreibung der Phoneme /e/ und /eu/. | | /a:/ | <a> | abbaden | | /o:/ | <o> | abholen | | /u:/ | <u> | abbulen | | /ü:/ | <ü> | abbüssen | | /ö:/ | <ö> | aböden |
Kurzvokale:
| /i/ | <i; i + Dk> | abdichten; aberwinnen; aberwitzig; aberwiz. Doppelkonsonant als (für /i/ zusätzliches, vgl. unter /i:/) Kennzeichen der Kürze des vorangehenden Vokals steht ausschließlich in der Stellung ‚Vokal + Konsonant + Vokal‘: -winnen, -witzig, dagegen: aberwiz; [tz] und [ck] haben den graphischen Wert von gedoppeltem z bzw. k (*_zz_; *_kk_). Nicht gedoppelt werden _[b], [d], [g]_ (es sei denn für Entlehnungen aus dem Niederdeutschen), _[ch], [ng], [sch], [j], [h], [w]._ Doppeltes _[s]_ in zwischenvokalischer Stellung, also _[ss],_ ist nicht Kürzenkennzeichen, sondern Kennzeichen der Stimmlosigkeit gegenüber _[s]._ | | _/e/_ | <_e; e + Dk; ä; ä + Dk;_ | _aberben, aberkennen, abkräftig, abspännig_ | | _/a/_ | <_a; a + Dk>_ | _aberhalten, abbannen_ | | _/o/_ | _<o; o + Dk>_ | _abhold, abkommen_ | | _/u/_ | _<u; u + Dk>_ | _abgunst, abbutzen_ | | _/ü/_ | _<ü; ü + Dk>_ | _abgünstig, abfüttern_ | | _/ö/_ | _<ö; ö + Dk>_ | _abfördern, abböllen_ |
Diphthonge:
| /ei/ | <ei> | abfeilen | | /au/ | <au> | abfaulen | | /eu/ | <eu; äu> | abenteuer, freude, abfäulen; zu [äu] vgl. /e:/. |
Konsonanten:
| /v/ | <w; u> | abwechsel, abquitten | | | | /u/ ausschließlich in der Phonemverbindung /kw/, graphisch [qu]. | | /f/ | <f; ff; v> | abfordern, äffen, vor. Zur Verwendung des Doppelgraphs [ff] vgl. /i/; [v] nur in ver-/vor-/von | | /z/ | <s> | absagen, abreisen | | /s/ | <s; ss> | aberchrist, abreissen, abbrossen. [ss] gegenüber [s] als Kennzeichen der Stimmlosigkeit | | /sch/ | <sch; s> | abscheiden, abfischen, abspannen, abstehen | | /j/ | <j> | abjagen | | /ch/ | <ch> | abfuchteln, abdachen, abstechen | | /h/ | <h> | abholz, abfahen, abgehen. In letzterem Beispiel hat /h/ keinen Phonembezug. | | /pf/ | <pf> | abpflocken, abrupfen | | /ts/ | <z; tz> | aberwiz (auslautend), aberwitzig (inlautend, vgl. unter /i/) | | /b/ | <b> | -baden, aber | | /p/ | <p; pp; b> | abpredigen, abpeitschen, abkappen, ab | | /d/ | <d> | abdingen, aberreden | | /t/ | <t; tt; d> | abertriegen, abtreten, abersat, aberwette, abschied | | /g/ | <g> | abgehen, abfegen | | /k/ | <k; ck; ch; q; g> | abkraft, abbrocken, abfechsen, fuchs ([ch] in der Phonemfolge /ks/), abquitten (dazu vgl. unter /v/), abweg | | /m/ | <m; mm> | abfirmen, abdämmen | | /n/ | <n; nn> | abfinden, aberwinnen | | /ng/ | <ng; n> | abdringen, abhenken | | /l/ | <l; ll> | abladen, abfallen | | /r/ | <r; rr> | abreden, aberrieren |
(5') Die semantische Lemmatisierung
Die Lösung der bisherigen Teilaufgaben der Lemmatisierung führt für eine bestimmte Menge von Vorkommensformen immer dann zu einem einzigen Lemmaansatz, wenn man
(1) inhaltlich verwandte Bedeutungen als Bedeutungen eines gleichen Wortes auffaßt und dem Wort dadurch Polysemie zuschreibt, und wenn man
(2) alle möglichen Assoziationen zu Hilfe nimmt, um denjenigen Bedeutungen, die auf den ersten Blick schwer in ein Bezugsverhältnis zu bringen sind (Verdachtsfälle für Homonymie), dennoch partiell gemeinsame Inhaltskennzeichen (in anderer Terminologie: partiell gleiche Gebrauchsbedingungen) zuerkennt.
Auch der umgekehrte Fall kann begegnen: man kann bereits die klassischen Fälle der Polysemie (zum Beispiel Metonymien) zum Anlaß nehmen, mehrere Lemmata anzusetzen (weil zum Beispiel zwischen nomina actionis und nomina acti ein fundamentaler Bedeutungsunterschied besteht: ‚Vorgang‘/‚Gegenstand‘), und man kann erst recht in den bekannten Homonymiefällen so verfahren. Weder das sprachreflexive linguale noch das linguistische Urteil des Lexikographen vermögen zwischen Polysemie und Homonymie eine ein für allemal bestehende fixe Grenze zu ziehen in dem Sinne, daß man sagen kann: Dies ist ein polysemes oder homonymes Wort. Man kann einem Wort höchstens Polysemie/Homonymie zuschreiben. Dafür sind Gründe anzugeben. Die Gründe können (1) etymologisch-ausdrucksseitig orientierter Natur sein, und sie können (2) synchron-semantischer Natur sein. Beide Begründungstypen stehen oft im Widerspruch zueinander: Etymologisch Zusammengehöriges kann sich semantisch so auseinanderentwickelt haben, daß eine Worteinheit nur noch unter Ansatz sehr generischer Inhaltskennzeichen plausibel gemacht werden kann, und etymologisch zu Trennendes kann semantisch zusammengesehen werden. Die hier dauernd gebrauchte Wendung kann ... werden deutet an, daß der Argumentationsspielraum beliebig weit ist.
Diese Situation kann sprachtheoretisch nur zu dem Schluß führen, daß (bei gleicher Wortart) auf eine Unterscheidung zwischen Polysemie und Homonymie durch den Ansatz eines bzw. mehrerer Lemmata verzichtet werden muß6666. Gleiches berichten Agricola/Brauße/Herberg [u. a.] 1983,81 vom Handwörterbuch der deutschen Gegenwartssprache, [vgl. Anm. 44].. So begründet dies zeichentheoretisch auch sein mag und so sehr es dem im Kern synchronen Charakter des Wörterbuches entsprechen würde, steht es doch im Widerspruch zu den für das Deutsche vorherrschenden Lemmatisierungskonventionen.6767. Vgl. z. B. das DWB, auch die Neubearbeitung; ferner: Duden, Uwb. 8; WDG 020. Diesen entsprechend werden deshalb immer dann mehrere Lemmata angesetzt, wenn unter etymologischem Aspekt Homonymie vorliegt und wenn diese in der Semantik des Wortes noch erkennbar ist; vgl. 1abmalen gegenüber 2abmalen, dagegen abspannen, in dem zwei mittelhochdeutsche Wörter, nämlich (ab)spanen und (ab)spannen lautlich und semantisch zusammengefallen sind. In all denjenigen Fällen, in denen keine Homonymie in dem gerade festgelegten Sinne anzusetzen ist, erscheint unabhängig vom Grade der Verwandtschaft der in Frage stehenden Bedeutungen ein einziges Lemma. Dies gilt auch dann, wenn zwei Bedeutungen eines solchen Wortes sich ansatzweise oder durchgehend durch das Geschlecht (bei Substantiven) oder durch die Konjugation (bei Verben) unterscheiden. Zu den Fällen wortbildungsmorphologischer Varianz (z. B. Volksetymologie, Kontamination, Konversion usw.) vgl. die Ausführungen im Abschnitt über die wortbildungsmorphologische Lemmatisierung (oben unter (2')).
Die Frage, wie lemmatisiert wird, wenn polyseme oder homonyme6868. Zu diesen Fachtermini vgl. man z. B. Oskar Reichmann, Germanistische Lexikologie. 2., vollst. umgearb. Aufl. von »Deutsche Wortforschung«. Stuttgart 1976. (Sammlung Metzler 82). (hier: homophone) Wörter graphisch differenziert werden (denkbare Fälle: wieder/wider für Polysemie und lerche/lärche für Homonymie), stellt sich nach dem bisherigen Exzerptionsstand für das Frühneuhochdeutsche noch nicht; Flucht aus der Polysemie und Homonymie durch orthographische Unterscheidung ist eine Erscheinung des späten 17. Jahrhunderts und der Folgezeit. Sollte sie dennoch wortgebunden begegnen, werden selbstverständlich zwei Lemmata angesetzt.
8.2. Die Anordnung der Lemmata und ihre graphische Kennzeichnung
8.2.1. Die Anordnung der Lemmata erfolgt von unten angegebener Ausnahme abgesehen streng alphabetisch6969. Zur Begründung der Ordnung sei auf Jacob Grimm verwiesen (DWB, Vorwort, S. XI): „die sicherheit und schnelle des gebrauchs hängen davon ab“ (neben anderem). – Vgl. auch: Mugdan, Joachim, Grammatik im Wörterbuch: Wortbildung. In: Studien zur neuhochdeutschen Lexikographie 4, 1984, 237–308, besonders S. 290., wobei Umlaute wie Nichtumlaute gewertet werden, also nicht, wie in Sachlexika manchmal üblich, als Vokal + e (ae, ue, oe usw.) zählen. Allerdings rangiert Nichtumlaut vor Umlaut. Lemmata mit genau gleicher Schreibform, aber von unterschiedlicher Wortartzugehörigkeit, werden wie folgt geordnet: Substantiv, Adjektiv, Verb, Partikel. Homonyme werden nach der Länge der zugehörigen Artikel aufgeführt: Der längere Artikel steht vor dem kürzeren, vgl. 1a, 2a, 3a oder 1ab, 2ab, 3ab.
Die Wörterbuchorganisation verlangt eine entscheidende Ausnahme von der dargelegten Regelung. Da b/p, c/k, d/t, f/v aus laut- und graphiegeschichtlichen wie -geographischen Gründen im Frühneuhochdeutschen nicht eindeutig verteilt sind, werden die Wörter, in denen sie in initialer Stellung auftreten, in je einem einzigen Arbeitsgang exzerpiert und bearbeitet. Dabei ergibt sich zwar eine Trennung zwischen den im Anlaut idealiter mit b, c, d, f geschriebenen von den idealiter mit p, k, t, v geschriebenen Wörtern; wollte man eine dementsprechende Trennung aber im Wörterbuch vornehmen, so müßte der Bearbeiter der mit b beginnenden Wörterbuchstrecke dem Bearbeiter der p-Strecke sein ausgearbeitetes Manuskript überlassen (und als Mitbearbeiter für p verantwortlich zeichnen). Dies führt zu unnötigen organisatorischen, darunter vor allem zeitlichen Abstimmungsproblemen. Aus diesem Grund erscheinen alle mit p beginnenden Wörter unter b; alle mit c, t und v beginnenden Wörter stehen unter k, d und f. Im indirekten Anlaut, in Medial- und Finalstellung zählen c, p, t, v als eigene Buchstaben. – Für den Fall, daß es – abgesehen von initialem b/p, c/k, d/t, f/v – gleichgeschriebene Wörter gibt (wie bauer/*pauer), steht b vor p, c vor k, d vor t, f vor v.
8.2.2. Alle Lemmata sind graphisch durch mehrere Mittel auf den ersten Blick erkennbar gemacht, und zwar durch Halbfettsatz, durch Einrückung nach rechts, durch einen im Vergleich zum artikelinternen Zeilenabstand etwas größeren Durchschuß zum vorangehenden Artikel sowie natürlich durch die lemmazugehörigen Informationspositionen ‚Wortvarianten‘ und ‚Wortartzugehörigkeit‘. Bei Mehrfachlemmata gilt die Rechtseinrückung lediglich für den erstaufgeführten Lemmateil; die übrigen Hervorhebungsmittel gelten für das Gesamtlemma. Homonyme werden durch eine vorangestellte Hochzahl voneinander geschieden, vergleiche 1abmalen, 2abmalen. Zum senkrechten Strich innerhalb einiger weniger Lemmata (z. B. bei ab|erkriegen gegenüber aber|reden) vgl. man Abschnitt 16.1.1.