1 Einführung 1.1 Was ist Morphologie? (1) Глокая куздра штеко
Transcription
1 Einführung 1.1 Was ist Morphologie? (1) Глокая куздра штеко
Morphologie und Lexikographie, 2006/7, S. Nagel 1 Einführung 1.1 Was ist Morphologie? [. . .] morphology is fun. On the one hand, because it is concentrated essentially on the study of the wordform in isolation, morphology is, in a sense, limited and therefore offers good chances for a relative exhaustiveness of description; on most occasions, it allows for a complete calculus of logical possibilities. It is the domain for the lover of the finished, the perfect, the detailed, the whole. In syntax and, even more so, in semantics you have to be satisfied with the unfinished, the sketchy, the schematic, the partial. At the same time, however, morphology presents many exotic and ‘bizarre’ phenomena, and in such quantity that its study does not frustrate the passionate admirer of the rarity and the paradoxical. Thanks to these two characteristics, morphology is interesting to any linguist who loves Her Majesty the Language more than the formal constructions called upon to represent her. In the infinite space of syntax and semantics, it is easier to develop vacuous formalisms to satisfy oneself with; the nice little valleys and groves of morphology require more attention to linguistic facts as such. It is not for nothing that linguistics began with morphology and for a couple of centuries was practically nothing more than morphology. [. . .] Syntactic and semantic structures and their constituent elements are not directly observable—they have to be inferred and inevitably represent the result of high-level abstractions. In morphology, on the other hand, the researcher is much closer to directly observable facts. True, we know that morphology is not universal (some languages lack it almost completely); we know as well that morphology ‘feeds’ on semantics and syntax. But this does not make morphology less fascinating or less important. It is the proofing ground of linguistics: everything here is more accessible to an in-depth analysis and can be better verified than in any other division of language. (Mel’čuk 2006: 564) (1) Глокая Glok-aja куздра штеко будланула бокра и кудрячит kuzdr-a šteko bokr-a i kudrjači-t A-NOM.FEM.SG N-NOM.FEM.SG ADV budlanu-l-a V-PRET-FEM.SG N-ACC.MASC.ANIM AND V-PRES.3.SG бокрёнка. bokr-ënk-a. N-CHILD-ACC.MASC.ANIM ,Eine blobige Undra muddelte malich den Bucker und lockelt das Bucklein.‘ (L.V. Ščerba, freie Übersetzung von mir) 1.2 Themen im Kurs • Terminologie • die Ausdrucksseite der Morphologie • morphologische Prozesse • ihre Modellierung in der CL • Lexikographie Morphologie und Lexikographie, 2006/7, S. Nagel 2 Das Wort in Text und Lexikon 2.1 Wortform – Lexem – Paradigma Der Begriff ‚Wort‘ ist für die Beschreibung sprachlicher Einheiten zu ungenau und mehrdeutig. Er bezeichnet 1. eine Folge von Lauten oder Buchstaben (in der CL: ‚Token‘). 2. Als ‚Wortform‘ (oder ‚syntagmatisches Wort‘) bezeichnet er dagegen das Wort „als zweiseitige Einheit“ des Textes mit einer Ausdrucks- und einer Inhaltsseite 3. Das Wort als Einheit des Lexikons wird ‚Lexem‘ (oder ‚paradigmatisches Wort‘) genannt. Auch ein Lexem verfügt über eine Ausdrucks- und Inhaltsseite. Es ist eine abstrakte Einheit und tritt also solche nicht in Texten auf. Repräsentiert wird es dort von einer Menge von Wortformen. Diese Menge wird ‚Paradigma‘ genannt. Ein Lexem oder ‚Lemma‘ wird im Lexikon üblicherweise nicht durch das Paradigma, sondern durch eine ‚Grundform‘ oder ‚Zitierform‘ repräsentiert. → die Wortformen eines Lemmas werden auch ‚Vollformen‘ genannt (Grundform ↔ Vollform) → Syntagmatik, Paradigmatik (→ Schuster 2003: 8) → sprachliches Zeichen (→ Mel’čuk 2006: 18-9) Ein Paradigma lässt sich auch als Satz von Zellen beschreiben, deren jede durch eine oder mehrere grammatische Bedeutungen benannt ist und (im Normalfall) eine Wortform enthält. Die Wortform unterscheidet sich in diesen Bedeutungen von allen anderen Wortformen des Paradigmas. Eine Wortform lässt sich umgekehrt durch diese Bedeutungen und ihre Zugehörigkeit zu einem bestimmten Lexem eindeutig bestimmen und benennen. Nominativ Akkusativ Genitiv Dativ Ablativ Singular insula insulam insulae insulae insula Plural insulae insulas insularum insulis insulis → ‚defektives Paradigma‘: Paradigma mit leeren Zellen → ‚Lexem‘ – ‚Lex‘ – ‚Allolex‘ (→ Mel’čuk 2006: 20-1) 2.2 Grammem und Grammatische Kategorie Die grammatischen Bedeutungen, die die Wortformen eines Paradigmas voneinander unterscheiden werden ‚Grammeme‘ genannt. Grammeme, die gleichartig und nicht miteinander kombinierbar sind, werden zu einer ‚grammatischen Kategorie‘ zusammengefasst. → formale Definition: Mel’čuk (2006: 21-4) 2.2.1 Methodik zur Bestimmung von Grammemen → set-theoretical school (→ Meyer 1994, Kiefer 1968: 41-50) L sei eine Variante des Deutschen mit eingeschränktem Vokabular und der Besonderheit, dass Artikel und Nomen als ein Wort betrachtet und deshalb zusammengeschrieben werden. Die Menge der Substantive N in L lautet: Lexem Wortformen Tür 1.1 1.2 dieTür derTür Haus 2.1 2.2 2.3 dasHaus desHauses demHaus Baum 3.1 3.2 3.3 3.4 3.5 derBaum desBaums desBaumes demBaum denBaum Als Menge der Kontexte C sei gegeben: C1 C2 C3 C4 C5 C6 Ich sehe . Das Auto nähert sich ist weiß. Der untere Teil Die Entfernung zu Max betritt . . ist grau. beträgt 200m. Bestimmen Sie die Anzahl der Kasus in L, indem Sie nach Meyer (1994: 342-5) die maximalen homogenen Mengen an Kontexten H1 , H2 , . . . , Hn aus C bestimmen. 2.3 Aufgaben 2.3.1 Nachzulesen Haspelmath (2002: 13-4,60-2), Mel’čuk (2006: 20-4); (Meyer 1994: 342-5) 2.3.2 Vorzubereiten Mel’čuk (2003: 193-7) 2.3.3 Zu bearbeiten 1. Wiederholen Sie die Vorgehensweise aus Abschnitt 2.2.1 an einem selbst gewählten Beispiel. 2. Gegeben ist der Satz: Er liebt das Mädchen, sie liebt ihn nicht. a) Wieviele Lexeme enthält der Satz? Begründen Sie ihre Antwort! Ordnen Sie jede Wortform ihrem Lexem zu und vervollständigen Sie die fehlenden Zellen des Paradigmas! b) Fertigen zu dem Satz eine “morpheme-by-morpheme”-Glosse an! Orientieren Sie sich dabei an den Regeln der “Leipzig Glossing Rules”, siehe Haspelmath (2002: 34-6) oder unter http://www.eva.mpg.de/lingua/files/morpheme.html. c) Versuchen Sie das gleiche für einen kurzen Satz einer weiteren Sprache. (Wenn möglich eine „morphologisch reiche“ Sprache!) Morphologie und Lexikographie, 2006/7, S. Nagel 3 Dependenz, Kongruenz und Rektion • Dependenz (→ Def. Mel’čuk 2003: 191) • semantische, syntaktische, morphologische Dependenz – Netz/Graph vs. Baum – Eigenschaften von Relation: ∗ reflexiv, symmetrisch, transitiv ∗ antireflexiv (auch: irreflexiv), antisymmetrisch, antitransitiv: es gibt kein(e) Element(e), für die die Relation reflexiv, symmetrisch bzw. transitiv ist • morphologische Dependenz (→ Def. Mel’čuk 2003: 193) – antireflexiv, aber nicht unbedingt antisymmetrisch und antitransitiv – Dependenten mit mehr als einem Regenten – keine Universalie • Kongruenz und Rektion beschreiben die morphosyntaktische Abhängigkeit zwischen zwei Wortformen: Eigenschaften der einen Wortform determinieren die Auswahl eines Grammems der anderen Form. 3.1 Kongruenz → Mel’čuk (2003: 194) unterscheidet zwischen ‚agreement‘ und ‚congruency‘ → Mel’čuk (→ Def. 2003: 194,197) 3.1.1 Variable Kongruenz (1) Dieses Mädchen hatte er gern und beschützte es oft . . . , weil sie die Tochter des Regenmachers war (Mel’čuk 2006: 101, aus Hesse, Glasperlenspiel) (2) a. Naš-a vrač skaza-l-a ... Unser-NOM.FEM.SG Arzt-NOM.MASC.SG sagen-PRET-FEM.SG . . . ‚Unsere Ärztin sagte . . .‘ b. Ministr inostrannych del Islandii zajavi-l-a, minister-NOM.MASC.SG of.foreign.affairs ‚Die isländische Außenministerin erklärte, dass . . .‘ c. * naš-a ministr Ingrid Torvaldsen (3) čto . . . of.Island declare-PRET-FEM.SG, that . . . (Mel’čuk 2006: 51) a. Etwa ein Dutzend Männer stürmte in den großen Raum. b. Rund ein Dutzend Männer stürmten aus den PKW, streiften sich hastig die Polizei-Armbinden über und setzten die Vorstandsmitglieder von "Bwin" fest. (4) Los médicos lo die Ärtze entendemos muy bien dies verstehen-1.PL sehr gut ‚Wir Ärtzte verstehen das sehr gut‘ 3.2 Rektion → Mel’čuk (→ Def. 2003: 195) 3.3 Aufgaben 3.3.1 Nachzulesen 3.3.2 Vorzubereiten Mel’čuk (2006: 110-36), insbes. 110-2, 120-33, 134 3.3.3 Zu bearbeiten (bis Dienstag, 31. Oktober) Nachfolgend sehen Sie eine tabellarische Aufstellung der Formen deutscher Adjektive in Abhängigkeit von verschiedenen Substantiven und Determinativen. Die drei Blöcke stehen für drei Klassen von Determinativen: 1. ohne Determinativ oder mit welch, zwei , Johanns, viel , etwas, etc. 2. der , dieser , mancher , solcher , etc. 3. ein, kein, mein, etc. Horizontal sind die drei Genera im Singular und der Plural angeordnet. Beantworten Sie folgende Fragen: 1. Was können Sie über die morphologischen Dependenzen in einer deutschen NP mit der Struktur DET-ADJ-N sagen? 2. Welche grammatische Kategorien sind beteiligt? 3. Welche Faktoren determinieren die Form des Adjektivs? Was sind die morphologischen Regenten des Adjektivs? 4. Bestimmen Sie, ob es sich bei jedem von Ihnen beobachteten Phänomen um Kongruenz oder Rektion handelt gemäß der Definition von Igor Mel’čuk? (welch) (welch) (welch) (welch) großer großen großem großen Turm Turms Turm Turm dieser dieses diesem diesen große großen großen großen Turm Turms Turm Turm kein_ keines keinem keinen großer großen großen großen Turm Turms Turm Turm große großer großer große Hütte Hütte Hütte Hütte diese dieser dieser diese große großen großen große Hütte Hütte Hütte Hütte keine keiner keiner keine große großen großen große Hütte Hütte Hütte Hütte großes großen großem großes Haus Hauses Haus(e) Haus dieses dieses diesem dieses große großen großen große Haus Hauses Haus(e) Haus kein_ keines keinem kein_ großes großen großen großes Haus Hauses Haus(e) Haus große großer großen große Türme Türme Türmen Türme diese dieser diesen diese großen großen großen großen Türme Türme Türmen Türme keine keiner keinen keine großen großen großen großen Türme Türme Türmen Türme Morphologie und Lexikographie, 2006/7, S. Nagel 4 Kasus substantivischer Kasus (caseI) ↔ adjektivischer Kasus (caseII) regierter Kasus (caseI.1) ↔ Kongruenzkasus (caseI.2), siehe Beispiel 11b bei Mel’čuk (2003: 195) caseI.1a – grammatische (Flexions-)Kategorie KasusI.1 b – ein Grammem der Kategorie Kasus (caseI.1a) c – eine Form, die ein Grammem caseI.1b ausdrückt 4.1 Der „sächsische Genitiv“ → Mel’čuk (2006: 120-6) 4.2 Kasusvarianten vs. ‚external autonomy of case forms‘ → Mel’čuk (2006: 126-) Erneut zur Frage: wieviel Kasusgrammeme besitzt eine Sprache Der Partitiv im Russischen: gg. sind drei Formen (rom, roma, romu) und folgende Kontexte: C1 Nalej mne (‚Schenk mir etwas Rum ein!‘) (‚Schenk mir Rum ein (und nichts anderes)!‘) C2 Nalej mne C3 On prodaval tuzemcam (‚Er verkaufte den Eingeborenen Rum.‘) C4 nemnogo (‚ein bisschen Rum‘) C5 cvet (‚die Farbe des Rums‘) Gibt es im Deutschen auch zwei „Genitive“? Gg. die Formen Maria und Marias mit den Kontexten: C1 Heimat C2 die Heimat meiner geliebten 4.3 Kasussysteme Wieviele Kasus hat das Russische? → Mel’čuk (2006: 130-1): zehn. Ein 11. Kasus? (1) a. idti v soldat-y gehen.INF in.PREP.ACC Soldat-ACC.PL.INANIM ‚Soldat werden‘ Mel’čuk (2006: 41) erklärt das Phänomen dadurch, dass Soldat in Ausdrücken dieses Typs nicht belebt sei. Alternative Lösungen wären: 1. die Annahme eines elften Kasus (‚Inklusiv‘) im Russischen, oder 2. ein Präposition v , die den Nominativ regiert. → Mel’čuk (2006: 152): Übersicht über die Anzahl von Kasusgrammemen in versch. Sprachen 4.4 Semantik und Funktion von Kasusgrammemen → Mel’čuk (2006: 134-8): Gibt es Kasusgrammeme, die eine Semantik haben und nicht nur (syntaktische) Dependenz ausdrücken? → Mel’čuk (2006: 152-7) Kasusgrammeme des Finnischen (aus wikipedia): Nominativ talo das Haus Genitiv talon des Hauses Akkusativ talon, talo das Haus Partitiv taloa das Haus Inessiv talossa im Haus Elativ talosta aus dem Haus Illativ taloon ins Haus Adessiv talolla am Haus Ablativ talolta vom Haus (weg) Allativ talolle zum Haus Essiv talona als Haus Translativ taloksi zum Haus (werden oder machen) Abessiv talotta ohne Haus Instruktiv taloin mittelst Häusern Komitativ taloineen mitsamt (seiner) Häuser 4.5 Aufgaben 4.5.1 Nachzulesen Mel’čuk (2006: 110-36,152-7) 4.5.2 Vorzubereiten Mel’čuk (2006: 47-55,322-348) Morphologie und Lexikographie, 2006/7, S. Nagel 5 Nominale Kategorien: Genus, Nominalklasse, Numerus 5.1 Kongruenzklasse → Mel’čuk (Def. 2006: 47-53) • „a partition into subsets“ für eine Wortart, d.h. keine (!) Flexionskategorie, d.h. keine Grammeme (!) • für jede dieser Teilmengen gibt es eine Menge von morphologischen Dependenten, bei denen ein Grammem selektiert wird: großer Turm, große Hütte, großes Haus • für alle morphologischen Dependenten innerhalb eines Kontextes muss das gleiche Grammem selektiert werden (↔ Rektionsklasse, Subkategorisierungsrahmen) • ein Lexem kann mehreren oder keiner Kongruenzklasse angehören (52-3): – Swahili MTI ‚Baum‘: mti (Sg., Kl.III), mati (Pl., Kl.IV) – russ. nožnicy ‚Schere‘ ist ein Plurale tantum (vgl. engl. scissors, dt. die Alpen). Da alle kongruierenden Wortarten (Adjektive, Pronomina) im Plural das Genus nicht markieren ist es unmöglich das Genus mittels Kontext zu bestimmen. Das Numerale ‚eins‘ verfügt über eine Pluralform odni nožnicy ‚eine Schere‘! 5.2 Genus ↔ Nominalklasse Genus und Nominalklasse sind Unterkategorien der ‚Kongruenzklasse‘, eine scharfe Trennung zwischen beiden Begriffen ist nicht möglich, typische Unterschiede sind: 1. 2. 3. 4. 5. 6. 7. 8. Anzahl Klassen direkter Bezug zu Sexus semantische Motivation darüberhinaus autonomer, nicht-kumulativer Marker am Nomen kumulativer Marker an kongruierenden Dependenten Zusammenhang mit Flexionklasse des Nomens Klassenwechsel im Zusammenhang mit Flexion Klassenwechsel als derivativer Prozess 2–4 ja kaum nein (covert category) ≥4 nein deutlich ja (overt category) ja nein ja nein nie ja nein ja → Genusneutralisierung (Mel’čuk 2006: 336-9) 5.3 Numerus (Mel’čuk 1997-2001: 9,89-91) Grammeme der Kategorie ‚Numerus‘ (des Substantivs) verweisen auf die Anzahl von Objekten Numerus des Adjektivs, Verbs: zum Ausdruck von Kongruenz, nicht semantisch motiviert Numerus des Personalpronomens: wir 6= ‚mehrere Ichs‘ • sprachspezifische semantische Besonderheiten: – mehrere Sorten: französische Weine – eine große Menge: franz. les sables du Sahara „die Sande Afrikas“ – Paarigkeit: span. los padres ‚die Eltern‘, los reyes ‚König und Königin‘ – ... • syntaktische Besonderheiten: Pluralia tantum: syntaktisch/morphologisch Plural, semantisch ? (1) dvadcat’ odin-Ø den’-Ø zwanzig ein-NOM.SG.MASC Tag-NOM.SG.MASC ‚einundzwanzig Tage‘ 5.4 Aufgaben 5.4.1 Nachzulesen 5.4.2 Vorzubereiten 5.4.3 Zu bearbeiten (bis Dienstag, 7. November, wird benotet!) Zahlreiche deutsche Substantive flektieren nach adjektivischem Muster, z.B. Angestellter , Beamter , (das) Wolfsjunge, (die) Grünen. 1. Diese Substantive weisen voneinander verschiedene Formen auf, wenn sie mit/ohne bzw. verschiedenen Determinativen stehen: der Beamte vs. ein Beamter. Muss deshalb für diese Gruppe von Substantiven eine gesonderte grammatische Kategorie (Flexionskategorie) angenommen werden? Begründen Sie Ihre Entscheidung! Wenn ja, wieviele Grammeme weist diese Kategorie auf? 2. Nun existieren für diese Substantive z.T. parallel maskuline und feminine Formen: ein Angestellter vs. eine Angestellte. Ist die Annahme einer weiteren Flexionskategorie ‚Genus‘ gerechtfertigt? Nennen Sie Gründe, die dafür und dagegen sprechen! 3. Geben Sie für jedes der genannte Substantive (Angestellte/r , Beamter , (das) Wolfsjunge, (die) Grünen) das vollständige Paradigma in tabellarischer Darstellung an. Kennzeichnen Sie alle Zeilen und Spalten mit den Grammemkombination, so dass jede Zelle eindeutig benannt ist. 4. Nun ist auf den ersten Blick nicht offensichtlich, welche Substantive zur Gruppe der adjektivisch flektierenden gehören (Wolfsjunge vs. Straßenjunge). Entwickeln Sie ein algorithmisches Testverfahren, das eine sichere Zuordnung erlaubt. Stellen Sie den Algorithmus in Form eines Entscheidungsbaums dar. Verwenden Sie an den Verzweigungen Einsetzproben, wo Wortformen des Lexems in Kontexte eingesetzt werden, z.B. „Unterscheiden sich die Wortformen in Kontext A und B? (ja/nein)“ Testen Sie (zu Ihrer eigenen Sicherheit) den Algorithmus an den beiden Lexemen Wolfsjunges und Straßenjunge. 5. Geben Sie in gleicher Weise einen Algorithmus an, um das Genus eines solchen Substantivs zu bestimmen, bzw. ob es sich um ein ‚Plurale tantum‘ handelt. Morphologie und Lexikographie, 2006/7, S. Nagel 6 Verbale Kategorien: Verbalgenus, Tempus, Aspekt, Modus 6.1 Genus verbi, Diathese semantische Aktanten: (1) ESSEN(X,Y), z.B. ESSEN(Max,Törtchen) (tiefen-)syntaktische Aktanten: • syntaktischer Anschluss wird im Rektionsmodell eines Lexems/Prädikats definiert, z.B. für essen: 1=X 2=Y wer was NNom NAkk • (tiefen-)syntaktische Aktanten werden mit fortlaufenden römischen Ziffern bezeichnet, die Nummerierung folgt per Konvention der Art ihrer Realisierung, d.h. I steht den Aktanten der als Subjekt realisiert wird, II für das direkte Objekt, III usw. für indirekte Objekte Diathese (Mel’čuk 2006: 187): „The diathesis of a wordform w is the correspondence between w’s Semantic and Deep-Syntactic Actants.“ Basisdiathese (Mel’čuk 2006: 189): „The basic diathesis of a Lexical unit L is the lexicographic diathesis of L, i.e., the diathesis which corresponds to the citation form of L and which must be stored in L’s lexical entry (in it’s syntactics).“ Voice, Genus verbi, Verbalgenus (Mel’čuk 2006: 191): „Voice is an inflectional category whose grammemes specify such modifications of the basic diathesis of a lexical unit L that do not affect the propositional meaning of L.“ logisch mögliche Voice-Grammeme und Beispiele siehe Mel’čuk (2006: 194-) 6.2 Tempus (Mel’čuk 1997-2001: II,60-80) Grammeme lokalisieren die Handlung auf einer Zeitachse in Bezug • auf den Sprechzeitpunkt (‚absolutes Tempus‘) • bezüglich einer anderen Handlung (‚relatives Tempus‘) 6.3 Aspekt (Mel’čuk 1997-2001: II,92-5,100-16) ‚Aspekt‘ charakterisiert die Verbalhandlung in Bezug auf ihren „inneren“ Zustand (‚inneres Tempus‘). Mel’čuk unterscheidet fünf Flexionskategorien ‚Aspekt‘: I Anzahl der Fakten/Handlungen: unbestimmt, einmal, mehrmals II Verteilung über Zeit und Ort: unbestimmt, Konzentrativ (Handlung auf einen Ort und einen Zeitpunkt beschränkt), Distributiv (zu einem Zeitpunkt, aber an mehreren Orten), Interativ (an mehreren aufeinanderfolgenden Zeitpunkten), Distributiv-Iterativ III zeitliche Ausdehnung einer Handlung: punktuell, durativ („zeitlich andauernd“), habituell (gewöhnlich, regulär) IV Aktualität der Handlung (findet sie gerade jetzt statt?): (Nicht-)Progressiv, z.B. engl. John sings well vs. John is singing well V Telizität der Handlung (wurde eine innere Grenze der Handlung überschritten): perfektiv vs. imperfektiv 6.4 Modus (Mel’čuk 1997-2001: II,153-9) Grammeme beschreiben die Einstellung des Sprechers zur Satzaussage/Proposition: • Indikativ (Sprecher bestätigt Satzaussage) • Imperativ (Sprecher will das Satzaussage wahr wird, wirkt auf Adressaten dementsprechend ein) • Optativ (Sprecher wünscht, das Satzaussage wahr wird) • Konjunktiv/Subjunktiv (Aussage ist anderem Prädikat untergeordnet) • Konditional (wenn . . . , dann . . . ), Irrealis (Sprecher nimmt an, das Aussage nicht zutrifft) • ... 6.5 Aufgaben 6.5.1 Nachzulesen Mel’čuk (2006: 194-209) 6.5.2 Vorzubereiten Haspelmath (2002: 60-84,113-147) Morphologie und Lexikographie, 2006/7, S. Nagel 7 Flexion vs. Derivation; Flexionsklassen 7.1 Flexion vs. Wortbildung Haspelmath (2002: 70-82), vgl. Mel’čuk (1997-2001: I,241-246,278-304) 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. Flexion / Grammem Wortbildung / Derivatem (semantisch) abstrakt semantisch regulär — Bezug zur Syntax: durch syntaktische Regeln bestimmt obligatorisch Verwendung/Anwendung unbeschränkt Ausdruck regulär eher wenige Stamm-Allomorphe — Ausdruck: an der Peripherie der Wortform Wechsel der Wortart: nein kumulativer Ausdruck möglich nicht iterierbar konkret (teilweise) idiomatisch „Amalgamierung“ mit lexikalischer Bed. (weitgehend) außerhalb Syntax fakultativ beschränkt irregulär, durch viele verschiedene Marker eher viele ersetzbar durch einzelnes Word nahe dem Stamm ja nicht möglich iterierbar 7.2 Flexionsklassen Beschreibung (vgl. Haspelmath 2002: 122-5) Vererbung (vgl. Haspelmath 2002: 125-30) Synkretismus: Zellen mit gleichlautenden, homonymen Wortformen/Allolexen Suppletivformen: Wortformen, die andere (fehlende) Formen innerhalb Paradigmas ersetzen, aber etymologisch fremd sind. ‚Suppletivismus‘ kann auf alle sprachliche Zeichen ausgedehnt werden. Zwei sprachliche Zeichen sind dann zueinander suppletiv, wenn sie auf der Inhaltsseite äquivalent und auf der Ausdrucksseite nicht äquivalent sind (vgl. Mel’čuk 2006: Kap. 8, Mel’čuk 1997-2001: IV,420-2). Periphrase: „Umschreibung“, Auffüllen einer leeren Zelle durch eine Kombination aus Wortformen (= ‚analytische Form‘) 7.3 Aufgaben 7.3.1 Nachzulesen Haspelmath (2002: 60-84,113-147) 7.3.2 Vorzubereiten Mel’čuk (2000), insbesondere 526–532 Morphologie und Lexikographie, 2006/7, S. Nagel 8 Morphologische Prozesse 8.1 Nachzulesen Mel’čuk (2000), insbesondere 526–532 8.2 Vorzubereiten (bis 16.11.) Mel’čuk (2006: 384–399) (bis 21.11.) Fleischer (2000), Booij (2005: 74–95) 8.3 Zu bearbeiten Bei welchen der folgenden Phänomen handelt es sich um morphologische Prozesse nach Mel’čuks Definition? Wie würden Sie die Phänomene benennen? Orientieren Sie sich an der Systematik und Terminologie Mel’čuks! (1) ev - ler - i -n - den Haus - Pl - 3.Sg - FugenMorphem - Ablativ türk. ‚von seinen/ihren Häusern (her)‘ (2) dt. aufessen → aufgegessen (3) dt. artig → unartig, rein → unrein (4) gr. summetra → asummetra ‚Symmetrie‘ → ‚Asymmetrie‘ (5) russ. kollektivnoe chozjajstvo → kolchoz Bauernhof‘ → ‚Kolchose‘ ,kollektiver (6) Warlpiri a. kurdu → kurdu-kurdu ‚Kind‘ → ‚Kinder‘ b. kamina → kamina-kamina ‚Mädchen.Sg‘ → ‚Mädchen.Pl‘ (7) dt. Student → Studi , Abitur → Abi (8) engl. *breakfast-lunch → brunch (9) arab. qtl → (qatala, qutila) ‚töten‘ → ‚er hat getötet‘, ‚er/es wurde getötet‘ (10) a. [a] bomb → [to] bomb ‚Bombe‘ → ‚bombardieren‘ b. [a] nail → [to] nail ‚Nagel‘ → ‚nageln‘ (11) dt. hassen → gehasst, rasen → gerast, mähen → gemäht (12) dt. Konferenz über Sicherheit und Zusammenarbeit in Europa → KSZE (13) Chines. a. ang → ang-ang → ang-ang-ang ‚rot‘ → ‚röter‘ → ‚sehr rot‘ (14) dt. Apfel → Äpfel , Mutter → Mütter , Vogel → Vögel (15) dt. Apfelbaum, Pflaumenbaum, Kirschbaum (16) dt. Apfel → Äpfelchen, Biene → Bienchen, Baum → Bäumchen (17) Agta a. takki → tak-takki ‚tak-takki‘ → ‚Beine‘ b. uffu → uf-uffu ‚Schenkel.Sg‘ → ‚Schenkel.Pl‘ Morphologie und Lexikographie, 2006/7, S. Nagel 9 Morphem; morphembasiert – lexembasiert; Basiseinheit eines morphologischen Wörterbuchs 9.1 Morph – Morphem – Allomorph traditionelle Definition (Bußmann (ed.) 2002: 448): Morph [griech. morphē ‚Form‘]. Kleinstes bedeutungstragendes lautliches Segment einer Äußerung auf der Ebene der Parole, das noch nicht als Repräsentant eines bestimmten Morphems (auf der Ebene der Langue) klassifiziert ist [. . .]. Haben zwei oder mehrere Morphe gleiche Bedeutung bei verschiedener Verteilung, so gehören sie zu demselben Morphem bzw. werden als Allomorphe bezeichnet; so sind z.B. /-e/ in Hunde, /-er / in Kinder , /-n/ in Opern, und /-s/ in Autos vier verschiedene lautliche Repräsentanten des deutschen Pluralmorphems. Vergleicht man die Morphe -er in Kinder , härter und er , so handelt es sich um ein homographes Morph, d.h. -er ist Allomorph verschiedener Morpheme, nämlich {Plural}, {Komparativ}, {Personlpronomen}. Die Unterscheidung Morph vs. Allomorph vs. Morphem entspricht methodisch derjenigen von Phon vs. Allophon vs. Phonem. Probleme: 1. Was heißt „bedeutungstragendes lautliches Segment“? (1) fernseh- in fernsehen/Fernseher (vgl. Fernglas, Fernsicht) (2) Großhöflein (Ort im österreichischen Burgenland) (3) die kalte Schulter zeigen 2. Was bedeutet „bei verschiedener Verteilung“? • /frau/ und /-in/ bedeuten beide ‚Person weiblichen Geschlechts‘ und stehen „in komplementärer Distribution“. Sind sie deshalb Allomorphe eines Morphems? • dito: Bewohner , /-er / (Dortmunder ), /-i / (Iraki ), /-iner / (Sachsen-Anhaltiner ), usw. Definition Mel’čuks (2006: 24,388 und davor für notwendige Konzepte) • Morph = elementares segmentales sprachliches Zeichen, d.h. – keine (quasi-)representierbaren Zeichen – keine nicht-segmentalen Zeichen, d.h. ∗ keine Operationen wie Reduplikation ∗ keine Zeichen die Prosodem enthalten (die kalte Schulter zeigen) • Morphem: nicht leere Menge von Morphen (m1 , m2 , . . . , mn = {mi }), für die gleichzeitg gilt: 1. das Bezeichnete von allen mi stimmt überein 2. alle mi sind entweder Wurzeln oder Affixe (⇒ damit wird sichergestellt, dass /frau/ und /-in/ nicht zu einem Morphem gehören, sondern zu verschiedenen synonymen Morphemen) 3. a) alle mi stehen in komplementärer Distribution, die sich durch (i.) generelle und (ii.) auf den Kontext einer ‚phonetischen Phrase‘ beschränkte Regeln beschreiben lassen ⇒ (i.) verwirft die Bewohnersuffixe (s.o.) als Allomorphe (vgl. Mel’čuk 2006: 392–4) ⇒ (ii.) erlaubt engl. a und an als Allomorphe b) Wurzeln mit verschiedener Form werden nur dann als Allomorphe aufgefasst, wenn sie durch Alternationen voneinander herleitbar sind: z.B. /sing/, /sung/, /sang/ (per Ablautalternation), aber nicht: /toilett/, /klosett/ Portmanteau-Morphem, strong megamorph (Mel’čuk 2006: 24,401): auf der Inhaltsseite, nicht aber Formseite dekomponierbares minimales Zeichen, z.B. engl. am = {‘be’,‘indic’,‘pres’,‘1pers’,‘sg’} Quasimorph (Mel’čuk 2006: 389–390): eine Kombination von mehreren Morphen/Morphoiden m1 , m2 , . . . , mn , bei der • das Bezeichnete phraseologisiert ist, also nicht als Kombination der Bedeutungen von m1 , m2 , . . . , mn herleitbar ist: Schiff-chen ‚Teil eines Webstuhls‘ • oder die Kombination geschieht nicht regulär ⇒ „the majority of the stems of lexical units in the lexicon of any language turn out to be quasimorphs“ dekomponierbar Form Inhalt Wortform, Phrase Quasimorph Strong Megamorph, Portmanteau-M. Morph + + – – + – + – } repräsentierbar o quasirepräsentierbar 9.2 Morphembasiert – lexembasiert In morpheme-based morphology, word-forms are analyzed as sequences of morphemes. A morpheme is defined as the minimal meaningful unit of a language. In a word like independently, we say that the morphemes are in-, depend, -ent, and ly; depend is the root and the other morphemes are, in this case, derivational affixes. In a word like dogs, we say that dog is the root, and that -s is an inflectional morpheme. This way of analyzing word-forms as if they were made of morphemes put after each other like beads on a string, is called Item-and-Arrangement. wikipedia The basic goal of most morpheme-based theories is to reduce language to simplex signs, each one of which is an arbitrary union of sound and meaning. In a language that is ideal from this point of view, arbitrariness will reside entirely at the level of the simplex sign: each simplex sign will consist of a one-to-one match between a stretch of sound and a meaning, and in the perfect language, at least, these matchings should be unique: each distinct arbitrary form should have a single meaning, and each distinct meaning a single form. (Aronoff 1994: 8) Lexeme-based morphology is (usually) an Item-and-Process approach. Instead of analyzing a wordform as a set of morphemes arranged in sequence, a word-form is said to be the result of applying rules that alter a word-form or stem in order to produce a new one. An inflectional rule takes a stem, changes it as is required by the rule, and outputs a word-form; a derivational rule takes a stem, changes it as per its own requirements, and outputs a derived stem; a compounding rule takes word-forms, and similarly outputs a compound stem. wikipedia 9.3 Typen/Basiseinheiten morphologischer Wörterbücher Aufgabe eines morphologischen Wörterbuchs: alle Wortformen einer Sprache zu beschreiben • Morphemwörterbuch – Problem der Quasimorphe – Zitierform eines Morphems? • Stammwörterbuch – Wie lautet die Zitierform eines Stammes? – Umgang mit Stammalternationen: ∗ Regeln beschreiben Alternation ∗ Auflisten der Stämme ∗ „pseudo-agglutinativ“: Stamm ist längstes gemeinsames Präfix der (orthographischen) Repräsentationen aller Formen des Paradigmas • Grundformenwörterbuch – Grund-/Zitierform traditionell und meist eindeutig – Operation nötig, um den Stamm zu ermitteln • Vollformenwörterbuch – schwer zu warten – mitunter sehr groß, erfordert effiziente Speicherung • Mischformen, z.B. Grundformenwörterbuch + Derivationsmorpheme 9.4 Aufgaben 9.4.1 Nachzulesen Mel’čuk (2006: 24,384–399) 9.4.2 Vorzubereiten perldoc -f substr, Maier-Meyer (1995: 45–9) (http://www.cis.uni-muenchen.de/pub/cis-berichte/CIS-Bericht-95-84.ps.gz) Fleischer (2000), Booij (2005: 74–95) 9.4.3 Zu bearbeiten (bis Dienstag 21.11.) Gegeben ist folgender Satz (im Kontext fett hervorgehoben): Im Mittelalter entstand ein neuer Typ, der Trittwebstuhl. Die Kettfäden sind nun waagerecht angeordnet. Die Fachbildung geschieht über sog. Schäfte, im Prinzip sind dies verdoppelte Litzenstäbe, die durch Fußtritte bewegt werden. Der Fadenanschlag wird anstelle des bisher verwendeten Schwertes oder Kamms durch einen neuen Geräteteil bewerkstelligt, die Lade. Das Einbringen des Querfadens nimmt nun das Schiffchen vor, ein hölzernes Bauteil, in dem ein Faden im Inneren aufgewickelt ist. Dieses Schiffchen wird, wenn das Fach durch Fußtritt gebildet ist, von einer Hand auf die Fadenbahn geworfen, gleitet schnell durch das Fach hindurch und wird auf der anderen Seite vom Weber mit der zweiten Hand aufgefangen. 1733 führte der Engländer John Kay den Schnellschützen ein, eine Ladenbahn, auf der das Schiffchen, von einer Schnur gezogen, entlang schießt. Damit war die letzte Stufe vor Beginn der Mechanisierung erreicht. 1. Zerlegung Sie alle Wortformen des Satzes in ihre Morphe. 2. Wie würden sie die Morpheme benennen? Paraphrasieren Sie den Satz in einer “morpheme-bymorpheme”-Glosse. 3. Nennen Sie Allomorphe zu mind. drei Morphen. 4. Welche Quasimorphe finden Sie vor? 5. Nennen Sie die Zitierformen der Lexeme, zu denen die Wortformen gehören. Morphologie und Lexikographie, 2006/7, S. Nagel 10 Flexion II; Wortbildung 10.1 Modellierung von Flexion 10.1.1 Das Flexionsmodul von Unitex Gg. den Lexikoneintrag aimer,V3 werden durch die Graphen alle Formen des Paradigmas beschrieben: aimer,aimer.V:W aimerai,aimer.V:F1s aimeras,aimer.V:F2s aimera,aimer.V:F3s aimerons,aimer.V:F1p aimerez,aimer.V:F2p aimeront,aimer.V:F3p ... Als Operationen sind definiert (nach dem Kopieren der Grundform): L ein Zeichen nach links Matrix + Lzen = Matrizen R ein Zeichen nach rechts acheter + LLLLèRR = achète; gérer + . . . D lösche ein Zeichen, schiebe alle Zeichen rechts davon um ein Zeichen nach links choose + LLDRRn = chosen C kopiere das aktuelle Zeichen, schiebe alle Zeichen rechts davon um ein Zeichen nach rechts permit + Ced = permitted; ship + . . . (alle anderen Zeichen) kopiere das Zeichen an die aktuelle Position, gehe eine Position nach rechts 10.1.2 Flexion deutscher Substantive in Perl siehe Programmfragment (hKursseitei/bin/flexN_.pl): Ergänzen Sie die zwei unvollständigen Ausdrücke! 10.2 Wortbildung Mel’čuk: morphologische Prozesse sind bedeutungstragend: „word-manufacturing methods“ [. . .], in sharp contrast to genuine morphological processes, are strictly diachronical: they expand lexical stock by creating new words, but they do not express meanings. Back-formation (of the type vacuum cleaner ⇒ [to] vacuum-clean) is less obvious, but it is a diachronical phenomen, too, even if it is highly productive and produces semantically predictable results. As soon as a verb of the type [to] vacuum-clean is formally derived by backformation, it becomes semantically primary; thus, vacuum-cleaner means ‘appliance designed to vacuum-clean with’; therefore, viewed synchronically, it is dereived from the verb [to] vacuum-clean. (Mel’čuk 2000: 532) nicht-bedeutungstragende „Wortschöpfungsverfahren“ (vgl. Mel’čuk 2000: 531-2, Haspelmath 2002: 25): • Blending (Amalgamierung) brunch smog Eurasien Demokratur • Clipping breakfast + lunch smoke + fog Europa + Asien Demokratie + Diktatur – back-clipping: Foto, Demo, Zoo; Realo, Tanke; Steffi – fore-clipping: Cello – hinten und vorne: engl. influenza → flu – in Komposita: Ölzweig = Ölbaumzweig – „Silbenwörter“: Trafo; russ. kolchoz • Abkürzungen: – CDU („Initialismus“, „Alphabetismus“) – TÜV („Akronym“) – GeStaPo, StaSi • Reduplikationen wie in plemplem, Tippeltappeltour bedeutungstragende Wortbildungsprozesse: → siehe morphologische Prozesse – Suffigierung – Präfigierung – Zirkumfigierung: sing-en → Ge-sing-e – Ersetzung: werfen → Wurf (im Dt. nicht mehr produktiv) – Reduplikation: Urgroßvater → Ururgroßvater – Komposition • Reihenbildung: sich verlaufen, sich verspielen, sich verfahren, sich verschreiben, sich vertippen, sich versprechen, . . . • Wortbildung und Koordinationsellipse: obdach-, eltern- und heimatlos ↔ *wind- und eisig 10.3 Aufgaben 10.3.1 Vorzubereiten Booij (2005: 74–95); Ortner et al. (1991) Morphologie und Lexikographie, 2006/7, S. Nagel 11 Komposition & (deutsche) Komposita Anteil der Substantivkomposita im Deutschen: <10% der Token (Wortformen im Text), >50% der Types (verschiedene Wortformen), >60% der Lexeme (Wörter im Lexikon) N, ADJ, V als Resultat der Komposition, als Konstituenten auch PREP, ADV, etc. Abgrenzung Phrase ↔ Kompositum: • Komposita werden zusammengeschrieben • tragen (Haupt-)Akzent (normalerweise) auf dem Erstglied (d.h. nicht auf dem Kopf!) • keine interne Flexion Syntaktische Eigenschaften: Kopf bestimmt Wortart, Genus und Flexionsklasse „Die erste determiniert [. . . ] die zweite, die sonst dominimiert.“(Ortner et al. 1991: 5) Phraseologisierung/Quasimorphe: Kindergarten 11.1 Typen • ‚endozentrisch‘: die Kategorie des Kompositums stimmt mit der eines Konstituenten überein. Dieser ist der Kopf des K.s: Bierfass • ‚exozentrisch‘: ital. porta-lettere „tragen-Briefe“ ‚Briefträger‘ • ‚Determinativkompositum‘: Erstglied bestimmt Kopf (Zweitglied) genauer • ‚Kopulativkompositum‘ (Dvandva): gegenseitiges Spezifikationsverhältnis: Fürstbischof , Strumpfhose, Hosenrock , blaugrau • Possessivkompositum (Bahuvrı̄hi): Kompositum bezeichnet prominente Eigenschaft des Bezeichneten: Rotkehlchen, Achtzylinder , Lästerzunge • ‚Rektionskompositum‘: Argumentstelle des Kopfes wird durch Erstglied gefüllt: Schuhverkäufer → Inkorporation (Booij 2005: 92, Mel’čuk 2000: 528): radfahren 11.2 Fugenelemente, -morpheme, -formen • -Ø, -e, -es, -en, -ens, -n, -s; mit Umlaut: -er , -e; -i , -o, -al (bei entlehnten Stämmen: Elektr-o-motor , Agr-i-kultur ); Bindestrich (Armee-Einheiten, US-Regierung) • keine allgemeingültigen Kriterien zur Wahl des Fugenmorphems: Rindfleisch, Rindsbraten, Rindersteak Kirchentür , Kirchturm Hofmauer , Friedhofsmauer Schweinebraten, Schweinsbraten, *Schweinbraten, aber Wildschweinbraten folgende Kriterien / Erklärungen sind nicht global gültig: – semantische (Interpretation der Fugenformen als Plural oder Genitiv): Stadtmitte vs. Städtepartnerschaft;Bettdecke vs. Bettenzahl , aber Mehrbettzimmer – phonotaktische Kriterien – -s häufiger nach Erstgliedern, die selbst Komposita sind – Verteilung nach Suffixen (vgl. Fleischer & Barz 1992: §2.2.15.2) z.B. -s bei (ig)keit, aber Ordnungswidrigkeitenrecht, Neuigkeiten-Seite – Analogie zu bestehenden Komposita • Fugenformen des Erstgliedes (analog zu „Flexions“formen) – Zusammenhang zwischen Flexion(sklasse) und Fugenelement – verbleiben in Koordinationsellipsen beim Erstglied: Schweins- und Rinderbraten – CISLEX (Langer 1998): 68 Operationen (Suffixoperationen + Umlaut) 11.3 Kompositasegmentierung • Ziele – syntaktische Eigenschaften des Kompositums – semantische Analyse ∗ Bestandteile ∗ Struktur / Argumentenstruktur Mädchen|(handels|schule) *(Mädchen|handels)|schule N N N N N Mädchen N N N N N schule handels schule Mädchen handels • Zerlegungsalgorithmus: finde Folge von “( Fugenform )+ Substantivform”, die genau der zu segmentierenden Wortform entspricht • Ambiguitäten / Fehlanalysen: Glück|sau|tomaten, Wachs|tube ↔ Wach|stube, Lern|ende, Antrags|teller , Winds|tau, Verse|pos (aus Verse + Po) • bracketing paradox: Semantisch motivierte Zerlegung: Morphologisch motivierte Zerlegung: (nuclear physic)-ist ‚derjenige, der sich mit nuclear physics beschäftigt‘ nuclear (physic-ist) N N A SuffNominal A N nuclear physic N ist N nuclear N SuffNominal physic ist 11.4 Aufgaben 11.4.1 Zu bearbeiten Gegeben sind folgende dt. Komposita: Donaudampfschifffahrtsgesellschaft, Lokalbaukommission, Ernährungsratschlag, Kleinwagenkäufer , Autobauer , Erdölindustrie, Bahnhof 1. Zerlegen Sie die Komposita in ihre Bestandteile. 2. Klammern Sie die zusammengehörenden Sequenzen aus Konstituenten. 3. Zeichnen Sie für eines der Komposita einen Baum, der die innere Struktur darstellt. 4. Welche der gg. Komposita sind semantische durchsichtig, d.h. nicht „phraseologisiert“? Morphologie und Lexikographie, 2006/7, S. Nagel 12 Wörterbücher – Einheiten des Lexikons Was ist ein Wörterbuch/Lexikon? – lexikographisches Nachschlagewerk, das zu (Stich-)Wörtern Informationen enthält Stichwort/Lemma: beschriebene Einheiten im Lexikon Versuch einer Typologie von Wörterbüchern: (vgl. Hausmann et al. (eds.) (1989-1991), Folien von Angelika Feine) • „Als Standardtyp eignet sich das Wörterbuch, das für den Laien im Zentrum des Wörterbuchbegriffes steht, das allgemeine einsprachige Definitionswörterbuch.“ (Hausmann 1985: 372) • linguistisch ↔ enzyklopädisch div. Sprachwörterbücher – Sachwörterbuch – Konversationslexikon – Universallexikon/Enzyklopädie • einsprachiges WB ↔ Übersetzungswörterbuch/zweisprachiges oder mehrsprachiges WB/bilingual dictionary • Allgemeinwörterbuch ↔ Fachwörterbuch allgemeinsprachlich ↔ fachsprachlich • Gesamtwörterbuch ↔ Spezialwörterbuch gesamter Wortschatz ↔ Teilmengen (z.B. Fremdwörter, Synonympaare usw.) • Verwendungszweck/Nutzergruppe/Umfang: Schulwörterbuch/Lernerwörterbuch/learner’s dictionary – Großwörterbuch – Taschenwörterbuch – Reisewörterbuch Grundwortschatz – Minimalwortschatz • synchron ↔ diachron: historisches Wörterbuch, Sprachstadienwörterbuch/Periodenwörterbuch, etymologisches Wörterbuch, Lehnwörterbuch • Auswahl der Lemmata – sprachliche Segmente als Einheiten ∗ Zeichenwörterbuch: Kanji-WB, character dictionary ∗ Morphem: Morphemwörterbuch, Wortfamilienwörterbuch, Wörterbuch der Ableitungen/Derivationen ∗ Wort (default) ∗ Syntagmen: · Konstruktionswörterbuch (syntactic patterns) · Kollokationswörterbuch · phraseologisches WB · Metaphernwörterbuch · Sprichwörterbuch, Sprichwörtersammlung, geflügelte Worte · Zitatenwörterbuch, Zitatensammlung · Satzwörterbuch – semantische Teilmengen: ∗ Namenwörterbuch, Eigennamenwörterbuch, Onomastikon, Gazetteer – Teilmengen nach syntaktischen Eigenschaften: Verbwörterbuch, Lexikon der Präpositionen etc. – nicht-sprachliche Einheiten: Symbolwörterbuch, Gestenwörterbuch – orientiert an Form des Zeichens ∗ Abkürzungswörterbuch, Akronyme • • • • • • • • • • • • ∗ Reimwörterbuch ∗ Palindromwörterbuch ∗ phonologisches Wörterbuch ∗ Kreuzworträtselwörterbuch – andere ∗ vergessene/untergegangene/seltene Wörter, Archaismen ∗ Neologismen ∗ Internationalismenwörterbuch ∗ Fremdwörterbücher semantisch orientiert (semantische Relationen zwischen Zeichen) – onomasiologisches Wörterbuch – Synonymwörterbuch, synonym finder – Antonmywörterbuch – thematisch/begrifflich geordnetes Wörterbuch, wordfinder – Thesaurus – Ontologie – assoziatives Wörterbuch syntagmatisch orientiert (Σx ): Valenzwörterbuch, Erklärend-Kombinatorisches WB Rechtschreibwörterbuch, orthographisches WB Aussprachewörterbuch Homonymwörterbuch, (bzw. Homophone, Paronyme) Flexionswörterbuch, Konjugationswörterbuch Schwierigkeiten, schwierige Wörter Sortierung: – Standard: alphabetische/lexikographische Sortierung – rückläufiges Wörterbuch, Index „a tergo“ Umkehrwörterbuch textbezogen: – individualsprachliche Wörterbücher, Autorenwörterbuch – Autorenbedeutungswörterbuch – Konkordanz, Belegstellenwörterbuch Frequenzwörterbuch, Häufigkeitswörterbuch Standardsprache/Schriftsprache ↔ Umgangssprache/gesprochene Sprache ↔ Dia-/Soziolekte: Mundartwörterbuch, Dialektwörterbuch Wörterbuch der Jugendsprache, Slangwörterbuch, Argot, Schimpfwörterbuch, sexuelle Lexik • Bildwörterbuch • Glossar 1. Welche Wörterbuchtypen sind für den Computerlinguisten (nicht) nützlich/brauchbar? 2. Welche sind durch den Computer (weitgehend) überflüssig geworden? 3. Welche Wörterbuchtypen sind für welche computerlinguistischen Anwendungen verwendbar? Lexikologie: Lehre von den Strukturierungen im Wortschatz Lexikografie beschäftigt sich mit der Erstellung von Wörterbüchern. Makrostruktur: Auswahl der Lemmata und ihre Anordnung Mikrostruktur: Aufbau eines Eintrags Morphologie und Lexikographie, 2006/7, S. Nagel 13 Phraseme: Idiome, Kollokationen etc. (Alle Seitenverweise beziehen sich auf Mel’čuk 1995: „Phrasemes in language and phraseology in linguistics“) Freie Phrasen ↔ Phraseme (173–6) • bei freien Phrasen bestehen keine Einschränkung bei der Auswahl von Lexemen und Regeln, die Bedeutung ist 100% kompositional, d.h. aus der Bedeutung der beteiligten Lexeme und Regeln ableitbar. • Phraseme sind nicht-freie Phrasen und gliedern sich in: Phraseme Pragmatische Phraseme 1. Pragmateme Semantische Phraseme 2. Idiome 3. Kollokationen 4. Quasiidiome Pragmateme: ausgehend von einem Konzept bestehen (pragmatische) Einschränkungen bei der Auswahl der Lexeme, z.B.: Parken verboten / # Kein Parken / # Nicht parken = No parking / # Parking forbidden / # Do not park = Stationnement interdit / # Aucun stationnement Alle # -Phrasen sind verständlich, aber eben doch (irgendwie) falsch! Idiom: Das Bezeichnete ‘X’ eines Idioms ist in keinem der beteiligten Lexeme A und B auch nur teilweise ausgedrückt. ins Gras beißen, den Löffel abgeben Kollokation: eines der beteiligten Lexeme (A, die ‚Basis‘) „behält seine Bedeutung“, das zweite Lexem (B, der ‚Kollokator‘) drückt jedoch eine andere Bedeutung C aus: scharzer Kaffee = ‘Kaffee ohne Milch’ Lexikalische Funktionen: Die durch B ausgedrückte Bedeutung C in einer Kollokationen. Zu unterscheiden sind: • Standardfunktionen: für eine (große) Menge von Basen A wird durch verschiedene Kollokatoren B die gleiche Bedeutung C ausgedrückt, z.B. C = ‘in hohem Maße, mit großer Intensität, sehr’, siehe unten LF ‘Magn’ • Nicht-Standard-LF: nur für sehr wenige Basen vorhanden, z.B. starker Kaffee Quasi-Idiom: Beide beteiligten Lexem A und B sind in ihrer Bedeutung „präsent“, aber es tritt noch eine weitere Bedeutung(skomponente) C hinzu, z.B.: bacon and eggs = Schinken (A) + Eier (B) + C: in einer spezifischen Weise zubereitet, durch Braten . . . morphologische Idiome, „Phraseologisierung“ auf Ebene der Morphologie (214) 14 Das erklärend kombinatorische Wörterbuch 1. Lemma/Stichwort mit Information über Morphologie und Stilebene 2. Definition, bestehend aus Konstanten (Konzepten) in natürlichsprachlicher Darstellung und Variablen (X, Y, Z) 3. Rektionsmodell: jede Tabellenspalte repräsentiert einen Aktanten, jeder Eintrag in der jeweiligen Spalte eine syntaktische Realisierungsmöglichkeit des Aktanten (3.a) Einschränkungen zum Rektionsmodell (3.a) Beispiele zum Rektionsmodell 4. Lexikalische Funktionen a) Paradigmatische LFs verweisen auf andere Lemmata, die Anstelle des Stichwortes verwendet werden können, z.B. Syn(Fahrstuhl ) = Lift Conv21 (hinter ) = vor [Konversive = Vertauschen der Aktanten] Gener(Apfel ) = Obst b) Syntagmatische LFs haben als Wert Lemmata oder Phrasen, die zusammen mit dem Stichwort verwendet werden: [Magn = lat. magnus ‚groß‘ = in hohem Maße, mit großer Intensität, sehr] Magn(dumm) = stock-, sau-, stroh-, wie Bohnenstroh Magn(frech) = rotz-, wie Oskar [Locin =Präposition auf die Frage wo? ] Locin (Party) = auf Locin (Vorlesung) = in [Oper1 = semantische weitgehend leeres Verb zur Bildung eines vollständigen Satzes, wobei Stichwort als direktes Objekt, erster Aktant als Subjekt realisiert wird] Oper1 (Vortrag) = halten Oper1 (talk ) = give 5. Beispiele für die Verwendung des Stichwortes mit LFs in Texten 6. Enzyklopädische Information 7. Idiome, in denen das Stichwort vorkommt (als Referenz auf die entsprechenden Einträge der Idiome selbst) Morphologie und Lexikographie, 2006/7, S. Nagel 14 Relationen zwischen Wörtern Relationen zwischen sprachlichen Zeichen (Mel’čuk 2006: Kap. 10) • Inhalts- und Formseite eines Zeichens als Menge von semantischen bzw. morphologischen Einheiten • vier mögliche Relationen zwischen zwei Zeichen (A und B sind identisch, A ist in B enthalten, A und B mit/ohne gemeinsame Elemente) • jeweils auf Inhalts- und Formseite übertragen, ergeben sich 17 mgl. Kombination, u.a.: 1. ‘A’ = ‘B’, /A/ = /B/ to walk : a walk (Konversion) 3. ‘A’ = ‘B’, /A/ ∩ /B/ 6= ∅ die Häuser : den Häusern (Flexion in rein syntaktischer Kategorie) 4. ‘A’ = ‘B’, /A/ ∩ /B/ = ∅ Fahrstuhl : Lift (Synonymie) Personenkraftwagen : Passagierflugzeug (Synonyme in komplementärer Distribution, ΣA 6= ΣB ) 5. ‘A’ ⊂ ‘B’, /A/ = /B/ Peter isst eine Kirsche : im Garten steht eine Kirsche : der Tisch ist aus Kirsche (chain polysemy, reguläre Polysemie) der Direktor der Schule : die Schule brennt to cook : a cook (Konversion + semantische Ableitung) 6. ‘A’ ⊂ ‘B’, /A/ ⊂ /B/ (verschiedene Arten von Derivation) Glocke : Glöckchen write : writer (≈ schreiben : Schreiberling) 7. ‘A’ ⊂ ‘B’, /A/ ⊃ /B/ („reverse“ Derivation) schreinern : Schreiner 10. ‘A’ ∩ ‘B’ 6= ∅, /A/ = /B/ (radial polysemy) Flügel (s.u.) 14. ‘A’ ∩ ‘B’ = ∅, /A/ = /B/ (Homonymie) mit dem Ball spielen : auf einen Ball gehen Kaffee mahlen : ein Bild malen (Homophon) Computerlinguistik ist modern : Grosse Mengen Fallholz liegen am Boden und modern vor sich hin. (Homograph) 14.1 Polysemie vs. Homonymie Kriterium für Polysemie ist das Vorhandensein einer semantischen Brücke, d.h. ein gemeinsamer, nichttrivialer Teil in der Bedeutungserklärung (vgl. Mel’čuk 2006: 535–6). Bank : ‚Sitzgelegenheit‘ ? ‚Geldinstitut‘ Flügel : Ist es möglich, die Bedeutungserklärungen in der Wikipedia so zu verändern, dass ein gemeinsames Element bleibt? 14.2 antonymische Relationen • graduelle Antonymie: jung ↔ alt • Komplementarität: auf ↔ zu, tot ↔ lebendig • reverse Relation: öffnen ↔ schließen • konverse Relation: kaufen ↔ verkaufen 14.3 Hyponymie etc. Hyponym ↔ Hyperonym – Unterordnungsrelation, wichtigste Relation zur Gliederung des Wortschatzes: ‘X ist ein Hyponym/Unterbegriff von Y ’ (‘Y ein Hyperonym/Oberbegriff von X’), wenn ‘X ist ein Y ’ oder ‘ein X ist eine Art Y ’ ISA-Relation (von engl. is a) z.B. Spatz ist ein Hyponym von Vogel Kohypohym : ‘X ist ein Hyponym von Y ’, ‘Z ist ein Hyponym von Y ’ ⇒ ‘X und Z sind Kohyponyme von Y ’, z.B. Taube und Spatz sind Kohyponyme Meronym (auch Partonym) ↔ Holonym – Teil-Ganzes-Relation: ‘X ist ein Meronym von Y ’ (‘Y ein Holonym von X’), wenn ‘X ist Teil/Mitglied/Bestandteil von Y ’ z.B. Dach ist ein Meronym von Haus oder Gebäude Tulpe – Blume: Hyponymie gilt nicht unter Aspekt ,Biertrinken‘, dort: ,Pilsglas‘ - ,Schaum‘ 14.4 Weitere Begriffe • – Wortfeld: bedeutungs„verwandte“ Wörter – Wortfamilie: formverwandte Wörter, d.h. mit gemeinsamem morphologischen Grundelement (üblicherweise Stamm) • Metapher – Metonymie: beide bezeichnen „Ersetzungen“ – Metapher: Ersetzung durch etwas Ähnliches, üblicherweise domänenübergreifend – Metonymie: reale Beziehung zwischen ersetztendem und ersetztem, z.B. Teil-Ganzes, AutorWerk oder Ursache-Wirkung 15 Zur Übung Um welche Relationen handelt es sich? 1. Morgen — Abend 2. Stimme (Reden und Singen) — Stimme (als Wahlberechtigter) 3. häufig — selten 4. Bus — Omnibus Morphologie und Lexikographie, 2006/7, S. Nagel 15 Thesaurus, Ontologie, WordNet 15.1 Begriffe: Taxonomie, Ontologie Taxonomie Ontologie • verzweigende Hierarchie (Baum) • System aus Begriffen (Klassen und Entitä• wissenschaftliche Taxonomie ↔ folk taxonoten mit Attributen) und Relationen zwischen my den Begriffen → folksonomy • Inferenz- und Integritätsregeln • meist auf Domäne/Fachgebiet beschränkt → semantic web 15.2 Thesaurus von jhsaurì (gr. ,Schatz, Schatzkammer‘): 1. Wörterbuch mit dem Ziel, den Gesamtwortschatz einer Sprache, eines Autors oder eines Textes zu erfassen (Thesaurus Linguae Latinae) 2. thematisch organisiertes Wörterbuch The present work is intended to supply, with respect to the English language, a desideratum hitherto unsupplied in any language; namely a collection of the words it contains and of the idiomatic combinations peculiar to it, arranged, not in alphabetical order as they are in a Dictionary, but according to the ideasy which they express. . . . classification of ideas is the true basis on which words, which are their symbols, should be classified. Roget, Peter Mark: Thesaurus of English words and phrases London, 1852 Ziel/Zweck: • Organisation von Wissen • Standardisierung von Terminologien • und natürlich: synonym finder, Didaktik, Fremdsprachenunterricht, für Reisende, Kreuzworträtsel Probleme/Schwierigkeiten: • welche Struktur organisiert den Wortschatz am sinnvollsten? • lässt sich der Wortschatz einer Sprach sprachunabhängig ordnen, d.h. mit einer zugrundeliegenden Struktur, die für alle Sprachen gleich gut geeignet ist? Roget (1852) (http://poets.notredame.ac.jp/Roget/contents.html): 5. Wesen, Beziehung, Geschehnis 1. Abstract Relations 6. Zeit 2. Space motion motion with reference to direction food 7. Sichtbarkeit, Licht, Farbe, Schall, Temperatur, Gewicht, Aggregatzustände 8. Ort und Ortsveränderung 9. Wollen und Handeln 3. Matter 10. Das Denken 4. Intellect: the exercise of the mind 11. Zeichen, Mitteilung, Sprache 5. Volition: the exercise of the will 12. Wissenschaft 6. Emotion 13. Kunst und Kultur Dornseiff (2003): 14. Menschliches Zusammenleben 1. Natur und Umwelt 15. Essen und Trinken 2. Leben 16. Sport und Freizeit 3. Raum, Lage, Form 17. Gesellschaft 4. Größe, Menge, Zahl 18. Geräte, Technik 19. Wirtschaft, Finanzen 7. herrenlose Hunde 20. Recht, Ethik 8. in diese Gruppierung gehörige 21. Religion, Übersinnliches 9. die sich wie Tolle gebärden Emporio celestial de conocimientos benévolos: 1. Tiere, die dem Kaiser gehören 10. die mit einem ganz feinen Pinsel aus Kamelhaar gezeichnet sind 2. einbalsamierte Tiere 11. und so weiter 3. dressierte 4. Milchschweine 5. Sirenen 6. Fabeltiere 12. die den Krug zerbrochen haben 13. die von weitem wie Fliegen aussehen (aus Jorge Luis Borges: The Analytical Language of John Wilkins) 15.3 WordNet • seit 1985 an der Princeton University • http://wordnet.princeton.edu/, http://www.globalwordnet.org/ • compounds, phrasal verbs, collocations, idiomatic phrases • nouns, verbs, adjectives, adverbs • „WordNet contains short phrases, such as bad person, that are not paraphrasable by a single word. These phrases reflect lexical gaps and are product of WordNet’s relational structure, which may link two concepts via a third that happens not to be lexicalized in English. But these gaps are not always structural artifacts; they are often lexicalized in other languages, and they reveal conceptual structures as distinct from lexical structures.“ (Fellbaum (ed.) 1998: 5–6) • Synsets = sets of synonyms • „WordNet contains no relations that indicate the words’ shared membership in a topic of discourse. For example, WordNet does not link racquet, ball , and net in a way that would show that these words, and the concepts behind them, are part of another concept that can be expressed by court game. Connecting racquet, ball , net, and court game, or physician and hospital, is a challenge for electronic dictionaries that Roger Cahffin (personal communication) has called the “tennis problem.”“ (Fellbaum (ed.) 1998: 10) • Netz (keine Taxomonie!) mit Kreuzklassifikationen • nur ein Typ Hyponymie-Relation • alle – Synsets – Domain • Nouns – Hyponyme/Hyperonyme/Kohyponyme – Meronyme/Holonyme ∗ has_part tree → branch, crown, . . . ∗ has_member forest → tree, {underbrush, undergrowth, underwood } ∗ has_substance tree → {heartwood , duramen} (‚Kernholz‘), {sapwood } (‚Splintholz‘) – Antonyme: ‚man‘ ↔ ‚woman‘, ‚victory‘ ↔ ‚defeat‘ • Verbs – Implikation/entailment: X entails Y if X cannot be done unless Y is, or has been, done (‚sleeping‘ – ‚snoring‘) – Hyponyme/Hyperonyme/Kohyponyme (=Troponymie: To V1 is to V2 in some particular manner: lisp – talk ) – Antonyme • Adjectives – Antonyme – Attribut-Relation zu Nomen, für das das Adjektiv einen Wert ausdrückt (weight: light, heavy) – participle of verb – Pertainyms • Adverbs – Antonyme – root adjectives WordNet 3.0 (2006) Number of words, synsets, and senses +----------+---------+---------+------------------+ | POS | Unique | Synsets | Total | | | Strings | | Word-Sense Pairs | +----------+---------+---------+------------------+ |Noun | 117798 | 82115 | 146312 | |Verb | 11529 | 13767 | 25047 | |Adjective | 21479 | 18156 | 30002 | |Adverb | 4481 | 3621 | 5580 | +----------+---------+---------+------------------+ |Totals | 155287 | 120982 | 206941 | +----------+---------+---------+------------------+