1 Einführung 1.1 Was ist Morphologie? (1) Глокая куздра штеко

Transcription

1 Einführung 1.1 Was ist Morphologie? (1) Глокая куздра штеко
Morphologie und Lexikographie, 2006/7, S. Nagel
1 Einführung
1.1 Was ist Morphologie?
[. . .] morphology is fun. On the one hand, because it is concentrated essentially on the study of the
wordform in isolation, morphology is, in a sense, limited and therefore offers good chances for a
relative exhaustiveness of description; on most occasions, it allows for a complete calculus of logical
possibilities. It is the domain for the lover of the finished, the perfect, the detailed, the whole. In
syntax and, even more so, in semantics you have to be satisfied with the unfinished, the sketchy, the
schematic, the partial. At the same time, however, morphology presents many exotic and ‘bizarre’
phenomena, and in such quantity that its study does not frustrate the passionate admirer of the
rarity and the paradoxical.
Thanks to these two characteristics, morphology is interesting to any linguist who loves Her Majesty
the Language more than the formal constructions called upon to represent her. In the infinite space
of syntax and semantics, it is easier to develop vacuous formalisms to satisfy oneself with; the nice
little valleys and groves of morphology require more attention to linguistic facts as such. It is not for
nothing that linguistics began with morphology and for a couple of centuries was practically nothing
more than morphology. [. . .] Syntactic and semantic structures and their constituent elements are
not directly observable—they have to be inferred and inevitably represent the result of high-level
abstractions. In morphology, on the other hand, the researcher is much closer to directly observable
facts. True, we know that morphology is not universal (some languages lack it almost completely); we
know as well that morphology ‘feeds’ on semantics and syntax. But this does not make morphology
less fascinating or less important. It is the proofing ground of linguistics: everything here is more
accessible to an in-depth analysis and can be better verified than in any other division of language.
(Mel’čuk 2006: 564)
(1) Глокая
Glok-aja
куздра
штеко будланула
бокра
и
кудрячит
kuzdr-a
šteko
bokr-a
i
kudrjači-t
A-NOM.FEM.SG N-NOM.FEM.SG ADV
budlanu-l-a
V-PRET-FEM.SG N-ACC.MASC.ANIM AND V-PRES.3.SG
бокрёнка.
bokr-ënk-a.
N-CHILD-ACC.MASC.ANIM
,Eine blobige Undra muddelte malich den Bucker und lockelt das Bucklein.‘
(L.V. Ščerba, freie Übersetzung von mir)
1.2 Themen im Kurs
• Terminologie
• die Ausdrucksseite der Morphologie
• morphologische Prozesse
• ihre Modellierung in der CL
• Lexikographie
Morphologie und Lexikographie, 2006/7, S. Nagel
2 Das Wort in Text und Lexikon
2.1 Wortform – Lexem – Paradigma
Der Begriff ‚Wort‘ ist für die Beschreibung sprachlicher Einheiten zu ungenau und mehrdeutig. Er
bezeichnet
1. eine Folge von Lauten oder Buchstaben (in der CL: ‚Token‘).
2. Als ‚Wortform‘ (oder ‚syntagmatisches Wort‘) bezeichnet er dagegen das Wort „als zweiseitige
Einheit“ des Textes mit einer Ausdrucks- und einer Inhaltsseite
3. Das Wort als Einheit des Lexikons wird ‚Lexem‘ (oder ‚paradigmatisches Wort‘) genannt. Auch
ein Lexem verfügt über eine Ausdrucks- und Inhaltsseite. Es ist eine abstrakte Einheit und tritt
also solche nicht in Texten auf. Repräsentiert wird es dort von einer Menge von Wortformen.
Diese Menge wird ‚Paradigma‘ genannt. Ein Lexem oder ‚Lemma‘ wird im Lexikon üblicherweise
nicht durch das Paradigma, sondern durch eine ‚Grundform‘ oder ‚Zitierform‘ repräsentiert.
→ die Wortformen eines Lemmas werden auch ‚Vollformen‘ genannt (Grundform ↔ Vollform)
→ Syntagmatik, Paradigmatik (→ Schuster 2003: 8)
→ sprachliches Zeichen (→ Mel’čuk 2006: 18-9)
Ein Paradigma lässt sich auch als Satz von Zellen beschreiben, deren jede durch eine oder mehrere
grammatische Bedeutungen benannt ist und (im Normalfall) eine Wortform enthält. Die Wortform unterscheidet sich in diesen Bedeutungen von allen anderen Wortformen des Paradigmas. Eine Wortform
lässt sich umgekehrt durch diese Bedeutungen und ihre Zugehörigkeit zu einem bestimmten Lexem
eindeutig bestimmen und benennen.
Nominativ
Akkusativ
Genitiv
Dativ
Ablativ
Singular
insula
insulam
insulae
insulae
insula
Plural
insulae
insulas
insularum
insulis
insulis
→ ‚defektives Paradigma‘: Paradigma mit leeren Zellen
→ ‚Lexem‘ – ‚Lex‘ – ‚Allolex‘ (→ Mel’čuk 2006: 20-1)
2.2 Grammem und Grammatische Kategorie
Die grammatischen Bedeutungen, die die Wortformen eines Paradigmas voneinander unterscheiden
werden ‚Grammeme‘ genannt. Grammeme, die gleichartig und nicht miteinander kombinierbar sind,
werden zu einer ‚grammatischen Kategorie‘ zusammengefasst.
→ formale Definition: Mel’čuk (2006: 21-4)
2.2.1 Methodik zur Bestimmung von Grammemen
→ set-theoretical school (→ Meyer 1994, Kiefer 1968: 41-50)
L sei eine Variante des Deutschen mit eingeschränktem Vokabular und der Besonderheit, dass Artikel und Nomen als ein Wort betrachtet und deshalb zusammengeschrieben werden. Die Menge der
Substantive N in L lautet:
Lexem
Wortformen
Tür
1.1
1.2
dieTür
derTür
Haus
2.1
2.2
2.3
dasHaus
desHauses
demHaus
Baum
3.1
3.2
3.3
3.4
3.5
derBaum
desBaums
desBaumes
demBaum
denBaum
Als Menge der Kontexte C sei gegeben:
C1
C2
C3
C4
C5
C6
Ich sehe
.
Das Auto nähert sich
ist weiß.
Der untere Teil
Die Entfernung zu
Max betritt
.
.
ist grau.
beträgt 200m.
Bestimmen Sie die Anzahl der Kasus in L, indem Sie nach Meyer (1994: 342-5) die maximalen homogenen Mengen an Kontexten H1 , H2 , . . . , Hn aus C bestimmen.
2.3 Aufgaben
2.3.1 Nachzulesen
Haspelmath (2002: 13-4,60-2), Mel’čuk (2006: 20-4); (Meyer 1994: 342-5)
2.3.2 Vorzubereiten
Mel’čuk (2003: 193-7)
2.3.3 Zu bearbeiten
1. Wiederholen Sie die Vorgehensweise aus Abschnitt 2.2.1 an einem selbst gewählten Beispiel.
2. Gegeben ist der Satz: Er liebt das Mädchen, sie liebt ihn nicht.
a) Wieviele Lexeme enthält der Satz? Begründen Sie ihre Antwort! Ordnen Sie jede Wortform
ihrem Lexem zu und vervollständigen Sie die fehlenden Zellen des Paradigmas!
b) Fertigen zu dem Satz eine “morpheme-by-morpheme”-Glosse an! Orientieren Sie sich dabei an den Regeln der “Leipzig Glossing Rules”, siehe Haspelmath (2002: 34-6) oder unter
http://www.eva.mpg.de/lingua/files/morpheme.html.
c) Versuchen Sie das gleiche für einen kurzen Satz einer weiteren Sprache. (Wenn möglich eine
„morphologisch reiche“ Sprache!)
Morphologie und Lexikographie, 2006/7, S. Nagel
3 Dependenz, Kongruenz und Rektion
• Dependenz (→ Def. Mel’čuk 2003: 191)
• semantische, syntaktische, morphologische Dependenz
– Netz/Graph vs. Baum
– Eigenschaften von Relation:
∗ reflexiv, symmetrisch, transitiv
∗ antireflexiv (auch: irreflexiv), antisymmetrisch, antitransitiv: es gibt kein(e) Element(e),
für die die Relation reflexiv, symmetrisch bzw. transitiv ist
• morphologische Dependenz (→ Def. Mel’čuk 2003: 193)
– antireflexiv, aber nicht unbedingt antisymmetrisch und antitransitiv
– Dependenten mit mehr als einem Regenten
– keine Universalie
• Kongruenz und Rektion beschreiben die morphosyntaktische Abhängigkeit zwischen zwei Wortformen: Eigenschaften der einen Wortform determinieren die Auswahl eines Grammems der anderen
Form.
3.1 Kongruenz
→ Mel’čuk (2003: 194) unterscheidet zwischen ‚agreement‘ und ‚congruency‘
→ Mel’čuk (→ Def. 2003: 194,197)
3.1.1 Variable Kongruenz
(1) Dieses Mädchen hatte er gern und beschützte es oft . . . , weil sie die Tochter des Regenmachers
war
(Mel’čuk 2006: 101, aus Hesse, Glasperlenspiel)
(2)
a. Naš-a
vrač
skaza-l-a
...
Unser-NOM.FEM.SG Arzt-NOM.MASC.SG sagen-PRET-FEM.SG . . .
‚Unsere Ärztin sagte . . .‘
b. Ministr
inostrannych del Islandii zajavi-l-a,
minister-NOM.MASC.SG of.foreign.affairs
‚Die isländische Außenministerin erklärte, dass . . .‘
c. * naš-a ministr Ingrid Torvaldsen
(3)
čto . . .
of.Island declare-PRET-FEM.SG, that . . .
(Mel’čuk 2006: 51)
a. Etwa ein Dutzend Männer stürmte in den großen Raum.
b. Rund ein Dutzend Männer stürmten aus den PKW, streiften sich hastig die Polizei-Armbinden
über und setzten die Vorstandsmitglieder von "Bwin" fest.
(4) Los médicos lo
die Ärtze
entendemos
muy bien
dies verstehen-1.PL sehr gut
‚Wir Ärtzte verstehen das sehr gut‘
3.2 Rektion
→ Mel’čuk (→ Def. 2003: 195)
3.3 Aufgaben
3.3.1 Nachzulesen
3.3.2 Vorzubereiten
Mel’čuk (2006: 110-36), insbes. 110-2, 120-33, 134
3.3.3 Zu bearbeiten
(bis Dienstag, 31. Oktober)
Nachfolgend sehen Sie eine tabellarische Aufstellung der Formen deutscher Adjektive in Abhängigkeit von verschiedenen Substantiven und Determinativen. Die drei Blöcke stehen für drei Klassen von
Determinativen:
1. ohne Determinativ oder mit welch, zwei , Johanns, viel , etwas, etc.
2. der , dieser , mancher , solcher , etc.
3. ein, kein, mein, etc.
Horizontal sind die drei Genera im Singular und der Plural angeordnet.
Beantworten Sie folgende Fragen:
1. Was können Sie über die morphologischen Dependenzen in einer deutschen NP mit der Struktur
DET-ADJ-N sagen?
2. Welche grammatische Kategorien sind beteiligt?
3. Welche Faktoren determinieren die Form des Adjektivs? Was sind die morphologischen Regenten
des Adjektivs?
4. Bestimmen Sie, ob es sich bei jedem von Ihnen beobachteten Phänomen um Kongruenz oder
Rektion handelt gemäß der Definition von Igor Mel’čuk?
(welch)
(welch)
(welch)
(welch)
großer
großen
großem
großen
Turm
Turms
Turm
Turm
dieser
dieses
diesem
diesen
große
großen
großen
großen
Turm
Turms
Turm
Turm
kein_
keines
keinem
keinen
großer
großen
großen
großen
Turm
Turms
Turm
Turm
große
großer
großer
große
Hütte
Hütte
Hütte
Hütte
diese
dieser
dieser
diese
große
großen
großen
große
Hütte
Hütte
Hütte
Hütte
keine
keiner
keiner
keine
große
großen
großen
große
Hütte
Hütte
Hütte
Hütte
großes
großen
großem
großes
Haus
Hauses
Haus(e)
Haus
dieses
dieses
diesem
dieses
große
großen
großen
große
Haus
Hauses
Haus(e)
Haus
kein_
keines
keinem
kein_
großes
großen
großen
großes
Haus
Hauses
Haus(e)
Haus
große
großer
großen
große
Türme
Türme
Türmen
Türme
diese
dieser
diesen
diese
großen
großen
großen
großen
Türme
Türme
Türmen
Türme
keine
keiner
keinen
keine
großen
großen
großen
großen
Türme
Türme
Türmen
Türme
Morphologie und Lexikographie, 2006/7, S. Nagel
4 Kasus
substantivischer Kasus (caseI) ↔ adjektivischer Kasus (caseII)
regierter Kasus (caseI.1) ↔ Kongruenzkasus (caseI.2), siehe Beispiel 11b bei Mel’čuk (2003: 195)
caseI.1a – grammatische (Flexions-)Kategorie KasusI.1
b – ein Grammem der Kategorie Kasus (caseI.1a)
c – eine Form, die ein Grammem caseI.1b ausdrückt
4.1 Der „sächsische Genitiv“
→ Mel’čuk (2006: 120-6)
4.2 Kasusvarianten vs. ‚external autonomy of case forms‘
→ Mel’čuk (2006: 126-)
Erneut zur Frage: wieviel Kasusgrammeme besitzt eine Sprache
Der Partitiv im Russischen: gg. sind drei Formen (rom, roma, romu) und folgende Kontexte:
C1 Nalej mne
(‚Schenk mir etwas Rum ein!‘)
(‚Schenk mir Rum ein (und nichts anderes)!‘)
C2 Nalej mne
C3 On prodaval
tuzemcam (‚Er verkaufte den Eingeborenen Rum.‘)
C4 nemnogo
(‚ein bisschen Rum‘)
C5 cvet
(‚die Farbe des Rums‘)
Gibt es im Deutschen auch zwei „Genitive“? Gg. die Formen Maria und Marias mit den Kontexten:
C1
Heimat
C2 die Heimat meiner geliebten
4.3 Kasussysteme
Wieviele Kasus hat das Russische? → Mel’čuk (2006: 130-1): zehn.
Ein 11. Kasus?
(1)
a. idti
v
soldat-y
gehen.INF in.PREP.ACC Soldat-ACC.PL.INANIM
‚Soldat werden‘
Mel’čuk (2006: 41) erklärt das Phänomen dadurch, dass Soldat in Ausdrücken dieses Typs nicht belebt
sei. Alternative Lösungen wären: 1. die Annahme eines elften Kasus (‚Inklusiv‘) im Russischen, oder 2.
ein Präposition v , die den Nominativ regiert.
→ Mel’čuk (2006: 152): Übersicht über die Anzahl von Kasusgrammemen in versch. Sprachen
4.4 Semantik und Funktion von Kasusgrammemen
→ Mel’čuk (2006: 134-8): Gibt es Kasusgrammeme, die eine Semantik haben und nicht nur (syntaktische) Dependenz ausdrücken?
→ Mel’čuk (2006: 152-7)
Kasusgrammeme des Finnischen (aus wikipedia):
Nominativ talo
das Haus
Genitiv
talon
des Hauses
Akkusativ talon, talo das Haus
Partitiv
taloa
das Haus
Inessiv
talossa
im Haus
Elativ
talosta
aus dem Haus
Illativ
taloon
ins Haus
Adessiv
talolla
am Haus
Ablativ
talolta
vom Haus (weg)
Allativ
talolle
zum Haus
Essiv
talona
als Haus
Translativ taloksi
zum Haus (werden oder machen)
Abessiv
talotta
ohne Haus
Instruktiv taloin
mittelst Häusern
Komitativ taloineen
mitsamt (seiner) Häuser
4.5 Aufgaben
4.5.1 Nachzulesen
Mel’čuk (2006: 110-36,152-7)
4.5.2 Vorzubereiten
Mel’čuk (2006: 47-55,322-348)
Morphologie und Lexikographie, 2006/7, S. Nagel
5 Nominale Kategorien: Genus, Nominalklasse, Numerus
5.1 Kongruenzklasse
→ Mel’čuk (Def. 2006: 47-53)
• „a partition into subsets“ für eine Wortart, d.h. keine (!) Flexionskategorie, d.h. keine Grammeme
(!)
• für jede dieser Teilmengen gibt es eine Menge von morphologischen Dependenten, bei denen ein
Grammem selektiert wird: großer Turm, große Hütte, großes Haus
• für alle morphologischen Dependenten innerhalb eines Kontextes muss das gleiche Grammem
selektiert werden (↔ Rektionsklasse, Subkategorisierungsrahmen)
• ein Lexem kann mehreren oder keiner Kongruenzklasse angehören (52-3):
– Swahili MTI ‚Baum‘: mti (Sg., Kl.III), mati (Pl., Kl.IV)
– russ. nožnicy ‚Schere‘ ist ein Plurale tantum (vgl. engl. scissors, dt. die Alpen). Da alle
kongruierenden Wortarten (Adjektive, Pronomina) im Plural das Genus nicht markieren ist
es unmöglich das Genus mittels Kontext zu bestimmen. Das Numerale ‚eins‘ verfügt über
eine Pluralform odni nožnicy ‚eine Schere‘!
5.2 Genus ↔ Nominalklasse
Genus und Nominalklasse sind Unterkategorien der ‚Kongruenzklasse‘, eine scharfe Trennung zwischen
beiden Begriffen ist nicht möglich, typische Unterschiede sind:
1.
2.
3.
4.
5.
6.
7.
8.
Anzahl Klassen
direkter Bezug zu Sexus
semantische Motivation darüberhinaus
autonomer, nicht-kumulativer Marker am
Nomen
kumulativer Marker an kongruierenden
Dependenten
Zusammenhang mit Flexionklasse des
Nomens
Klassenwechsel im Zusammenhang mit
Flexion
Klassenwechsel als derivativer Prozess
2–4
ja
kaum
nein (covert category)
≥4
nein
deutlich
ja (overt category)
ja
nein
ja
nein
nie
ja
nein
ja
→ Genusneutralisierung (Mel’čuk 2006: 336-9)
5.3 Numerus
(Mel’čuk 1997-2001: 9,89-91)
Grammeme der Kategorie ‚Numerus‘ (des Substantivs) verweisen auf die Anzahl von Objekten
Numerus des Adjektivs, Verbs: zum Ausdruck von Kongruenz, nicht semantisch motiviert
Numerus des Personalpronomens: wir 6= ‚mehrere Ichs‘
• sprachspezifische semantische Besonderheiten:
– mehrere Sorten: französische Weine
– eine große Menge: franz. les sables du Sahara „die Sande Afrikas“
– Paarigkeit: span. los padres ‚die Eltern‘, los reyes ‚König und Königin‘
– ...
• syntaktische Besonderheiten:
Pluralia tantum: syntaktisch/morphologisch Plural, semantisch ?
(1) dvadcat’ odin-Ø
den’-Ø
zwanzig ein-NOM.SG.MASC Tag-NOM.SG.MASC
‚einundzwanzig Tage‘
5.4 Aufgaben
5.4.1 Nachzulesen
5.4.2 Vorzubereiten
5.4.3 Zu bearbeiten
(bis Dienstag, 7. November, wird benotet!)
Zahlreiche deutsche Substantive flektieren nach adjektivischem Muster, z.B. Angestellter , Beamter ,
(das) Wolfsjunge, (die) Grünen.
1. Diese Substantive weisen voneinander verschiedene Formen auf, wenn sie mit/ohne bzw. verschiedenen Determinativen stehen: der Beamte vs. ein Beamter. Muss deshalb für diese Gruppe von
Substantiven eine gesonderte grammatische Kategorie (Flexionskategorie) angenommen werden?
Begründen Sie Ihre Entscheidung! Wenn ja, wieviele Grammeme weist diese Kategorie auf?
2. Nun existieren für diese Substantive z.T. parallel maskuline und feminine Formen: ein Angestellter
vs. eine Angestellte. Ist die Annahme einer weiteren Flexionskategorie ‚Genus‘ gerechtfertigt?
Nennen Sie Gründe, die dafür und dagegen sprechen!
3. Geben Sie für jedes der genannte Substantive (Angestellte/r , Beamter , (das) Wolfsjunge, (die)
Grünen) das vollständige Paradigma in tabellarischer Darstellung an. Kennzeichnen Sie alle Zeilen
und Spalten mit den Grammemkombination, so dass jede Zelle eindeutig benannt ist.
4. Nun ist auf den ersten Blick nicht offensichtlich, welche Substantive zur Gruppe der adjektivisch flektierenden gehören (Wolfsjunge vs. Straßenjunge). Entwickeln Sie ein algorithmisches
Testverfahren, das eine sichere Zuordnung erlaubt. Stellen Sie den Algorithmus in Form eines
Entscheidungsbaums dar. Verwenden Sie an den Verzweigungen Einsetzproben, wo Wortformen
des Lexems in Kontexte eingesetzt werden, z.B. „Unterscheiden sich die Wortformen in Kontext
A und B? (ja/nein)“ Testen Sie (zu Ihrer eigenen Sicherheit) den Algorithmus an den beiden
Lexemen Wolfsjunges und Straßenjunge.
5. Geben Sie in gleicher Weise einen Algorithmus an, um das Genus eines solchen Substantivs zu
bestimmen, bzw. ob es sich um ein ‚Plurale tantum‘ handelt.
Morphologie und Lexikographie, 2006/7, S. Nagel
6 Verbale Kategorien: Verbalgenus, Tempus, Aspekt, Modus
6.1 Genus verbi, Diathese
semantische Aktanten:
(1) ESSEN(X,Y), z.B. ESSEN(Max,Törtchen)
(tiefen-)syntaktische Aktanten:
• syntaktischer Anschluss wird im Rektionsmodell eines Lexems/Prädikats definiert, z.B. für essen:
1=X 2=Y
wer
was
NNom NAkk
• (tiefen-)syntaktische Aktanten werden mit fortlaufenden römischen Ziffern bezeichnet, die Nummerierung folgt per Konvention der Art ihrer Realisierung, d.h. I steht den Aktanten der als
Subjekt realisiert wird, II für das direkte Objekt, III usw. für indirekte Objekte
Diathese (Mel’čuk 2006: 187):
„The diathesis of a wordform w is the correspondence between w’s Semantic and Deep-Syntactic Actants.“
Basisdiathese (Mel’čuk 2006: 189):
„The basic diathesis of a Lexical unit L is the lexicographic diathesis of L, i.e., the diathesis which
corresponds to the citation form of L and which must be stored in L’s lexical entry (in it’s syntactics).“
Voice, Genus verbi, Verbalgenus (Mel’čuk 2006: 191):
„Voice is an inflectional category whose grammemes specify such modifications of the basic diathesis
of a lexical unit L that do not affect the propositional meaning of L.“
logisch mögliche Voice-Grammeme und Beispiele siehe Mel’čuk (2006: 194-)
6.2 Tempus
(Mel’čuk 1997-2001: II,60-80)
Grammeme lokalisieren die Handlung auf einer Zeitachse in Bezug
• auf den Sprechzeitpunkt (‚absolutes Tempus‘)
• bezüglich einer anderen Handlung (‚relatives Tempus‘)
6.3 Aspekt
(Mel’čuk 1997-2001: II,92-5,100-16)
‚Aspekt‘ charakterisiert die Verbalhandlung in Bezug auf ihren „inneren“ Zustand (‚inneres Tempus‘).
Mel’čuk unterscheidet fünf Flexionskategorien ‚Aspekt‘:
I Anzahl der Fakten/Handlungen: unbestimmt, einmal, mehrmals
II Verteilung über Zeit und Ort: unbestimmt, Konzentrativ (Handlung auf einen Ort und einen
Zeitpunkt beschränkt), Distributiv (zu einem Zeitpunkt, aber an mehreren Orten), Interativ (an
mehreren aufeinanderfolgenden Zeitpunkten), Distributiv-Iterativ
III zeitliche Ausdehnung einer Handlung: punktuell, durativ („zeitlich andauernd“), habituell (gewöhnlich, regulär)
IV Aktualität der Handlung (findet sie gerade jetzt statt?): (Nicht-)Progressiv, z.B. engl. John sings
well vs. John is singing well
V Telizität der Handlung (wurde eine innere Grenze der Handlung überschritten): perfektiv vs.
imperfektiv
6.4 Modus
(Mel’čuk 1997-2001: II,153-9)
Grammeme beschreiben die Einstellung des Sprechers zur Satzaussage/Proposition:
• Indikativ (Sprecher bestätigt Satzaussage)
• Imperativ (Sprecher will das Satzaussage wahr wird, wirkt auf Adressaten dementsprechend ein)
• Optativ (Sprecher wünscht, das Satzaussage wahr wird)
• Konjunktiv/Subjunktiv (Aussage ist anderem Prädikat untergeordnet)
• Konditional (wenn . . . , dann . . . ), Irrealis (Sprecher nimmt an, das Aussage nicht zutrifft)
• ...
6.5 Aufgaben
6.5.1 Nachzulesen
Mel’čuk (2006: 194-209)
6.5.2 Vorzubereiten
Haspelmath (2002: 60-84,113-147)
Morphologie und Lexikographie, 2006/7, S. Nagel
7 Flexion vs. Derivation; Flexionsklassen
7.1 Flexion vs. Wortbildung
Haspelmath (2002: 70-82), vgl. Mel’čuk (1997-2001: I,241-246,278-304)
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
Flexion / Grammem
Wortbildung / Derivatem
(semantisch) abstrakt
semantisch regulär
—
Bezug zur Syntax: durch syntaktische Regeln
bestimmt
obligatorisch
Verwendung/Anwendung unbeschränkt
Ausdruck regulär
eher wenige Stamm-Allomorphe
—
Ausdruck: an der Peripherie der Wortform
Wechsel der Wortart: nein
kumulativer Ausdruck möglich
nicht iterierbar
konkret
(teilweise) idiomatisch
„Amalgamierung“ mit lexikalischer Bed.
(weitgehend) außerhalb Syntax
fakultativ
beschränkt
irregulär, durch viele verschiedene Marker
eher viele
ersetzbar durch einzelnes Word
nahe dem Stamm
ja
nicht möglich
iterierbar
7.2 Flexionsklassen
Beschreibung (vgl. Haspelmath 2002: 122-5)
Vererbung (vgl. Haspelmath 2002: 125-30)
Synkretismus: Zellen mit gleichlautenden, homonymen Wortformen/Allolexen
Suppletivformen: Wortformen, die andere (fehlende) Formen innerhalb Paradigmas ersetzen, aber
etymologisch fremd sind. ‚Suppletivismus‘ kann auf alle sprachliche Zeichen ausgedehnt werden. Zwei
sprachliche Zeichen sind dann zueinander suppletiv, wenn sie auf der Inhaltsseite äquivalent und auf
der Ausdrucksseite nicht äquivalent sind (vgl. Mel’čuk 2006: Kap. 8, Mel’čuk 1997-2001: IV,420-2).
Periphrase: „Umschreibung“, Auffüllen einer leeren Zelle durch eine Kombination aus Wortformen (=
‚analytische Form‘)
7.3 Aufgaben
7.3.1 Nachzulesen
Haspelmath (2002: 60-84,113-147)
7.3.2 Vorzubereiten
Mel’čuk (2000), insbesondere 526–532
Morphologie und Lexikographie, 2006/7, S. Nagel
8 Morphologische Prozesse
8.1 Nachzulesen
Mel’čuk (2000), insbesondere 526–532
8.2 Vorzubereiten
(bis 16.11.) Mel’čuk (2006: 384–399)
(bis 21.11.) Fleischer (2000), Booij (2005: 74–95)
8.3 Zu bearbeiten
Bei welchen der folgenden Phänomen handelt es sich um morphologische Prozesse nach Mel’čuks Definition? Wie würden Sie die Phänomene benennen? Orientieren Sie sich an der Systematik und Terminologie Mel’čuks!
(1) ev
- ler - i
-n
- den
Haus - Pl - 3.Sg - FugenMorphem - Ablativ
türk. ‚von seinen/ihren Häusern (her)‘
(2) dt. aufessen → aufgegessen
(3) dt. artig → unartig, rein → unrein
(4) gr. summetra → asummetra
‚Symmetrie‘ → ‚Asymmetrie‘
(5) russ. kollektivnoe chozjajstvo → kolchoz
Bauernhof‘ → ‚Kolchose‘
,kollektiver
(6) Warlpiri
a. kurdu → kurdu-kurdu
‚Kind‘ → ‚Kinder‘
b. kamina
→ kamina-kamina
‚Mädchen.Sg‘ → ‚Mädchen.Pl‘
(7) dt. Student → Studi , Abitur → Abi
(8) engl. *breakfast-lunch → brunch
(9) arab. qtl
→ (qatala,
qutila)
‚töten‘ → ‚er hat getötet‘, ‚er/es wurde getötet‘
(10)
a. [a] bomb → [to] bomb
‚Bombe‘ → ‚bombardieren‘
b. [a] nail → [to] nail
‚Nagel‘ → ‚nageln‘
(11) dt. hassen → gehasst, rasen → gerast, mähen → gemäht
(12) dt. Konferenz über Sicherheit und Zusammenarbeit in Europa → KSZE
(13) Chines.
a. ang → ang-ang → ang-ang-ang
‚rot‘ → ‚röter‘
→ ‚sehr rot‘
(14) dt. Apfel → Äpfel , Mutter → Mütter , Vogel → Vögel
(15) dt. Apfelbaum, Pflaumenbaum, Kirschbaum
(16) dt. Apfel → Äpfelchen, Biene → Bienchen, Baum → Bäumchen
(17) Agta
a. takki
→ tak-takki
‚tak-takki‘ → ‚Beine‘
b. uffu
→ uf-uffu
‚Schenkel.Sg‘ → ‚Schenkel.Pl‘
Morphologie und Lexikographie, 2006/7, S. Nagel
9 Morphem; morphembasiert – lexembasiert; Basiseinheit eines morphologischen Wörterbuchs
9.1 Morph – Morphem – Allomorph
traditionelle Definition (Bußmann (ed.) 2002: 448):
Morph [griech. morphē ‚Form‘]. Kleinstes bedeutungstragendes lautliches Segment einer Äußerung
auf der Ebene der Parole, das noch nicht als Repräsentant eines bestimmten Morphems (auf der
Ebene der Langue) klassifiziert ist [. . .]. Haben zwei oder mehrere Morphe gleiche Bedeutung bei
verschiedener Verteilung, so gehören sie zu demselben Morphem bzw. werden als Allomorphe bezeichnet; so sind z.B. /-e/ in Hunde, /-er / in Kinder , /-n/ in Opern, und /-s/ in Autos vier
verschiedene lautliche Repräsentanten des deutschen Pluralmorphems. Vergleicht man die Morphe
-er in Kinder , härter und er , so handelt es sich um ein homographes Morph, d.h. -er ist Allomorph
verschiedener Morpheme, nämlich {Plural}, {Komparativ}, {Personlpronomen}. Die Unterscheidung Morph vs. Allomorph vs. Morphem entspricht methodisch derjenigen von Phon vs. Allophon
vs. Phonem.
Probleme:
1. Was heißt „bedeutungstragendes lautliches Segment“?
(1) fernseh- in fernsehen/Fernseher (vgl. Fernglas, Fernsicht)
(2) Großhöflein (Ort im österreichischen Burgenland)
(3) die kalte Schulter zeigen
2. Was bedeutet „bei verschiedener Verteilung“?
• /frau/ und /-in/ bedeuten beide ‚Person weiblichen Geschlechts‘ und stehen „in komplementärer Distribution“. Sind sie deshalb Allomorphe eines Morphems?
• dito: Bewohner , /-er / (Dortmunder ), /-i / (Iraki ), /-iner / (Sachsen-Anhaltiner ), usw.
Definition Mel’čuks (2006: 24,388 und davor für notwendige Konzepte)
• Morph = elementares segmentales sprachliches Zeichen, d.h.
– keine (quasi-)representierbaren Zeichen
– keine nicht-segmentalen Zeichen, d.h.
∗ keine Operationen wie Reduplikation
∗ keine Zeichen die Prosodem enthalten (die kalte Schulter zeigen)
• Morphem: nicht leere Menge von Morphen (m1 , m2 , . . . , mn = {mi }), für die gleichzeitg gilt:
1. das Bezeichnete von allen mi stimmt überein
2. alle mi sind entweder Wurzeln oder Affixe
(⇒ damit wird sichergestellt, dass /frau/ und /-in/ nicht zu einem Morphem gehören,
sondern zu verschiedenen synonymen Morphemen)
3. a) alle mi stehen in komplementärer Distribution, die sich durch (i.) generelle und (ii.) auf
den Kontext einer ‚phonetischen Phrase‘ beschränkte Regeln beschreiben lassen
⇒ (i.) verwirft die Bewohnersuffixe (s.o.) als Allomorphe (vgl. Mel’čuk 2006: 392–4)
⇒ (ii.) erlaubt engl. a und an als Allomorphe
b) Wurzeln mit verschiedener Form werden nur dann als Allomorphe aufgefasst, wenn
sie durch Alternationen voneinander herleitbar sind: z.B. /sing/, /sung/, /sang/ (per
Ablautalternation), aber nicht: /toilett/, /klosett/
Portmanteau-Morphem, strong megamorph (Mel’čuk 2006: 24,401): auf der Inhaltsseite, nicht aber
Formseite dekomponierbares minimales Zeichen, z.B. engl. am = {‘be’,‘indic’,‘pres’,‘1pers’,‘sg’}
Quasimorph (Mel’čuk 2006: 389–390): eine Kombination von mehreren Morphen/Morphoiden m1 , m2 , . . . , mn ,
bei der
• das Bezeichnete phraseologisiert ist, also nicht als Kombination der Bedeutungen von m1 , m2 , . . . , mn
herleitbar ist: Schiff-chen ‚Teil eines Webstuhls‘
• oder die Kombination geschieht nicht regulär
⇒ „the majority of the stems of lexical units in the lexicon of any language turn out to be quasimorphs“
dekomponierbar
Form
Inhalt
Wortform, Phrase
Quasimorph
Strong Megamorph, Portmanteau-M.
Morph
+
+
–
–
+
–
+
–
} repräsentierbar
o
quasirepräsentierbar
9.2 Morphembasiert – lexembasiert
In morpheme-based morphology, word-forms are analyzed as sequences of morphemes. A morpheme
is defined as the minimal meaningful unit of a language. In a word like independently, we say that
the morphemes are in-, depend, -ent, and ly; depend is the root and the other morphemes are, in
this case, derivational affixes. In a word like dogs, we say that dog is the root, and that -s is an
inflectional morpheme. This way of analyzing word-forms as if they were made of morphemes put
after each other like beads on a string, is called Item-and-Arrangement.
wikipedia
The basic goal of most morpheme-based theories is to reduce language to simplex signs, each one
of which is an arbitrary union of sound and meaning. In a language that is ideal from this point of
view, arbitrariness will reside entirely at the level of the simplex sign: each simplex sign will consist
of a one-to-one match between a stretch of sound and a meaning, and in the perfect language, at
least, these matchings should be unique: each distinct arbitrary form should have a single meaning,
and each distinct meaning a single form.
(Aronoff 1994: 8)
Lexeme-based morphology is (usually) an Item-and-Process approach. Instead of analyzing a wordform as a set of morphemes arranged in sequence, a word-form is said to be the result of applying
rules that alter a word-form or stem in order to produce a new one. An inflectional rule takes a
stem, changes it as is required by the rule, and outputs a word-form; a derivational rule takes a
stem, changes it as per its own requirements, and outputs a derived stem; a compounding rule takes
word-forms, and similarly outputs a compound stem.
wikipedia
9.3 Typen/Basiseinheiten morphologischer Wörterbücher
Aufgabe eines morphologischen Wörterbuchs: alle Wortformen einer Sprache zu beschreiben
• Morphemwörterbuch
– Problem der Quasimorphe
– Zitierform eines Morphems?
• Stammwörterbuch
– Wie lautet die Zitierform eines Stammes?
– Umgang mit Stammalternationen:
∗ Regeln beschreiben Alternation
∗ Auflisten der Stämme
∗ „pseudo-agglutinativ“: Stamm ist längstes gemeinsames Präfix der (orthographischen)
Repräsentationen aller Formen des Paradigmas
• Grundformenwörterbuch
– Grund-/Zitierform traditionell und meist eindeutig
– Operation nötig, um den Stamm zu ermitteln
• Vollformenwörterbuch
– schwer zu warten
– mitunter sehr groß, erfordert effiziente Speicherung
• Mischformen, z.B. Grundformenwörterbuch + Derivationsmorpheme
9.4 Aufgaben
9.4.1 Nachzulesen
Mel’čuk (2006: 24,384–399)
9.4.2 Vorzubereiten
perldoc -f substr,
Maier-Meyer (1995: 45–9) (http://www.cis.uni-muenchen.de/pub/cis-berichte/CIS-Bericht-95-84.ps.gz)
Fleischer (2000), Booij (2005: 74–95)
9.4.3 Zu bearbeiten
(bis Dienstag 21.11.)
Gegeben ist folgender Satz (im Kontext fett hervorgehoben):
Im Mittelalter entstand ein neuer Typ, der Trittwebstuhl. Die Kettfäden sind nun waagerecht angeordnet. Die Fachbildung geschieht über sog. Schäfte, im Prinzip sind dies verdoppelte Litzenstäbe, die durch Fußtritte bewegt werden. Der Fadenanschlag wird anstelle des bisher verwendeten
Schwertes oder Kamms durch einen neuen Geräteteil bewerkstelligt, die Lade. Das Einbringen
des Querfadens nimmt nun das Schiffchen vor, ein hölzernes Bauteil, in dem ein Faden
im Inneren aufgewickelt ist. Dieses Schiffchen wird, wenn das Fach durch Fußtritt gebildet ist,
von einer Hand auf die Fadenbahn geworfen, gleitet schnell durch das Fach hindurch und wird auf
der anderen Seite vom Weber mit der zweiten Hand aufgefangen. 1733 führte der Engländer John
Kay den Schnellschützen ein, eine Ladenbahn, auf der das Schiffchen, von einer Schnur gezogen,
entlang schießt. Damit war die letzte Stufe vor Beginn der Mechanisierung erreicht.
1. Zerlegung Sie alle Wortformen des Satzes in ihre Morphe.
2. Wie würden sie die Morpheme benennen? Paraphrasieren Sie den Satz in einer “morpheme-bymorpheme”-Glosse.
3. Nennen Sie Allomorphe zu mind. drei Morphen.
4. Welche Quasimorphe finden Sie vor?
5. Nennen Sie die Zitierformen der Lexeme, zu denen die Wortformen gehören.
Morphologie und Lexikographie, 2006/7, S. Nagel
10 Flexion II; Wortbildung
10.1 Modellierung von Flexion
10.1.1 Das Flexionsmodul von Unitex
Gg. den Lexikoneintrag aimer,V3 werden durch die Graphen alle Formen des Paradigmas beschrieben:
aimer,aimer.V:W
aimerai,aimer.V:F1s
aimeras,aimer.V:F2s
aimera,aimer.V:F3s
aimerons,aimer.V:F1p
aimerez,aimer.V:F2p
aimeront,aimer.V:F3p
...
Als Operationen sind definiert (nach dem Kopieren der Grundform):
L ein Zeichen nach links
Matrix + Lzen = Matrizen
R ein Zeichen nach rechts
acheter + LLLLèRR = achète; gérer + . . .
D lösche ein Zeichen, schiebe alle Zeichen rechts davon um ein Zeichen nach links
choose + LLDRRn = chosen
C kopiere das aktuelle Zeichen, schiebe alle Zeichen rechts davon um ein Zeichen nach rechts
permit + Ced = permitted; ship + . . .
(alle anderen Zeichen) kopiere das Zeichen an die aktuelle Position, gehe eine Position nach rechts
10.1.2 Flexion deutscher Substantive in Perl
siehe Programmfragment (hKursseitei/bin/flexN_.pl): Ergänzen Sie die zwei unvollständigen Ausdrücke!
10.2 Wortbildung
Mel’čuk: morphologische Prozesse sind bedeutungstragend:
„word-manufacturing methods“ [. . .], in sharp contrast to genuine morphological processes, are strictly diachronical: they expand lexical stock by creating new words, but they do not express meanings.
Back-formation (of the type vacuum cleaner ⇒ [to] vacuum-clean) is less obvious, but it is a diachronical phenomen, too, even if it is highly productive and produces semantically predictable results.
As soon as a verb of the type [to] vacuum-clean is formally derived by backformation, it becomes
semantically primary; thus, vacuum-cleaner means ‘appliance designed to vacuum-clean with’; therefore, viewed synchronically, it is dereived from the verb [to] vacuum-clean.
(Mel’čuk 2000: 532)
nicht-bedeutungstragende „Wortschöpfungsverfahren“ (vgl. Mel’čuk 2000: 531-2, Haspelmath 2002: 25):
• Blending (Amalgamierung) brunch
smog
Eurasien
Demokratur
• Clipping
breakfast + lunch
smoke + fog
Europa + Asien
Demokratie + Diktatur
– back-clipping: Foto, Demo, Zoo; Realo, Tanke; Steffi
– fore-clipping: Cello
– hinten und vorne: engl. influenza → flu
– in Komposita: Ölzweig = Ölbaumzweig
– „Silbenwörter“: Trafo; russ. kolchoz
• Abkürzungen:
– CDU („Initialismus“, „Alphabetismus“)
– TÜV („Akronym“)
– GeStaPo, StaSi
• Reduplikationen wie in plemplem, Tippeltappeltour
bedeutungstragende Wortbildungsprozesse:
→ siehe morphologische Prozesse
– Suffigierung
– Präfigierung
– Zirkumfigierung: sing-en → Ge-sing-e
– Ersetzung: werfen → Wurf (im Dt. nicht mehr produktiv)
– Reduplikation: Urgroßvater → Ururgroßvater
– Komposition
• Reihenbildung: sich verlaufen, sich verspielen, sich verfahren, sich verschreiben, sich vertippen,
sich versprechen, . . .
• Wortbildung und Koordinationsellipse: obdach-, eltern- und heimatlos ↔ *wind- und eisig
10.3 Aufgaben
10.3.1 Vorzubereiten
Booij (2005: 74–95); Ortner et al. (1991)
Morphologie und Lexikographie, 2006/7, S. Nagel
11 Komposition & (deutsche) Komposita
Anteil der Substantivkomposita im Deutschen: <10% der Token (Wortformen im Text), >50% der
Types (verschiedene Wortformen), >60% der Lexeme (Wörter im Lexikon)
N, ADJ, V als Resultat der Komposition, als Konstituenten auch PREP, ADV, etc.
Abgrenzung Phrase ↔ Kompositum:
• Komposita werden zusammengeschrieben
• tragen (Haupt-)Akzent (normalerweise) auf dem Erstglied (d.h. nicht auf dem Kopf!)
• keine interne Flexion
Syntaktische Eigenschaften: Kopf bestimmt Wortart, Genus und Flexionsklasse „Die erste determiniert
[. . . ] die zweite, die sonst dominimiert.“(Ortner et al. 1991: 5)
Phraseologisierung/Quasimorphe: Kindergarten
11.1 Typen
• ‚endozentrisch‘: die Kategorie des Kompositums stimmt mit der eines Konstituenten überein.
Dieser ist der Kopf des K.s: Bierfass
• ‚exozentrisch‘: ital. porta-lettere „tragen-Briefe“ ‚Briefträger‘
• ‚Determinativkompositum‘: Erstglied bestimmt Kopf (Zweitglied) genauer
• ‚Kopulativkompositum‘ (Dvandva): gegenseitiges Spezifikationsverhältnis: Fürstbischof , Strumpfhose, Hosenrock , blaugrau
• Possessivkompositum (Bahuvrı̄hi): Kompositum bezeichnet prominente Eigenschaft des Bezeichneten: Rotkehlchen, Achtzylinder , Lästerzunge
• ‚Rektionskompositum‘: Argumentstelle des Kopfes wird durch Erstglied gefüllt: Schuhverkäufer
→ Inkorporation (Booij 2005: 92, Mel’čuk 2000: 528): radfahren
11.2 Fugenelemente, -morpheme, -formen
• -Ø, -e, -es, -en, -ens, -n, -s;
mit Umlaut: -er , -e;
-i , -o, -al (bei entlehnten Stämmen: Elektr-o-motor , Agr-i-kultur );
Bindestrich (Armee-Einheiten, US-Regierung)
• keine allgemeingültigen Kriterien zur Wahl des Fugenmorphems:
Rindfleisch, Rindsbraten, Rindersteak
Kirchentür , Kirchturm
Hofmauer , Friedhofsmauer
Schweinebraten, Schweinsbraten, *Schweinbraten, aber Wildschweinbraten
folgende Kriterien / Erklärungen sind nicht global gültig:
– semantische (Interpretation der Fugenformen als Plural oder Genitiv): Stadtmitte vs. Städtepartnerschaft;Bettdecke vs. Bettenzahl , aber Mehrbettzimmer
– phonotaktische Kriterien
– -s häufiger nach Erstgliedern, die selbst Komposita sind
– Verteilung nach Suffixen (vgl. Fleischer & Barz 1992: §2.2.15.2) z.B. -s bei (ig)keit, aber
Ordnungswidrigkeitenrecht, Neuigkeiten-Seite
– Analogie zu bestehenden Komposita
• Fugenformen des Erstgliedes (analog zu „Flexions“formen)
– Zusammenhang zwischen Flexion(sklasse) und Fugenelement
– verbleiben in Koordinationsellipsen beim Erstglied: Schweins- und Rinderbraten
– CISLEX (Langer 1998): 68 Operationen (Suffixoperationen + Umlaut)
11.3 Kompositasegmentierung
• Ziele
– syntaktische Eigenschaften des Kompositums
– semantische Analyse
∗ Bestandteile
∗ Struktur / Argumentenstruktur
Mädchen|(handels|schule)
*(Mädchen|handels)|schule
N
N
N
N
N
Mädchen
N
N
N
N
N
schule
handels
schule
Mädchen
handels
• Zerlegungsalgorithmus: finde Folge von “( Fugenform )+ Substantivform”, die genau der zu
segmentierenden Wortform entspricht
• Ambiguitäten / Fehlanalysen: Glück|sau|tomaten, Wachs|tube ↔ Wach|stube, Lern|ende, Antrags|teller , Winds|tau, Verse|pos (aus Verse + Po)
• bracketing paradox:
Semantisch motivierte Zerlegung:
Morphologisch motivierte Zerlegung:
(nuclear physic)-ist ‚derjenige, der sich
mit nuclear physics beschäftigt‘
nuclear (physic-ist)
N
N
A
SuffNominal
A
N
nuclear
physic
N
ist
N
nuclear
N
SuffNominal
physic
ist
11.4 Aufgaben
11.4.1 Zu bearbeiten
Gegeben sind folgende dt. Komposita: Donaudampfschifffahrtsgesellschaft, Lokalbaukommission, Ernährungsratschlag, Kleinwagenkäufer , Autobauer , Erdölindustrie, Bahnhof
1. Zerlegen Sie die Komposita in ihre Bestandteile.
2. Klammern Sie die zusammengehörenden Sequenzen aus Konstituenten.
3. Zeichnen Sie für eines der Komposita einen Baum, der die innere Struktur darstellt.
4. Welche der gg. Komposita sind semantische durchsichtig, d.h. nicht „phraseologisiert“?
Morphologie und Lexikographie, 2006/7, S. Nagel
12 Wörterbücher – Einheiten des Lexikons
Was ist ein Wörterbuch/Lexikon? – lexikographisches Nachschlagewerk, das zu (Stich-)Wörtern Informationen enthält
Stichwort/Lemma: beschriebene Einheiten im Lexikon
Versuch einer Typologie von Wörterbüchern:
(vgl. Hausmann et al. (eds.) (1989-1991), Folien von Angelika Feine)
• „Als Standardtyp eignet sich das Wörterbuch, das für den Laien im Zentrum des Wörterbuchbegriffes steht, das allgemeine einsprachige Definitionswörterbuch.“ (Hausmann 1985: 372)
• linguistisch ↔ enzyklopädisch
div. Sprachwörterbücher – Sachwörterbuch – Konversationslexikon – Universallexikon/Enzyklopädie
• einsprachiges WB ↔ Übersetzungswörterbuch/zweisprachiges oder mehrsprachiges WB/bilingual
dictionary
• Allgemeinwörterbuch ↔ Fachwörterbuch
allgemeinsprachlich ↔ fachsprachlich
• Gesamtwörterbuch ↔ Spezialwörterbuch
gesamter Wortschatz ↔ Teilmengen (z.B. Fremdwörter, Synonympaare usw.)
• Verwendungszweck/Nutzergruppe/Umfang: Schulwörterbuch/Lernerwörterbuch/learner’s dictionary
– Großwörterbuch – Taschenwörterbuch – Reisewörterbuch
Grundwortschatz – Minimalwortschatz
• synchron ↔ diachron: historisches Wörterbuch, Sprachstadienwörterbuch/Periodenwörterbuch, etymologisches Wörterbuch, Lehnwörterbuch
• Auswahl der Lemmata
– sprachliche Segmente als Einheiten
∗ Zeichenwörterbuch: Kanji-WB, character dictionary
∗ Morphem: Morphemwörterbuch, Wortfamilienwörterbuch, Wörterbuch der Ableitungen/Derivationen
∗ Wort (default)
∗ Syntagmen:
· Konstruktionswörterbuch (syntactic patterns)
· Kollokationswörterbuch
· phraseologisches WB
· Metaphernwörterbuch
· Sprichwörterbuch, Sprichwörtersammlung, geflügelte Worte
· Zitatenwörterbuch, Zitatensammlung
· Satzwörterbuch
– semantische Teilmengen:
∗ Namenwörterbuch, Eigennamenwörterbuch, Onomastikon, Gazetteer
– Teilmengen nach syntaktischen Eigenschaften: Verbwörterbuch, Lexikon der Präpositionen
etc.
– nicht-sprachliche Einheiten: Symbolwörterbuch, Gestenwörterbuch
– orientiert an Form des Zeichens
∗ Abkürzungswörterbuch, Akronyme
•
•
•
•
•
•
•
•
•
•
•
•
∗ Reimwörterbuch
∗ Palindromwörterbuch
∗ phonologisches Wörterbuch
∗ Kreuzworträtselwörterbuch
– andere
∗ vergessene/untergegangene/seltene Wörter, Archaismen
∗ Neologismen
∗ Internationalismenwörterbuch
∗ Fremdwörterbücher
semantisch orientiert (semantische Relationen zwischen Zeichen)
– onomasiologisches Wörterbuch
– Synonymwörterbuch, synonym finder
– Antonmywörterbuch
– thematisch/begrifflich geordnetes Wörterbuch, wordfinder
– Thesaurus
– Ontologie
– assoziatives Wörterbuch
syntagmatisch orientiert (Σx ): Valenzwörterbuch, Erklärend-Kombinatorisches WB
Rechtschreibwörterbuch, orthographisches WB
Aussprachewörterbuch
Homonymwörterbuch, (bzw. Homophone, Paronyme)
Flexionswörterbuch, Konjugationswörterbuch
Schwierigkeiten, schwierige Wörter
Sortierung:
– Standard: alphabetische/lexikographische Sortierung
– rückläufiges Wörterbuch, Index „a tergo“
Umkehrwörterbuch
textbezogen:
– individualsprachliche Wörterbücher, Autorenwörterbuch
– Autorenbedeutungswörterbuch
– Konkordanz, Belegstellenwörterbuch
Frequenzwörterbuch, Häufigkeitswörterbuch
Standardsprache/Schriftsprache ↔ Umgangssprache/gesprochene Sprache ↔ Dia-/Soziolekte:
Mundartwörterbuch, Dialektwörterbuch
Wörterbuch der Jugendsprache, Slangwörterbuch, Argot, Schimpfwörterbuch, sexuelle Lexik
• Bildwörterbuch
• Glossar
1. Welche Wörterbuchtypen sind für den Computerlinguisten (nicht) nützlich/brauchbar?
2. Welche sind durch den Computer (weitgehend) überflüssig geworden?
3. Welche Wörterbuchtypen sind für welche computerlinguistischen Anwendungen verwendbar?
Lexikologie: Lehre von den Strukturierungen im Wortschatz
Lexikografie beschäftigt sich mit der Erstellung von Wörterbüchern.
Makrostruktur: Auswahl der Lemmata und ihre Anordnung
Mikrostruktur: Aufbau eines Eintrags
Morphologie und Lexikographie, 2006/7, S. Nagel
13 Phraseme: Idiome, Kollokationen etc.
(Alle Seitenverweise beziehen sich auf Mel’čuk 1995: „Phrasemes in language and phraseology in linguistics“)
Freie Phrasen ↔ Phraseme (173–6)
• bei freien Phrasen bestehen keine Einschränkung bei der Auswahl von Lexemen und Regeln, die
Bedeutung ist 100% kompositional, d.h. aus der Bedeutung der beteiligten Lexeme und Regeln
ableitbar.
• Phraseme sind nicht-freie Phrasen und gliedern sich in:
Phraseme
Pragmatische Phraseme
1. Pragmateme
Semantische Phraseme
2. Idiome
3. Kollokationen
4. Quasiidiome
Pragmateme: ausgehend von einem Konzept bestehen (pragmatische) Einschränkungen bei der Auswahl der Lexeme, z.B.:
Parken verboten / # Kein Parken / # Nicht parken
= No parking / # Parking forbidden / # Do not park
= Stationnement interdit / # Aucun stationnement
Alle # -Phrasen sind verständlich, aber eben doch (irgendwie) falsch!
Idiom: Das Bezeichnete ‘X’ eines Idioms ist in keinem der beteiligten Lexeme A und B auch nur
teilweise ausgedrückt.
ins Gras beißen, den Löffel abgeben
Kollokation: eines der beteiligten Lexeme (A, die ‚Basis‘) „behält seine Bedeutung“, das zweite Lexem
(B, der ‚Kollokator‘) drückt jedoch eine andere Bedeutung C aus:
scharzer Kaffee = ‘Kaffee ohne Milch’
Lexikalische Funktionen: Die durch B ausgedrückte Bedeutung C in einer Kollokationen. Zu unterscheiden sind:
• Standardfunktionen: für eine (große) Menge von Basen A wird durch verschiedene Kollokatoren
B die gleiche Bedeutung C ausgedrückt, z.B. C = ‘in hohem Maße, mit großer Intensität, sehr’,
siehe unten LF ‘Magn’
• Nicht-Standard-LF: nur für sehr wenige Basen vorhanden, z.B. starker Kaffee
Quasi-Idiom: Beide beteiligten Lexem A und B sind in ihrer Bedeutung „präsent“, aber es tritt noch
eine weitere Bedeutung(skomponente) C hinzu, z.B.: bacon and eggs = Schinken (A) + Eier (B) + C:
in einer spezifischen Weise zubereitet, durch Braten . . .
morphologische Idiome, „Phraseologisierung“ auf Ebene der Morphologie (214)
14 Das erklärend kombinatorische Wörterbuch
1. Lemma/Stichwort mit Information über Morphologie und Stilebene
2. Definition, bestehend aus Konstanten (Konzepten) in natürlichsprachlicher Darstellung und Variablen (X, Y, Z)
3. Rektionsmodell: jede Tabellenspalte repräsentiert einen Aktanten, jeder Eintrag in der jeweiligen
Spalte eine syntaktische Realisierungsmöglichkeit des Aktanten
(3.a) Einschränkungen zum Rektionsmodell
(3.a) Beispiele zum Rektionsmodell
4. Lexikalische Funktionen
a) Paradigmatische LFs verweisen auf andere Lemmata, die Anstelle des Stichwortes verwendet
werden können, z.B.
Syn(Fahrstuhl ) = Lift
Conv21 (hinter ) = vor [Konversive = Vertauschen der Aktanten]
Gener(Apfel ) = Obst
b) Syntagmatische LFs haben als Wert Lemmata oder Phrasen, die zusammen mit dem Stichwort verwendet werden:
[Magn = lat. magnus ‚groß‘ = in hohem Maße, mit großer Intensität, sehr]
Magn(dumm) = stock-, sau-, stroh-, wie Bohnenstroh
Magn(frech) = rotz-, wie Oskar
[Locin =Präposition auf die Frage wo? ]
Locin (Party) = auf
Locin (Vorlesung) = in
[Oper1 = semantische weitgehend leeres Verb zur Bildung eines vollständigen Satzes, wobei
Stichwort als direktes Objekt, erster Aktant als Subjekt realisiert wird]
Oper1 (Vortrag) = halten
Oper1 (talk ) = give
5. Beispiele für die Verwendung des Stichwortes mit LFs in Texten
6. Enzyklopädische Information
7. Idiome, in denen das Stichwort vorkommt (als Referenz auf die entsprechenden Einträge der
Idiome selbst)
Morphologie und Lexikographie, 2006/7, S. Nagel
14 Relationen zwischen Wörtern
Relationen zwischen sprachlichen Zeichen (Mel’čuk 2006: Kap. 10)
• Inhalts- und Formseite eines Zeichens als Menge von semantischen bzw. morphologischen Einheiten
• vier mögliche Relationen zwischen zwei Zeichen (A und B sind identisch, A ist in B enthalten, A
und B mit/ohne gemeinsame Elemente)
• jeweils auf Inhalts- und Formseite übertragen, ergeben sich 17 mgl. Kombination, u.a.:
1. ‘A’ = ‘B’, /A/ = /B/
to walk : a walk (Konversion)
3. ‘A’ = ‘B’, /A/ ∩ /B/ 6= ∅
die Häuser : den Häusern (Flexion in rein syntaktischer Kategorie)
4. ‘A’ = ‘B’, /A/ ∩ /B/ = ∅
Fahrstuhl : Lift (Synonymie)
Personenkraftwagen : Passagierflugzeug (Synonyme in komplementärer Distribution, ΣA 6= ΣB )
5. ‘A’ ⊂ ‘B’, /A/ = /B/
Peter isst eine Kirsche : im Garten steht eine Kirsche : der Tisch ist aus Kirsche (chain
polysemy, reguläre Polysemie)
der Direktor der Schule : die Schule brennt
to cook : a cook (Konversion + semantische Ableitung)
6. ‘A’ ⊂ ‘B’, /A/ ⊂ /B/ (verschiedene Arten von Derivation)
Glocke : Glöckchen
write : writer (≈ schreiben : Schreiberling)
7. ‘A’ ⊂ ‘B’, /A/ ⊃ /B/ („reverse“ Derivation)
schreinern : Schreiner
10. ‘A’ ∩ ‘B’ 6= ∅, /A/ = /B/ (radial polysemy)
Flügel (s.u.)
14. ‘A’ ∩ ‘B’ = ∅, /A/ = /B/ (Homonymie)
mit dem Ball spielen : auf einen Ball gehen
Kaffee mahlen : ein Bild malen (Homophon)
Computerlinguistik ist modern : Grosse Mengen Fallholz liegen am Boden und modern vor sich
hin. (Homograph)
14.1 Polysemie vs. Homonymie
Kriterium für Polysemie ist das Vorhandensein einer semantischen Brücke, d.h. ein gemeinsamer, nichttrivialer Teil in der Bedeutungserklärung (vgl. Mel’čuk 2006: 535–6).
Bank : ‚Sitzgelegenheit‘ ? ‚Geldinstitut‘
Flügel : Ist es möglich, die Bedeutungserklärungen in der Wikipedia so zu verändern, dass ein gemeinsames Element bleibt?
14.2 antonymische Relationen
• graduelle Antonymie: jung ↔ alt
• Komplementarität: auf ↔ zu, tot ↔ lebendig
• reverse Relation: öffnen ↔ schließen
• konverse Relation: kaufen ↔ verkaufen
14.3 Hyponymie etc.
Hyponym ↔ Hyperonym – Unterordnungsrelation, wichtigste Relation zur Gliederung des Wortschatzes:
‘X ist ein Hyponym/Unterbegriff von Y ’ (‘Y ein Hyperonym/Oberbegriff von X’), wenn ‘X ist ein Y ’
oder ‘ein X ist eine Art Y ’ ISA-Relation (von engl. is a) z.B. Spatz ist ein Hyponym von Vogel
Kohypohym : ‘X ist ein Hyponym von Y ’, ‘Z ist ein Hyponym von Y ’ ⇒ ‘X und Z sind Kohyponyme
von Y ’, z.B. Taube und Spatz sind Kohyponyme
Meronym (auch Partonym) ↔ Holonym – Teil-Ganzes-Relation:
‘X ist ein Meronym von Y ’ (‘Y ein Holonym von X’), wenn ‘X ist Teil/Mitglied/Bestandteil von Y ’
z.B. Dach ist ein Meronym von Haus oder Gebäude
Tulpe – Blume: Hyponymie gilt nicht unter Aspekt ,Biertrinken‘, dort: ,Pilsglas‘ - ,Schaum‘
14.4 Weitere Begriffe
•
– Wortfeld: bedeutungs„verwandte“ Wörter
– Wortfamilie: formverwandte Wörter, d.h. mit gemeinsamem morphologischen Grundelement
(üblicherweise Stamm)
• Metapher – Metonymie: beide bezeichnen „Ersetzungen“
– Metapher: Ersetzung durch etwas Ähnliches, üblicherweise domänenübergreifend
– Metonymie: reale Beziehung zwischen ersetztendem und ersetztem, z.B. Teil-Ganzes, AutorWerk oder Ursache-Wirkung
15 Zur Übung
Um welche Relationen handelt es sich?
1. Morgen — Abend
2. Stimme (Reden und Singen) — Stimme (als Wahlberechtigter)
3. häufig — selten
4. Bus — Omnibus
Morphologie und Lexikographie, 2006/7, S. Nagel
15 Thesaurus, Ontologie, WordNet
15.1 Begriffe: Taxonomie, Ontologie
Taxonomie
Ontologie
• verzweigende Hierarchie (Baum)
• System aus Begriffen (Klassen und Entitä• wissenschaftliche Taxonomie ↔ folk taxonoten mit Attributen) und Relationen zwischen
my
den Begriffen
→ folksonomy
• Inferenz- und Integritätsregeln
• meist auf Domäne/Fachgebiet beschränkt
→ semantic web
15.2 Thesaurus
von jhsaurì (gr. ,Schatz, Schatzkammer‘):
1. Wörterbuch mit dem Ziel, den Gesamtwortschatz einer Sprache, eines Autors oder eines Textes
zu erfassen (Thesaurus Linguae Latinae)
2. thematisch organisiertes Wörterbuch
The present work is intended to supply, with respect to the English language, a desideratum hitherto
unsupplied in any language; namely a collection of the words it contains and of the idiomatic
combinations peculiar to it, arranged, not in alphabetical order as they are in a Dictionary, but
according to the ideasy which they express.
. . . classification of ideas is the true basis on which words, which are their symbols, should be
classified.
Roget, Peter Mark: Thesaurus of English words and phrases London, 1852
Ziel/Zweck:
• Organisation von Wissen
• Standardisierung von Terminologien
• und natürlich: synonym finder, Didaktik, Fremdsprachenunterricht, für Reisende, Kreuzworträtsel
Probleme/Schwierigkeiten:
• welche Struktur organisiert den Wortschatz am sinnvollsten?
• lässt sich der Wortschatz einer Sprach sprachunabhängig ordnen, d.h. mit einer zugrundeliegenden
Struktur, die für alle Sprachen gleich gut geeignet ist?
Roget (1852) (http://poets.notredame.ac.jp/Roget/contents.html):
5. Wesen, Beziehung, Geschehnis
1. Abstract Relations
6. Zeit
2. Space
motion
motion with reference to direction
food
7. Sichtbarkeit, Licht, Farbe, Schall, Temperatur, Gewicht, Aggregatzustände
8. Ort und Ortsveränderung
9. Wollen und Handeln
3. Matter
10. Das Denken
4. Intellect: the exercise of the mind
11. Zeichen, Mitteilung, Sprache
5. Volition: the exercise of the will
12. Wissenschaft
6. Emotion
13. Kunst und Kultur
Dornseiff (2003):
14. Menschliches Zusammenleben
1. Natur und Umwelt
15. Essen und Trinken
2. Leben
16. Sport und Freizeit
3. Raum, Lage, Form
17. Gesellschaft
4. Größe, Menge, Zahl
18. Geräte, Technik
19. Wirtschaft, Finanzen
7. herrenlose Hunde
20. Recht, Ethik
8. in diese Gruppierung gehörige
21. Religion, Übersinnliches
9. die sich wie Tolle gebärden
Emporio celestial de conocimientos benévolos:
1. Tiere, die dem Kaiser gehören
10. die mit einem ganz feinen Pinsel aus Kamelhaar gezeichnet sind
2. einbalsamierte Tiere
11. und so weiter
3. dressierte
4. Milchschweine
5. Sirenen
6. Fabeltiere
12. die den Krug zerbrochen haben
13. die von weitem wie Fliegen aussehen
(aus Jorge Luis Borges: The Analytical Language of John Wilkins)
15.3 WordNet
• seit 1985 an der Princeton University
•
http://wordnet.princeton.edu/, http://www.globalwordnet.org/
• compounds, phrasal verbs, collocations, idiomatic phrases
• nouns, verbs, adjectives, adverbs
• „WordNet contains short phrases, such as bad person, that are not paraphrasable by a single word. These phrases
reflect lexical gaps and are product of WordNet’s relational structure, which may link two concepts via a third that
happens not to be lexicalized in English. But these gaps are not always structural artifacts; they are often lexicalized
in other languages, and they reveal conceptual structures as distinct from lexical structures.“ (Fellbaum (ed.)
1998: 5–6)
• Synsets = sets of synonyms
• „WordNet contains no relations that indicate the words’ shared membership in a topic of discourse. For example,
WordNet does not link racquet, ball , and net in a way that would show that these words, and the concepts
behind them, are part of another concept that can be expressed by court game. Connecting racquet, ball , net,
and court game, or physician and hospital, is a challenge for electronic dictionaries that Roger Cahffin (personal
communication) has called the “tennis problem.”“ (Fellbaum (ed.) 1998: 10)
• Netz (keine Taxomonie!) mit Kreuzklassifikationen
• nur ein Typ Hyponymie-Relation
• alle
– Synsets
– Domain
• Nouns
– Hyponyme/Hyperonyme/Kohyponyme
– Meronyme/Holonyme
∗ has_part tree → branch, crown, . . .
∗ has_member
forest
→
tree,
{underbrush, undergrowth, underwood }
∗ has_substance tree → {heartwood ,
duramen} (‚Kernholz‘), {sapwood }
(‚Splintholz‘)
– Antonyme: ‚man‘ ↔ ‚woman‘, ‚victory‘ ↔
‚defeat‘
• Verbs
– Implikation/entailment: X entails Y if X
cannot be done unless Y is, or has been,
done (‚sleeping‘ – ‚snoring‘)
– Hyponyme/Hyperonyme/Kohyponyme
(=Troponymie: To V1 is to V2 in some
particular manner: lisp – talk )
– Antonyme
• Adjectives
– Antonyme
– Attribut-Relation zu Nomen, für das das
Adjektiv einen Wert ausdrückt (weight:
light, heavy)
– participle of verb
– Pertainyms
• Adverbs
– Antonyme
– root adjectives
WordNet 3.0 (2006)
Number of words, synsets, and senses
+----------+---------+---------+------------------+
|
POS
| Unique | Synsets |
Total
|
|
| Strings |
| Word-Sense Pairs |
+----------+---------+---------+------------------+
|Noun
| 117798 |
82115 |
146312 |
|Verb
|
11529 |
13767 |
25047 |
|Adjective |
21479 |
18156 |
30002 |
|Adverb
|
4481 |
3621 |
5580 |
+----------+---------+---------+------------------+
|Totals
| 155287 | 120982 |
206941 |
+----------+---------+---------+------------------+