handouts

Transcription

handouts
Neue Ansätze in der historischen
Sprachwissenschaft
Johann-Mattis List
[email protected]
Institut für Sprache und Information
Heinrich Heine Universität Düsseldorf
Wintersemester 2012
Inhaltsverzeichnis
1 Einführung
3
Grundlegende Konzepte der historischen Linguistik . . . . . . . . . . . . . . . . . . 3
Historische Aspekte der historischen Sprachwissenschaft . . . . . . . . . . . . . . 12
Übung zur Vertiefung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2 Wandel und Relationen
21
Zeichenwandel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Zeichenrelationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Übung zur Vertiefung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3 Rekonstruktion von Zeichenbeziehungen
Sequenzalinierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Kognatenerkennung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übung zur Vertiefung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
39
48
56
4 Rekonstruktion von Sprachbeziehungen
57
Phylogenetische Rekonstruktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Nachweis von Sprachverwandtschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
Übung zur Vertiefung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5 Zukunftsmusik
75
Quantitative Aspekte von Bedeutungswandel . . . . . . . . . . . . . . . . . . . . . . 75
Lehnworterkennung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
2
1 Einführung
In diesem Block werden grundlegende Aspekte besprochen, die für ein Verständnis
der folgenden Blöcke wichtig sind. Dazu gehören grundlegende Konzepte in der historischen Linguistik, historische Aspekte der historischen Sprachwissenschaft und eine
kleine Übung zur Vertiefung.
3
1 Einführung
Johann-Mattis List
Grundlagen
2012-11-30
Grundlegende Konzepte der historischen Linguistik
1 Gegenstand
1.1 Sprachen
Was ist eine Sprache?
Was als Sprache gilt, d. h. welche Sprechtraditionen zu einer Sprache gezählt werden,
hängt nicht von rein linguistischen, sondern insbesondere auch von sozialen und kulturellen Kriterien ab (Barbour und Stevenson 1998: 8). Demzufolge geht man bspw. davon aus, dass die Menschen in Shanghai, Peking und Meixian alle Dialekte des “Chinesischen” sprechen, während die Menschen in Skandinavien eine der Sprachen “Norwegisch”, “Schwedisch” oder “Dänisch” sprechen. Dies bedeutet jedoch nicht, dass sich die
chinesischen Varietäten weniger voneinander unterscheiden als die skandinavischen, wie
Tabelle 1 deutlich macht:
Beijing Chinese
Hakka Chinese
iou²¹ i⁵⁵
iu³³
xuei³⁵
1
Shanghai Chinese
1
ɦi²²
tʰɑ̃⁵⁵ ʦɿ²¹ poʔ³foŋ⁴⁴
Beijing Chinese
2
ʂei³⁵
Hakka Chinese
1
2
Shanghai Chinese
2
Norwegian
1
Swedish
1
Danish
man³³
sa³³
it⁵⁵
pei²¹fəŋ⁵⁵
pai³³a¹¹
pet³³fuŋ³³
də⁵⁵
ɲin¹¹
ɲiŋ⁵⁵
ɦəʔ²¹
nuːɾɑʋinˑn̩
ɔ
suːln̩
1
noʌ̯ʌnvenˀn̩
ʌ
soːl ̩ˀn
Norwegian
2
ʋem
ɑ
dem
Swedish
Danish
2
2
vɛm
vɛmˀ
ɑv
a
dɔm
b̥m̩
nuːɖanvɪndən
ɔ
suːlən
kʷɔ⁵⁵
kʰʌm
sɱ̩
kən⁵⁵
tʰuŋ¹¹
taʔ⁵
tʰai⁵¹iaŋ¹¹
ɲit¹¹tʰeu¹¹
tʰa³³ɦiã⁴⁴
pən³⁵ liŋ²¹
ta⁵¹
pəŋ³³ zɿ⁴⁴
du¹³
vɔi⁵³
tv̥ɪstadə
ʋɑː
sɔm vɑ
d̥
vɑ
ən gɔŋ
eŋg̊ɑŋ
ɖɳ̩
d̥n̩
t͡ʂəŋ⁵⁵ ʦai⁵³ naɚ⁵¹
hɔk³³
e⁵³
ʦəŋ³³ hɔ⁴⁴
kɾɑŋlət
i sd̥ʁiðˀ
t͡ʂəŋ⁵⁵luən⁵¹
au⁵⁵
ləʔ¹lə²³ʦa⁵³
ɔm
ɔm
ʌmˀ
stæɾ̥kəstə
staɹkast
sd̥æʌ̯g̊əsd̥ə
Tabelle 1: “Der Nordwind und die Sonne” in verschiedenen Sprachvarietäten
Die Tabelle zeigt phonetische Transkriptionen der Übersetzung des
Satzes "Der Nordwind und die Sonne stritten sich, wer von ihnen der
stärkere sei" in sechs verschiedenen sprachlichen Varietäten. Leider
gibt es keine weiteren Angaben zur Struktur der Tabelle. Wie lässt
sich diese erklären? Welche Schlussfolgerungen in Bezug auf die Einteilung der chinesischen Varietäten in Dialekte und der skandinavischen
Varietäten in Sprachen lassen sich aus der Tabelle ziehen?
Das Konzept des Diasystems
Um den komplexen, heterogenen Charakter von Sprachen im Rahmen der Linguistik realistischer widerzuspiegeln wird in der Soziolinguistik gewöhnlich vom Modell des Diasystems (Bussmann 1996: 312) Gebrauch gemacht. Gemäß diesem Modell sind Sprachen
komplexe Aggregate verschiedener linguistischer Systeme, “die miteinander koexistieren
und sich gegenseitig beeinflussen” (Coseriu 1973: 40). Ein wichtiger Aspekt ist dabei das
Vorhandensein einer sogenannten Dachsprache, d. h. einer linguistischen Varietät, die als
1
4
Johann-Mattis List
Grundlagen
2012-11-30
Standard für interdialektale Kommunikation dient (Goossens 1973: 11). Die unterschiedlichen linguistischen Varietäten (Dialekte, Soziolekte), welche durch einen solchen Standard verbunden werden, bilden den Varietätenraum einer Sprache (Oesterreicher 2001),
wie in Abbildung 1 dargestellt.
Standard Language
Diatopic Varieties
Diastratic Varieties
Diaphasic Varieties
Abbildung 1: Sprache als Diasystem
Wie lässt sich mit Hilfe des Modells des Diasystems die unterschiedliche Einteilung der chinesischen und der skandinavischen Varietäten
erklären?
Vereinfachtes Sprachmodell der historischen Linguistik
In der historischen Linguistik wird ein sehr vereinfachtes Sprachmodell zugrunde gelegt.
Es interessiert dabei weniger, was eine Sprache tatsächlich “ist” als vielmehr, wie eine
Sprache sich verändert. Dabei wird Sprache als System angesehen. In einem weiten Sinne besteht ein System aus einer Menge von Elementen und einer Menge von Relationen,
die sich auf die Menge der Elemente beziehen (Marchal 1975: 462f). Für das Sprachmodell in der historischen Linguistik bedeutet dies, dass sprachliche Systeme Laute (Phone,
Phoneme) und Zeichen (Wörter, Morpheme) als Elemente aufweisen und phonotaktische
und syntaktische Regeln als Relationen.
Reicht ein dermaßen vereinfachtes Sprachmodell für eine Behandlung
der wichtigen Probleme der historischen Linguistik aus?
1.2 Zeichen
Das klassische Zeichenmodell
Sprachliche Zeichen werden in der historischen Linguistik gewöhnlich im Rahmen des traditionellen Zeichenmodells von Saussure (1916) beschrieben. Es wird also die Ausdrucksseite von der Inhaltsseite des sprachlichen Zeichens unterschieden, oder, wie Roman Jakobson es ausdrückt:
2
5
1 Einführung
Johann-Mattis List
Grundlagen
2012-11-30
The sign has two sides: the sound, or the material side on the one hand, and meaning,
or the intelligible side on the other. Every word, and more generally every verbal sign,
is a combination of sound and meaning, or to put it another way, a combination of
signifier and signified [...]. (Jakobson 1976[1978]: 3)
Was mein Jakobson mit ``material" und ``intelligible"?
Nachtrag
Normalerweise wird das klassische Zeichenmodell Saussure’s wie folgt verbildlicht:
↑
↓ ↑
[kop͡f]
“head”
↓
[kʌp]
“cup”
Konstituierend für das sprachliche Zeichen ist neben der Form (Signifikant) und der Bedeutung (Signifikat) aber auch das sprachliche System, in dem das Zeichen seine Geltung hat.
Eine genauere Verbildlichung des Zeichenmodells sollte daher auch dem System Rechnung tragen:
[kɔp͡f]
“head”
[kʌp]
MEANING
FORM
“cup”
FORM
Kopf
MEANING
cup
LANGUAGE
LANGUAGE
German
English
Betrachtet man die Struktur von Zeichenform und Zeichenbedeutung, so lassen sich grundlegende Unterschiede zwischen den beiden
feststellen. Bei der Zeichenform handelt es sich um eine (phonetische) Sequenz, also eine Abfolge distinktiver Laute. Diese Laute sind
materiell, insofern als sie bspw. als Schwingungen in der Luft gemessen
werden können, oder als Spuren von Tinte auf einem Blatt Papier.
Wichtig ist für die Zeichenform ferner ihre Linearität, denn nicht die
bloße Anhäufung an Lauten, sondern ihre Abfolge ist entscheidend
für die Unterscheidung von Zeichenformen. Man kann daher sagen,
dass die Zeichenform (a) substantiell, (b) segmentierbar, und (c) linear
ist. Wie aber verhält es sich mit der Zeichenbedeutung? Trage die
Entsprechungen in der jeweiligen Spalte in der Tabelle ein.
No.
(a)
(b)
(c)
Form
substantiell
segmentierbar
linear
Bedeutung
3
6
Johann-Mattis List
Grundlagen
2012-11-30
2 Wandel
Wandel als Katastrophe
Schon früh in der Geschichte der Linguistik war den Forschern in Europa bewusst, dass
Sprachen sich wandeln können. Vorherrschend war dabei jedoch die Ansicht, dass alle
Formen des Wandels “katastrophisch” abliefen, dass Wandel also im Rahmen eines unberechenbaren, chaotischen “Verfalls” vor sich ginge. Erst spät (zu Beginn des 19. Jahrhunderts) wurde erstmals klar, dass sich bestimmte Phänomene des Sprachwandels, insbesondere der Lautwandel, durch eine beachtliche Regelmäßigkeit auszeichnen.
Die katastrophische Theorie des Sprachwandels wird zuweilen auch als
das "hebräische Paradigma" bezeichnet. Womit mag diese Benennung
zusammenhängen?
Wandel als Prozess
Dass Lautwandel gerade nicht zwangsläufig katastrophisch verläuft, kann schnell gezeigt
werden, wenn man Wörter des Lateinischen mit Wörtern einer seiner Nachfolgersprachen
(wie bspw. des Italienischen) vergleicht. Dabei stellen die Daten in Tabelle 2 jeweils nur
Beispiele dar, die sich nahezu beliebig erweitern lassen.
Bedeutung
“Feder”
“flach”
“Platz”
Latein
pluːma
plaːnus
plateːa
Italienisch
pjuma
pjano
pjaʦːa
Bedeutung
“Zunge”
“Mond”
“langsam”
Latein
liŋgua
lu:na
lentus
Italienisch
liŋgwa
luna
lento
Tabelle 2: Lateinische und Italienische Wörter
Wenn die Daten in Tabelle 2 tatsächlich nur einen Ausschnitt für eine
viel größere Anzahl von Beispielen von Wortvergleichen zwischen dem
Lateinischen und dem Italienischen darstellen, welche grundlegenden
Eigenschaften des Lautwandels lassen sich dann daraus ableiten?
Wandel als Gesetz
Die Erkenntnis, dass Lautwandel zu großen Teilen regelmäßig verläuft, wurde enthusiastisch von den Sprachforschern zu Beginn des 19. Jahrhunderts aufgenommen, und führte
von der Regularitätsannahme schnell zum Terminus des Lautgesetzes. Das Phänomen
des Lautwandels wurde dabei bewusst mit einem den Naturgesetzen vergleichbaren gemeingültigen Prozess in Beziehung gesetzt. Die stärkste Hypothese in Bezug auf den
Lautwandel wurde dabei von den sogenannten Junggrammatikern (einer Gruppe von Linguisten in Leipzig, die durchschnittlich jünger als andere Linguisten in Deutschland waren)
formuliert, welche als “Junggrammatische Hypothese” in die Geschichte einging:
Aller lautwandel, soweit er mechanisch vor sich geht, vollzieht sich nach ausnahmslosen gesetzen, d.h. die richtung der lautbewegung ist bei allen angehörigen einer
sprachgenossenschaft, ausser dem Fall, dass dialektspaltung eintritt, stets dieselbe,
und alle wörter, in denen der der lautbewegung unterworfene laut unter gleichen verhältnissen erscheint, werden ohne ausnahme von der änderung ergriffen. (Osthoff und
Brugmann 1878: XIII)
4
7
1 Einführung
Johann-Mattis List
Grundlagen
2012-11-30
Was genau besagt die junggrammatische Hypothese in ihren Einzelheiten?
Ausblick
Wenn man sich mit Sprachwandel beschäftigt, lassen sich verschiedene Ebenen unterscheiden. Die bisherigen Beispiele orientieren sich primär am Lautwandel. Lautwandel
an sich lässt sich jedoch wiederum im Hinblick auf verschiedene Aspekte untersuchen.
Die prozedurale Perspektive beschäftigt sich mit dem Prozess und dessen Geltungsbereich, wobei unterschiedliche Mechanismen des Lautwandels untersucht werden. Diese
Perspektive wird in der Sitzung “Zeichenwandel” in Block II im Vordergrund stehen. Die
substantielle Perspektive beschäftigt sich mit dem Wandel hinsichtlich der lautlichen
Substanz, wobei unterschiedliche Typen des Lautwandels unterschieden werden. Diese Perspektive wird in der Sitzung “Sequenzalinierung” in Block III genauer behandelt
werden.
Lautwandel ist jedoch nicht die einzige Form von Wandel, die in der historischen Linguistik untersucht wird, denn auch die Bedeutungsseite des sprachlichen Zeichens kann
sich im Laufe der Zeit wandeln. Phänomene des semantischen Wandels werden in der
Sitzung “Bedeutungswandel” genauer untersucht werden.
Eine weitere und allgemeinere Form des sprachlichen Wandels, die eine wichtige Rolle
in der historischen Linguistik spielt, ist der lexikalische Wandel. Dieser wird vor allem in
der Sitzung “Lexikostatistik” in Block IV wieder aufgegriffen.
3 Relationen
Wandel und Resultate des Wandels
Ausgehend von der Annahme, dass Lautwandel regelmäßig verläuft, lassen sich bestimmte Rückschlüsse in Bezug auf mögliche Resultate des Lautwandels postulieren. Tabelle 3
zeigt Beispiele für diese Resultate anhand der genetisch verwandten Sprachen Sanskrit,
Latein, Griechisch und Gotisch.
Nummer
1
2
3
4
5
6
7
8
9
10
11
12
Sanskrit
padpi'tarpardateː
ta'noːti
'trajas
tu
*ka'put*kalnkra'vis
kaʧʲi-'raø
Latein
peːdpater
ø
tendere
tres
tu
kaput
ø
kruor
kʷoj
kʷieːs
s-kʷalus
Griechisch
podpa'teːr
'perdomai
'teinein
treis
ty
ø
ø
'kreas
po-tʰen
ø
a's-palos
Gotisch
foːtfadrs
*firtan
θanjan
θreis
θu
hawbiθ
hals
*hreːwa
hʷas
hʷiː-la
*hʷalas
Bedeutung
Fuß
Vater
furzen
dehnen
drei
du
Kopf
Hals
Fleisch, Blut
wie?, was?
Ruhe
Wal, Fisch
Tabelle 3: Lautkorrespondenzen verschiedener indogerman. Sprachen
Bezeichnend für die Anfänge der historischen Linguistik, aber auch nach wie vor für
viele neuere Darstellungen, ist ein Vermischen der Phänomene mit den Resultaten des
5
8
Johann-Mattis List
Grundlagen
2012-11-30
Lautwandels. Während sich die Phänomene mit Hinblick auf einen Anfangs- und Endpunkt
beschreiben lassen, müssen Anfangs- und Endpunkt aus den Resultaten des Lautwandels
erst erschlossen werden. Wie der von Jacob Grimm (1785 – 1863) geprägte Terminus
“Lautverschiebung” jedoch schon andeutet, war diese strikte Trennung alles andere als
selbstverständlich für die Pioniere der historischen Linguistik. So interpretiert Grimm seine Daten direkt historisch als Prozess, ohne deutlich zu machen, dass der Prozess nicht
zwangsläufig aus den Daten ersichtlich wird:
Noch merkwürdiger als die einstimmung der liq. und spir. ist die abweichung der lippenzungen- und kehllaute nicht allein von der gothischen, sondern auch der alth. einrichtung. Nämlich genau wie das alth. in allen drei graden von der goth. ordnung eine
stufe abwärts gesunken ist, war bereits das goth. selbst eine stufe von der lateinischen (griech. indischen) herabgewichen. Das goth. verhält sich zum lat. gerade wie
das alth. zum goth. (Grimm 1822: 584)
Das Gleiche gilt für Rasmus Rask (1787 – 1832), der die “Lautverschiebung” bereits vor
Grimm entdeckte:
Aber nicht nur in den Endungen, auch im Wort selbst gehen vielfältige Veränderungen
vor sich. Es ist vielleicht nicht unangebracht, auf die häufigsten von diesen Übergängen
vom Griechischen und Lateinischen zum Isländischen hinzuweisen.(Rask 1818: 169)1
Ähnliche Beispiele für die Resultate des Lautwandels wie die in Tabelle
3 dargestellten lassen sich auch in den Werken von Grimm und Rask
finden. Worin besteht die grundlegende Vermengung der Resultate mit
den Phänomenen des Lautwandels in den Werken der beiden Forscher?
Ausblick
Die Unterscheidung zwischen “Wandel” und den “Resultaten des Wandels” spiegelt sich in
unterschiedlichen, grundlegenden Relationen zwischen Zeichen und Sprachen wieder. Mit
Relationen zwischen Zeichen werden wir uns in der Sitzung “Zeichenrelationen” in Block
II genauer befassen. Relationen zwischen Sprachen werden eine wichtige Rolle in den
Sitzungen “Lexikostatistik” und “Nachweis von Sprachverwandtschaft” in Block III spielen.
4 Ähnlichkeiten
Strukturelle Ähnlichkeiten und Lautkorrespondenzen
Wenn, wie die Arbeitshypothese der historischen Linguistik dies besagt, Sprachen sich
hinsichtlich ihres Lautsystems regelmäßig ändern, so muss diese regelmäßige Änderung
sich in Sprachen, die genetisch verwandt sind, in Form von Ähnlichkeiten in Lexemen widerspiegeln. Wenn bspw. eine hypothetische Sprache X die Worte [lambada] ”tanzen” und
[limbo] ”Bauch” aufweist und sich dann im Verlaufe ihrer Geschichte in zwei Tochtersprachen Y und Z aufspaltet, und in diesen Tochtersprachen beide Wörter noch erhalten sind,
dann kann man davon ausgehen, dass die Wörter in den Tochtersprachen sich zwar unterscheiden, weil sich ihre Lautgestalt gewandelt hat, sie aber dennoch strukturelle Ähnlichkeiten aufweisen. In Sprache Y könnten die Wörter bspw. als [ləmfəθ] ”feiern” und [limf]
1
Meine Übersetzung, Originaltext: “Men ikke blot i Endelserne, ogsaa i Ordene selv foregas mangfoldige
Forandringer, det vil maaskje ikke være af Vejen her at mærke sig de hyppigste af disse Overgange fra
Græsk og Latin til Islandsk.”
6
9
1 Einführung
Johann-Mattis List
Grundlagen
2012-11-30
”Wampe” erhalten sein und in Sprache Z als [rãbda] ”hüpfen” und [ri ̃bɔ] ”Magen”, wie die
folgende Abbildung zeigt:
lambada
”tanzen”
ləmfəθ
”feiern”
limbo
”Bauch”
rãbda
”hüpfen”
limf
”Wampe”
ri ̃bɔ
”Magen”
In Sprache Y hätte entsprechend Lautwandel von [a] zu [ə], von [b, d] zu [f, θ], stattgefunden, und ein Schwund von Vokalen in Endsilben. In Sprache Z hätte ein Verlust von
[m] nach Vokal mit gleichzeitiger Nasalierung des Vokals, ein Wandel von [l] zu [r], und
ein Schwund aller Vokale in Mittelsilben stattgefunden. In einem solchen Fall würden die
beiden Wörter in den beiden Tochtersprachen zwar sehr unterschiedlich aussehen, sie
würden aber strukturelle Ähnlichkeiten aufweisen, die sich am besten aufzeigen lassen,
indem man die Wörter aliniert, d.h. indem man die Segmente, die sich entsprechen, einander gegenüberstellt:
Sprache
Y
Z
Y
Z
Wort
ləmpət
rãbda
limp
ri ̃bɔ
Bedeutung
”feiern”
”hüpfen”
”Wampe”
”Magen”
Alinierung
l
ə m
r ã l
i
m
r ĩ -
f
b
f
b
ə
ɔ
θ
d
a
Wenn man sich diese Tabelle genauer anguckt, kann man sehr leicht erkennen, dass bestimmte Segmente miteinander ”korrespondieren”: obwohl sie unterschiedlich sind, so wie
[l] und [r], treten sie doch an den gleichen Stellen in den Wörtern auf, und zwar nicht nur
in einem Fall. Die Wörter sind somit strukturell ähnlich. Die Lautsegmente, die in diesen
Wörtern korrespondieren, werden Lautkorrespondenzen genannt. Wörter unterschiedlicher Sprachen, die auf eine gemeinsame Vorform in einer gemeinsamen Vorgängersprache zurückgehen, nennt man Kognaten.
Dt. <Zeh> und en. <toe> sind Kognaten, genauso wie dt. <Zahn> und
en. <tooth> und dt. <Zaun> und en. <town>. Welche Lautkorrespondenz lässt sich aufgrund der Beispiele postulieren?
Ausblick
Ähnlichkeiten zwischen Zeichen und Sprachen werden eine große Rolle in den Sitzungen
“Sequenzalinierung” und “Kognatenerkennung” in Block III spielen.
5 Beweise
Schlussverfahren
Schlussverfahren sind wichtig, um “zu einem Schluss zu kommen”, also etwas zu beweisen. Sie sind daher auch wichtig für die historische Linguistik, da diese schließlich wie
alle Wissenschaften irgendetwas beweisen will. Die drei grundlegende Schlussverfahren
Deduktion, Induktion und Abduktion lassen sich am besten unterscheiden, indem man
sie als eine Kombination von Regel, Ereignis, und ::::::::
Resultat auffasst:
7
10
Johann-Mattis List
Grundlagen
2012-11-30
Deduktion: “All bunnies have long ears, and the thing that brings the Easter eggs is a
bunny. Therefore,
the thing that brings the Easter eggs has long ears.”
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
Induktion: “The thing that brings the Easter eggs is a bunny, and :::
the::::::
thing ::::
that ::::::
brings::::
the
Easter
eggs
has
long
ears.
Therefore,
all
bunnies
have
long
ears.”
::::::::::::::::::::::::::
Abduktion: “All bunnies have long ears, and the
thing that brings the Easter eggs has
::::::::::::::::::::::::::::::::::::::::
long
ears.
Therefore,
the
thing
that
brings
the
Easter eggs is a bunny.”
:::::::::
Das abduktive Schlussverfahren wird gemeinhin als das schwächste der
drei Verfahren angesehen. Warum ist das so, und warum findet es
dennoch vor allem in historischen Wissenschaften Verwendung?
Ausblick
Mit Beweisen, Indizien und Schlussverfahren werden wir uns explizit in der Sitzung “Nachweis von Sprachverwandtschaft” in Block IV auseinandersetzen.
Literatur
Barbour, S. und P. Stevenson (1998). Variation im Deutschen. Soziolinguistische Perspektiven. Berlin: de Gruyter.
Bussmann, H., Hrsg. (1996). Routledge dictionary of language and linguistics. A. d. Deutschen übers. von G. Trauth und K. Kazzazi. London und New York: Routledge.
Coseriu, E. (1973). Probleme der strukturellen Semantik. Vorlesung gehalten im Wintersemester 1965/66 an der Universität Tübingen. Tübingen: Narr.
Goossens, J. (1973). Niederdeutsch. Sprache und Literatur. Eine Einführung. Neumünster:
Karl Wachholtz.
Grimm, J. (1822). Deutsche Grammatik. 2. Aufl. Bd. 1. Göttingen: Dieterichsche Buchhandlung. Google Books: MnsKAAAAIAAJ.
Jakobson, R. (1976 [1978]). Six lectures on sound and meaning. A. d. Französischen
übers. von J. Mepham. Mit einer Einl. von C. Lévi-Strauss. Cambridge und London: MIT
Press.
Marchal, J. H. (1975). “On the concept of a system”. English. In: Philosophy of Science
42.4, 448–468. JSTOR: 187223.
Oesterreicher, W. (2001). “Historizität, Sprachvariation, Sprachverschiedenheit, Sprachwandel”. In: Language typology and language universals. An international handbook.
Hrsg. von M. Haspelmath. Berlin und New York: Walter de Gruyter, 1554–1595.
Osthoff, H. und K. Brugmann (1878). Morphologische Untersuchungen auf dem Gebiete
der indogermanischen Sprachen. Bd. 1. Leipzig: Hirzel.
Rask, R. K. (1818). Undersögelse om det gamle Nordiske eller Islandske sprogs oprindelse [Investigation of the origin of the Old Norse or Icelandic language]. Copenhagen:
Gyldendalske Boghandlings Forlag. GoogleBooks: cWgJAAAAQAAJ; Englische Übersetzung: – (1993). Investigation of the origin of the Old Norse or Icelandic language. Übers.
von N. Ege. Travaux du Cercle Linguistique de Copenhague 26. Copenhagen: The Linguistic Circle of Copenhagen.
Saussure, F. de (1916). Cours de linguistique générale. Hrsg. von C. Bally. Lausanne:
Payot; Deutsche Übersetzung: – (1967). Grundfragen der allgemeinen Sprachwissenschaft. A. d. Französischen übers. von H. Lommel. 2. Aufl. Berlin: Walter de Gruyter &
Co.
8
11
1 Einführung
Johann-Mattis List
Historische Aspekte
2012-11-30
Historische Aspekte der historischen Sprachwissenschaft
1 Allgemeine Punkte vorweg
Sprachvergleich
Wenn man sich mit den historischen Aspekten der historischen Sprachwissenschaft befasst, so stellt sich zu allererst die Frage, was man eigentlich unter historischer Sprachwissenschaft versteht. Fasst man den Rahmen sehr eng, so beginnt die Geschichte der
historischen Sprachwissenschaft eigentlich erst ab dem 19. Jahrhundert, parallel mit der
Entwicklung der Evolutionstheorie und der Erforschung der Geschichte der Erde in der
Geologie, denn davor wurden Sprachen nicht aus einem explizit historischen Blickwinkel betrachtet. Fasst man den Rahmen weiter, so kann man die Frage nach den Wurzeln des historischen Denkens in Bezug auf Sprachen stellen, und erforschen, wie Sprachen im Laufe der Geschichte verglichen wurden, wann genau die „moderne” historische
Sprachwissenschaft begann, und worin die entscheidenden Unterschiede zur „vormodernen” Sprachforschung liegen.
In der Sprachtypologie werden Sprachen generell nicht-historisch betrachtet. Weshalb lässt sich die historische Sprachbetrachtung dennoch
auch in der synchronen Typologie nicht gänzlich ignorieren?
Periodisierung
Eine gängige grobe Periodisierung der Geschichte der historischen Sprachwissenschaft
teilt diese in drei Phasen ein: (a) Antike und Mittelalter, (b) die Zeit vom 16. bis zum 18.
Jahrhundert, und (c) den Beginn der historischen Linguistik im 19. Jahrhundert.
Was mag der Grund sein, dass gerade die Zeit vom 16. bis zum 18.
Jahrhundert als eine gesonderte Phase angesetzt wird? Am 26. Juli
1581 schlug ein Meteorit in Thüringen ein (Wikipedia: ,,1581"). Welche
weiteren ,,makrohistorischen" Ereignisse fallen in diese Zeit?
2 Antike und Mittelalter
Kein Bock auf Fremdsprachen
Die Antike, vor allem das alte Griechenland, zeichnet sich durch ein nahezu vollständiges
Desinteresse an fremden Sprachen und Sprachvergleich aus (Pedersen 1983: 10, Robins
1973: 5). Etymologische Betrachtungen wurden zuweilen angestellt, waren jedoch meist
mit der Absicht verbunden, die „wahre” Bedeutung der Wörter zu finden (Diderichsen 1974:
278-280), und nicht mit einem Interesse an der Bedeutungsentwicklung sprachlicher Zeichen an sich.
Woran mag es liegen, dass die so geistverliebten Griechen und Römer kein Interesse zeigten, sich mit dem Vergleich von Sprachen zu
befassen?
1
12
Johann-Mattis List
Historische Aspekte
2012-11-30
Die physei-thesei-Debatte
Grundlage der physei-thesei-Debatte, die ausführlich in Platons Krátylos beschrieben wird,
ist die Frage nach der Beziehung von Zeichenform und Zeichenbedeutung. Der grundsätzliche Streitpunkt der physei-thesei-Debatte ist dabei, ob die Struktur der Sprache durch die
Natur (altgr. φύσει physei) oder durch die Konvention (altgr. θέσει, thesei) bestimmt sei. Die
Beantwortung dieser Frage hat unmittelbare Folgen für die Etymologie: Wenn die Beziehung zwischen Bezeichnendem und Bezeichnetem natürlich ist, so stellt die ursprüngliche
Bedeutung der Wörter deren „wahre” Bedeutung dar. Die Etymologie könnte also also den
wahren Kern eines Wortes enthüllen. Wenn die Beziehung nicht natürlich ist, so sollte sie
schleunigst aus allen Diskussionen verbannt werden, in denen die „wahre Bedeutung” als
Argument für eine bestimmte Überzeugung angeführt wird.
Es heißt oft, die physei-thesei-Debatte wurde in gewisser Weise
von Ferdinand de Saussure (1857 -- 1913) wieder aufgegriffen, als
er sein berühmtest Postulat von der `Arbitrarität des sprachlichen
Zeichens' machte, und der Debatte zugunsten der `Konvention' ein
Ende bereitete. Unten sind zwei Zitate, eins von Saussure selbst,
und eins von Roman Jakobson (1896 -- 1982) abgedruckt. Bestätigen
diese Zitate die Behauptung, dass Saussure sich ausnahmslos auf die
Seite der `Konventionalisten' geschlagen habe?
Das Wort beliebig erfordert hierbei eine Bemerkung. Es soll nicht die Vorstellung erwecken, als ob die Bezeichnung von der freien Wahl der sprechenden Person abhinge
[...]; es soll besagen, daß es unmotiviert ist, d.h. beliebig im Verhältnis zum Bezeichneten, mit welchem es in Wirklichkeit keinerlei natürliche Zugehörigkeit hat. (Saussure
1916: 80)
Der Zusammenhang zwischen einem signans und einem signatum, den Saussure
willkürlicherweise arbiträr nennt, ist in Wirklichkeit eine ge- wohnheitsmäßige, erlernte Kontiguität, die für alle Mitglieder der gegebenen Sprachgemeinschaft obligat ist.
Aber neben dieser Kontiguität behauptet sich auch das Ähnlichkeitsprinzip, la ressemblance. [Dieses] Prinzip [spielt] eine gewaltige Rolle in der Frage der Derivation,
in der Frage der Wortsippen, wo die Ähnlichkeit der Wörter einer gemeinsamen Wurzen so entscheidend ist, und wo man schon gang und gar nicht mehr vom Willkürlichen
sprechen darf. (Jakobson 1962[1971]: 272f)
Das hebräische Paradigma
Die Verbreitung des Christentums führte zur Literalisierung vieler bis dahin nicht verschriftlichter Sprachen und weckte damit auch allmählich das Interesse der Europäer an diesen
Sprachen (Pedersen 1972: 4). Die Verbreitung des Christentums führte gleichzeitig dazu,
dass das Hebräische entsprechend der biblischen Geschichte von Turmbau zu Babel als
die älteste Sprache, oder „Mutter aller Sprachen”angesehen wurde (Arens 1955: 72-80,
Klein 1999, Klein 2004).
Unten ist ein Zitat aus Isidors Etymologiae sive origines wiedergegeben, dass als frühes Beispiel für das ,hebräische Paradigma'
dienen kann. Inwiefern mag Isidors Argumentation typisch sein für
die damalige Zeit?
„Die lateinischen und griechischen Buchstaben sind offensichtlich aus den Griechischen entstanden. Dort nämlich steht das Aleph an erster Stelle. Aus diesem wurde
2
13
1 Einführung
Johann-Mattis List
Historische Aspekte
2012-11-30
dann aufgrund ähnlicher Aussprache von den Griechen das Alpha abgeleitet, und daraufhin von den Lateinern das A. Der Übersetzer hat nämlich aufgrund des ähnlichen
Klangs der anderen Sprache die Buchstaben erschaffen, woraus ersichtlich wird, dass
die hebräische Sprache die Mutter aller Sprachen und Schriften ist.” (Etymologiae:
1.3.4) 1
Sprachbeziehungen
Während vor dem Beginn der historischen Linguistik eine genealogische Perspektive auf
Sprachbeziehungen nur sporadisch angenommen wurde, waren sich die Gelehrten recht
früh der Tatsache bewusst, dass Sprachen einander auf weit andere Art beeinflussen können. Dies ist sicherlich der Tatsache geschuldet, dass die Folgen von Sprachkontakt sehr
viel einfacher zu erkennen sind als die Folgen von Sprachverwandtschaft, nicht nur für diejenigen, die sich besonders für Sprachen interessieren, sondern auch für die „normalen”
Sprecher, die in Kontakt mit Sprechern anderer Sprachen sind. Ähnlichkeiten zwischen
Sprachen als Folge von Sprachkontakt und nicht als Folge von genetischer Sprachverwandtschaft anzusehen, war eine Perspektive, die von der Mehrheit der Gelehrten in der
Antike bis hinein ins Mittelalter eingenommen wurde (Allen 1953: 57). Sprachbeziehungen
wurden also weitestgehend als derivationell angesehen.
Was mag der Grund sein, dass derivationelle Sprachbeziehungen problemlos von Gelehrten erkannt und anerkannt wurden, während man
genealogische Beziehungen meist ignorierte? Inwiefern können die
beiden unten wiedergegebenen Zitate in diesem Zusammenhang als
,typisch' für antikes Denken bezeichnet werden?
Ich denke nämlich, daß die Hellenen, zumal die in der Nähe der Barbaren wohnenden, gar viele Worte von den Barbaren angenommen haben. [...] Wenn nun einer aus
der hellenischen Sprache erklären will, inwiefern diese mögen richtig gebildet sein,
und nicht aus jener, der das Wort wirklich angehört, so siehst du wohl, daß er nichts
schaffen wird. (Krátylos: 409d-e)
In continuation, that I may follow the course which I prescribed to myself, let me repeat
that words are either Latin or foreign. Foreign words, like men, and like many of our
institutions, have come to us, I might almost say, from all nations. [...] But this division
of mine is intended to refer chiefly to the Greek language, for it is from thence that
the Roman language is, in a very great degree, derived, and we use even pure Greek
words where our own fail, as they also sometimes borrow from us. (Institutio oratoria:
I.5.55-58)
3 Vom 16. bis zum 18. Jahrhundert
Sprachvergleich
Ab dem 16. Jahrhundert wurden erste Grammatiken semitischer Sprachen in Europa veröffentlicht. Hebräisch wurde dadurch neben Latein und Griechisch zur dritten Gelehrtensprache. Beflügelt durch das durch die Erfindung der Druckkunst rasch anwachsende grammatische und lexikalische Sprachmaterial (Pedersen 1972: 6), versuchten viele Forscher nun
1
Meine Übersetzung, Originaltext: „Litterae Latinae et Graecae ab Hebraeis videntur exortae. Apud illos enim
prius dictum est aleph, deinde ex simili enuntiatione apud Graecos tractum est alpha, inde apud Latinos
A. Translator enim ex simili sono alterius linguae litteram condidit, ut nosse possimus linguam Hebraicam
omnium linguarum et litterarum esse matrem.”
3
14
Johann-Mattis List
Historische Aspekte
2012-11-30
auch, den etymologischen Nachweis für das Alter des Hebräischen und die Abstammung
aller Sprachen von diesem zu erbringen.
Begriffe aus der hebräischen Grammatik beeinflussten auch die Sprachforschung. So
scheint auch das Konzept der „Wurzel”, dem als Vergleichsgegenstand in der historischvergleichenden Sprachwissenschaft nach wie vor zentrale Bedeutung zukommt, auf die
Erforschung der semitischen Sprachen und der traditionellen semitischen Grammatiken
zurückzugehen (Campbell und Poser 2008: 95).
Die Art und Weise, wie der Nachweis der Verwandtschaft des Hebräischen mit allen
anderen erbracht wurde, war allerdings – aufgrund der Tatsache, dass er ja durch die biblische Geschichte ohnehin schon „bewiesen”war – noch sehr weit von dem entfernt, was
man heutzutage wissenschaftlich nennen würde. Einzelne Wörter wurden aus Wortlisten
herausgepickt und verglichen, wobei meist schon eine geringe Ähnlichkeit Vokalen und
Konsonanten ausreichte, um die These der Sprachenharmonie als bestätigt anzusehen.
Unten sind einige beispielhafte Zitate zu Wortvergleichen, sowie
Wortvergleiche selbst in Tabellen wiedergegeben. In der vorherigen
Sitzung wurden kurz Beispiele für ,richtige' Wortvergleiche gegeben.
Worin besteht der grundlegende Unterschied?
Hebräisch
ʔēm
māḥār
Deutsch
Am
Morn
Bedeutung
„Mutter”
[E]inige hebräische Wörter sind (auch) in unserer deutschen Sprache verblieben. (Münster 1523: 27f) 2
Was die Ableitung der Wörter durch Addition, Subtraktion, Transposition und Inversion
der Buchstaben anlangt, so steht fest, dass man so verfahren kann und muss, wenn
wir bedenken, dass die Hebräer von rechts nach links schreiben und die Griechen und
die übrigen von links nach rechts. (Guichard 1606, zitiert nach Arens 1955: 76)
Webb-Chinesisch
keûen
niu gin
yuen xue
Mittelchinesisch
kʰwen²
ɳjo²-ȵin
ŋjon³-ɣæwk
Griechisch
kūōn
gunē
fa-iēn
Bedeutung
„Hund”
„Frau”
„wollen (lernen, sprechen)”
But was not γυνη compounded of niu gin under the customary licence of transposition?
(Webb 1787: 50)
Die Skythenhypothese
Im Zuge der etymologischen Forschungen unter dem hebräischen Paradigma stießen verschiedene Forscher zwangsläufig auch auf “tatsächliche” Ähnlichkeiten zwischen den europäischen Sprachen. Es war in bewisser Weise also nur eine Frage der Zeit, bis die Forscher bemerken sollten, dass auch ohne abstruse Vergleiche auffällige Ähnlichkeiten zwischen verschiedenen Sprachen entdeckt werden konnten, die weit zwingender waren, als
die Vergleiche mit dem Hebräischen. Die Skythenhypothese (vgl. insbes. Metcalf 1974:
234-240, Muller 1986: 9-12, Campbell und Poser 2008: 18-23), die in diesem Zusammenhang besondere Beachtung verdient, kann dabei als Vorläufer der “IndogermanenHypothese” angesehen werden.
2
Meine Übersetzung, Originaltext: „[...] aliquot Hebraeas voces in nostram Germanicam receptas esse linguam.”
4
15
1 Einführung
Johann-Mattis List
Historische Aspekte
2012-11-30
Im unten wiedergegebenen Zitat wird der Skythenhypothese ein
,abstrakter' Charakter zugewiesen. Lässt sich der Grund für
diese Argumentation aus dem Zitat selbst erschließen? Wenn
ja, worin besteht er? Wenn nein, worin könnte er bestehen?
Since the early 17th century there had been formulated, first in the Netherlands, a
theory of the common origin of the main languages of Europe from the somewhat
mythical language of the Scythians. This principle of a linguistic unity of the European
languages, classical and modern, reaching far into the East, soon gained the abstract
character of a prototype.(Muller 1986: 10)
4 Der Beginn der historischen Linguistik
Lautkorrespondenzen
Lautkorrespondenzen zwischen miteinander verwandten Sprachen wurden bereits vor dem
19. Jahrhundert für eine Reihe von Sprachen entdeckt. Ihre Bedeutung für den Nachweis
von Sprachverwandtschaft erlangten sie jedoch erst durch die Werke von Jacob Grimm
(1785 – 1863, vgl. Grimm (1822)), und Rasmus Rask (1787 – 1832, vgl. Rask 1818) zu Beginn des 19. Jahrhunderts. Mit den Lautkorrespondenzen ist gleichzeitig ein Übergang von
einer auf oberflächlichen Ähnlichkeiten beruhenden „phänotypischen” Betrachtungsweise
hin zu einer „genotypischen” Betrachtungsweise von Kognaten verbunden (vgl. Lass 1997:
130). Dies heißt, dass Ähnlichkeit nicht mehr als Kriterium für das Auffinden von kognaten
Wörtern in miteinander verwandthen Sprachen verwendet wird, sondern Regelmäßgkeit
der Korrespondenz.
Das unten wiedergegebene Zitat zur Wichtigkeit der Regelmäßigkeit der Lautkorrespondenzen ist in seiner Radikalität typisch, auch für heutige historische Linguistik. Worin besteht die
Radikalität, und warum wird sie von vielen historischen Linguisten
befürwortet?
Das bedeutet, dass bei Vergleichen der Form und bedingt der Vorzug gegeben werden
muss. Wenn zwei Formen sich genau - oder den Regeln nach - entsprechen, wiegt das
auch gewisse Abweichungen in der Bedeutung auf. Szemerényi 1970: 15f
Bäume und Sterne
Nach Jacob Grimm und Rasmus Rask war August Schleicher (1821 – 1868) eine der
einflussreichsten Persönlichkeiten der Linguistik des 19. Jahrhunderts. Er prägte durch
seine Arbeiten wie kein anderer den wissenschaftlichen Stil der Forschung in der historischen Sprachwissenschaft. Schleicher entwickelte das Verfahren der linguistischen
Rekonstruktion, indem er Protoformen an die Stelle von Lautkorrespondenzen setzte und damit die „Grundlosigkeit der noch immer nicht ganz verschollenen Annahme,
daß auch die nicht indischen indogermanischen indogermanischen Sprachen vom altindischen (Sanskrit) abstammen” (Schleicher 1861[1866]: 8) untermauerte. Schleicher etablierte die neue Fassung der Verwandtschaftsmetapher, die ihren Ausdruck in dem berühmten Stammbaummodell fand, welches er erstmals im Jahr 1853 publizierte (Schleicher 1853a, Schleicher 1853b).
5
16
Johann-Mattis List
Historische Aspekte
2012-11-30
Für Schleichers Ansichten finden sich oben viele Zitate. Welche
Überschrift könnte man jedem von diesen am besten geben,
und wie könnte man Schleichers Auffassung von "Vererbung",
"Wandel" und "Ursprung" charakterisieren?
Der Verfall ist wirklich ein allmählicher wie die geschichtliche Entwicklung, er ist in
Perioden theilbar, wie diese, je nach dem grösseren oder geringeren Grade der Entfernung vom Ursprünglichen und er verläuft bei allen Sprachen in analoger Weise,
wie die Geschichte. Aus letzterem Satze folgt die Möglichkeit und der Vortheil einer
vergleichenden Behandlung der Sprachengeschichte. (Schleicher 1848: 25)
Dennoch würde es eben so falsch sein das Lettische eine slawische Sprache zu nennen, als das Ossetische mit den Mingrelischen, Suarischen, u.s.w. zu einer Klasse zu
rechnen. Dass dergleichen Färbungen von einer zur anderen Sprache sich verpflanzen
können, scheint daher durch die Erfahrung gerechtfertigt und ist auf diese Erscheinung
bei der Eintheilung der Sprachen gebührende Rücksicht zu nehmen. (ebd.: 30)
Das Wichtigste und Entscheidende aber ist, dass das Ossetische die das Iranische
charakterisierenden, es von den andern indogermanischen Familien unterscheidenden
Lautgesetze aufzuweisen hat. (ebd.: 67)
Von Sprachsippen, die uns genau bekannt sind, stellen wir eben so Stammbäume auf,
wie diess Darwin (S. 121) für die Arten von Pflanzen und Thieren versucht. (Schleicher
1863: 14)
Abbildung 1: Sprachstammbäume in Schleicher (1853a und 1853b)
Literatur
Allen, W. S. (1953). “Relationship in comparative linguistics”. In: Transactions of the Phylological Society, 52–108.
Arens, H. (1955). Sprachwissenschaft. Der Gang ihrer Entwicklung von der Antike bis zur
Gegenwart. Freiburg: Alber.
6
17
1 Einführung
Johann-Mattis List
Historische Aspekte
2012-11-30
Campbell, L. und W. J. Poser (2008). Language classification: History and method. Cambridge: Cambridge University Press.
Diderichsen, P. (1974). “The foundation of comparative linguistics: Revolution or Continuation?” In: Studies in the history of linguistics: Traditions and paradigms. Hrsg. von D. H.
Hymes. Indiana University studies in the history and theory of linguistics. Bloomington:
Indiana University Press, 277306.
Grimm, J. (1822). Deutsche Grammatik. 2. Aufl. Bd. 1. Göttingen: Dieterichsche Buchhandlung. Google Books: MnsKAAAAIAAJ.
Guichard, E. (1606). L’Harmonie etymologique des Langues: HebraiÌ�que, ChaldaiÌ�que,
Syrique, Greque, Harmonie étymologique des langues hébrai’que, chaldai’que, syriaque,
grecque, latine, francoise, italienne, espagnole, allemande, flamande, angloise, où se
démontre que toutes les langues sont descendues de l’hébraïque. Paris: Le Noir.
Jakobson, R. (1962 [1971]). Zeichen und System der Sprache. Diskussionsbeitrag. In:
Selected writings. Bd. 2: Word and language. Berlin: Mouton, 272–279.
Klein, W. P. (1999). “Die ursprüngliche Einheit der Sprachen in der philologisch-grammatischen Sicht der frühen Neuzeit”. In: The Language of Adam. Proceedings of a conference
held at the Herzog August Bibliothek (Wolfenbüttel, 30.–31. Mai 1995). Hrsg. von A. P.
Coudert. Wolfenbütteler Forschungen 84. Wiesbaden: Harrassowitz, 25–56.
– (2004). “Was wurde aus den Wörtern der hebräischen Ursprache? Zur Entstehung der
komparativen Linguistik aus dem Geist etymologischer Spekulation”. In: Gottes Sprache
in der philologischen Werkstatt. Hebraistik vom 15. bis zum 19. Jahrhundert. Tagungsbericht der Tagung “Die Geburt der Philologie aus dem Geist der Hebraistik” (Wittenberg,
6.–6. Okt. 2002). Hrsg. von G. Veltri und G. Necker. Studies in European Judaism 11.
Leiden: Brill, 3–23.
Lass, R. (1997). Historical linguistics and language change. Cambridge: Cambridge University Press.
Metcalf, G. J. (1974). “The Indo-European hypothesis in the sixteenth and seventeenth
centuries”. In: Studies in the history of linguistics: Traditions and paradigms. Hrsg. von D.
H. Hymes. Indiana University studies in the history and theory of linguistics. Bloomington:
Indiana University Press, 233–257.
Muller, J.-C. (1986). “Early stages of language comparison from Sassetti to Sir William
Jones (1786)”. In: Kratylos 31, 1–31.
Münster, S. (1523). Dictionarium Hebraicum, nunc primum editum et typis excusum, adiectis Chaldaicis vocabulis non parum multis. Latin. apud Frobenium. Gallica: ark:/12148/
bpt6k929970.
Pedersen, H. (1972). The discovery of language. Linguistic science in the nineteenth century. 5. print. Bd. 40. Indiana University studies in the history and theory of linguistics.
Bloomington: Indiana University Press.
– (1983). A Glance at the History of Linguistics, with Particular Regard to the Historical
Study of Phonology. John Benjamins.
Englische Übersetzung: Rask, R. K. (1993). Investigation of the origin of the Old Norse or
Icelandic language. Übers. von N. Ege. Travaux du Cercle Linguistique de Copenhague
26. Copenhagen: The Linguistic Circle of Copenhagen.
Robins, R. H. (1973). “The history of language classification”. In: Diachronic, areal and
typological linguistics. Hrsg. von H. M. Hoenigswald und R. H. Langacre. Current Trends
in Linguistics 11. The Hague und Paris: Mouton, 3–41.
Saussure, F. de (1916). Cours de linguistique générale. Hrsg. von C. Bally. Lausanne:
Payot; Deutsche Übersetzung: – (1967). Grundfragen der allgemeinen Sprachwissen-
7
18
Johann-Mattis List
Historische Aspekte
2012-11-30
schaft. A. d. Französischen übers. von H. Lommel. 2. Aufl. Berlin: Walter de Gruyter &
Co.
Schleicher, A. (1848). Zur vergleichenden Sprachengeschichte. Bonn: König.
– (1853a). “Die ersten Spaltungen des indogermanischen Urvolkes”. In: Allgemeine Monatsschrift für Wissenschaft und Literatur, 786–787.
– (1853b). “O jazyku litevském, zvlástě na slovanský. Čteno v posezení sekcí filologické
král. České Společnosti Nauk dne 6. června 1853.” In: Časopis Čsekého Museum 27,
320–334.
– (1863). Die Darwinsche Theorie und die Sprachwissenschaft. Offenes Sendschreiben
an Herrn Dr. Ernst Haeckel. Weimar: Hermann Böhlau. ZVDD: urn:nbn:de:bvb:12bsb10588615-5.
– (1861 [1866]). Compendium der vergleichenden Grammatik der indogermanischen Sprache. I: Kurzer Abriss einer Lautlehre der indogermanischen Ursprache, des Altindischen
(Sanskrit), Alteranischen (Altbaktrischen), Altgriechischen, Altitalischen (Lateinischen,
Umbrischen, Oskischen), Altkeltischen (Altirischen), Altslawischen (Altbulgarischen), Litauischen und Altdeutschen (Gotischen). 2. Aufl. Weimar: Böhlau.
Szemerényi, O. (1970). Einführung in die vergleichende Sprachwissenschaft. Darmstadt:
Wissenschaftliche Buchgesellschaft.
Webb, D. (1787). Some reasons for thinking, that the Greek language was borrowed from
the Chinese. In: Notes on the Grammatica Sinica of Mons. Fourmont. London: Dodsley.
Wikipedia. Wikipedia. The Free Encyclopedia. URL: http : / / en . wikipedia . org;
Deutsche Ausgabe: Wikipedia. Die freie Enzyklopädie. URL: http://de.wikipedia.
org.
Quellen
Etymologiae
Institutio oratoria
Krátylos
Etymologiae sive origines [Etymologies or origins] (ca. 623 n. Chr.).
Von Isidorus Hispalensis (ca. 560–636 n. Chr.); Kritische Edition: W.
M. Lindsay, Hrsg. und Komm. (1911). Isidori Hispalensis episcopi etymologiarvm sive originvm libri XX [The twenty books on the origins and
etymologies of the bishop IsidorusHispalensis]. Bd. 1: Libri I-XX [Books
1 - 10]. Scriptorum classicorum bibliotheca Oxoniensis. Oxford: Clarendon Press.
Institutio oratoria [Institutes of oratory] (ca. 95 n. Chr.). Von Quintilian
(35–100); Englische Übersetzung: Quintilian (2006). Institutes of oratory. Hrsg. von L. Honeycutt. Übers. von J. S. Watson. Iowa. URL: http:
//honeyl.public.iastate.edu/quintilian/.
Krátylos (nach 399 v. Chr.). Von Plátōn (424–348 v. Chr.); Englische
Übersetzung: Cratylus (1921). In: Plato in twelve volumes. Bd. 4: Cratylus. Parmenides. Greater Hippias. Lesser Hippias. Aus dem Griechischen übers. von H. N. Fowler. London: William Heinemann Ltd.; Deutsche Übersetzung: Kratylos (2001). In: Platon. Werke in acht Bänden.
Griechisch und Deutsch. Bd. 3: Phaidon. Das Gastmahl. Kratylos. Hrsg.
von G. Eigler. Bearb. von D. Kurz. Griechischer Text von L. Robin und L.
Méridier. Aus dem Griechischen übers. von F. Schleiermacher. Darmstadt: Wissenschaftliche Buchgesellschaft.
8
19
1 Einführung
Johann-Mattis List
2012-11-30
Übungen
Übungen
In der Tabelle unten sind Wörter aus dem Deutschen und
dem Niederländischen mit gleicher, bzw. ähnlicher, Bedeutung
in allgemeiner Orthographie und in IPA-Transkription wiedergegeben. Versuche, die Wörter in der Tabelle zu alinieren.
Sprache
Wort
Bedeutung
IPA
Alinierung
dt.
ndl.
Apfel
appel
”Apfel”
”Apfel”
ap͡fəl
ɑpəl
dt
ndl.
Pflug
ploeg
”Pflug”
”Pflug”
dt
ndl.
Zunge
tong
”Zunge”
”Zunge”
dt
ndl.
dt
ndl.
dt
ndl.
zu
toe
tun
doen
Tochter
dochter
”zu”
”zu”
”tun”
”tun”
”Tochter”
”Tochter”
p͡fluːk
pluːx
t͡sʊŋə
tɔŋ
t͡suː
tuː
tuːn
duːn
tɔxtər
dɔxtər
Aus den oben vorgenommenen Alinierungen lassen sich gewisse
Lautkorrespondenzen erschließen. Nutze die Erkenntnisse, die
aus den Daten in der obigen Tabelle gewonnen werden können,
um die korrespondierenden Elemente in der Tabelle unten zu
ergänzen. Wenn man nun annimmt, dass jeweils eine der Formen
,ursprünglicher' ist als die anderen, sich also im Verlaufe der
Geschichte weniger verändert hat, welche ist dies wohl? Trage
diese Form in der Spalte ,Rekonstrukt' ein.
dt.
p͡f
t͡s
ndl.
<=>
<=>
<=>
<=>
Rekonstrukt
uː
d
Nutze das aus der Alinierung der Wörter und der Erschließung
der Lautgesetze gewonnene Wissen, um die fehlenden Wörter
in der Tabelle zu ergänzen. Dt. <ei> entspricht dabei ndl. <ij>
[ɛɪ].
Dt.
IPA
Kampf
Pfeife
kamp͡f
p͡faɪfə
Ndl.
IPA
tal
pal
tɑl
pɑl
1
20
2 Wandel und Relationen
In diesem Block werden Grundlagen zum Wandel von Zeichensystemen und daraus resultierende Relationen zwischen Zeichensystemen besprochen.
21
2 Wandel
und Relationen
Johann-Mattis
List
Zeichenwandel
11.01.2013
Zeichenwandel
1 Sprachwandel
Reim dich oder ich fress dich...
Dass Sprachen sich im Laufe ihrer Geschichte verändern können, war keine notwendige
Entdeckung, welche die Gelehrten im Laufe der Geschichte machen mussten. Dies gilt
insbesondere für die sich weniger offensichtlich verändernden Bereiche der Sprache, wie
bspw. die Laute. Die folgende Tabelle gibt ein Beispiel für die Folgen des Lautwandels:
Das chinesische Gedicht, entnommen aus dem Buch der Oden (ca. 1050–600 v. Chr.,
Shījīng: 28.3) und wiedergegeben in moderner Pīnyīn-Transliteration mitsamt einer Übersetzung von Bernhard Karlgren 1950, reimt nicht durchgängig in allen Reimwörtern, die
grau unterlegt sind.
燕
yān
之
zhī
瞻
zhān
燕
yān
子
zǐ
望
wàng
于
yú
于
yú
弗
fú
飛,
fēi
歸,
guī,
及,
jí,
下
xià
遠
yuǎn
實
shí
上
shàng
送
sòng
勞
láo
其
qí
于
yú
我
wǒ
音。
yīn
南。
nán
心。
xīn
The swallows go flying, falling and
rising are their voices;
This young lady goes to her new home,
far I accompany her to the south.
I gaze after her, can no longer see her,
truly it grieves my heart.
Angesichts der Tatsache, dass zwischen der ursprünglichen Fassung des Gedichts und
der jetzigen Form über 2000 Jahre vergangen sind, ist dies nicht verwunderlich. Für chinesische Gelehrte war es jedoch lange Zeit nicht die offensichtlichste Erklärung, warum
die alten Gedichte zuweilen komische Reime aufwiesen. So wurden die komischen Reime
zunächst alternativ erklärt als Folge von
a) laxen Reimkonventionen der Vorfahren (Baxter 1992: 153-157), oder
b) von sogenannten „Lautharmonisierungen” (xiéyīn 叶 音), welche die Vorfahren aus
ästhetischen Gründen vorgenommen hätten (ebd.).
Ohne irgendeine Vorstellung von Sprachwandel zu haben, begannen die chinesischen
Gelehrten die verschiedenen „komischen” Reime zu systematisieren. Das Ergebnis waren erste Rekonstruktionen eines – wenn auch nicht als solchen erkannten – abstrakten
Systems der Reime des Altchinesischen. Erst der chinesische Gelehrte Chén Dì (1541 –
1606) stellte die Hypothese auf, dass die komischen Reime tatsächlich eine Folge von
Sprachwandel seien:
The writings of scholars must be made of adequate sounds. Even in the rural
areas everybody orders the sounds harmonically. Can it be that the ancients
solely did not have rhymes? One can say that in the same way in which ancient
times differ from modern times, and places in the North differ from places in the
South, characters change and sounds shift. This is a natural tendency. Therefore, it is inevitable that reading the ancient writings with modern pronunciation
will sound improper and wrong. (Máoshī Gǔyīnkǎo: 原序)1
In China entdeckte man den Sprachwandel recht spät, wie sah es im
Westen aus?
1
Meine Übersetzung, Original: 故士人篇章,必有音節,田野俚典,亦名諧聲,豈以古人之詩而獨無韻乎?蓋
時有古今, 地有南北,字有更革,音有轉移,亦埶所必至。故以今之音讀古之作,不免乖剌而不入。
1
22
Johann-Mattis List
Zeichenwandel
11.01.2013
Wandel und Regelmäßigkeit
Während den Menschen im Verlaufe der Geschichte bereits relativ lange bewusst war,
dass Sprachen sich ändern können, war es eine radikal neue Erkenntnis, die sich zu
Beginn des 19. Jahrhunderts herauskristallisierte, dass Sprachen sich in Prozessen ändern, von denen bestimmte sogar regelmäßig verlaufen können. Mit der Entdeckung der
Regelmäßigkeit einher festigte sich ebenfalls die Erkenntnis, dass Sprachen miteinander
verwandt sein können, wobei Verwandtschaft von Sprachen dadurch definiert ist, dass
miteinander verwandte Sprachen aus einer gemeinsamen Vorgängersprache entstanden
sind, wie bspw. das Englische und das Deutsche, die beide aus dem Protogermanischen
hervorgegangen sind.
Warum ist die "Entdeckung der Regelmäßigkeit" so wichtig für
das Postulieren von Verwandtschaftsbeziehungen zwischen Sprachen (oder ist sie das überhaupt?)?
2 Lautwandel
Wandel als Gesetz
Rufen wir uns zunächst noch mal in Erinnerung, was die These der Junggrammatiker in
Bezug auf den Lautwandel war:
Aller lautwandel, soweit er mechanisch vor sich geht, vollzieht sich nach ausnahmslosen gesetzen, d.h. die richtung der lautbewegung ist bei allen angehörigen einer
sprachgenossenschaft, ausser dem Fall, dass dialektspaltung eintritt, stets dieselbe,
und alle wörter, in denen der der lautbewegung unterworfene laut unter gleichen verhältnissen erscheint, werden ohne ausnahme von der änderung ergriffen. (Osthoff und
Brugmann 1878: XIII)
Wang (1969) trifft, wie
zwischen verschiedenen
dieses Zitat aus, die
bestimmen? Begründe
Text.
wir inzwischen wissen, die Unterscheidung
Perspektiven auf den Lautwandel. Reicht
junggrammatische Position eindeutig zu
Deine Meinung mit Rückgriff auf den
Von Wörtern und Geschichten
Nicht alle Linguisten waren der Meinung der Junggrammatiker. Besonders Dialektologen
folgten dem berühmten Slogan „chaque mot a son histoire” („jedes Wort hat seine Geschichte”), der gewöhnlich Jules Gilliéron (1854 – 1926) zugeschrieben wird (Campbell
1998: 189). Die Bedenken der Dialektologen standen jedoch strengenommen nicht direkt
im Widerspruch zur junggrammatischen Doktrin, schließlich besagte die junggrammatische Theorie ja nicht, dass sich zwangsläufig alle Wörter einer Sprache regelmäßig änderten, sondern lediglich, dass idiosynkratischer Wandel „could be accounted for [...] by certain
less obvious mechanisms of borrowing and analogy” (Kiparsky 1988: 368). Dennoch begann die linguistische Gemeinschaft sich zu spalten, während die Diskussion selbst in eine
Sackgasse geraten war, da keines der beiden Lager vollkommen überzeugende Argument
für sich in Anspruch nehmen konnte.
Was meint Herr Kiparsky in diesem Zusammenhang mit "Analogie"?
2
23
2 Wandel
und Relationen
Johann-Mattis
List
Zeichenwandel
11.01.2013
Von der Diffusion
Die Situation änderte sich erst in den 60er Jahren des 20. Jahrhunderts, als neue Forschungen – die vorwiegend im Bereich der chinesischen Dialekte stattfanden – zur Beschreibung eines neuen Wandelmechanismus führten, der gewissermaßen das Gegenteil
der junggrammatischen Hypothese darstellte. Diese nämlich hattne angenommen, dass
Lautwandel lexikalisch abrupt und phonetisch graduell verläuft:
Regarding the lexicon [they assumed] that a change always affects the whole lexicon,
and can therefore be seen as an abrupt change. Regarding the sounds [they assumed] that the change proceeded step by step, and can therefore be seen as a gradual
change. (Wang 2006: 109) 2
Die Ergebnisse der chinesischen Dialektologen jedoch legten den Schluss nahe, dass
ein bestimmter Mechanismus des Lautwandels, der später lexikalische Diffusion genannt
wurde, genau umgekehrt verläuft, nämlich lexikalisch graduell und phonetisch abrupt:
Phonological change may be implemented in a manner that is phonetically abrupt but
lexically gradual. As the change diffuses across the lexicon, it may not reach all the
morphemes to which it is applicable. If there is another change competing for part of
the lexicon, residue may result. (Wang 1969: 9)
Die folgende Tabelle gibt ein Beispiel für die Phänomene der lexikalischen Diffusion. Die
Tabelle listen Zeichenpaare mit identischer mittelchinesischer Lesung (ca. 600 n. Chr.),
die mit ihren modernen Reflexen im Shuangfeng Dialekt, der zur Gruppe der Min-Dialekte
gehört, kontrastiert worden sind.
Character
步
捕
刨
跑
盜
導
Pīnyīn
bù
bǔ
páo
páo
dào
dǎo
Meaning
„to walk”
„to grasp”
„to dig”
„to scrape”
„to rob”
„to lead”
Middle Chinese
bo³
bo³
bæw¹
bæw¹
daw³
daw³
Shuāngfēng
bu³³
pʰu²¹
bə³³
pʰə²¹
də³³
tʰə³⁵
Warum sind die mittelchinesischen Zeichenlesungen mit ihren Reflexen im Shuangfeng-Dialekt ein Beispiel für lexikalische Diffusion? Wie könnten die Beispiele alternativ erklärt werden?
In Dubio pro Diffusione
Als Einzelfall sind Beispiele wie die in der Tabelle oben nur Beispiele für wie auch immer
motivierten „irregulären” Lautwandel, die leicht mit Hilfe externer Faktoren erklärt werden
können. Dies scheint im Shangfeng-Dialekt jedoch nicht der Fall zu sein, wie eine umfangreiche Studie Chen (1972) der 616 Zeichen, deren Lesung im Mittelchinesischen einen stimmhaften Initial aufwies, zeigt: Zwar zeigen sich viele Beispiele für die Prozesse
der Anlautverhärtung (devoicing) und Aspiration der stimmhaften Initiale, jedoch gibt es
ebenfalls viele Fälle, in denen die stimmhaften Initiale bewahrt wurden. Dies spricht eher
für eine Tendenz hin zur Anlautverhärtung und Aspiration im Shuangfeng-Dialekt, denn für
2
Meine Übersetzung, Original: „作為詞彙,要變就都變,因而是一種突變。作為語音,變化是逐漸的,因而
是一種漸變”.
3
24
Johann-Mattis List
Zeichenwandel
11.01.2013
ein ausnahmsloses Gesetz. Eine derartige Tendenz kann recht gut erklärt werden, wenn
man annimmt, dass Lautwandeln nicht notwendigerweise das ganze Lexikon simultan erfasst, sondern in unterschiedlichen Geschwindigkeiten von Wort zu Wort „springt”:
When a phonological innovation enters a language it begins as a minor rule, affecting
a small number of words [...]. As the phonological innovation gradually spreads across
the lexicon, however, there comes a point when the minor rule gathers momentum and
begins to serve as a basis for extrapolation. At this critical cross-over point, the minor
rule becomes a major rule, and we would expect diffusion to be much more rapid. The
change may, however, reach a second point of inflection and eventually taper off before
it completes its course, leaving behind a handful of words unaltered.
Ist die lexikalische Diffusion eine notwendige Schlussfolgerung
aus den Daten?
Tertium datur
Die lexikalische Diffusion ist dem junggrammatischen Lautwandelkonzept nicht nur in chronologischer Hinsicht entgegengesetzt, sondern greift auch dessen wichtigste Implikation
für die linguistische Rekonstruktion an: Lautwandel verläuft der Theorie zufolge nicht ausnahmslos. Während einige Forscher dar- aufhin die junggrammatische „Hypothese” vollständig verwarfen, wies Labov (1981) jedoch nach, dass bestimmte Formen von Lautwandel phonologisch graduell und lexikalisch einheitlich verlaufen, dass also lexikalische
Diffusion und „junggrammatisches Lautgesetz” zwei verschiedene Mechanismen von Lautwandel darstellen:
There is no basis for contending that lexical diffusion is somehow more fundamental
than regular, phonetically motivated sound change. On the contrary, if we were to decide the issue by counting cases, there appear to be far more substantially documented
cases of Neogrammarian sound change than of lexical diffusion. (Labov 1994: 471)
Warum wohl wurde in diesem Zusammenhang das Wort "Mechanismus" gewählt, um den Geltungsbereich von lexikalischer Diffusion und junggrammatischem Lautwandel abzustecken? Welche
"Aspekte des Lautwandels" werden hierbei hervorgehoben?
3 Bedeutungswandel
It’s the Meaning, Stupid!
Während die Erforschung von Lautwandel sich großer Beliebtheit erfreut, und die Linguistik hier auch große Erfolge vorweisen kann, sieht es um die Erforschung des Bedeutungswandels weit weniger gut aus. Dies hängt sicher vor allem damit zusammen, dass man
zwar weiß (und zuweilen sogar beobachten kann), dass Bedeutungen von Wörtern sich
ändern, dass die Regelmäßigkeit, mit der sich die Lautgestalt von Wörtern ändert, jedoch
keine Entsprechung in der Semantik findet:
There is [...] little in semantic change which bears any relationship to regularity in phonological change’ (Fox 1995: 111).
Welche Beispiele für semantischen Wandel kennst Du? Welche
Regelmäßigkeiten (wie marginal sie auch sein mögen) lassen sich
zuweilen antreffen?
4
25
2 Wandel
und Relationen
Johann-Mattis
List
Zeichenwandel
11.01.2013
Alternation, Akkumulation, Reduktion
Ein Grund für die Unterschiede zwischen Lautwandel und Bedeutungswandel in Bezug
auf die Regelmäßigkeit lässt sich in der grundlegend unterschiedlichen Struktur der Formund der Bedeutungsseite des sprachlichen Zeichens finden. Während die Formseite des
sprachlichen Zeichens eine sequenzielle Struktur aufweist, und Lautwandel durch die Alternation von Segmenten gekennzeichnet ist, ist die Bedeutungsseite wohl eher als konzeptuelles “Netzwerk” zu beschreiben, und Bedeutungswandel ist nicht durch Alternation
gekennzeichnet, sondern durch Akkumulation und Reduktion.
German
“head”
.
Kopf
k
ɔ
p͡f
Pre-German
“head”
*kop
k
ɔ
p
–
“vessel”
ProtoGermanic
*kuppaz
k
u
pː
a
z
“vessel”
In der oben abgebildeten Grafik ist versucht worden, die Unterschiede zwischen Lautwandel und Bedeutungswandel anhand
eines Beispiels zu kontrastieren. Wie lässt sich das Beispiel näher
erläutern? Welche weiteren Beispiele gibt es für die Prozesse
der Reduktion und der Akkumulation?
Referenzpotential
Im Gegensatz zur Form des sprachlichen Zeichens mangelt es der Zeichenbedeutung and
Substanz und Linearität. Es mangelt ihr an Linearität, weil sie nicht sinnlich erfassbar ist,
und es mangelt ihr an Linearität, da sie nicht von der Zeit abhängt. Ein weiteres Problem ist,
dass – aufgrund der Arbitrarität der Verbindung zwischen Zeichenform und Zeichenbedeutung – „meaning is inherently fuzzy and non-systematic” (Hock und Joseph 1995[2009]:
206). Bis heute gibt es daher leider noch keine semantische Theorie, die von einem breiten
Teil der linguistischen Gemeinschaft unterstützt würde.
Saussures Zeichenmodell ist indifferent hinsichtlich der Frage, ob ein Zeichen verwendet wird, um auf die „reale Welt” Bezug zu nehmen. Es wird lediglich betont, dass der
5
26
1
Johann-Mattis List
Zeichenwandel
11.01.2013
Bedeutungsteil nicht mit dem Objekt, dass er denotiert, verwechselt werden sollte (Saussure 1916: 98). Triadische Zeichenmodelle versuchen, diese Lücke zu schließen, indem
die Bedeutung eines Wortes (meaning) von dessen Referenz (reference) unterschieden
wird, wobei erstere eine Kategorie und letztere ein mögliches Referenzobjekt determiniert
(Löbner 2003: 257).
MEANING
REFERENT
REFERENT
FORM
REFERENT
Da die Referenz eines sprachlichen Zeichens jedoch nur dann eindeutig ist, wenn das
Zeichen in einem bestimmten Kontext verwendet wird, ist es sinnvoll eine weitere Unterscheidung zwischen Referenz und Referenzpotential zu machen (Schwarz 1996: 175).
Das Referenzpotential eines sprachlichen Zeichens wird dabei verstanden als die Menge
aller Möglichen Referenten, die von dem Zeichen denotiert werden können (siehe Grafik oben). Dabei hängt das Referenzpotential eines Zeichens von seiner Bedeutung ab:
Je spezifischer diese ist, desto eingeschränkter ist die Anzahl (unterschiedlicher) möglicher Referenten (Löbner 2003: 306). Wenn man bspw. die Wörter Deutsch Stein [ʃtain]
und Deutsch Ding [dɪŋ] vergleicht, dann kann man sagen, dass das Referenzpotential von
Stein eingeschränkter ist, als das von Ding, da das erste ja nur Steine oder steinartige Objekte denotieren kann, während das andere zur Denotation aller möglichen Arten (meist
greifbarer) Objekte verwendet werden kann.
Warum ist es so schwer, das Referenzpotential eines sprachlichen
Zeichens zu messen?
Bedeutungswandel als Wandel von Referenzpotentialen
Mit Hilfe der Idee vom Referenzpotential kann man das, was beim semantischen Wandel
vor sich geht, zuweilen ein wenig erhellen. Wenn wir nur die am häufigsten auftretenden Referenten der Wörter Englisch cup „Tasse”, Niederländisch kop „Kopf, Tasse” und
Deutsch Kopf betrachten, so lässt sich ein bestimmtes Kontinuum bezüglich der häufigsten
Referenten der Wörter feststellen. Dieses Kontinuum spiegelt nicht nur frühere Prozesse
semantischen Wandels wider, sondern vermag eventuell auch auf zukünftige Prozesse
oder generelle Trends zu verweisen. Der Wandel von KOPF zu CHEF, bspw., der wahrscheinlich über eine Zwischenstufe OBERER TEIL vonstatten ging, ist auch im Chinesischen attestiert, wo shǒu 首 [ʂou₂₁₄] „erster, Chef” ursprünglich „Kopf” hieß, wie man an
der Orakelknochenversion des Zeichens noch gut erkennen kann: 首.
6
27
2 Wandel
und Relationen
Johann-Mattis
List
Zeichenwandel
11.01.2013
Das Konzept des Referenzpotentials mag vielleicht helfen, semantischen Wandel genauer zu beschreiben. Es hilf jedoch
zwangsläufig nicht, ihn regelmäßig zu machen. Angenommen,
semantischer Wandel wiese tatsächlich regelmäßige Züge auf,
wie würden diese sich äußern, d.h. welcher Art wären diese
Regelmäßigkeiten wohl?
“cup”
CONTEST
TROPHY
[kʌp]
CUP
(a) Englisch
“head, cup”
CUP
HEAD
[kɔp]
TOP
(b) Niederländisch
“head”
HEAD
TOP
[kɔp͡f]
CHIEF
(c) Deutsch
7
28
Johann-Mattis List
Zeichenwandel
11.01.2013
Literatur
Baxter, W. H. (1992). A handbook of Old Chinese phonology. Berlin: Mouton de Gruyter.
Campbell, L. (1998). Historical linguistics: An introduction. 2. Aufl. Edinburgh: Edinburgh
Univ. Press.
Chen, M. (1972). “The Time Dimension. Contribution toward a Theory of Sound Change”.
In: Foundations of Language 8.4, 457–498. JSTOR: 25000618.
Máoshī Gǔyīnkǎo 毛 詩 古 音 攷 [Investigation of the old sounds in Mao’s compilation of
the Book of Odes] (1606). Von Chén Dì 陳第 (1541–1617); Kritische Edition: Chén Dì
陳 第 (1606). Máoshī Gǔyīnkǎo 毛 詩 古 音 攷 [Investigation of the old sounds in Mao’s
compilation of the Book of Odes]. Sìkù Quánshū 四庫全書 [Complete Library of the Four
Treasuries]; Jīngbù 經部; Xiǎoxuélèi 小學類; Míng 明. Internet Archive: 06048676.cn.
Fox, A. (1995). Linguistic reconstruction. An introduction to theory and method. Oxford:
Oxford University Press.
Hock, H. H. und B. D. Joseph (1995 [2009]). Language history, language change and
language relationship. An introduction to historical and comparative linguistics. 2. Aufl.
Berlin und New York: Mouton de Gruyter.
Karlgren, B. (1950). The book of odes. Chinese text, transcription and translation. Stockholm: Museum of Far Eastern Antiquities.
Kiparsky, P. (1988). “Phonological change”. In: Linguistics. The Cambridge survey. Bd. 1:
Linguistic theory. Foundations. Hrsg. von F. J. Newmeyer. Cambridge u. a.: Cambridge
University Press, 363–415.
Labov, W. (1981). “Resolving the Neogrammarian Controversy”. In: Language 57.2, 267–
308. JSTOR: 413692.
– (1994). Principles of Linguistic Change. Bd. 2: Internal Factors. Blackwell.
Löbner, S. (2003). Semantik. Eine Einführung. Berlin: de Gruyter.
Osthoff, H. und K. Brugmann (1878). Morphologische Untersuchungen auf dem Gebiete
der indogermanischen Sprachen. Bd. 1. Leipzig: Hirzel.
Saussure, F. de (1916). Cours de linguistique générale. Hrsg. von C. Bally. Lausanne:
Payot; Deutsche Übersetzung: – (1967). Grundfragen der allgemeinen Sprachwissenschaft. A. d. Französischen übers. von H. Lommel. 2. Aufl. Berlin: Walter de Gruyter &
Co.
Schwarz, M. (1996). Einführung in die kognitive Linguistik. Basel und Tübingen: Francke.
Shījīng 詩經 [The book of odes] (ca. 1050 BC); Kritische Edition: Máoshī (1922). Máoshī
毛詩 [Mao’s compilation of the Book of Odes]. Komm. von Máo Hēng 毛亨 (Hàn Dynasty:
207 BC–9 AD). Sìbù Cóngkān 四部叢刊 [The collected publications from the Four Categories]. Shanghai: Shāngwù 商务; Englische Übersetzung: Karlgren, B. (1950). The
book of odes. Chinese text, transcription and translation. Stockholm: Museum of Far
Eastern Antiquities.
Wang, W. S.-Y. (1969). “Competing changes as a cause of residue”. In: Language 45.1,
9–25. JSTOR: 411748.
– (2006). Yǔyán, yǔyīn yǔ jìshù 語言,語音與技術 [Language, phonology and technology].
Shanghai: Xiānggǎng Chéngshì Dàxué.
8
29
2 Wandel
und Relationen
Johann-Mattis
List
Zeichenrelationen
11.01.2013
Zeichenrelationen
1 Termini
1.1 Biologische Schlüsseltermini
Im Folgenden wollen wir versuchen, uns mit einigen Schlüsseltermini der Biologie vertraut
zu machen, welche mitunter helfen können, linguistische Konzepte von Sprachverwandtschaft und Sprachgeschichte besser und klarer zu fassen.
Merkmal
Eines der wichtigsten Konzepte in der Evolutionsbiologie ist das Konzept des Merkmals
(engl. character). Dieses kann allgemein in etwa wie folgt definiert werden:
A biological character can be thought of as a part of an organism that exhibits causal coherence to have a well-defined identity and that plays a (causal) role in some
biological processes. (Wagner 2000: 3)
Nenne Beispiele für mögliche biologische Merkmale.
Homologie
Homologie (engl. homology) ist der allgemeine Terminus für die zentralste Relation in der
Evolutionsbiologie: die Relation der gemeinsamen Abstammung (engl. common descent)
zwischen zwei Merkmalen oder Organismen.
Homology is the relationship of two characters that have descended, usually with divergence, from a common ancestral character. This is important because most of the
terminological problems stem from different definitions of homology. Characters can
be any genic, structural or behavioral feature of an organism. (Fitch 2000: 227)
Der Terminus "Homologie" beschreibt eine Relation zwischen zwei
gleichartigen Objekten. Wie bei den meisten wissenschaftlichen
Termini lassen sich auch von diesem Terminus unterschiedliche
Ableitungen bilden. So sind die Ableitungen "Homologe" und
"homolog" durchaus gebräuchlich. Worauf sollte man bei der
Verwendung dieser abgeleiteten Termini allerdings strikt achten,
wenn man von deren eigentlicher Bedeutung ausgeht?
Orthologie, Paralogie, Xenologie
Homologie beschreibt allgemein Fälle von von gemeinsamer Abstammung zwischen Merkmalen. In der molekularen Biologie, deren grundlegende Vergleichseinheit genetische Sequenzen sind, können Untertypen von gemeinsamer Abstammung Unterschieden werden,
deren gebräuchlichste die Orthologie (engl. orthology), die Paralogie (engl. paralogy) und
die Xenologie (engl. xenology) sind. Diese Untertypen der Homologie wurden in Bezug
auf den Genotypen definiert, sie haben keine eindeutige Entsprechung im Phänotypen.
Die Bedeutung der Termini kann man wie folgt zusammenfassen:
1
30
Johann-Mattis List
Zeichenrelationen
11.01.2013
• Orthologie ist die Relation, die für „genes related via speciation” (Koonin 2005: 311)
gilt;
• Paralogie bezeichnet die Relation zwischen „genes related via duplication” (ebd.);
und
• Xenologie bezieht sich auf die Relation zwischen Genen, „whose history, since their
common ancestor, involves an interspecies (horizontal) transfer of the genetic material for at least one of those characters” (Fitch 2000: 229).
Weiter unten werden wir uns mit der "Entlehnung" als Schlüsselkonzept der historischen Sprachwissenschaft beschäftigen. Mit
welchem der drei in diesem Abschnitt eingeführten biologischen
Termini wäre diese wohl am besten zu vergleichen, und warum
besteht dennoch ein unüberwindlicher Unterschied zwischen dem
biologischen und dem linguistischen Konzept?
Analogie
Wir Linguisten werden wahrscheinlich denken, dass wir diesen Terminus kennen, insbesondere, wenn wir in der letzten Sitzung aufgepasst haben. Leider ist dies jedoch nicht
ganz richtig, denn Analogie bezeichnet in der Evolutionsbiologie etwas anderes als in der
historischen Linguistik und auch im Allgemeinen:
The relationship of any two characters that have descended convergently from unrelated ancestors. (ebd.)
Es mag sein, dass das Zitat von Fitch den Leser keinen Deut
klüger macht. Wenn dem so sein sollte, liegt dies vermutlich
an dem Wort "convergently", welches auf Deutsch "konvergent"
oder einfacher "aufeinander zulaufend" (also "in die selbe Richtung") lautet. Was bezeichnet Analogie in der Evolutionsbiologie
also genau?
Isologie
Als wären es nicht genug Logien, denen wir uns bisher widmen mussten! Die Biologen
setzen aber trotzdem einen drauf und führen gleich noch das Konzept der Isologie (engl.
isology) ein:
When dealing with molecular data concepts of homology have often been rather confused [...] with the word homology being used to mean several unrelated things, which
could perhaps better be given alternative names. In particular,‘sequence homology’
is often used as a synonym for‘sequence identity’(i.e. the number of nucleotides or
amino acids that are inferred to be held in common between two sequences). These
are not necessarily the same thing [...], since similarity can be the result either of common ancestry or of chance convergence, parallelism or reversal; and‘isology’may
be a better term to use (Wegnez 1987). (Morrison 2006: 488)
To use the same word, “homology”, for structures with the same ancestry, either in
comparative morphology or in molecular biology, is not itself a bad choice. Problems
have arisen because the term has been used to express what it was not supposed to
2
31
2 Wandel
und Relationen
Johann-Mattis
List
Zeichenrelationen
11.01.2013
express. It is very difficult to quantify to what extent homologous morphological structures are identical. On the other hand, it si very easy to quantify the degree of identity
of two proteins or genes – indeed, this is usually the first interpretative step following
seuqence analysis. Most of the scientists concerned with sequence comparison have forgotten the morphological, embryological, and evolutionary origins of “homology”,
and the word has lost in the process its all-or-none concept status. Today the problem ist first to restore the true meaning of the word “homology”, and then to find an
appropriate term for quantitative sequence comparisons. (Wegnez 1987: 516)
Kurz und schmerzlos: Warum brauchen wir (oder besser: die
Biologen) einen solchen Terminus, und in welcher Beziehung
steht er zu "Homologie" und "Analogie"?
1.2 Linguistische Schlüsseltermini
Sprachverwandtschaft
Sprachverwandtschaft (engl. genetic [language] relationship) ist das zentrale Konzept der
historischen Sprachwissenschaft und bestimmt die Forschung in all ihren Grundzügen.
The relationship between languages that have a common ancestor; languages that are
languages of the same language family. (Campbell und Mixco 2007: 68)
Sprachverwandtschaft wurde im Laufe des Seminars bereits
mehrfach angesprochen. Welches ist das traditionelle Modell,
mit dessen Hilfe Sprachgeschichte -- und damit auch die Entwicklung von Sprachverwandtschaften -- dargestellt wird, und
warum ist dieses Modell so problematisch?
Kognazität
Nicht weniger wichtig, aber leider weitaus komplizierter und verwirrender, was den Gebrauch des Terminus betrifft, ist das Konzept der Kognazität (engl. cognacy). In der historischen Sprachwissenschaft bezeichnet Kognazität primär eine Relation der gemeinsamen
Abstammung zwischen zwei Merkmalen. Dieser Terminus selbst ist jedoch weit weniger
gebräuchlich als der Terminus Kognate (engl. cognate), der im Glossar von Campbell und
Mixco folgendermaßen erläutert wird:
A word (or morpheme) that is related to a word (morpheme) in sister languages by
reason of these words (morphemes) having been inherited by the related languages
from a common word (morpheme) of the proto-language from which they descend.
For example, Italian cane /kane/, Portuguese cã o /kãõ/, French chien /šyɛ̃/ ‘dog’ are
all cognates, since they descend in these Romance languages from the same original
word in Latin (ancestor of the Romance languages): canis ‘dog’. (ebd.: 33f)
Seien wir ehrlich und schonungslos: Die Beschreibung von Campbell und Mixco ist schrecklich ungenau, fehlerhaft und ungeschickt. Es stellt sich nur die Frage: Warum ist das so? Oder
auch: Muss das so sein?
3
32
Johann-Mattis List
Zeichenrelationen
11.01.2013
Entlehnung
Wo von Relationen zwischen Sprachen die Rede ist, darf die Entlehnung (engl. borrowing)
natürlich nicht fehlen.
The process in which a language takes linguistic elements from another language
and makes them part of its own. The borrowed elements are typically loanwords, but
borrowing is not restricted just to lexical items taken from one language into another:
any linguistic material – sounds, phonological rules, grammatical morphemes, syntactic
patterns, semantic associations, discourse strategies – can be borrowed, that is, can
be taken over so as to become part of the borrowing language. (Campbell und Mixco
2007: 25f)
Die Definition von Campbell und Mixco weist einen schlimmen
Denkfehler auf, der im Prinzip unverzeihlich ist. Welcher Fehler
ist das?
2 Historische Relationen
Im Folgenden wollen wir versuchen, uns unabhängig von der Frage, ob es nun um die Linguistik oder die Biologie oder dergleichen geht, klarzumachen, welche historischen Relationen wichtig für die historischen Wissenschaften sind. Die grundlegende Frage, von der
wir uns dabei leiten lassen wollen, ist die, ob, und wenn ja welche, „Geschichte” zwei oder
mehr Objekte (seien es nun Wörter oder Gene) miteinander teilen.
Welche Wissenschaften können angeführt werden, um das oben
genannte "dergleichen" mit Inhalt zu füllen?
2.1 Ontologische Relationen
Mit ontologischen Relationen sollen im Folgenden diejenigen Relationen bezeichnet werden, die, wenn wir gesunden Menschenverstand annehmen, für Merkmale von historischen
Objekten gelten, ob wir diese Relationen nun epistemologisch entdecken können, oder
nicht. Da die grundlegende Frage ist, ob zwei oder mehr Merkmale historischer Objekte
eine gemeinsame Geschichte miteinander teilen, und wenn dies der Fall ist, welcher Art
diese gemeinsame Geschichte ist, können wir für diese Merkmale eine Reihe grundlegender ontologischer Relationen ansetzen.
Gemeinsame Abstammung
Für zwei oder mehr Merkmale characters unterschiedlicher Objekte gilt die Relation gemeinsamer Abstammung, wenn diese Merkmale zu einem früheren Zeitpunkt in der Geschichte einmal die Merkmale eines einzigen Objekts waren.
Nenne Beispiele für gemeinsame Abstammung in a) der Linguistik, b) der Biologie, und c) der Theologie.
Untertypen der gemeinsamen Abstammung
Wir können die grundlegende Relation der gemeinsamen Abstammung weiter ergänzen,
indem wir die folgenden Untertypen ansetzen:
4
33
2 Wandel
und Relationen
Johann-Mattis
List
Zeichenrelationen
11.01.2013
• direkte gemeinsame Abstammung bezeichnet eine Abstammungsrelation zwischen
Merkmalen, die lediglich aus der Auseinanderentwicklung („Spaltung”) der Objekte, welche diese Merkmale aufweisen, resultiert und keine weitere Veränderung der
Merkmale einschließt;
• indirekte gemeinsame Abstammung bezeichnet eine Abstammungsrelation zwischen Merkmalen, die eine nach der Auseinanderentwicklung der Objekte, welche
die Merkmale aufweisen, unabhängige Weiterentwicklung von mindestens einem der
Merkmale aufweist; und
• nicht-vertikale gemeinsame Abstammung bezeichnet eine Abstammungsrelation
zwischen Merkmalen, die durch den (horizontalen) Transfer von mindestens einem
der Merkmale zwischen den Objekten, die die Merkmale aufweisen, gekennzeichnet
ist.
Es ist sicher klar, dass diese Relationen sich stark an den biologischen Konzepten der "Orthologie", "Paralogie" und "Xenologie"
orientieren. Welche Beispiele gibt es nun aber in der historischen Linguistik für diese drei Untertypen der gemeinsamen
Abstammung?
2.2 Epistemologische Relationen
Was (ontologisch) der Fall ist, kann uns (epistemologisch) durchaus verborgen bleiben!
Um die ontologischen Relationen zwischen Merkmalen zu erschließen, müssen wir immer
dann, wenn die Vorfahren der Objekte (wie Sprachen oder Spezies), die wir untersuchen,
nicht erhalten sind, auf Indizien zurückgreifen. Das grundlegende Prinzip, mit dem Geschichte in der Biologie, der Linguistik und anderen historischen Wissenschaften dabei
rekonstruiert wird, ist der Vergleich von Objekten, welcher realisiert wird als Vergleich von
Merkmalen. Die grundlegende Relation, auf die wir uns als Indiz stützen, ist eine Ähnlichkeitsrelation, wobei die Frage, wie Ähnlichkeit konkret in der Praxis der jeweiligen Wissenschaften definiert ist, durchaus variieren kann.
similarities
coincidental
Grk. θεός
Spa. dios
“god”
non-coincidental
natural
non-natural
Chi. māma
Ger. Mama genealogical contact-induced
“mother”
Eng. tooth Eng. mountain
Ger. Zahn Fre. montagne
“tooth”
“mountain”
5
34
Johann-Mattis List
Zeichenrelationen
11.01.2013
Die oben wiedergegebene Abbildung zeigt grundlegende Typen
von Ähnlichkeiten zwischen Wörtern verschiedener Sprachen mit
Hilfe einer Entscheidungsbaum-Struktur. Bisher wurden unterschiedlichste Konzepte und Termini zur Beschreibung historischer
Relationen besprochen. Welche Termini bieten sich an, um die
Knoten des Baumes als Relationen zu fassen?
3 Zeichenrelationen
Wenn wir die gängigen, in der Literatur verwendeten Zeichenrelationen in der Linguistik
denen in der Biologie gegenüberstellen, und diese wiederum mit den ontologischen historischen Relationen vergleichen, fällt auf, dass die linguistische Terminologie nicht sehr gut
geeignet ist, diese ontologischen Relationen auf systematisch ansprechende Weise abzudecken. Während jede der grundlegenden historischen ontologischen Relationen ihren
Terminus in der Biologie hat, weist die Linguistik lediglich den Terminus „Kognazität” auf,
der darüber hinaus sowohl direkte als auch indirekte gemeinsame Abstammung bezeichnet. Es ist an der Zeit, diese terminologische Armut zu bekämpfen.
indirect
due to lateral
transfer
homology..........
common descent.....
direct
orthology
paralogy
xenology
cognacy....
Terminology
Biology
Linguistics
Relations
?
oblique
cognacy
?
Könnte man beim Betrachten der Tabelle nicht den Eindruck
gewinnen, dass die Gegenüberstellung der biologischen und der
linguistischen Termini der Linguistik nicht ganz gerecht wird,
da die Phänomene, die zu den Relationen führen, Linguisten ja
nicht unbekannt sind?
3.1 Kognatenrelationen
Die Kognazitätsrelation stellt eine wichtige Relation in der historischen Linguistik dar. Im
konkreten Fall von sprachlichen Zeichen setzt sie voraus, dass kognate Zeichen direkt von
der gemeinsamen Vorgängersprache geerbt wurden, wie das Beispiel auf der folgenden
Abbildung zeigt. Voraussetzung für die Kognazität zweier Wörter A und B ist somit, dass
für diese Wörter selbst eine Vorgänger-Nachfolger-Relation (engl. ancestor-descendant
relation) zu einem Wort C einer Vorgängersprache nachweisbar ist.
6
35
2 Wandel
und Relationen
Johann-Mattis
List
Zeichenrelationen
[kɔp͡f]
“head”
11.01.2013
[kʌp]
COGNATE
Kopf
“cup”
cup
German
English
ANCESTOR
ANCESTOR
*[kupːaz]
“vessel”
*kuppaz
ProtoGermanic
Worin unterscheidet sich die Vorgänger-Nachfolger-Relation
von der Relation der Kognazität? Welche Beispiele kann man
für direkte und indirekte (oblique) Kognazität anführen?
3.2 Etymologische Relationen
Wenn zwei Zeichen A und B nicht über ein Zeichen C miteinander verbunden werden können, zu dem sowohl A als auch B in einer Vorgänger-Nachfolger-Relation stehen, dann
heißt das noch nicht, dass nicht eine historische Relation zwischen A und B bestehen könnte. Die folgende Abbildung illustriert einen solchen Fall. Die beiden Zeichen Deutsch Kopf
und Französisch coupe sind nicht mehr kognat, ihre Entstehungsgeschichte verlief jedoch
nicht vollkommen unabhängig voneinander, da Kopf der Nachfolger von Proto-Germanisch
*kuppaz ist, welches wiederum von Latein cūpa entlehnt wurde. Um diese Beziehung zu
benennen, schlage ich den Terminus „oblique etymologische Relation” vor.
[kɔp͡f]
“head”
[kup]
“cup”
DONOR
ETYM. RELATION
Kopf
coupe
German
French
ANCESTOR
ANCESTOR
*[kupːaz]
[kuːpa]
*kuppaz
ProtoGermanic
cūpa
DONOR
“vessel”
“vessel”
Latin
Der Terminus ,,oblique etymologische Relation" wurde relativ
unvermittelt eingeführt. Gibt es eine Möglichkeit, aus dem bisher
gelernten zu erschließen, warum der Terminus gewählt wurde?
7
36
Johann-Mattis List
Zeichenrelationen
11.01.2013
3.3 Zusammenfassung
In der folgenden Tabelle werden die neuen Termini zusammengefasst und den ontologischen Relationen gegenübergestellt. Um deutlich zu machen, dass es sich um Relationen
handelt, werden die Termini auch als solche benannt, wobei die traditionelle Relation der
Kognazität nicht ersetzt, sondern durch zwei Spezialfälle ergänzt wird. Der „Homologie” in
der Biologie entsprechend wurde der Terminus „etymologische Relation” gewählt, da in einer dem Gebrauch des Terminus „Homologie” analogen Weise – nicht nur in der Linguistik
– häufig von einer „etymologischen Beziehung zwischen Wörtern” gesprochen wird.
indirect
due to lateral transfer
cognate relation
direct
Terminology
etymological relation..
common descent.....
Relations
direct cognate relation
oblique cognate
relation
oblique etymological
relation
In dieser Sitzung wurde versucht, strikt darauf zu achten,
die historischen Relationen jeweils strikt für Merkmale (im Gegensatz zu taxonomischen ,,Objekten") zu definieren. Ist das
gerechtfertigt, oder könnte man die Beziehungen nicht vielleicht
gewinnbringend auf historische Beziehungen zwischen Sprachen
übertragen?
Literatur
Campbell, L. und M. Mixco (2007). A glossary of historical linguistics. Edinburgh: Edinburgh
University Press.
Fitch, W. M. (2000). “Homology. A personal view on some of the problems”. In: Trends in
Genetics 16.5, 227–231.
Koonin, E. V. (2005). “Orthologs, paralogs, and evolutionary genomics”. In: Annual Review
of Genetics 39, 309–338.
Morrison, D. A. (2006). “Multiple sequence alignment for phylogenetic purposes”. In: Australian Systematic Botany 19, 479–539.
Wagner, G. P. (2000). “Characters, unit and natural kinds. An introduction”. In: Hrsg. von
G. P. Wagner. San Diego u. a.: Academic Press, 1–12.
Wegnez, M. (1987). “Letter to the editor”. In: Cell 51, 516.
8
37
2 Wandel
und Relationen
Johann-Mattis
List
Übungen
2013-01-11
Übungen
In der letzten Sitzung haben wir uns eingängig mit Zeichenrelationen beschäftigt. Dabei
wurde deutlich, dass nicht allen Relationen auch ein Terminus in der Linguistik entspricht.
Ferner wurde (hoffentlich) klar, dass die ontologische und die epistemologische Perspektive nicht immer strikt genug voneinander getrennt werden. Dies soll geändert werden,
indem im Folgenden der Versuch unternommen werden soll, ein neues Schema zu entwickeln, das, wenn auch die Termini fehlen mögen, dieses zu füllen, den grundlegenden
historischen Relationen und Prozessen in der historischen Linguistik gerecht wird.
Relationen sind eine Folge spezifischer Prozesse sind. Erstelle
ein ontologisches Schema historischer Prozesse analog zu dem
besprochenen ontologischen Schema historischer Relationen, und
füge dieses in tabellarischer Form im unteren Kasten ein.
Versuche, die grundlegenden Ähnlichkeitsrelationen, die unter
Punkt 2.2 in der letzten Sitzung besprochen wurden, in tabellarischer Form den ontologischen Relationen gegenüberzustellen.
Ziel ist dabei, dass aus einer solchen Darstellung unmittelbar ersichtlich wird, welcher "Grund" für Ähnlichkeiten welcher
ontologischen Relation gegenübersteht.
1
38
3 Rekonstruktion von
Zeichenbeziehungen
In diesem Block geht es um die Rekonstruktion von Zeichenbeziehungen, also um die
phonologische Rekonstruktion, und um das Entdecken von kognaten Wörtern.
39
3 Rekonstruktion
Johann-Mattisvon
List Zeichenbeziehungen
18.01.2013
Alinierung
Sequenzalinierung
1 Allgemeines vorweg
1.1 Sequenzen
Viele Strukturen, mit denen wir es im Alltag und in der Wissenschaft zu tun haben, können
als Sequenzen dargestellt werden. Der Vogelgesang, der uns morgens weckt, ist eine Sequenz von Schallwellen, die Filme, die wir anschauen, sind Sequenzen von Bildern, und
die Gerichte, die wir kochen, basieren auf den Sequenzen von Instruktionen, die wir einem
Rezept entnommen haben.
Was haben Rezepte, Vogelgesang und Filme gemein?
Diskrete und kontinuierliche Entitäten
Oft sind die Objekte, die wir als Sequenzen modellieren, nicht diskret, sondern das Ergebnis kontinuierlicher Variablen (Raum, Zeit, etc., vgl. Kruskal 1983: 130).
In der Linguistik hat das „Diskretmachen” des Kontinuierlichen eine lange Tradition.
Da unser Blick auf Sprache normalerweise geblendet wird vom alphabetischen Denken,
wird häufig ignoriert, dass die natürliche Erscheinungsform des Sprechens ein Kontinuum
ist und dass die Segmentierung der Rede in Lauteinheiten das Ergebnis einer expliziten
Analyse ist: „Neither the movements of the speech organs nor the acoustic signal offers a
clear division of speech into successsive phonetic units” (IPA Handbook 1999: 5).
Frequency (Hz)
Frequency (Hz)
5000
5000
00
00
0.8
0.8
Time (s)
Time (s)
tʰ
a
ɦ i
ã
Die Graphik zeigt das Spektogramm der Aussprache von Shanghainesisch tàiyáng 太阳[tʰa₃₃ɦiã₄₄] ``Sonne". Was fällt auf, wenn man
die IPA-Transkription des Wortes mit dessen Widerspiegelung
im Spektogramm vergleicht?
Formale Definition von Sequenzen
Definition: Ein Alphabet ist eine nicht-leere endliche Menge deren Elemente Buchstaben genannt werden. Eine Sequenz ist eine geordnete Liste von Buchstaben, die
aus dem Alphabet gezogen werden. Die Elemente von Sequenzen werden Segmente
1
40
Johann-Mattis List
18.01.2013
Alinierung
genannt, die Mächtigkeit einer Sequenz ist die Anzahl ihrer unterschiedlichen Buchstaben, und die Länge einer Sequenz ist die Anzahl ihrer Segmente. (vgl. Böckenbauer
und Bongartz 2003: 30f)
Was hat die Abbildung mit den Perlen auf der Schnur mit
Sequenzen und Mengen zu tun?
1.2 Sequenzvergleiche
Sequenzvergleiche können mitunter recht kompliziert werden. Es genügt nicht, Sequenzen als einfache Menge aufzufassen und bspw. festzustellen, aus welchen Segmenten sie
bestehen. Da Sequenzen sowohl eine Struktur als auch einen Gehalt haben, muss ein
Vergleich von Sequenzen auf eben diese Tatsache Rücksicht nehmen. Bevor man also
einzelne Segmente miteinander vergleicht, muss immer auch festgestellt werden, ob sich
diese Segmente überhaupt entsprechen. Das ist leicht, wenn beide Sequenzen die gleiche
Struktur haben. Dann muss man nämlich lediglich vergleichen, an welchen Positionen die
Sequenzen sich unterscheiden. Dies lässt sich sogar relativ leicht quantifizieren, indem
man einfach die unterschiedlichen Positionen zählt.
0
H
H
H
H
H
0
0
H
H
H
H
H
0
Die Anzahl unterschiedlicher Positionen zwischen zwei Sequenzen
gleicher Struktur ist auch bekannt als die sogenannte HammingDistanz, benannt nach R. W. Hamming (1915 -- 1998), der
sie erstmals in einem Aufsatz aus dem Jahre 1950 einführte
(Hamming 1950). Wie groß ist die Hamming-Distanz zwischen den
beiden Perlenketten auf der Abbildung oben?
Die Korrespondenzperspektive
Um Sequenzen mit unterschiedlicher Struktur vergleichen zu können, reicht die HammingDistanz allein nicht aus. Will man zwei oder mehr Sequenzen unterschiedlicher Struktur
2
41
3 Rekonstruktion
Johann-Mattisvon
List Zeichenbeziehungen
18.01.2013
Alinierung
vergleichen, ist es zunächst notwendig, zu ermitteln, wie die Segmente miteinander korrespondieren. Dabei ist es zunächst wichtig, festzustellen, ob die Segmente überhaupt korrespondieren. Wenn zwei Segmente miteinander korrespondieren, so wird dies als Match
bezeichnet. Wenn ein Element zu keinem anderen Segment korrespondiert, wird dies als
leeres Match (empty match) bezeichnet. Die Matches selbst können wiederum unterteilt
werden in unterschiedliche Typen, und zwar in solche, bei denen die korrespondierenden Segmente identisch sind (einheitliches Match, uniform match) und solche, bei denen
die korrespondierenden Segmente unterschiedlich sind (divergierendes Match, divergent
match).
0
H
H
H
H
H
0
uniform match
0
H
H
H
H
0
divergent match
empty match
Die obige Abbildung fasst die grundlegenden Typen von
Segment-Korrespondenzen zusammen. Mit diesen kann man
prinzipiell alle Unterschiede zwischen Sequenzen beschreiben. Man
könnte die grundlegenden Typen von Sequenzkorrespondenzen
jedoch auch um mindestens zwei weitere Typen erweitern. Welche sind dies wohl?
Die Editierperspektive
Die zuvor besprochene Korrespondenzperspektive stellt nur eine mögliche Perspektive
dar, um Unterschiede zwischen Sequenzen zu modellieren. Eine in der Literatur weit verbreitetere Perspektive ist die sogenannte Editierperspektive. Die grundlegende Idee dieser
Perspektive ist es, Unterschiede zwischen Sequenzen mit Hilfe von Editieroperationen darzustellen, also den Basisoperationen, die man benötigt, um die eine Sequenz in die andere
zu transformieren. Die grundlegenden Editieroperationen sind hierbei die Substitution, die
Insertion, und die Deletion (zusammengefasst auch als Indel bezeichnet). Sie wurden zuerst von dem russischen Mathematiker V. I. Levenshtein (? – ?) eingeführt (Levenshtein
1965).
Perspective
Correspondence Edit
uniform match
continuation
divergent match
substitution
insertion
empty match
deletion
crossed match
transposition
compression
complex match
expansion
Oh weh! Flix der Felertäufel hat wieder zugeschlagen und in der
obigen Tabelle eine Reihe von Zellen geweißt. Schaffst Du es,
die ursprünglichen Zelleninhalte wiederherzustellen?
3
42
Johann-Mattis List
18.01.2013
Alinierung
1.3 Alinierung
Formale Definition
Die Alinierung stellt die gebräuchlichste Form dar, um Unterschiede zwischen Sequenzen
aufzuzeigen. Formal kann man eine Alinierung in etwa wie folgt definieren:
Eine Alinierung von n (n > 1) Sequenzen ist eine n-reihige Matrix, in der alle Sequenzen dergestalt angeordnet werden, dass alle matchenden Segmente in derselben Spalte erscheinen, während nicht-matchende Segmente, die aus leeren Matches
resultieren, durch Gap-Symbole angezeigt werden. (vgl. Gusfield 1997: 216)
0
H
H
H
H
H
0
H
H
H
H
0
0
0
H
H
H
H
H
0
0
H
H
H
H
H
0
Die Levenshtein-Distanz zwischen zwei Sequenzen S1 und S2 ist
definiert als die Anzahl von Editieroperationen, die notwendig
ist, um S₁ in S2 zu transformieren. Mit Hilfe des Konzepts der
Alinierung lässt sich dieses Distanzmaß leicht auf die HammingDistanz zurückführen. Wie genau?
Alinierungsmodi
Wir haben bei der Beschreibung der Alinierung bisher stets angenommen, dass diese sich
auf die Sequenzen in ihrer ganzen Länge beziehen muss. Eine lediglich teilweise Alinierung ist jedoch genau so gut möglich und zuweilen sogar durchaus sinnvoll. Je nachdem,
welche Teile von Sequenzen bei der Alinierung genau berücksichtigt werden, lassen sich
unterschiedliche Alinierungsmodi unterscheiden:
• semi-globale Alinierung beruht nicht notwendigerweise auf dem vollständigen Vergleich zweier Sequenzen. Stattdessen ist es möglich, Präfixe und Suffixe zu ignorieren, wenn diese die Kosten einer optimalen Alinierung zu stark erhöhen würden,
• lokale Alinierung berücksichtigt nur die Alinierung von Subsequenzen, wobei der
Rest der Sequenzen ignoriert wird,
• diagonale Alinierung setzt eine globale Alinierung aus lokalen Teilalinierungen von
Diagonalen, also Alinierungen, die keine Lücken enthalten, zusammen.
Modus
global
semi-global
lokal
diagonal
Alinierung
G R E E N
A
F A T
G R E E N
- - - - GREEN CATFISH
A FAT CAT
- - - - A
F A T
C
C
A T F I S
A T - - C A T F I
A
F A T
C
H U N T E R
H U N T E R
G R E E N
C
- - - - C
H
S
A
H
H
H
T
A
A
T
T
U
U
H
H
F
-
I
-
N
N
U
U
T
T
N
N
S
-
E
E
T
T
H
-
R
R
E
E
R
R
H
H
U
U
N
N
T
T
E
E
R
R
Die obige Tabelle zeigt, wie im Rahmen der vier Alinierungsmodi
zwei Beispielsequenzen aliniert werden. Versuche, die Unterschiede darzustellen.
4
43
3 Rekonstruktion
Johann-Mattisvon
List Zeichenbeziehungen
18.01.2013
Alinierung
2 Phonetische Alinierung
Obwohl Alinierungsanalysen eine der allgemeinsten Möglichkeiten darstellen, Sequenzen
zu vergleichen, steckt ihre Verwendung in der historischen Linguistik noch in den Kinderschuhen. Natürlich alinieren historische Linguisten eigentlich immer Wörter und haben dies
auch schon immer getan, da ohne Alinierung überhaupt keine regulären Lautkorrespondenzen ermittelt werden könnten. Der Sprachvergleich basierte lange Zeit jedoch eher auf
einer impliziten Alinierung, die selten visualisiert wurde, und wenn doch, dann nur aus
illustrativen Zwecken.
Language
Russian
Polish
French
Italian
German
Swedish
Alignment
s
ɔ
s
w
ɔ
s
ɔ
s
o
s
ɔ
s
uː
n
nʲ
l
l
n
l
ʦ
ʦ
-
ə
ɛ
ɛ
e
ə
-
Language
Russian
Polish
French
Italian
German
Swedish
j
-
(a) Globale Alinierung
Alignment
s
ɔ
s
w
s
ɔ
l
s
o
l
s
ɔ
s
uː
l
ɔ
-
n
nʲ
-
ʦ
ʦ
-
ə
ɛ
-
ɛj
e
nə
(b) Lokale Alinierung
Die obige Tabelle stellt zwei verschiedene Alinierungen von einzelsprachlichen Reflexen von Urindogermanisch *séh₂u̯el- dar, eine
scheinbar naheliegende globale Alinierung, und eine realistische
lokale Alinierung. Was fällt beim Vergleich der beiden Alinierungen auf? Welche Gründe mag es geben, dass eine korrekte
Alinierung in der historischen Linguistik so verdammt schwierig
ist? Warum sind Alinierungen dennoch so unheimlich wichtig für
die historische Linguistik?
2.1 Die zwei Arten von Ähnlichkeit
Die deutschen Wörter schlafen und Flaschen sind recht ähnlich, da sie – phonetisch gesehen – aus sechs verschiedenen Lauten bestehen, die einander recht ähnlich sind. Ähnliche
Ähnlichkeit besteht zwischen den Wörtern Obst und Post. Eine andere Form von Ähnlichkeit besteht zwischen den Wörtern Kerker und Tanten. Die Ähnlichkeit besteht hier nicht
in der Substanz der Lautsequenzen, sondern in der Struktur: beide Wörter bestehen aus
einer identischen Kette unterschiedlicher Zeichen, wie man leicht sehen kann, wenn man
die Wörter aliniert: Jedes distinkte Element korrespondiert direkt mit einem distinkten Element des anderen Wortes, und das Umwandeln der einen Lautsequenz in die andere kann
durch eine einfache Ersetzungstabelle erreicht werden, was nicht möglich ist für schlafen
und Flaschen, da die beiden Lautsequenzen nicht strukturell äquivalent sind. Basierend
auf diesen Überlegungen können wir zwei grundlegende Arten von Ähnlichkeiten zwischen
Wörtern unterscheiden: substantielle und strukturelle Ähnlichkeit.
Lass (1997: 130) verwendet die Termini phänotypische und genotypische Ähnlichkeit um zufällige oberflächliche Ähnlichkeiten
zwischen Wörtern von Ähnlichkeiten zu unterscheiden, die aus der
Kognazität von Wörtern resultieren. In welchem Zusammenhang
steht dieses Ähnlichkeitskonzept zu dem von substantieller und
struktureller Ähnlichkeit?
5
44
Johann-Mattis List
18.01.2013
Alinierung
2.2 Typen des Lautwandels
Die lange Forschungstradition in der historischen Linguistik hat dazu geführt, dass eine
beträchtliche Reihe von Lautwandeltypen von verschiedenen Forschern postuliert wurde.
Leider liegt diesen Lautwandeltypen eine unstete Terminologie zugrunde, die von sehr
konkreten Termini, die sehr konkrete Arten von Lautwandel beschreiben, bis hin zu sehr
generellen Termini, die sehr abstrakte Klassen von Lauten abdecken, reicht. Was in der
Literatur als „Lautwandeltyp” bezeichnet wird, reicht von Phänomenen wie dem „Rhotazismus” (Trask 2000: 288), der, einfach gesagt, auf den Wandel von [s] zu [r] referiert, bis
hin zur Lenisierung (engl. lenition), die einen Wandeltyp bezeichnet, „in which a segment
becomes less consonant-like than previously” (ebd.: 190). Manche Termini sind ferner
eher „erklärend” denn „beschreibend”, da sie gleichzeitig einen Grund dafür nennen, warum sich ein Laut gemäß einem bestimmten Typ wandelt. So wird Assimilierung in vielen
Textbüchern nicht nur beschreiben als „[a] change in which one sound becomes more similar to another”, sondern es wird gleichzeitig betont, dass dies „through the influence of a
neighboring, usually adjacent, sound” geschieht (Campbell und Mixco 2007: 16). Dies ist
natürlich problematisch, da eine Beschreibung einer Erklärung immer vorangehen sollte.
In der folgenden Tabelle werden fünf mehr oder weniger triviale Lautwandeltypen abgeleitet, indem, basierend auf der Gleichsetzung von Lautwandel mit einer Funktion, lediglich das Verhältnis zwischen Eingabe und Ausgabe als Klassifikationskriterium zugrunde
gelegt wird. Da Lautwandel kontextabhängig verlaufen kann, ist es gut möglich, dass eine
solche Funktion zusätzliche Parameter benötigt (wie die Silbenumgebung, den vorangehenden oder nachfolgenden Laut, usw.).
Typ
Kontinuation
Beschreibung
absence of change
Darstellung
x>x
Substitution
Ersetzung eines Lauts
x>y
Insertion
Gewinn eines Lauts
∅>y
Deletion
Verlust eines Lauts
x>∅
Metathesis
change in the order of
sounds
xy > yx
Beispiel
Althochdeutsch hant >
Deutsch Hand
Althochdeutsch snēo >
Deutsch Schnee
Althochdeutsch ioman >
Deutsch jemand
Althochdeutsch angust >
Deutsch Angst
Urslavisch *žьltъ > Tschechisch žlutý “gelb”
Flix der Felertäufel treibt es aber heute wirklich mal wieder
zu bunt! Da hat er schon wieder einige Zellen geweißt. Kannst
Du sie fachgerecht rekonstruieren? Woran erinnern Dich diese
Typen des Lautwandels?
2.3 Lautklassen
Beim Alinieren in der historischen Linguistik ist es wichtig, der Tatsache Rechnung zu tragen, dass substantielle Ähnlichkeit zwischen Lauten nicht notwendigerweise auch auf deren Kognazität hinweist. Nur, wenn zwei Segmente auch systematisch (also in den Sprachsystemen) korrespondieren, sollten sie tatsächlich als ähnlich angesehen werden. In den
Schritten des Sprachvergleichs kann diese systematische Ähnlichkeit jedoch schwer ermittelt werden, denn zu Beginn eines Sprachvergleichs sind weder die kognaten Wörter
6
45
3 Rekonstruktion
Johann-Mattisvon
List Zeichenbeziehungen
18.01.2013
Alinierung
bekannt, noch die regulär korrespondierenden Laute. Für automatische Ansätze zur phonetischen Alinierung und zur automatischen Kognatenerkennung ist es daher wichtig, einen heuristischen Ansatz zu entwickeln, der nicht nach absolut korrespondierenden Segmenten sucht, sondern nach wahrscheinlich korrespondierenden. Theoretische Grundlage
eines solchen Ansatzes ist die von vielen Autoren geteilte Überzeugung, dass die unterschiedlichen Typen von Sprachwandel mit unterschiedlicher Häufigkeit und Wahrscheinlichkeit auftreten. Daraus folgt weiter, dass sich in den Sprachen der Welt bestimmte Muster von Lautkorrespondenzen häufiger finden lassen, als andere.
Um dieser „Korrespondenzwahrscheinlichkeit” im automatischen Sprachvergleich Rechnung zu tragen, bietet sich das Konzept der „Lautklassen” an, das erstmals von Dolgopolsky (1964) vorgeschlagen wurde. Grundlegende Idee dabei ist, dass Laute, die häufig in
Korrespondenzbeziehung in genetisch verwandten Sprachen auftreten, in Klassen (Typen)
eingeteilt werden können. Es wird dabei angenommen, dass „phonetic correspondences
inside a ,type’ are more regular than those between different ,types’” (ebd.: 35).
No.
1
2
3
4
5
6
7
8
9
10
Cl.
"P"
"T"
"S"
"K"
"M"
"N"
"R"
"W"
"J"
"Ø"
Description
labial obstruents
dental obstruents
sibilants
velar obstruents, dental and alveolar affricates
labial nasal
remaining nasals
liquids
voiced labial fricative and initial rounded vowels
palatal approximant
laryngeals and initial velar nasal
Examples
p, b, f
d, t, θ, ð
s, z, ʃ, ʒ
k, g, ʦ, ʧ
m
n, ɲ, ŋ
r, l
v, u
j
h, ɦ, ŋ
Die Tabelle oben zeigt Dolgopolskys ursprüngliches Lautklassenschema. Was fällt auf, wenn man die oben wiedergegebenen
Reflexe des Urindogermanischen Worts für Sonne entsprechend
diesem Schema in Lautklassensequenzen umwandelt?
2.4 Sekundärstrukturen
Abgesehen von einer primären Struktur können Sequenzen auch eine sekundäre Struktur
haben. Primäre Struktur meint hier die Ordnung der Segmente. Unter sekundärer Struktur
wird die Anordnung sekundärer Segmente, d. h. von Segmenten, die aus dem Gruppieren
von primären Segmenten zu höheren Einheiten resultieren, verstanden. Worauf genau die
sekundäre Struktur basiert, ist dabei nebensächlich. Im Zusammenhang mit phonetischen
Sequenzen spielen jedoch sekundäre Segmente wie Silben, Morpheme, Wörter und Sätze, eine mitunter wichtige Rolle. In der phonetischen Alinierungen kommt die wichtigste
Rolle dabei der Morphemstruktur von Wörtern zu, da diese bei der manuellen Alinierung
ohnehin meist implizit angewendet wird, und erst hilft eine realistische Alinierung von Lautsequenzen vorzunehmen.
Die Tabelle unten gibt ein ein Beispiel für die Unterschiede zwischen primärer und
sekundärer Alinierung. Während die primäre Alinierung eine falsche Korrespondenz zwischen dem finalen [t] und dem initialen [tʰ] ansetzt, setzt die sekundäre im Falle von
Yinchuan richtig zwei Morpheme ʐʅ⁵¹ ”Sonne” und tʰou¹ ”Kopf (Suffix)” an, denen ein Morphem zit³ ”Sonne” in Haikou gegenübersteht.
7
46
Johann-Mattis List
18.01.2013
Alinierung
Primäre Alinierung
Haikou
z
i
Beijing
ʐ
ʅ
⁵¹
t
tʰ
ou
³
¹
Sekundäre Alinierung
Haikou
z
i
t
Beijing
ʐ
ʅ
-
³
⁵¹
tʰ
ou
¹
Da die Morphemstruktur chinesischer Wörter meist eindeutig
mit deren Silbenstruktur gleichzusetzen ist (eine Silbe = ein
Morphem), ist die sekundäre Alinierung in diesen Fällen einfach.
Wie sieht dies bei anderen Sprachen aus?
Literatur
Böckenbauer, H.-J. und D. Bongartz (2003). Algorithmische Grundlagen der Bioinformatik.
German. Stuttgart, Leipzig und Wiesbaden: Teubner.
Campbell, L. und M. Mixco (2007). A glossary of historical linguistics. Edinburgh: Edinburgh
University Press.
Dolgopolsky, A. B. (1964). “Gipoteza drevnejšego rodstva jazykovych semej Severnoj Evrazii s verojatnostej točky zrenija [A probabilistic hypothesis concering the oldest relationships among the language families of Northern Eurasia]”. In: Voprosy Jazykoznanija
2, 53–63.
Gusfield, D. (1997). Algorithms on strings, trees and sequences. Cambridge: Cambridge
University Press.
Hamming, R. W. (1950). “Error detection and error detection codes”. In: Bell System Technical Journal 29.2, 147–160.
IPA Handbook (1999). Handbook of the International Phonetic Association. A guide to the
use of the international phonetic alphabet. Cambridge: Cambridge University Press.
Kruskal, J. B. (1983). “An overview of sequence comparison. Time warps, string edits, and
macromolecules”. In: SIAM Review 25.2, 201–237. JSTOR: 2030214.
Lass, R. (1997). Historical linguistics and language change. Cambridge: Cambridge University Press.
Levenshtein, V. I. (1965). “Dvoičnye kody s ispravleniem vypadenij, vstavok i zameščenij simvolov [Binary codes with correction of deletions, insertions and replacements]”.
In: Doklady Akademij Nauk SSSR 163.4, 845–848; English translation: – (1966). “Binary codes capable of correcting deletions, insertions, and reversals”. In: Soviet Physics
Doklady 10.8, 707–710.
Trask, R. L., Hrsg. (2000). The dictionary of historical and comparative linguistics. Edinburgh: Edinburgh University Press.
8
47
3 Rekonstruktion
Johann-Mattisvon
List Zeichenbeziehungen
18.01.2013
Kognatenerkennung
Kognatenerkennung
1 Die komparative Methode
Die Methode der heutigen Komparativistik, welche allgemein unter dem nicht sehr
glücklichen Terminus „vergleichend-historische Methode” bekannt ist, stellt eine große
Gesamtheit an abstrakten und konkreten Verfahren zur Untersuchung der Geschichte verwandter Sprachen dar, die genetisch auf eine bestimmte einheitliche Tradition
der Vergangenheit zurückgehen, welche man üblicherweise als Proto-Sprache oder
Grundsprache qualifiziert. Dieses methodische Instrumentarium, auf welches zurückgegriffen wird, um eine große Menge verschiedener Probleme zu lösen, wird verwendet, um ein Erkenntnissystem über die historische Entwicklung von Sprachfamilien aufzubauen, welches seine endgültige Gestalt in From historisch-vergleichender Grammatiken erhält. (Klimov 1990: 6)1
Ja, nee, is klar! Eine Methode, die aus einem Sammelsurium unterschiedlichster Verfahren besteht? Manchmal haben die historischen
Linguisten wirklich ein paar Knoten locker. Wenn das ultimative Ziel
dieser Methode darin bestehen soll, die historische Entwicklung von
Sprachfamilien aufzuzeigen, dann kann man ja sicher eine ganze Menge
Unterverfahren ansetzen, aus denen diese "Methode" besteht. Und
die wären?
1.1 Grundannahmen
Zu den unumstößlichen Grundannahmen der komparativen Methode zählen die Annahme
der Regelmäßigkeit von Lautwandel (Regularitätspostulat), der Universalität von Sprachwandel (Universalitätspostulat), und der Möglichkeit von Sprachspaltung (Postulat der
baumartigen Sprachentwicklung). Entsprechend der ersten Annahme verläuft Lautwandel
demnach dergestalt, dass er große Teile des Lexikons einer Sprache erfasst und lediglich
vom phonetischen Kontext abhängt, nicht jedoch von anderen Faktoren, wie bspw. der
Bedeutung der Wörter. Die zweite Annahme besagt, dass Sprachwandel unabhängig vom
Ort, der Zeit und der Sprache eintritt, und die dritte besagt, dass unabhängiger Sprachwandel bei geographischer Trennung der Sprecher einer Sprache im Laufe der Zeit zu
Sprachspaltung führen kann.
Welcher linguistischen Tradition lässt sich das Regularitätspostulat der
komparativen Methode zuschreiben und worin bestehen die Probleme
dieser Tradition? Ist das dritte Postulat wirklich wichtig genug, dass
es in diesem Zusammenhang extra genannt werden muss?
1
Meine Übersetzung, Originaltext: «Методика современной компаративистики, щироко известная в
лингвистической литературе под довольно неудачным термином ”сравнительно-исторический
метод”, представляет собой больщую совокупность методов и конкретных приемов изучения
истории родственных языков,генетически восходящих к некоторой единой традиции прощлого,
обычно квалифицируемой в качестве праязыка или языка-основой. Этот методический
инструментарий, призванный обслуживать рещение множества задач, используется для
построения системы знаний об историческом развитии языковых семей, формируемой в конечном
счете в виде сравнительно-исторических грамматик».
1
48
Johann-Mattis List
18.01.2013
Kognatenerkennung
1.2 Arbeitsweise
Allgemeine Arbeitsweise
Hinsichtlich der allgemeinen Arbeitsweise der komparativen Methode sind sich die Forscher nicht immer einig. Eine der explizitesten Zusammenfassungen, die ich bisher finden
konnte, stammt von Ross und Durie (1996: 6f):
1. Determine on the strength of diagnostic evidence that a set of languages are
genetically related, that is, that they constitute a ‘family’;
2. Collect putative cognate sets for the family (both morphological paradigms and
lexical items).
3. Work out the sound correspondences from the cognate sets, putting ‘irregular’
cognate sets on one side;
4. Reconstruct the protolanguage of the family as follows:
a Reconstruct the protophonology from the sound correspondences worked
out in (3), using conventional wisdom regarding the directions of sound
changes.
b Reconstruct protomorphemes (both morphological paradigms and lexical
items) from the cognate sets collected in (2), using the protophonology reconstructed in (4a).
5. Establish innovations (phonological, lexical, semantic, morphological, morphosyntactic) shared by groups of languages within the family relative to the reconstructed protolanguage.
6. Tabulate the innovations established in (5) to arrive at an internal classification
of the family, a ‘family tree’.
7. Construct an etymological dictionary, tracing borrowings, semantic change, and
so forth, for the lexicon of the family (or of one language of the family).
Nicht, dass das die einzige Frage wäre, die hier offen bleiben kann,
aber was verstehen die Autoren wohl unter "diagnostischer Evidenz",
und warum ist es wichtig, Sprachverwandtschaft zu Beginn der komparativen Methode bereits nachgewiesen zu haben?
1.2.1 Der Versuch eines Arbeitsschemas
Jeder historische Linguist hat wohl eine
etwas andere Auffassung von dem, was
die komparative Methode denn eigentlich
sei. Daher ist es schwierig, einen verbindlichen Konsens zu finden. Basierend auf
den bekanntesten Beschreibungen in der
Literatur lässt sich jedoch ein fünfstufiges
Arbeitsschema festlegen, wie es auf der
Graphik zur Rechten zu sehen ist. Die
gestrichelten Linien zwischen den unterschiedlichen Arbeitsschritten deuten dabei den iterativen Charakter der Methode
an.
proof of
relationship
revise
identification
of cognates
identification of
sound correspondences
revise
revise
reconstruction
of proto-forms
internal
classification
revise
2
49
3 Rekonstruktion
Johann-Mattisvon
List Zeichenbeziehungen
18.01.2013
Kognatenerkennung
Die komparative Methode wird oft als iteratives Verfahren beschrieben, wobei der iterative Charakter als eine große Stärke der Methode
hervorgehoben wird. Was bedeutet "iterativ" überhaupt, und warum
sollte das eine Stärke sein?
Kognatenerkennung
Wenn wir nur das Verfahren zur Kognatenerkennung betrachten, das in der komparativen
Methode zur Anwendung kommt, so lässt sich dieses in etwa wie folgt beschreiben:
• Erstelle eine erste Liste möglicher Kognatensets.
• Aliniere die Wörter in der Kognatenliste.
• Extrahiere eine erste Liste möglicher Lautkorrespondenzen aus den Alinierungen.
• Verbessere die Kognatenliste und die Korrespondenzliste durch
– Hinzufügen von mit der Korrespondenzliste kompatiblen und Entfernen von mit
der Korrespondenzliste nicht kompatiblen Kognatensets,
– Hinzufügen von mit der Kognatenlisteliste kompatiblen und Entfernen von mit
der Kognatenliste nicht kompatiblen Korrespondenzsets.
• Hör auf, wenn die Resultate publikationsreif sind.
Der iterative Charakter der komparativen Methode erstreckt sich
streng genommen durch alle ihre Arbeitsschritte. Somit hängt auch
das Verfahren zur Kognatenerkennung von den ihm im Schema vorangehenden (Nachweis von Sprachverwandtschaft) und den ihm nachfolgenden Schritten (Rekonstruktion und interne Klassifikation) ab.
Versuche, zu erläutern, wie man sich diese gegenseitige Abhängigkeit
vorstellen kann.
Zusammenfassung
Die komparative Methode ist ein iteratives Verfahren zur Kognatenerkennung, sowie zur
linguistischen und zur phylogenetischen Rekonstruktion. Grundlage des Verfahrens zur
Kognatenerkennung sind Verfahren zur phonetischen Alinierung und zur Endeckung regulärer Lautkorrespondenzen.
Die Vorteile der komparativen Methode bestehen in ihrer Flexibilität und ihrer Zuverlässigkeit. Die Methode ist flexibel, insofern als sie gleichzeitig auf viele Sprachen (multilingualer Aspekt) und auf unterschiedlichste Sprachdaten angewendet werden kann (multimodaler (?) Aspekt). Ihre Verlässlichkeit begründet sich dadurch, dass die Wirksamkeit
der Methode im Verlaufe der Geschichte inzwischen an vielen Beispielen aufgezeigt werden konnte. Derzeit gibt es noch keine wirkliche Alternative zu diesem Verfahren.
Bisher wurden nur die Vorteile der komparativen Methode aufgezeigt.
Wie sieht es aber mit den Nachteilen aus?
3
50
Johann-Mattis List
18.01.2013
Kognatenerkennung
2 Automatische Kognatenerkennung
2.1 Kognatenerkennung als Problem
In der Mathematik und Algorithmik ist es üblich, bestimmte Aufgaben als „Probleme” zu
klassifizieren. Der Gedanke, der wahrscheinlich dahintersteht ist, dass es leichter ist, etwas zu lösen, wenn man sich vorher klar darüber geworden ist, was eigentlich gelöst werden soll. In diesem Sinne können wir auch im Zusammenhang mit der automatischen Kognatenerkennung von einem „Problem” sprechen, wobei wir zwischen unterschiedlichen
Problemstufen unterscheiden können.
Bevor wir zu den richtigen Problemen kommen, sollten wir uns noch
einmal kurz in Erinnerung rufen, was Kognaten eigentlich sind.
Generelles Problem der Kognatenidentifikation
Gegeben sind Wortlisten verschiedener Sprachen. Finde alle Wörter in diesen
Listen, die kognat sind.
Charakteristik
Unterscheidung von Lehn- und Erbwörtern
Semantische Ähnlichkeit wird vorausgesetzt
Auf unbegrenzte Anzahl von Sprachen anwendbar
Ja
Nein
Die Tabelle enthält drei Charakteristika des Problems der Kognatenidentifikation. Ob diese Charakteristika jedoch vorliegen, oder nicht,
wurde offengelassen. Kreuze die Ausprägungen der Charakteristika an, die sich aus der Beschreibung des generellen Problems der
Kognatenidentifikation ableiten lassen.
Generelles Problem der Identifikation etymologisch verwandter Wörter
Gegeben sind Wortlisten verschiedener Sprachen. Finde alle Wörter in diesen
Listen, die etymologisch verwandt sind.
Charakteristik
Unterscheidung von Lehn- und Erbwörtern
Semantische Ähnlichkeit wird vorausgesetzt
Auf unbegrenzte Anzahl von Sprachen anwendbar
Ja
Nein
Kreuze die entsprechenden Ausprägungen der Charakteristika des generellen Problems der Identifikation etymologisch verwandter Wörter
an. Wie könnte man dieses Problem alternativ nennen?
Spezielles Problem der Identifikation etymologisch verwandter Wörter
Gegeben ist eine mehrsprachige Wortliste, also eine Wortliste, die semantisch
alinierte Wörter verschiedener Sprachen enthält. Finde alle Wörter in dieser
Liste, die etymologisch verwandt sind.
4
51
3 Rekonstruktion
Johann-Mattisvon
List Zeichenbeziehungen
18.01.2013
Charakteristik
Unterscheidung von Lehn- und Erbwörtern
Semantische Ähnlichkeit wird vorausgesetzt
Auf unbegrenzte Anzahl von Sprachen anwendbar
Kognatenerkennung
Ja
Nein
Kreuze die entsprechenden Ausprägungen der Charakteristika des
speziellen Problems der Identifikation etymologisch verwandter Wörter
an. Woran mag es liegen, dass von den bisher postulierten Algorithmen
zur automatischen Kognatenerkennung vorwiegend dieses Problem im
Gegensatz zu den beiden zuvor genannten allgemeineren Problemen
adressiert wurde?
2.2 Die Entdeckung von Lautkorrespondenzen
Signifikanz und Gradualität
Die Entdeckung von Lautkorrespondenzen ist ein stochastisches Problem. Es geht dabei
weniger um die absolute An- zahl an Korrespondenzen, die im Rahmen eines Sprachvergleichs aufgefunden werden können, als vielmehr darum, ob diese Anzahl tatsächlich signifikant ist. Dies wiederum führt automatisch zu einer Abkehr vom üblicherweise
bemühten „Absolutheitspostulat”: Traditionell werden Lautkorrespondenzen nämlich meist
als absolut angesehen: Entweder treten sie auf, oder nicht. Tatsächlich aber sollten Lautkorrespondenzen angesichts der für die historische Linguistik typischen sich ständig ändernden Datenlage als graduell angesehen werden, wobei manche Lautkorrespondenzen
wahrscheinlicher und manche weniger wahrscheinlich sind.
Manche Wissenschaften haben sich im Laufe ihrer Geschichte eine
absolutierende Attitüde zugelegt. Die historische Linguistik gehört
zweifellos auch dazu. Womit mag dies zusammenhängen? Lassen sich
gute Gründe leichter erkennen, wenn man die historische Linguistik
mit ähnlichen Wissenschaften vergleicht?
Quantifizieren von Lautkorrespondenzen
In der Bioinformatik ist es üblich, die Wahrscheinlichkeit von Korrespondenzen zu ermitteln, indem man attestierte mit erwarteten (zufälligen) Verteilungen vergleicht. Auf die Linguistik übertragen bedeutet das, dass wir eine attestierte Verteilung korrespondierender
Laute vergleichen mit einer Verteilung, die wir erwarten würden, wenn zwei oder mehr
Sprachen nicht miteinander verwandt sind. Normalerweise werden in der historischen Linguistik dabei lange Listen möglicher Kognaten angeführt, wie in der folgenden Liste, die
Beispielwörter aus dem Italienischen und dem Französischen aufführt:
Meaning
“square”
“feather”
“flat”
Italian
pjaʦːa
pjuma
pjano
French
plas
plym
plɑ̃
Meaning
“tear”
“tongue”
“moon”
Italian
lakrima
liŋgwa
luna
French
laʀm
lɑ̃ɡ
lyn
Tatsächlich sind es aber nicht nur mögliche Kognaten, auf denen die Identifizierung erster
möglicher Lautkorrespondenzen beruht, sondern mögliche alinierte Kognaten, wie sie die
folgende Liste zeigt:
5
52
Johann-Mattis List
18.01.2013
“square”
“feather”
“flat”
| pp
| pp
| pp
j
l
j
l
j
l
a
a
u
y
a
ɑ̃
ʦː a
s -.
m a
m -.
n o
- -.
|
|
|
Kognatenerkennung
| ll
| ll
| ll
“tear”
“tongue”
“moon”
a
ɑ
i
ɑ̃
u
y
k
ŋ
n
n
r i m
ʀ - m
w a
g -.
a
-.
a
-.
|
|
|
Das Quantifizieren von Lautkorrespondenzen könnte man nun als einfachen Prozess des
Zählens darstellen, für den man eine einfache Matrix anlegt, und in dieser alle Kookkurrenzen aller Lautkombinationen auflistet (siehe linke Tabelle unten). Tatsächlich wird man damit dem oben erwähnten Regularitätspostulat des Lautwandels nur unzulänglich gerecht,
da Lautwandel ja nur selten unabhängig vom phonetischen Kontext stattfindet. Daher ist
es sinnvoller, auch den Kontext in die Quantifizierung miteinzubeziehen, indem man Laute nicht nur durch ihre Substanz, sondern auch durch ihren sonorischen Kontext (initial,
steigende, fallende Sonorität, final, etc.) charakterisiert (Tabelle links). Basierend auf derartigen Überlegungen lässt sich bereits ein der manuellen komparativen Methode recht
nahe kommendes automatisches Modell der Kognatenerkennung erstellen.
p
l
a
...
p
3
0
0
...
j
0
3
0
...
a
0
0
1
...
l
0
3
0
...
...
...
...
...
...
p/#
l/#
l/C
a/V
...
p/#
3
0
0
0
...
j/C
0
0
3
0
...
a/C
0
0
0
1
...
l/C
0
3
0
0
...
...
...
...
...
...
...
Ist die Einbeziehung des phonetischen Kontexts für die Entdeckung
regulärer Lautkorrespondenzen tatsächlich so entscheidend? Begründe
Deine Meinung mit Rückgriff auf die Beispielwörter aus dem Italienischen und Französischen.
2.3 Clusterung
Unter Clusterung versteht man normalerweise die Einteilung von Objekten in Gruppen.
Somit stellt die Unterteilung von Deutsch, Englisch, Italienisch und Französisch in germanische und romanische Sprachen eine Clusterung dar. Wenn wir uns die Probleme der
Kognatenerkennung genauer anschauen, fällt auf, dass es sich auch hierbei primär um
Clusteraufgaben handelt. Es geht nämlich darum, Wörter in Gruppen einzuteilen, wobei
Wörter, die der gleichen Gruppe zugeordnet werden, jeweils als miteinander „kognat” oder
„etymologisch verwandt” klassifiziert werden. Die Wörter Deutsch Zahn [ʦaːn], Italienisch
dente [dɛnte], Niederländisch tand [tand], Russisch zub [zup], und Englisch tooth [tʊːθ]
würde man dabei beispielsweise zwei verschiedenen Clustern zuschreiben, einem, dem
alle Wörter angehören, die ein Reflex von Urindogermanisch *deh₃nt- „Zahn” sind (Zahn,
dente, tand und tooth), und einem, dem die Wörter angehören, die ein Reflex von Urindogermanisch *ǵombʰ-o- „Nagel” sind (zub) (DERKSEN: 549).
ʦaːn
dɛnte
tand
zub
tʊːθ
ʦaːn
0.00
0.53
0.35
0.57
0.57
dɛnte
0.53
0.00
0.10
0.97
0.52
tand
0.35
0.10
0.00
0.86
0.39
zup
0.57
0.97
0.86
0.00
0.70
tʊːθ
0.57
0.52
0.39
0.70
0.00
6
53
3 Rekonstruktion
Johann-Mattisvon
List Zeichenbeziehungen
18.01.2013
Kognatenerkennung
In automatischen Analysen haben Clusterverfahren den großen Vorteil, dass die Evidenz, die beim Vergleich von lediglich einem Sprachpaar fehlen mag, durch allgemeine
Evidenz ausgeglichen werden kann. Die Verwendung multipler Evidenz (Sturtevant 1920:
11) ist ein grundlegendes Charakteristikum der komparativen Methode, dem auf diese
Weise Rechnung getragen werden kann.
Die Tabelle zeigt die paarweisen Distanzen, die mit Hilfe der SCAAlinierungsmethode (List 2012b) errechnet wurden, zwischen den oben
erwähnten fünf unterschiedlichen Wörtern für "Zahn" auf. Inwiefern
lässt sich anhand dieser Tabelle zeigen, wie wichtig es ist, sich beim
Sprachvergleich auf multiple Evidenz zu stützen? Beachte dabei die in
hellgrau und grau unterlegten Zellen.
2.4 LexStat
INPUT
word lists (semantically aligned)
CONVERSION
convert words into sound classes and prosodic strings
PREPROCESSING
calculate preliminary cognates
using a simple distance method
repeat
1000
SCORING SCHEME CREATION
times
ATTESTED
EXPECTED
align all preliminary cognates using global and
local alignment analyses
shuffle word lists, align
word pairs, and count
correspondences
LOG-ODDS
merge the distributions
by calculating the logodds scores
DISTANCE
calculate pairwise distances
between all language pairs
CLUSTERING
cluster all words into cognate
sets whose distance is beyond
the threshold
OUTPUT
write the cluster decisions and
the alignments to text file
Die Graphik zeigt das Schema der LexStat-Methode zur automatischen Kognatenerkennung (List 2012a). Diese Methode nimmt die meisten der bisher erwähnten Ideen zur au-
7
54
Johann-Mattis List
18.01.2013
Kognatenerkennung
tomatischen Kognatenerkennung auf und vereint sie in einem Rahmenwerk, das recht nah
den grundlegenden Ideen der traditionellen komparativen Methode folgt. LexStat basiert
auf einer alinierungsbasierten Strategie zur automatischen Identifikation von Lautkorrespondenzen und bietet einen Lösungsansatz für das spezielle Problem der Identifikation
etymologisch verwandter Wörter. Phonetische Alinierung kommt in zwei Schritten des Programms zum Tragen: als anfängliche Heuristik, die helfen soll, auch nur „verheißungsvolle
Wortpaare” in die engere Auswahl möglicher Kognaten zu nehmen, und als abschließendes Evaluierungsverfahren, mit dessen Hilfe die Distanzen zwischen den Wörtern der Eingabe berechnet werden, die dann mit Hilfe des Clusterverfahrens in eindeutige „Kognazitätspostulate” überführt werden. Die phonetische Alinierung selbst basiert in der anfänglichen Heuristik auf dem Lautklassen-Verfahren. Es werden also nicht direkt phonetische
Sequenzen aliniert, sondern durch Umwandlung der IPA-Zeichen in ein erweitertes Lautklassenschema erzeugte Lautklassensequenzen. Die folgende Abbildung verdeutlicht das
zugrundeliegende Schema.
INPUT
tɔxtər
dɔːtər
TOKENIZATION
CONVERSION
ALIGNMENT
CONVERSION
t, ɔ, x, t, ə, r
d, ɔː, t, ə, r
t ɔx… → T O G …
d ɔː t … → T O T …
T O G … → tɔx…
T O - … → d oː - …
T O G T E R
T O - T E R
OUTPUT
t ɔ x t ə r
d ɔː - t ə r
Obwohl die LexStat-Methode auf der automatischen Identifikation
regulärer Lautkorrespondenzen basiert, ist sie prinzipiell nicht in der1
Lage, zwischen Xenologen und Kognaten zu unterscheiden. Woran
liegt das?
Literatur
Klimov, G. A. (1990). Osnovy lingvističeskoj komparativistiki [Foundations of comparative
linguistics]. Moscow: Nauka.
List, J.-M. (2012a). “LexStat. Automatic Detection of Cognates in Multilingual Wordlists”. In:
Proceedings of the EACL 2012 Joint Workshop of LINGVIS & UNCLH. (Avignon, France,
23.–24. Apr. 2012). Association for Computational Linguistics, 117–125.
– (2012b). “SCA. Phonetic alignment based on sound classes”. In: New directions in logic,
language, and computation. Hrsg. von M. Slavkovik und D. Lassiter. LNCS 7415. Berlin
und Heidelberg: Springer, 32–51.
Ross, M. D. und M. Durie (1996). “Introduction”. In: The comparative method reviewed:
Regularity and irregularity in language change. Hrsg. von M. Durie. New York: Oxford
University Press, 3–38.
Sturtevant, E. H. (1920). The pronunciation of Greek and Latin. Chicago: University of
Chicago Press. Internet Archive: pronunciationgr00unkngoog.
Wörterbücher
DERKSEN
R. Derksen, Hrsg. (2008). Etymological dictionary of the Slavic inherited lexicon. Leiden Indo-European Etymological Dictionary Series 4. Leiden und
Boston: Brill.
8
55
3 Rekonstruktion
Johann-Mattisvon
List Zeichenbeziehungen
Übungen
2013-01-18
Übungen: Tocharisch A und B (S. A. Burlak) 1
1 Ausgangspunkt
Gegeben sind Wörter aus Tocharisch B 2 , die in einer nicht-traditionellen lateinischen Transkription wiedergegeben werden und ihre Übersetzungen für die meisten von ihnen in Tocharisch A (vgl. Tabelle 1).
Toch. B
tapre
šaŋkʷ
sark
kare
sakʷ
yat
taŋkʷ
ratre
Toch. A
tpär
šuŋk
särk
kär
suk
yät
?
?
Toch. B
ñakte
yalce
yarke
yakʷ
šal´pe
yakne
l´am
kante
Toch. A
ñkät
wälc
yärk
yuk
?
wkäṇ
l´äm
känt
Tabelle 1: Wörter in Toch. B und ihre Entsprechungen in Toch. A
2 Aufgaben
A 1: Füllen Sie die Lücken aus.
A 2: Wie könnte Tocharisch A l´äk in der Übersetzung nach Tocharisch B aussehen? Und
wie Tocharisch B yarm in der Übersetzung nach Tocharisch A?
3 Anmerkungen
Im Tocharischen wird y ungefähr wie dt. <ü> ausgesprochen, c ungefähr wie dt. <z>, l
´ ungefähr wie dt. <lj>, ñ ungefähr wie dt. <nj>, š ungefähr wie dt. <sch>, ŋ in etwa wie
dt. <ng>, kʷ wie <qu>, ṇ stellt einen schwachen nasalen Anlaut dar, ä einen besonderen
tocharischen Vokal.
Literatur
Burlak, S. A. und S. A. Starostin (2005). Sravnitel’no-istoričeskoe jazykoznanie [Comparativehistorical linguistics]. Moscow: Akademia.
1
2
Aufgabe aus: Burlak und Starostin (2005: 390). Meine Übersetzung.
Tocharisch A und Tocharisch B sind tote Sprachen, die eine besondere Gruppe innerhalb der indogermanischen Sprachfamilie darstellen. Sie waren verbreitet im chinesischen Turkestan vom 6. bis zum 8. Jh.
unserer Zeit.
1
56
4 Rekonstruktion von
Sprachbeziehungen
Hat man die Beziehungen zwischen Zeichen rekonstruiert, so kann in einem weiteren Schritt die Beziehung zwischen Sprachsystemen rekonstruiert werden. Hier sind
zwei Aspekte zu unterscheiden: Die Rekonstruktion externer Sprachgeschichte, und der
Nachweis von Sprachverwandtschaft.
57
4 Rekonstruktion
Johann-Mattisvon
List Sprachbeziehungen
Phylogenetische Rekonstruktion
21.02.2013
Phylogenetische Rekonstruktion
1 Allgemeines zur phylogenetischen Rekonstruktion
1.1 Innere und äußere Sprachgeschichte
Georg von der Gabelentz (1840 – 1893) war ein genialer Sprachwissenschaftler, dessen
Werk in der modernen Sprachforschung leider allzu oft ignoriert wird. Da 2013 nicht nur
Grimm-Jahr, sondern auch Gabelentz-Jahr ist, rufen wir uns noch einmal einige seiner
berühmtesten Sätze in Erinnerung.
Der Zweig der Sprachforschung, der uns hier beschäftigt, hat es zunächst mit den
trockensten Einzelthatsachen zu thun: Sind die Sprachen A und B miteinander verwandt, und in welchem Grade? Giebt es dieses Wort oder jene Form in der und der
Sprache oder in der und der Zeit der Sprachgeschichte? wie lautet es da? Welche Gesetzmässigkeit herrscht in den lautlichen Abweichungen? Besteht im einzelnen Falle
Urgemeinschaft oder Entlehnung? Was ist alles Gemeingut, was neu hinzu erworben?
u. s. w. Alles das klingt und is auch wirklich sehr trocken. Was die menschliche Rede im Innersten bewegt, was sonst die Wissenschaft von den Sprachen der Völker zu
einer der lebensvollsten macht, das tritt hier zunächst zurück: nur einige ihrer Ausläufer ranken in das Seelen- und Sittenleben der Völker hinüber. Der einzelsprachliche
Forscher kann gar nicht schnell genug die fremde Sprache in’s eigene Ich aufnehmen:
der Sprachhistoriker steht draussen vor seinem Gegenstande: hier der Anatom, da der
Cadaver. (Gabelentz 1891: 145)
Wir werden, um Missverständnisse zu vermeiden, gut thun, zwischen äusserer und
innerer Sprachgeschichte zu unterscheiden. Die äussere Geschichte einer Sprache ist
die Geschichte ihrer räumlichen und zeitlichen Verbreitung, ihrer Verzweigungen und
etwaigen Mischungen (Genealogie). Die innere Sprachgeschichte erzählt und sucht
zu erklären, wie sich die Sprache in Rücksicht auf Stoff und Form allmählich verändert
hat. (ebd.: 146)
In der Biologie unterscheidet man zwischen Phylogenese und Ontogenese, wobei Phylogenese die (ausschnittsweise) Geschichte aller Arten bezeichnet, und Ontogenese die Geschichte einzelner
Organismen. Lassen sich diese Termini mit der inneren und
der äußeren Sprachgeschichte Gabelentz' vergleichen, und wenn
nicht Welche grundlegenden Probleme und Unterschiede lassen
sich festhalten?
1.2 Bäume, Wellen, Netze
Bäume
Es wurde bereits in der zweiten Sitzung darauf hingewiesen, dass August Schleicher eine herausragende Persönlichkeit in der Geschichte der Linguistik war und wir ihm insbesondere die sogenannte Stammbaumtheorie verdanken, die er in zwei frühen Werken
erstmals im Jahre 1853 veröffentlichte (Schleicher 1853a, Schleicher 1853b). Schleichers
Theorie zur äußeren Sprachgeschichte war wahrscheinlich direkt beeinflusst von František
Čelakovský (1799 – 1852), den er während einer Professur in Prag kennengelernt hatte,
und der noch vor Schleicher einen ersten Stammbaum der slawischen Sprachen veröffentlichte (Čelakovský 1853).
1
58
Johann-Mattis List
Phylogenetische Rekonstruktion
21.02.2013
Die ältesten teilungen des indogermanischen bis zum entstehen der grundsprachen
der den sprachstamm bildenden sprachfamilien laßen sich durch folgendes schema
anschaulich machen. Die länge der linien deutet die zeitdauer an, die entfernung derselben von einander den verwantschaftsgrad. (Schleicher 1861: 6)
Oben sind eine Abbildung und ein Zitat aus Schleichers berühmtem Werk "Compendium der vergleichenden Grammatik der indogermanischen Sprachen" wiedergegeben. Auf welchen Grundannahmen beruht die Stammbaumtheorie? Welchen Anspruch hat
sie in Bezug auf die Darstellung von Sprachgeschichte?
Welle
Nicht lange, nachdem August Schleicher seine berühmte Stammbaumtheorie erstmals
postuliert hatte, regte sich Widerspruch in den Kreisen der Indogermanisten und historischen Linguisten. Am bekanntesten ist in diesem Zusammenhang das Werk von Johannes
Schmidt (1843 – 1901), der die Stammbaumtheorie verwarf, und an ihrer Stelle seine nicht
minder berühmte Wellentheorie propagierte.
Es bleibt also keine Wahl, wir müssen anerkennen, dass das lituslawische einerseits
untrennbar mit dem deutschen, andererseits ebenso untrennbar mit dem arischen verkettet ist. Die europäischen, deutschen und arischen charakterzüge durchdringen einander so vollständig, dass eine ganze reihe von erscheinungen nur durch ir organisches zusammenwirken hervorgerufen ist, und dass es worte gibt, deren form weder
ganz europäisch noch ganz arisch ist und nur als ergebniss diser beiden einander
durchkreuzenden strömungen begreiflich wird. (Schmidt 1872: 16)
Wollen wir nun die verwantschaftsverhältnisse der indogermanischen sprachen in einem bilde darstellen, welches die entstehung irer verschidenheiten veranschaulicht,
so müssen wir die idee des stammbaumes gänzlich aufgeben. Ich möchte an seine
stelle das bild der welle setzen, welche sich in concentrischen mit der entfernung vom
2
59
4 Rekonstruktion
Johann-Mattisvon
List Sprachbeziehungen
Phylogenetische Rekonstruktion
21.02.2013
mittelpunkte immer schwächer werdenden ringen ausbreitet. Dass unser sprachgebiet keinen kreis bildet, sondern höchstens einen kreissector, dass die ursprünglichste
sprache nicht im mittelpunkte, sondern an dem einen ende des gebietes ligt, tut nichts
zur sache. Mir scheint auch das bild einer schiefen vom sanskrit zum keltischen in
ununterbrochener linie geneigten ebene nicht unpassend. (Schmidt 1872: 27)
Die oben wiedergegebenen zwei Ausschnitte aus Schmidts Werk
sollen seine Argumente gegen die Stammbaum- und für die
Wellentheorie illustrieren. Worin genau bestehen diese Argumente gegen die Stammbaumtheorie? Wie genau hat man sich
die Wellentheorie vorzustellen?
Netze und anderes Gewirr
Das größte Problem von Schmidts Wellentheorie war, das niemand genau wusste, wie er
die äußere Sprachgeschichte denn nun schematisch darstellen sollte. Und so finden wir im
Laufe der Geschichte eine Vielzahl von Versuchen zur Visualisierung der Wellentheorie.
(a) Hirt (1905)
(b) Meillet (1908)
(c) Bonfante (1931)
(d) Bloomfield (1933)
Oben sind vier unterschiedliche Versuche, die Wellentheorie zu
visualisieren, wiedergegeben. Was haben alle diese Versuche gemein und worin bestehen ihre Unterschiede? Worin unterscheiden
sich die alternativen (Wellen-)Modelle in ganz prägnanter Weise
von der Stammbaumtheorie?
1.3 Perspektiven
Ein grundlegender Unterschied zwischen Stammbaum- und Wellentheorie liegt in ihrer unterschiedlichen Ausrichtung: Während sich die Wellentheorie, wie man an den späteren
3
60
Johann-Mattis List
Phylogenetische Rekonstruktion
21.02.2013
Visualisierungsversuchen und auch an Äußerungen Schmidts sehen kann, an der epistemologischen Perspektive der äußeren Sprachgeschichte orientiert, orientiert sich die
Stammbaumtheorie stark an der ontologischen Perspektive derselben. Dass es wichtig
ist, diese beiden Perspektiven zu unterscheiden, wurde nun schon oft in diesem Seminar
angedeutet. In Bezug auf die äußere Sprachgeschichte ist die Unterscheidung deshalb so
relevant, weil der Unterschied zwischen dem, was man wissen kann, und dem, was man
gern wissen würde, mitunter sehr groß sein kann. Schmidt begründet seine Ablehnung
der Stammbaumtheorie mit dem Hinweis auf die Unmöglichkeit, die Fakten mit Hilfe eines
Baums darzustellen.
Man mag sich also drehen und wenden wie man will, so lange man an der anschauung
fest hält, dass die in historischer zeit erscheinenden sprachen durch merfache gabelungena us der ursprache hervorgegangen seien, d. h. so lange man einen stammbaum der indogermanischen sprachen annimmt, wird man nie dazu gelangen alle die
hier in frage stehenden tatsachen wissenschaftlich zu erklären. (Schmidt 1872: 17)
Seine Fakten sind dabei vor allem Auflistungen geteilter Wurzeln (Kognaten im weiten Sinne) zwischen verschiedenen indogermanischen Sprachen. Das Problem dieser „Fakten”
ist jedoch, dass sie selbst vom jeweiligen Forschungsstand abhängen. Wenn man zum
Beispiel Schmidts Zählungen zu geteilten Wurzeln zwischen Griechisch, Altindisch und
Latein mit der Anzahl an Wurzeln in Nicholaev (2007) vergleicht, so fällt auf, dass die starke Nähe zwischen Latein und Griechisch, die Schmidts Daten vermuten lassen, vor dem
Hintergrund der Daten Nicholaevs gar nicht mehr so ausgeprägt erscheinen. Ähnliches gilt
für die bei Schmidt sehr geringe Anzahl an Ähnlichkeiten zwischen Altindisch und Latein.
(a) Schmidt (1872)
(b) Nicholaev (2007)
Johannes Schmidt würde wahrscheinlich sagen, dass man die
Daten in der Abbildung oben nicht mit Hilfe eines Baumes darstellen kann. Stimmt das? Und wenn nicht, welche Unterschiede
zeigen dann der Baum von Schmidt und der von Nicholaev?
1.4 Darstellung
Wir müssen unterscheiden zwischen Schemata (seien es Wellen oder Bäume) zur Darstellung von Daten, und Schemata zur Darstellung von Geschichte (vgl. die Unterscheidung
zwischen data-display und evolutionary in Morrison 2011: 42f). Schleichers Baum von
1861 ist dabei ein klares Beispiel für ein Schema, das den Anspruch hat, ein geschichtliches Schema zu sein, während die Beispiele für die Visualisierung der Wellentheorie wohl
eher als Datendarstellungsschemata bezeichnet werden sollten, da sie nicht für sich in
Anspruch nehmen, äußere Sprachgeschichte zu modellieren. Schemata zur Darstellung
4
61
4 Rekonstruktion
Johann-Mattisvon
List Sprachbeziehungen
Phylogenetische Rekonstruktion
21.02.2013
von Daten können unter Umständen in Schemata zur Darstellung von Geschichte überführt werden, jedoch hängt die Überführbarkeit davon ab, ob die Daten die Rekonstruktion von Geschichte auch erlauben. Die Frage ist also, wenn man Sprachen miteinander
vergleicht, welche Unterschiede zwischen Sprachen tatsächlich eine Rekonstruktion der
äußeren Sprachgeschichte erlauben, wie schon Karl Brugmann (1849 – 1919) in seinen
Ausführungen zur Problematik der genealogischen Klassifikation der acht großen indogermanischen Sprachgruppen deutlich machte:
Im ganzen ist also nur wenig, was aus den spezielleren Übereinstimmungen zwischen
einzelnen von den acht Hauptgruppen für die Beziehungen der Völker zu einander in
sogen. voreinzelsprachlicher Zeit mit grösserer Wahrscheinlichkeit entnommen werden kann. Und jedenfalls treten, so viel wir heute wissen, nirgends speziellere Gemeinsamkeiten, die als gemeinsame Neuerungen erscheinen, in so grosser Anzahl
entegegen, dass man auf Grund derselben die betreffenden Sprachzweige in derselben Art zu Einheiten zusammenschliessen dürfte [...]. Dies gilt selbst für den Fall, dass
man keine von diesen Übereinstimmungen als nur zufällig und keine als auf Entlehnung beruhend betrachten wollte. (Brugmann 1904[1970]: 21f)
Brugmann äußert sich vordergründig über das Problem der genealogischen Klassifikation der indogermanischen Sprachen. Dabei
nennt er jedoch auch einige sehr wichtige Prinzipien, die bei der
phylogenetischen Rekonstruktion (= genealogische Klassifikation)
beachtet werden müssen. Welche sind dies?
2 Lexikostatistik
2.1 Hintergrund
Die Lexikostatistik stellt ein statistisch basiertes Verfahren zur Ermittlung von Verwandtschaftsbeziehungen zwischen Sprachen (und damit zur phylogenetischen Rekonstruktion) dar. Sie wurde von Morris Swadesh (1909 – 1967) in einer Reihe von Artikeln zu
Beginn der 50er Jahre des 20. Jahrhunderts vorgestellt und weiterentwickelt (Swadesh
1950, Swadesh 1952, Swadesh 1955). In der Folgezeit mehrte sich jedoch die Kritik an
der Methode (Bergsland und Vogt 1962, Hoijer 1956, Rea 1973) und kam am Ende aus
der Mode. Grundsätzlich werden im Rahmen der Lexikostatistik historisch relevante Gemeinsamkeiten zwischen Sprachen ausgezählt. Die zugrunde liegenden Zahlen können
dann weiterverwendet werden, um genealogische Bäume automatisch zu rekonstruieren,
oder um (unter der Annahme konstanten Wandels) Sprachspaltungszeitpunkte zu ermitteln. Die Methode erlebte zu Beginn des 21. Jahrhunderts eine Wiedergeburt im Rahmen
neuer quantitativer biologischer Ansätze, mit deren Hilfe genealogische Bäume automatisch aus spezifischen Sprachdaten gewonnen werden können (Atkinson und Gray 2006,
Gray und Atkinson 2003).
Um Spekulation wird gebeten: Aus welchen Gründen wurde die
Lexikostatistik so schnell wieder verworfen? Aus welchen Gründen wurde sie so euphorisch wiedereingeführt?
2.2 Grundannahmen
Die Grundannahmen der Lexikostatistik wurden in einer Vielzahl von Arbeiten besprochen
(Gudschinsky 1956, Sankoff 1969). Basierend auf diesen Arbeiten lassen sie sich in etwa
wie folgt zusammenfassen (vgl. Geisler und List im Druck):
5
62
Johann-Mattis List
Phylogenetische Rekonstruktion
21.02.2013
1. The lexicon of every human language contains words which are relatively resistant
to borrowing and relatively stable over time due to the meaning they express: these
words constitute the basic vocabulary of languages.
2. Shared retentions in the basic vocabulary of different languages reflect their degree
of genetic relationship, i.e. they are representative for the reconstruction of language
phylogenies.
Zwei kurze Fragen: (1) Welche Wörter gehören wohl zum Basisvokabular? (2) Worin besteht der Unterschied zwischen Punkt
2 und den Punkten, die Brugmann (siehe oben) angesprochen
hatte?
2.3 Praktische Umsetzung
Was theoretisch sehr abstrakt und wohlüberlegt klingen mag, zeigt sich in der Praxis als
ein recht einfaches Verfahren, das wohl am besten in fünf Schritte unterteilt werden kann
(vgl. Geisler und List im Druck):
1. Compilation: Compile a list of basic vocabulary items (a Swadesh-list).
2. Translation: Translate the items into the languages that shall be investigated.
3. Cognate Judgments: Search the language entries for cognates.
4. Coding: Convert the cognate information into a numerical format.
5. Computation: Perform a computational analysis (cluster analysis, tree calculation) of
the numerical data, which allows to make conclusions regarding the phylogeny of the
languages under investigation.
Es gibt unterschiedliche Swadesh-Listen, auf denen lexikostatistische Analysen beruhen.
Die folgende Tabelle zeigt eine sehr kleine Liste von 35 Items, die von Sergej Jachontov
vorgeschlagen wurde (Burlak und Starostin 2005: 13):
1
6
11
16
21
26
31
BLOOD
EGG
GIVE
LOUSE
ONE
THOU
WHAT
2
7
12
17
22
27
32
BONE
EYE
HAND
MOON
STONE
TONGUE
WHO
3
8
13
18
23
28
33
DIE
FIRE
HORN
NAME
SUN
TOOTH
SALT
4
9
14
19
24
29
34
DOG
FISH
I
NEW
TAIL
TOOTH
WIND
5
10
15
20
25
30
35
EAR
FULL
KNOW
NOSE
THIS
WATER
YEAR
Kurzes Hirnstürmen: In welchen Arbeitsschritten kann man wohl
bei einem solchen Verfahren die größten Probleme erwarten?
Welche Probleme können aus Konzeptlisten wie der von Jachontov entstehen?
6
63
4 Rekonstruktion
Johann-Mattisvon
List Sprachbeziehungen
Phylogenetische Rekonstruktion
21.02.2013
2.4 Kritik
Auf grundlegende Probleme wurde bereits kurz nach dem Erscheinen von Swadeshs ersten Veröffentlichungen zur Lexikostatistik hingewiesen. Diese betrafen Punkte, die auch
aus den traditionellen Methoden zur genealogischen Klassifikation von Sprachen gut bekannt sind. Die wichtigsten Punkte sind dabei:
• Entlehnung: Unentdeckte Entlehnungen können die Ergebnisse verfälschen.
• Aussagekraft: Lexikalische Ersetzung ist als Prozess nicht aussagekräftig für Sprachgeschichte.
• Fehleranfälligkeit: Die Methode ist fehleranfällig, da die Daten auf eine problematische Weise erstellt werden.
Während die ersten beiden Punkte in der Literatur von oben bis untern durchgekaut wurden, ohne dass sie den Befürwortern der Lexikostatistik tatsächlich argumentatorisch entgegentreten konnten, wurde der letzte Punkt nur wenig beachtet, obwohl er das größte Problem der Lexikostatistik und ihrer Nachfolgermethoden anspricht: Das Problem der
Subjektivität der Daten, die eine lexikostatistische Analyse produziert. Neuere Vergleiche
haben dabei zeigen können, dass die Daten, die von Forscherteams unabhängig produziert werden, derartig große Unterschiede aufweisen, dass dies zu Unterschieden von über
30% in von den Daten automatisch berechneten Baumtopologien führt (Geisler und List im
Druck). Die größten Probleme liegen dabei weniger im Bereich der Kognatenzuweisungen
(Schritt 3, obwohl auch dieser problematisch ist), sondern bereits im Bereich der Übersetzung (Schritt 2). Denn bereits hier zeigen sich große Unterschiede zwischen unabhängig
erstellten Datensätzen, die zeigen, dass mangelnde Kompetenz der Forscher in den Einzelsprachen, aber auch mangelnde Beschreibung der Konzepte in den Konzeptlisten, zu
einer Vielzahl von Unterschieden bereits in den Ausgangsdaten führen können.
Wie lassen sich die vielen Unterschiede in den Übersetzungen
(Schritt 2) erklären?
Literatur
Atkinson, Q. D. und R. D. Gray (2006). “How old is the Indo-European language family?
Illumination or more moths to the flame?” In: Phylogenetic methods and the prehistory
of languages. Hrsg. von P. Forster und C. Renfrew. McDonald Institute monographs.
Cambridge, Oxford und Oakville: McDonald Institute for Archaeological Research; Distributed by Orbow Books, 91–109.
Bergsland, K. und H. Vogt (1962). “On the Validity of Glottochronology”. In: Current Anthropology 3.2, 115–153. JSTOR: 2739527.
Bloomfield, L. (1933 [1973]). Language. London: Allen & Unwin.
Bonfante, G. (1931). “I dialetti indoeuropei”. In: Annali del R. Istituto Orientale di Napoli 4,
69–185.
Brugmann, K. (1904[1970]). Kurze vergleichende Grammatik der indogermanischen Sprachen. Auf Grund des fünfbändigen ’Grundrisses der vergleichenden Grammatik der indogermanischen Sprachen von K. Brugmann und B. Delbrück’ verfasst. Photomechanischer Nachdruck 1970. Walter de Gruyter & Co., Berlin. Strassburg: Karl J. Trübner.
Burlak, S. A. und S. A. Starostin (2005). Sravnitel’no-istoričeskoe jazykoznanie [Comparativehistorical linguistics]. Moscow: Akademia.
7
64
Johann-Mattis List
Phylogenetische Rekonstruktion
21.02.2013
Gabelentz, H. G. C. (1891). Die Sprachwissenschaft. Ihre Aufgaben, Methoden und bisherigen Ergebnisse. Leipzig: T. O. Weigel. Internet Archive: diesprachwissen00gabegoog.
Geisler, H. und J.-M. List. “Beautiful trees on unstable ground. Notes on the data problem
in lexicostatistics”. In: Die Ausbreitung des Indogermanischen. Thesen aus Sprachwissenschaft, Archäologie und Genetik. Hrsg. von H. Hettrich. Wiesbaden: Reichert.
Gray, R. D. und Q. D. Atkinson (2003). “Language-tree divergence times support the Anatolian theory of Indo-European origin”. In: Nature 426.6965, 435–439.
Gudschinsky, S. C. (1956). “Three Disturbing Questions concerning Lexicostatistics”. In:
International Journal of American Linguistics 22.3, 212–213. JSTOR: 1264017.
Hirt, H. (1905). Die Indogermanen. Ihre Verbreitung, ihre Urheimat und ihre Kultur. Bd. 1.
Strassburg: Trübner. Internet Archive: dieindogermaneni01hirtuoft.
Hoijer, H. (1956). “Lexicostatistics. A critique”. In: Language 32.1, 49–60. JSTOR: 410652.
Meillet, A. (1922 [1908]). Les dialectes Indo-Européens. Paris: Librairie Ancienne Honoré
Champion. Internet Archive: lesdialectesindo00meil.
Morrison, D. A. (2011). An introduction to phylogenetic networks. Uppsala: RJR Productions.
Nicholaev, S. (2007). Indo-European etymology. Available online: http://starling.rinet.ru/.
Rea, J. A. (1973). “The Romance data of pilot studies for glottochronology”. In: Diachronic, areal and typological linguistics. Hrsg. von H. M. Hoenigswald und R. H. Langacre.
Bd. 11. Current Trends in Linguistics. The Hague; Paris: Mouton, 355–367.
Sankoff, D. (1969). “Historical linguistics as stochastic process”. (A thesis submitted to the
Faculty of Graduate Studies and Research in partial fulfillment of the requirements for
the degree of Doctor of Philosophy). Diss. Montreal: McGill University.
Schleicher, A. (1853a). “Die ersten Spaltungen des indogermanischen Urvolkes”. In: Allgemeine Monatsschrift für Wissenschaft und Literatur, 786–787.
– (1853b). “O jazyku litevském, zvlástě na slovanský. Čteno v posezení sekcí filologické
král. České Společnosti Nauk dne 6. června 1853.” In: Časopis Čsekého Museum 27,
320–334.
– (1861). Compendium der vergleichenden Grammatik der indogermanischen Sprache.
Bd. 1: Kurzer Abriss einer Lautlehre der indogermanischen Ursprache, des Altindischen
(Sanskrit), Alteranischen (Altbaktrischen), Altgriechischen, Altitalischen (Lateinischen,
Umbrischen, Oskischen), Altkeltischen (Altirischen), Altslawischen (Altbulgarischen), Litauischen und Altdeutschen (Gotischen). Weimar: Böhlau.
Schmidt, J. (1872). Die Verwantschaftsverhältnisse der indogermanischen Sprachen. Weimar: Hermann Böhlau.
Swadesh, M. (1950). “Salish internal relationships”. In: International Journal of American
Linguistics 16.4, 157–167. JSTOR: 1262898.
– (1952). “Lexico-statistic dating of prehistoric ethnic contacts. With special reference to
North American Indians and Eskimos”. In: Proceedings of the American Philosophical
Society 96.4, 452–463. JSTOR: 3143802.
– (1955). “Towards greater accuracy in lexicostatistic dating”. In: International Journal of
American Linguistics 21.2, 121–137. JSTOR: 1263939.
Čelakovský, F. L. (1853). Čtení o srovnavací mluvnici slovanské. Prague.
8
65
4 Rekonstruktion
Johann-Mattisvon
List Sprachbeziehungen
Nachweis von Sprachverwandtschaft
21.02.2013
Nachweis von Sprachverwandtschaft
1 Allgemeines
1.1 Das Grundproblem
Historische Linguisten würden am liebsten den ganzen Tag Sprachen vergleichen und Ursprachen rekonstruieren. Das Problem dabei ist aber, dass man als historischer Linguist
nicht wild drauf los vergleichen darf, sondern nur solche Sprachen vergleichen sollte, von
denen man weiß, dass sie miteinander verwandt sind. Daher stellt sich für jeden historischen Linguisten das Problem, nachweisen zu müssen, dass zwei oder mehr Sprachen
tatsächlich miteinander verwandt sind.
Dieses Grundproblem des Nachweises von Sprachverwandtschaft wird in der historischen Linguistik auf sehr unterschiedliche Weise angegangen. Nach wie vor herrscht keine
Einigkeit darüber, wie der Verwandtschaftsbeweis tatsächlich erbracht werden sollte. Die
Diskussion über die Unterschiedlichen Indizien, die als Beweismittel angeführt werden,
nimmt zuweilen Formen von Grabenkämpfen an.
Warum kann ein historischer Linguist nicht einfach drauf los
vergleichen? Warum muss überhaupt erst nachgewiesen worden
sein, dass die Sprachen, die verglichen werden, auf einen gemeinsamen Vorgänger zurückgehen?
1.2 Historisches
Der im Zusammenhang mit Sprachverwandtschaftsnachweisen meistzitierte Forscher ist
wohl Sir William Jones (1746 – 1794), der in Indien tätig war, wo er mit dem Sanskrit
in Berührung kam und auf dessen überraschende Ähnlichkeit mit dem Griechischen und
Lateinischen aufmerksam wurde. In dem Third anniversary discourse, on the Hindus aus
dem Jahre 1786 liest sich dies wie folgt:
The Sanscrit language, whatever be its antiquity, is of a wonderful structure; more
perfect than the Greek, more copious than the Latin, and more exquisitely refined than
either, yet bearing to both of them a stronger affinity, both in the roots of verbs and
the forms of grammar, than could possibly have been produced by accident; so strong
indeed, that no philologer could examine them all three, without believing them to have
sprung from some common source, which, perhaps, no longer exists. (Jones 1798:
422f)
Obwohl Jones oft als „Entdecker des Indogermanischen” gepriesen wird, war er keineswegs der erste, dem die Ähnlichkeiten zwischen Sanskrit und den europäischen Sprachen
auffiel. Der Italiener Filippo Sassetti (1540 – 1588) zum Beispiel hatte bereits 200 Jahre vor Jones darauf hingewiesen, dass es auffällige Ähnlichkeiten zwischen dem Sanskrit
und dem Italienischen gebe:
Alles Wissenschaftliche ist in einer Sprache verfasst, die sie „Sanscruta” nennen, was
soviel heißt wie „gut artikuliert”. Unsere Sprache hat viele Gemeinsamkeiten mit dieser, darunter viele unserer Wörter, insbesondere die Zahlen 6, 7, 8, und 9, „Gott”,
„Schlange”, und viele andere. (Sassetti 1855: 415)1
1
Meine Übersetzung, Originaltext: „Sono scritte le loro scienze tutte in una lingua, che dimandano Sanscruta,
che vuol dire bene articolata. [...] et ha la lingua d’oggi molte cose comuni con quella, nella quale sono
molti de’nostri nomi, e particularmente de’numeri il 6, 7, 8 e 9, Dio, serpe, et altri assai.”
1
66
Johann-Mattis List
Nachweis von Sprachverwandtschaft
21.02.2013
Woran Sassetti dabei dachte, waren Ähnlichkeiten zwischen Wörtern, wie sie in der folgenden Tabelle wiedergegeben sind:
Sanscruta
Italienisch
Sanscruta
Italienisch
Sanscruta
Italienisch
sarpáserpe
deváDio
saptásette
s
s
d
d
s
s
a
ɛ
e
i
a
ɛ
r
r
v
p
-
p
p
a
o
t
tː
a
ə
a
ə
Was genau fällt auf beim Betrachten der Wortpaare, die Sassetti als Beispiele anführte, und den Ausführungen von Jones?
Worauf genau fußt das, was als "Beweis" der Verwandtschaft
angeführt wird?
2 Probleme
2.1 Zirkularität
Ein grundlegendes und vieldiskutiertes Problem des Verwandtschaftsbeweises ist das Problem der Zirkularität. Georg von der Gabelentz (1840 – 1893) fasst dieses wie folgt zusammen:
Es leuchtet ein, dass man, solange man nur sprachgeschichtliche Zwecke verfolgt,
nur genetisch verwandte Sprachen miteinander vergleichen darf. Und umgekehrt ist
es einleuchtend, dass der Beweis der Verwandtschaft, wo er nöthig ist, nur im Wege
der Vergleichung geführt werden kann. So scheint es, als drehten wir uns im Kreise. In
der That ist aber die vergleichende Arbeit, die nur die Familienzugehörigkeit erweisen
will, summarisch im Gegensatze zu jenen minutiösen Untersuchungen, die die innere
Sprachgeschichte erheischt. Zudem ist jene Arbeit die vorbereitende, und schon darum
muss sie zuerst betrachtet werden. (Gabelentz 1891: 150)
Moment mal: Zirkularität ist uns doch auch schon früher begegnet, aber wo nur? Und was genau schlägt Gabelentz jetzt
eigentlich vor, um dieses Problem zu umgehen?
2.2 Comparanda
Neben dem Problem der Zirkularität stellt insbesondere auch das Problem der Wahl der
Comparanda eines der Hauptprobleme beim Nachweis von Sprachverwandtschaft dar.
Gabelentz lässt uns diesbezüglich wissen:
Dass der Wolf zum Hundegeschlechte gehört, lehrt uns ein einziger Blick. Dass aber
die Blindschleiche nicht eine Schlange, sondern eine Eidechsenart ist, erfahren wir
erst, wenn wir dem Thiere die Haut abstreifen und es anatomisch untersuchen. Beiderlei kommt auch in der Sprachenwelt vor, nur dass hier noch viel öfter die Verwandtschaftsmerkmale unter der Haut zu suchen sind. (ebd.: 151)
Alles schön und gut, Sprachverwandtschaft liegt
Haut, wie Gabelentz sagt. Aber was sind den jetzt
vergleichbare Comparanda in der Linguistik, und wie
Sprachen aufschneiden, um ihnen unter die Haut zu
unter der
bitteschön
können wir
schauen?
2
67
4 Rekonstruktion
Johann-Mattisvon
List Sprachbeziehungen
Nachweis von Sprachverwandtschaft
21.02.2013
2.3 Monogenese oder Polygenese
Ein großer Streitpunkt war im Laufe der Geschichte schon immer die Frage nach dem Ursprung der Sprache, die, um hipper zu klingen, heute zuweilen auch als die Frage nach
der „Evolution von Sprache” (evolution of language) gestellt wird. Viele Arbeiten, die die
Wörter „Evolution” und „Sprache” im Titel haben, beschäftigen sich mit ebendieser Frage.
Zuweilen gibt es Probleme aufgrund dieser Terminologie, da auch etwas hippere historische Linguisten anfangen, von „Sprachevolution” zu reden, darunter jedoch eigentlich die
innere oder äußere Sprachgeschichte, also die Frage der genealogischen Sprachklassifikation oder die Frage des Sprachwandels, verstehen. Die grundsätzliche Frage bezüglich
des Sprachursprungs ist die, ob Sprache nur einmal, oder an mehrmals und unabhängig
voneinander entstanden ist:
Woher noch immer die Menge der Sprachstämme? und woher die grosse Menge der Sprachen, die noch keinem bekannten Stamme zugeordnet sind? War
es wirklich so, wie Manche glauben, dass an mehreren Orden der Erde, unabhängig von einander sich sprachlose Anthropoiden zu sprachbegabten Menschen entwickelt haben? [...] Wie aber, wenn jene Anderen Recht hätten, die
da annehmen, die sprechende Menschheit, also auch die menschliche Sprache habe sich aus einer ursprünglichen Einheit differenziert? (Gabelentz 1891:
151)
Wie immer dem auch sein mag, ob also eine Monogenese oder eine Polygenese für den
Sprachursprung zutreffen mag, Linguisten haben die Frage strenggenommen schon sehr
früh dergestalt entschieden, dass sie fortan nicht wieder gestellt werden darf. Und zwar
bereits im Jahre 1866, in dem die Statuten der Zeitschrift der linguistischen Gesellschaft
von Paris genau dies zum Ausdruck brachten:
Die Gesellschaft lässt keine Art von Mitteilungen – weder bezüglich des Ursprungs
von Sprache, noch bezüglich der Schaffung einer Universalsprache – zu. (Société de
Linguistique de Paris 1871: „Statuts”, III)2
Schön und gut, aber was soll das Problem des Sprachursprungs
jetzt eigentlich mit dem Problem des Nachweises von Sprachverwandtschaft zu tun haben? Sind das nicht zwei verschiedene
Tassen Tee?
3 Lösungsansätze
3.1 Ähnlichkeiten
Genealogische und kontaktinduzierte Ähnlichkeiten
Das erste Teilproblem, das im Rahmen des Nachweises von Sprachverwandtschaft gelöst
werden muss, ist das der Indizien. Grundlegend gilt hier, dass nur Ähnlichkeiten zwischen
Sprachen als Indizien in Frage kommen können. Ferner gilt auch, dass nicht alle Ähnlichkeiten zwischen Sprachen aufgrund von Sprachverwandtschaft entstanden sind, wie wir
rasch feststellen können, wenn wir uns noch mal den Entscheidungsbaum aus Sitzung 5
in Erinnerung rufen:
2
Meine Übersetzung, Originaltext: „La Société n’admet aucune communication concernant, soit l’origine du
langage, soit la création d’une langue universelle.”
3
68
Johann-Mattis List
Nachweis von Sprachverwandtschaft
21.02.2013
similarities
coincidental
Grk. θεός
Spa. dios
“god”
non-coincidental
natural
non-natural
Chi. māma
Ger. Mama genealogical contact-induced
“mother”
Eng. tooth Eng. mountain
Ger. Zahn Fre. montagne
“tooth”
“mountain”
Warum ist es so viel schwieriger, nicht-natürliche Ähnlichkeiten
auseinanderzuhalten, als nicht-zufällige, oder zufällige?
Skala der Entlehnbarkeit
Das Problem des Nachweises von Sprachverwandtschaft ist, dass, während natürliche und
zufällige Ähnlichkeiten relativ leicht von den nicht-natürlichen zu unterscheiden sind, die
nicht-natürlichen Ähnlichkeiten selbst nicht eindeutig voneinander getrennt werden können. Sprachverwandtschaft liegt nur dann vor, wenn die Ähnlichkeiten aus der Verwandtschaft resultieren, nicht hingegen, wenn sie die Folge von Sprachkontakt sind. Leider gibt
es diesbezüglich keine absoluten Universalien, es lassen sich jedoch gewisse grundlegende Tendenzen aufzeigen, die in den meisten Fällen verlässlich sind. So schlägt Aikhenvald
(2006: 5) beispielsweise die folgende Skala vor:
more similar to genetic relatives
inflectional (or core) morphology (form/function)
core lexicon
syntactic construction types
discourse structure
structure of idioms
more similar to neighbouring languages
Moment mal, was war noch mal das "core lexicon"? Irgendwie
klingt das komisch vertraut…
1
3.2 Grabenkämpfe
Die Frage nach den „richtigen” Ähnlichkeiten für den Nachweis von Sprachverwandtschaft
führte zu einem regelrechten Grabenkampf in der historischen Linguistik, der sich um die
4
69
4 Rekonstruktion
Johann-Mattisvon
List Sprachbeziehungen
Nachweis von Sprachverwandtschaft
21.02.2013
Frage zündete, welche Teile des sprachlichen Systems als Grundlage für den Nachweis
von Sprachverwandtschaft eigentlich in Frage kämen.
In diesem Zusammenhang stehen sich nachwievor zwei Lager in hasserfüllter Rivalität
gegenüber: das Lager der „Grammatikalisten”, die der Ansicht sind, dass Sprachverwandtschaft nur durch „Grammatik” (oder vielmehr paradigmatische Morphologie als Spezialfall
von Grammatik) nachgewiesen werden kann, und das Lager der „Lexikalisten”, welche
der Ansicht sind, Grammatik sei für den Nachweis von Sprachverwandtschaft weniger bedeutsam als durch Lautkorrespondenzen abgesicherte Entsprechungen (nachgewiesene
Kognaten) in stabilen Teilen des Lexikons. In den traditionell stark vertretenen Disziplinen
der historischen Sprachwissenschaft (insbesondere der Indogermanistik) überwiegt dabei
die Zahl derer, welche nur, oder vorwiegend, grammatische Evidenz als Nachweis von
Sprachverwandtschaft einfordern und gestatten.
Die beiden unten wiedergegebenen Zitate aus einem Aufsatz
von Dybo und Starostin nennen zwei offensichtliche Gründe, die
für die Grammatik als Grundlage des Nachweises von Sprachverwandtschaft zu sprechen scheinen. Welche sind das?
One major reason for this is historical: it is no big secret that the Indo-European family
was recognized primarily on the basis of the amazing similarity between the paradigmatic systems of Old Indian and classic European languages like Greek or Latin,
and, since the general methodology of comparative linguistics grew out of working with
Indo-European languages, morphological comparison, by the very force of tradition, is
still held in high esteem and frequently suggested as a universal means for establishing
relationship. (Dybo und Starostin 2008: 124f)
Another reason lies in the intuitive sphere. Morphology (and grammar in general) is traditionally seen as the “skeleton” of the language, its main constituent
which, in comparison with lexics that “comes and goes”, is relatively stable
and thus far more valid for the first stage of comparison. Thus, if the languages
compared do not seem to share much common morphology, but are nevertheless quite close lexically, for many linguists the obvious explanation will be that
the languages are not related, but show traces of extensive contacts (“convergence”). (ebd.: 125)
Die Grammatikalisten
Gewöhnlich gilt in der Indogermanistik Franz Bopp (1791 – 1867) mit seinem 1816 erschienenen Buch „Über das Conjugationssystem der Sanskritsprache, in Vergleichung
mit jenem der griechischen, lateinischen, persischen und germanischen (insbesondere
gothischen) Sprache” als Begründer des Verfahrens zum grammatischen Nachweis von
Sprachverwandtschaft. „Während vorher Vermutungen nur durch einzelne Wortvergleiche gestützt waren, erfolgte Bopps Nachweis der Verwandtschaft über den Vergleich der
Grammatik” (Meier-Brügger 2002: 12).
Der prägende Einfluss auf die Indogermanistik und auch Teile der allgemeinen historischen Sprachwissenschaft stammt jedoch von Antoine Meillet (1866 – 1936), der sich in
seinem Buch „La méthode comparative en linguistique historique” aus dem Jahre 1925 betont, dass der Nachweis von Sprachverwandtschaft vorwiegend auf grammatischen Ähnlichkeiten zwischen Sprachen beruhen sollte.
5
70
Johann-Mattis List
Nachweis von Sprachverwandtschaft
21.02.2013
In einem neueren Artikel, der bewusst auf den Aussagen Meillets aufbaut, prägte Nichols (1996) als moderne Vertreterin der Grammatikalisten den Begriff der „individuellidentifizierenden Evidenz” (individual-identifying evidence) als oberstem Kriterium für den
Nachweis von Sprachverwandtschaft. Gemeint ist damit „evidence that identifies a unique
individual proto-language rather than [...] evidence that identifies a set of languages or a
type of language” (ebd.: 48), also Evidenz, die nicht typologishcer sondern sehr spezifischer Natur ist, die also auf eine Ursprache mit individuellen Strukturen verweist und nicht
auf eine Sprachen mit bestimmten typologischen Eigentschaften. Diese Evidenz ist laut
Nichols „primarily grammatical and includes morphological material with complex paradigmatic and syntagmatic organization” (ebd.: 41).
Unten ist ein Zitat von Meillet wiedergegeben, in dem er erläutert, worin die Beweiskraft grammatischer Indizien besteht.
Worin genau besteht das, was Meillet als "grammatische Korrespondenzen" bezeichnet? Kann man die Wortgleichungen Deutsch
gut, besser, (am) best(en) [guːt, bɛsər, bɛst] = Englisch good,
better, best [gʊd, bɛtər, bɛst] als Beispiel für diese Art von Evidenz ansehen? Welche Schwachstellen hat die grammatikalistische
Position?
Grammatical correspondences are proof, and only they are rigorous proof, provided one
makes use of the material detail of the forms and that it is established that particular
grammatical forms used in the languages under consideration go back to a common
source. (Meillet 1925, Übersetzung übernommen von Nichols 1996: 47)
Die Lexikalisten
Im Gegensatz zum offiziellen Mantra der Indogermanistik, dass Sprachverwandtschaft
nur auf Basis von Grammatik (also paradigmatischer Morphologie) nachgewiesen werden könnte, ist es interessant, sich die Argumentationen einiger prominenter Vertreter der
Disziplin ein wenig genauer anzuschauen. In vielen Fällen, in denen von Sprachverwandtschaft die Rede ist, wird nämlich gerade nicht paradigmatische Morphologie als Indiz für
diese angeführt, sondern lexikalische Entsprechungen, die durch reguläre Lautkorrespondenzen abgesichert sind.
Obwohl in der Indogermanistik allgemein die Annahme vorherrscht, dass nur paradigmatische Morphologie tatsächlich den Nachweis von Sprachverwandtschaft erbringen
könne, findet man doch in den Argumentationen verschiedenster Grammatikalisten immer
wieder Verweise auf lexikalische Übereinstimmungen, die als (zusätzliche) Indizien für
Sprachverwandtschaft angeführt werden. Das gesamte Verfahren der linguistischen Rekonstruktion schließlich, beruht zum großen Teil auf lexikalischen Gleichungen. Man kann
davon ausgehen, dass - wenn zwei Sprachen erwiesenermaßen miteinander verwandt
sind - immer auch lexikalische Entsprechungen gefunden werden können.
Der Grund, warum lexikalische Evidenzen von den Grammatikalisten verworfen werden, besteht darin, dass das Lexikon üblicherweise als der instabilste Teil von Sprachen
angesehen wird. Wörter lassen sich leicht entlehnen, werden durch andere ersetzt, oder
verschwinden völlig aus dem Wortschatz. Dem Misstrauen in das Lexikon als tragfähigen
Indizienlieferanten für Sprachverwandtschaftsnachweise stellen Vertreter der Lexikalisten
das Konzept des Basisvokabulars gegenüber. Grundannahme ist dabei, dass es „einige
Bereiche der Lexik [gibt], in denen Entlehnung fast unmöglich ist, bspw. Pronomen, Be-
6
71
4 Rekonstruktion
Johann-Mattisvon
List Sprachbeziehungen
Nachweis von Sprachverwandtschaft
21.02.2013
zeichnungen für Körperteile, Verwandtschaftsbeziehungen, wichtige Naturerscheinungen,
einige häufig verwendete Verben und Adjektive” (Jachontov 1965: 14).3
Das Konzept des Basisvokabulars wird traditionell mit dem Namen von Morris Swadesh (1909 -- 1967) in Verbindung gebracht
(vgl. die vorherige Sitzung). Welche der Konzepte HAND, FRIDGE, FOOT, NOSE, SUN, SNOW, STONE, SUNDAY und EXCREMENT
gehören wohl eher zum Basisvokabular, welche nicht, und warum?
Wer hat Recht?
Am Ende haben wahrscheinlich beide Lager ein bisschen Recht: Nichols (1996) liegt sicher
richtig, wenn sie betont, dass Suppletiv-Paradigmen mitunter mehr Überzeugungskraft besitzen als einfache Paare von Lexemen. Dybo und Starostin (2008) haben aber sicherlich
auch Recht, wenn sie betonen, dass es oftmals die lexikalischen Entsprechungen sind, die
zum Nachweis von Sprachverwandtschaft angeführt werden, und dass ganz ohne diese
wohl auch schwer nachzuweisen wäre, dass zwei Sprachen wirklich verwandt sind.
Was von den meisten Diskutanten in diesem Zusammenhang leider übersehen wird,
ist, dass die Trennung in das grammatische und das lexikalische Lager an sich gar nicht
vollzogen wird, denn auch der „grammatische Nachweis” der Sprachverwandtschaft setzt
ja voraus, dass Lautkorrespondenzen ermittelt werden können. Allein die Tatsache, dass
eine Sprache ein suppletives Komparationsparadigma für ein Wort mit der Bedeutung „gut”
aufweist, genügt nicht. Nur im Zusammenhang mit den nachweisbaren Lautkorrespondenzen erlangt es unmittelbare Beweiskraft.
Anstelle der leidigen Unterscheidung von grammatischen und lexikalischen Indizien
kann daher meines Erachtens der Nachweis von „systematisch-funktionalen” Ähnlichkeiten als Grundlage für den Nachweis von Sprachverwandtschaft angesehen werden. Unter „systematisch-funktional” wird dabei verstanden, dass die Ähnlichkeiten einerseits auf
einem Vergleich ganzer (Teil-)Systeme von Sprachen beruhen, und andererseits als funktionale Entsprechungen (also ähnlich in Bezug auf das „Funktionieren” sprachlicher Elemente) aufgezeigt werden können. Konkret sind damit vorwiegend regelmäßige Lautkorrespondenzen in kognaten Wörtern und Morphemen gemeint. Das lässt sich in etwa wie
folgt zusammenfassen:
Systematische Ähnlichkeiten: Als Folge regelmäßigen Lautwandels lassen sich bis zu
einer gewissen Zeittiefe systematische Ähnlichkeiten im Lexikon miteinander verwandter Sprachen auffinden. Systematisch impliziert hierbei, dass die Ähnlichkeiten
sprachspezifisch sind.
Reguläre Lautkorrespondenzen: Die grundlegenden Sprachspezifischen Ähnlichkeiten,
welche nachweisbar sind, sind sich funktional entsprechende Laute im lexikalischen
System miteinander verwandter Sprachen. Funktional meint hierbei, dass die einander entsprechenden Laute in den jeweiligen Systemen die gleiche distinktive Funktion innehaben. Sie dienen also auf ähnliche Weise der Bedeutungsunterscheidung,
insofern als sie in ähnlichen Positionen in kognaten Wörtern auftauchen. Eine substantielle Ähnlichkeit der Lautsegmente ist dabei nicht zwingend erforderlich, auch
wenn sich korrespondierende Lautsegmente in nah miteinander verwandten Sprachen meist auch substantiell ähneln.
3
Meine Übersetzung, Originaltext: „[Но есть] некоторые области лексики, где заимствования почти
невозможны, например: местоимения, названия частей тела, родственных отношений, важнейших
явлений природы, некоторые наиболее употребительные глаголы и прилагательные и т. п.”
7
72
Johann-Mattis List
Nachweis von Sprachverwandtschaft
21.02.2013
Kognaten: Können reguläre Lautkorrespondenzen für zwei oder mehr Sprachen nachgewiesen werden, lassen sich zwangsläufig auch Kognaten identifizieren. Kognaten
sind Wörter, die von den Sprachen aus einer gemeinsamen Vorgängersprache geerbt wurden. Kognaten lassen sich nur mit Rückgriff auf reguläre Lautkorrespondenzen nachweisen, jedoch sind die Lautkorrespondenzen keine zwingende Voraussetzung dafür, dass zwei Wörter kognat sind, denn die Sprachen könnten sich auch so
weit auseinanderentwickelt haben, dass keine Kognazität mehr nachgewiesen werden kann. In diesem Falle kann eine Sprachverwandtschaft jedoch auch nicht mehr
nachgewiesen werden.
In der Indogermanistik wird oft betont, dass Sprachverwandtschaft nicht die beste, sondern die einzige Erklärung für die
gegebenen Indizien sei. Inwiefern ist dies problematisch und
woran mag es liegen, dass gerade dies in der historischen
Linguistik so oft betont wird?
Literatur
Aikhenvald, A. Y. (2006). “Grammars in contact. A cross-linguistic perspective”. In: Grammars in contact. Hrsg. von A. Y. Aikhenvald und R. M. W. Dixon. Oxford: Oxford University Press, 1–66.
Dybo, A. und G. Starostin (2008). “In defense of the comparative method, or the end of the
Vovin controversy”. In: Aspekty komparativistiki. Bd. 3. Hrsg. von I. S. Smirnov. Orientalia
et Classica XI. Moscow: RGGU, 119–258. PDF: http : / / starling . rinet . ru /
Texts/compmeth.pdf.
Gabelentz, H. G. C. (1891). Die Sprachwissenschaft. Ihre Aufgaben, Methoden und bisherigen Ergebnisse. Leipzig: T. O. Weigel. Internet Archive: diesprachwissen00gabegoog.
Jachontov, S. E. (1965). Drevnekitajskij jazyk [Old Chinese]. Moscow: Nauka.
Jones, W. (1798). “The third anniversary discourse, delivered 2 February, 1786, by the
president. On the Hindus”. In: Asiatick Researches: or, Transactions of the Society Instituted in Bengal for Inquiring into the History and Antiquities, the Arts, Sciences, and
Literature, of Asia 1, 415–431. Google Books: iSsoAAAAYAAJ.
Meier-Brügger, M. (2002). Indogermanische Sprachwissenschaft. Unter Mitarb. von M.
Fritz und M. Mayrhofer. 8. Aufl. Berlin und New York: de Gruyter.
Meillet, A. (1925). La méthode comparative en linguistique historique. Oslo und Leipzig:
Aschehoug.
Nichols, J. (1996). “The comparative method as heuristic”. In: The comparative method
reviewed. Regularity and irregularity in language change. Hrsg. von M. Durie. Mit einer
Einl. von M. D. Ross und M. Durie. New York: Oxford University Press, 39–71.
Sassetti, P. (1855). “Lettere edite e inedite di Filippo Sassetti: Raccolte e annotate da Ettore
Marcucci”. In: Google Book Search.
“Statuts” (1871). “Statuts. Approuvés par décision ministérielle du 8 Mars 1866”. In: Bulletin
de la Société de Linguistique de Paris 1, III–IV.
8
73
4 Rekonstruktion von Sprachbeziehungen
Johann-Mattis List
Übungen
21.02.2013
Mikronesische Sprachen (V. I. Belikov)¹
1 Ausgangspunkt
Die karolinischen Inseln gehören zu Mikronesien. Zu diesen gehören, u. a., die Inseln Voleai, Puluvat, Satava, Sonsorol, Truk und Uliti. Diese Gruppe von Inseln bewohnen die Nachfolger eines ehemals einheitlichen
Volkes, welche einander nah verwandte Sprachen sprechen. In diesen Sprachen gibt es selbstverständlich
viele gemeinsame Wörter. Unten werden die Prozente der gemeinsamen Wörter für einige Sprachen aufgezeigt, die von den Bewohnern der sechs genannten Inseln gesprochen werden.
Voleai
Puluvat
Sataval
Sonsorol
Truk
Uliti
70-80
60-70
60-70
60-70
50-60
Truk
60-70
70-80
70-80
50-60
Sonsorol
50-60
50-60
50-60
Sataval
70-80
70-80
Puluvat
60-70
Gegeben ist ferner ein Fragment einer Karte dieses Gebietes. Auf ihm sind die Namen der Inseln Voleai,
Puluvat, Sonsorol und Truk durch Ziffern von 1 bis 4 ersetzt worden. Außerdem sind die Namen dreier
weiterer Inseln (darunter auch die Insel Sataval) mit Lateinischen Buchstaben A,B und C ersetzt worden.
2 Aufgaben
• Finden Sie heraus, welche Inselns ich hinter den Ziffern von 1 bis 4 verbergen.
• Finden sie heraus, mit welchem lateinischen Buchstaben die Insel Sataval kodiert wurde.
References
B
,S
A
’
,&S
A
’
S
koznanie. Moskva: Akademia, ucebnoe izd. edition.
¹Aufgabe aus: Burlak & Starostin 2005, 404f, meine Übersetzung
1
74
. 2005. Sravnitel’no-istoričeskoe jazy-
5 Zukunftsmusik
Zwei weitere Punkte, die in der historischen Linguistik eine große rolle spielen, aber selten beachtet wurden, werden noch erwähnt: die quantitative Behandlung semantischen
Wandels, und die automatische Erkennung von Lehnwörtern.
75
5 Zukunftsmusik
Johann-Mattis List
Bedeutungswandel
22.02.2012
Quantitative Aspekte von
Bedeutungswandel
1 Bedeutungsprobleme
1.1 Was ist Bedeutung?
Bedeutung für Sprachforscher
Die Aufgabe, die Bedeutung eines Wortes festzustellen, mag für den Logiker besagen:
seinen begrifflichen Inhalt möglichst genau erfassen und abgrenzen, eine Definition
liefern, die nach altbewährtem Rezept die übergeordnete Art und die unterscheidenden
Merkmale angibt. Für den Sprachforscher bedeutet sie etwas anderes und in der Regel
weit Schwierigeres, denn er ist schon hier, wie in allen weiteren Stadien seiner Arbeit,
genötigt, neben den klar erfaßbaren logischen auch psychologische Faktoren von oft
schwer greif- und wägbarer Natur in Betracht zu ziehen. (Sperber 1923: 1)
Ungeachtet der Tatsache, ob Sperber Recht hat, oder nicht.
Wenn man an einen dieser unheimlich berühmten Sätze von Saussure denkt, sollte es eigentlich leicht sein, zu sagen, worin der
Unterschied zwischen der Bedeutung eines Wortes in der Logik und der Bedeutung eines Wortes in der Linguistik besteht.
Welcher Satz ist gemeint?
Wenn Bedeutung allein keinen Sinn mehr macht
Bedeutung ist nicht alles...
„Worte sind Zeichen für Begriffe.” Dieser Satz bedarf – wie schon dargelegt – in mehr
als einer Hinsicht der Einschränkung. Aber auch wenn man den Sinn des Wortes „Begriff” so weit faßt wie nur irgend möglich, giebt der Satz keinesfalls eine erschöpfende
Definition. Worte sind noch anderes und mehr als Zeichen für Begriffe. Sie enthalten
Werthe, die nichts mit dem zu schaffen haben, was wir bisher an den Wortbedeutungen beachtet und untersucht haben; Werthe, auf denen gerade die feinsten Wirkungen
der Sprache beruhen. Es empfielt sich, sie von dem gewöhnlichen, dem begrifflichen
Wortsinne abzusondern und ihm gegenüber zu stellen. (Erdmann 1900: 78)
Sinn macht Bedeutung
Es liegt nun nahe, mit einem Zeichen (Namen, Wortverbindung, Schriftzeichen) außer
dem Bezeichneten, was die Bedeutung des Zeichens heißen möge, noch das verbunden zu denken, was ich den Sinn des Zeichens nennen möchte, worin die Art des
Gegebenseins enthalten ist. Es würde danach in unserm Beispiele zwar die Bedeutung der Ausdrücke „der Schnittpunkt von a und b” und „der Schnittpunkt von b und
c” dieselbe sein, aber nicht ihr Sinn. Es würde die Bedeutung von „Abendstern” und
„Morgenstern” dieselbe sein, aber nicht der Sinn. (Frege 1892: 26f)
Bedeutung hat Hintersinn
Um eine bequeme Verständigung zu erzielen, wird es sich empfehlen, wie ich schon
andeutete, scharf zwischen dem begrifflichen Inhalt und der Gesammtbedeutung des
Wortes zu unterscheiden; zwischen dem begrifflichen Inhalt, der alle objectiven Merkmale einschließt, und der allgemeinen Wortbedeutung, die außer dem Begriff noch
alle anderen Werthe enthält, die das Wort zum Ausdruck bringt. Diese Werthe sondere ich also von der Wortbedeutung ab, stelle sie dem Begriff gegenüber und fixiere
sie sprachlich als „Nebensinn” und „Gefühlswerth” (Stimmungsgehalt). Nach dieser
Auffassuns- und Ausdrucksweise ist es dann eindeutig zu sagen, dass Leu und Löwe
1
76
Johann-Mattis List
Bedeutungswandel
22.02.2012
einerseits und Hose und Beinkleid andererseits Worte von verschiedener Bedeutung
aber gleichem begrifflichen Inhalt seien. (Erdmann 1900: 80)
Die oben wiedergegebenen Zitate stehen repräsentativ für typische Debatten, die in der Semantik geführt wurden und immer
noch geführt werden. Welche Debatten verbergen sich hinter
den letzten beiden Zitaten und mit welchen Termini würde man
das, was dort gesagt wird, heute bezeichnen?
1.2 Mehrdeutigkeit
Zunächst gehören hierher alle die fälle, in denen die lautliche übereinstimmung bei
verschiedenheit der bedeutung nur auf zufall beruht, wie bei nhd. acht = diligentia
[Aufmerksamkeit] – proscriptio [Bann]– octo [acht]. [...] lautlich besteht [...] identität,
und derjenige, welcher einen solchen lautcomplex ausser zusammenhang aussprechen hört, hat kein mittel zu erkennen, welche von den verschiedenen damit verknüpften bedeutungen der sprechende im sinne hat. [...] Wirkliche mehrheit von bedeutungen muss man aber auch in sehr vielen fällen anerkennen, wo nicht bloss lautliche,
sondern auch etymologische identität besteht. Man vergleiche z.b. nhd. fuchs vulpes
– pferd von fuchsiger farbe – rothaariger mensch – schlauer mensch – goldstück –
student im ersten semester, boc hircus – bock der kutsche – fehler, futter pabulum –
überzug oder unterzug, [...]. In den meisten der angeführten fälle ist es ohne geschichtliche studien überhaupt nicht möglich den ursprünglichen zusammenhang zwischen
den einzelnen bedeutungen zu erkennen, und dieselben verhalten sich dann gar nicht
anders zu einander, als wenn die lautliche identität nur zufällig wäre. (Paul 1880[1886]:
68)
Die folgenden Beispielsätze sind mehrdeutig, wobei die Mehrdeutigkeit jeweils auf die Mehrdeutigkeit eines Lexems zurückzuführen ist. Identifiziere das mehrdeutige Wort in den Sätzen
und charakterisiere es mit Hilfe der Termini "Polysemie", "Homonymie", "Homophonie", "Homographie" und "Vagheit".
1. ER SCHEINT DAS HINDERNIS UMFAHREN ZU WOLLEN.
2. ER IST AN DER RUHR ERKRANKT.
3. HAST DU DIE ARME GESEHEN?
4. HAST DU DIE FLIEGEN GESEHEN?
5. ICH HAB EIN NEUES SCHLOSS.
6. ER HATTE LEIDER KEINE STIMME MEHR.
7. MEIN OPA WAR SEHR STRENG.
8. DAS WIRD ZU LANG.
9. WAS FÜR EIN DUMMER AUGUST.
10. eːɐ hat aŋst diː fɛlə ʦuː veɐliːɐn
2
77
5 Zukunftsmusik
Johann-Mattis List
Bedeutungswandel
22.02.2012
2 Bedeutungswandel
2.1 Bedeutungswandel und Lautwandel
Während der lautwandel durch eine widerholte unterschiebung von etwas unmerklich verschiedenem zu stande kommt, wobei also das alte untergeht, zugleich mit der
entstehung des neuen, ist beim bedeutungswandel die erhaltung des alten durch die
entstehung des neuen nicht ausgeschlossen. Er besteht immer in einer erweiterung
oder einer verengung des umfangs der bedeutung, denen eine verarmung oder bereicherung des inhalts entspricht. Erst durch die aufeinanderfolge von erweiterung und
verengung kann eine von der ursprünglichen völlig verschiedene bedeutung sich bilden. (Paul 1880[1886]: 66)
Wir haben bereits in einer früheren Sitzung von den grundliegenden Unterschieden zwischen Bedeutungs- und Lautwandel
gesprochen. Worin bestehen diese? Welches waren die Schlagworte, mit denen die unterschiedlichen Prozesse beschrieben
wurden?
2.2 Bedeutungswandel und lexikalischer Wandel
Wenn es keinen semantischen Wandel gäbe, würden sich die Lexika der Sprachen der
Welt nicht ändern und in allen Zeiten gleich bleiben. Wörter würden zwar ihre Form ändern, es würde aber immer eine ungebrochene Tradition identischer Denotation geben.
Da dies nicht so ist, wandeln sich die Lexika unserer Sprachen ständig. Wörter gehen verloren, wenn die Sprecher sie nicht mehr verwenden, neue Wörter treten ins Lexikon ein,
wenn neue Konzepte geschaffen werden, sei es durch Entlehnung oder durch Neuschöpfung. Diese Prozesse des Worterwerbs (word gain) und des Wortverlustes (word loss) sind
sehr häufig und können zuweilen sogar direkt durch die Sprecher einer Sprache bemerkt
werden.
Der wichtigste Prozess des lexikalischen Wandels ist der Prozess der lexikalischen
Ersetzung (lexical replacement). Lexikalische Ersetzung meint den Prozess, durch den ein
Wort A, das normalerweise verwendet wird, um eine Bedeutung x auszudrücken, diese
Bedeutung nicht weiter ausdrückt, da zur selben Zeit ein Wort B, das zuvor die Bedeutung
y ausdrückte, fortan verwendet wird, um die Bedeutung x auszudrücken.
Nenne ein Beispiel für den Prozess der lexikalischen Ersetzung.
Worin besteht der Unterschied dieses Prozesses zum semantischen Wandel?
2.3 Das ewig Abstrakte zieht uns hinab
Sehr häufig entdeckt man, daß einem Wort bloß deshalb ein Bedeutungswandel zugeschrieben wird, weil seine tatsächliche Bedeutung sich nicht oder nicht völlig mit
derjenigen deckt, die der etymologische Wortsinn anzudeuten scheint. Z. B. liegt in
dem Wort Schneider kein Hinweis darauf, daß das, was der so bezeichnete Handwerker schneidet, gerade zu Kleidern bestimmte Stoffe sein müssen. Es sieht vielmehr
ganz so aus, als habe hier ein Wort, das ursprünglich ganz allgemein „Mensch, welcher (etwas beliebiges) schneidet” bedeutete, sekundär eine Einschränkung seines
Begriffsumfanges erlitten, die zur Entwicklung seines heutigen engbegrenzten Sinnes führte. Oder: Gewehr bedeutet etymologisch nicht „Handfeuerwaffe von einem
bestimmten Typus” sondern „irgendetwas, womit man sich wehrt” usw. ins Unendliche. Schon Paul hat mit Recht darauf hingewiesen, daß in solchen Fällen immer
3
78
Johann-Mattis List
Bedeutungswandel
22.02.2012
erst untersucht werden muss, ob die durch die Etymologie angedeutete allgemeinere Bedeutung jemals bestanden hat, oder ob nicht das betreffende Wort vom ersten
Augenblick and nur die engere Bedeutung besessen hat, eine Einschränkung seines
Begriffsumfanges also gar nicht erfolgt ist. [...] Die erste Bedingung für die Ansetzung
eines Bedeutungsübergangs ist doch offenbar, daß mindestens zwei Bedeutungen eine ursprüngliche und eine abgeleitete, im Sprachbewußtsein wirklich vorhanden sind
oder waren. Bevor man von einem Bedeutungswandel spricht, muß man sich daher
immer zuerst überzeugen, daß nicht die eine dieser Bedeutungen auf einem unbefugten Rückschluß aus dem buchstäblichen Sinn des Wortes beruht. (Sperber 1923:
11f)
Wow, wieder ein langes Zitat. Scheint aber wichtig zu sein, wenn
der Dozent das in voller Länge abdruckt. Er will wahrscheinlich
auf die Indizien hinaus, die erlauben, Bedeutungswandel zu
rekonstruieren, also …
3 Netzwerke aus sprachübergreifenden Polysemien
Wir könnten uns Fragen, warum wir uns überhaupt mit Bedeutungswandel beschäftigen.
Könnte man diese ganze Thematik nicht einfach ignorieren? Nun, von einem allgemeinen
Standpunkt her kann sie natürlich ignoriert werden, und zwar dann, wenn wir die historische Linguistik generell als ein unsinniges Betreiben abtun. Wenn wir uns diese Ansicht
jedoch nicht zu eigen machen, ist eine genauere Erforschung des semantischen Wandels
von großer Bedeutung für die historische Linguistik: Sie hilft uns, wenn wir sie sinnvoll
betreiben, im Rahmen der semantischen Rekonstruktion die ursprünglichen Bedeutungen
von Wörtern zu rekonstruieren. Sie hilft uns, allgemeine Tendenzen semantischen Wandels zu ermitteln, falls es diese gibt. Und sie kann uns helfen, Kognaten zwischen genetisch verwandten Sprachen auch dort zu identifizieren, wo sich die Bedeutung von Formen
gewandelt hat.
Moment mal, die Lexikostatistik beruht doch auf dieser Annahme, dass es Basisvokabular gibt, also eine Liste von stabilen
Konzepten. In dem Zusammenhang wäre es doch auch wichtig, wenn wir mehr über Bedeutungswandel wüssten, denn dann
könnten wir ja …
3.1 Milch und Euter
Was haben „Milch” und „Euter” miteinander gemein? Konzeptuell stehen sie in enger Beziehung, da „Milch” das ist, was aus dem „Euter” rauskommt. Auch sprachlich können
beide Wörter ähnlich sein, denn in viele Sprachen werden sie durch ein und dieselbe
Wortform ausgedrückt. Historisch kann man sich vorstellen, dass die Beziehung zwischen
„Milch” und „Euter” als semantischer Wandel auftritt. Im Standardchinesischen ist das
Wort [niou³⁵nai²¹⁴] „Milch” beispielsweise ein Kompositum aus [niou³⁵] „Kuh” und [nai²¹⁴]
„Milch”, das ursprünglich selbst „Euter” und „Brust” bedeutete.
Wie nennt man das Phänomen in der Linguistik, wenn konzeptuell
verwandte Bedeutungen in einer Sprache durch dasselbe Wort
ausgedrückt werden? Welches Problem ist mit diesem Terminus
verbunden?
4
79
5 Zukunftsmusik
Johann-Mattis List
Bedeutungswandel
22.02.2012
3.2 Polysemie als Indiz für semantischen Wandel
Der Terminus Polysemie wurde zuerst von Bréal (1897: 154) verwendet, der dabei explizit betonte, dass Polysemie eine Folge semantischen Wandels sei. Semantischer Wandel
wird heute meist als ein Prozess angesehen, der eine polyseme Phase einschließt (Traugott und Dasher 2002). Dies heißt wiederum, das Fälle von Polysemie umgekehrt als Indiz für semantische Wandelprozesse genommen werden können. Natürlich kann man die
Wandelprozesse nicht direkt aus Polysemien ablesen, man kann jedoch durch die Suche
nach Polysemien diejenigen Konzepte identifizieren, die in konzeptueller Nähe zueinander
stehen, weil sie häufig entweder den Ausgangs- oder den Endpunkt von Wandelprozessen
darstellen. Die Idee, Polysemien explizit zu verwenden, um einen quantitativen Zugang
zum semantischen Wandel zu bekommen, wurde in einer Reihe von Arbeiten von verschiedenen Autoren verfolgt (Croft u. a. 2009, Cysouw 2010, François 2008, Perrin 2010,
Steiner u. a. 2011).
Diese Darstellung war jetzt ein bisschen unscharf. Was genau
verbirgt sich hinter den Ansätzen, die Polysemie als Indiz für
semantischen Wandel nehmen? Wie muss man sich das vorstellen?
3.3 Netzwerke
Wenn man genug Daten hat, ist es recht einfach, Konzeptnetzwerke aus sprachübergreifenden Polysemien zu rekonstruieren. Alles, was man braucht, sind semantisch alinierte
Wortlisten, die in möglichst viele verschiedene Sprachen übersetzt wurden. Wenn wir uns
beispielsweise eine Wortliste wie die folgende anschauen, dann fällt auf, dass in dieser
Liste zwei „Polysemien” auftauchen, nämlich Russisch derevo „tree + wood” und Deutsch
Erde „earth, land + ground, soil”. Wenn wir uns nun ein Netzwerk vorstellen, in dem alle
Konzepte in unserer Wortliste Knoten sind, dann können wir Kanten zwischen allen Knoten
ziehen, die in einer der Sprachen durch die gleiche Wortform ausgedrückt werden. Das Gewicht dieser Kanten kann ferner bestimmt werden, indem man zählt, wie oft ein bestimmtes
Konzeptpaar durch dieselbe Wortform in den Sprachen auf der Wortliste ausgedrückt wird.
Key
1.1
1.21
1.212
1.420
1.430
...
Concept
world
earth, land
ground, soil
tree
wood
...
Russian
mir, svet
zemlja
počva
derevo
derevo
...
German
Welt
Erde, Land
Erde, Boden
Baum
Wald
...
...
...
...
...
...
...
...
Gewichte von Kanten werden in Netzwerken durch die Dicke der
Kanten visualisiert. Somit ergibt sich für Konzepte rund um
,,Euter" und ,,Milch" beispielsweise unten abgebildete Netzwerk.
Worin besteht das prinzipielle Problem des Wortlisten-Ansatzes,
wenn man sich die traditionelle Definition von "Polysemie" ins
Gedächtnis ruft?
5
80
Johann-Mattis List
Bedeutungswandel
22.02.2012
udder
nipple, teat
breast (of
woman)
milk (noun)
chest
3.4 Netzwerkanalyse
Polysemienetzwerke allein bringen wenig, wenn man keine Möglichkeit hat, sie richtig zu
analysieren. Denn Polysemienetzwerke können mitunter sehr komplex sein, so dass durch
das bloße Betrachten dieser Netzwerke keine neuen Erkenntnisse gewonnen werden können. Die folgende Grafik zeigt beispielsweise ein Netzwerk, das aus der Analyse von 1289
Konzepten, übersetzt in 195 Sprachen aus 44 Sprachfamilien erstellt wurde List u. a. (forthcoming). Sehen kann man in einem solchen Netzwerk nicht viel.
Netzwerkanalysen mit Hilfe von speziellen Algorithmen helfen im Falle von Polysemiedaten
jedoch, die Struktur von Netzwerken genauer zu analysieren und spezifische Gruppen (sogenannte Communities) zu isolieren, die für die Struktur des Netzwerks bedeutsam sind.
Communities sind definiert als „groups of vertices [Knoten] within which the connections
are dense but between which they are sparser” (Newman 2004: 4). Eine Analyse des Netzwerks aus List u. a. (forthcoming) mit Hilfe des Algorithmus zur Community-Entdeckung
6
81
5 Zukunftsmusik
Johann-Mattis List
Bedeutungswandel
22.02.2012
von Girvan und Newman (2002), teilt dieses beispielsweise in 337 Communities auf, wobei 104 relativ groß sind (5 und mehr Knoten), und einen Großteil der Konzepte abdecken
(879 von 1289, 68%).
Das Schöne an dieser Analyse ist, dass die meisten dieser großen Communities Konzepte auf intuitiv einleuchtende, sinnvolle Art gruppieren. Eine Community, bspw. deckt
Bedeutungen ab, die mit der Bedeckung von Körpern zu tun haben („Feder”, „Haar”, „Rinde”, etc.), eine weiter Community deckt Bedeutungen ab, die mit „Lernen” zu tun haben
(„studieren”, „zählen”, „versuchen”), und eine Community deckt gruppiert Fahrzeuge („Kanu”, „Boot”, „Wagen”).
Unten ist eine Community aus dem Netzwerk abgebildet, in
der Bedeutungen gruppiert werden, die den Konzepten "Baum"
und "Holz" nahe stehen. Was lässt sich durch die Betrachtung
des Netzwerkes erfahren? Welche Schlüsse kann man aus dem
Netzwerk ziehen, welche nicht? Wie kann man sich die konkrete
Verwendung von dieser Art von Netzwerken im Dienste von
Algorithmen zur Kognatenerkennung vorstellen?
tree stump
tree trunk
tree
doorpost, jamb
plant (noun)
post, pole
beam
wood
woods, forest
firewood
rafter
shelf
club
board
staff, walking
stick
table
7
82
Johann-Mattis List
Bedeutungswandel
22.02.2012
Literatur
Bréal, M. (1897). Essai de sémantique. Science des significations. Paris: Hachette. Internet Archive: essaidesmantiq00bruoft; Englische Übersetzung: – (1900). Semantics. Studies in the science of meaning. A. d. Französischen übers. von H. Cust.
Mit einer Einl. von J. P. Postgate. New York: Henry Holt & Company. Internet Archive:
semanticsstudie02postgoog.
Croft, W., C. Beckner, L. Sutton, T. Wilkins J.and Bhattacharya und D. Hruschka (2009).
Quantifying semantic shift for reconstructing language families. Vortrag, gehalten auf der
Konferenz “83rd Annual Meeting of the Linguistic Society of America” (San Francisco).
Cysouw, M. (2010). “Semantic maps as metrics on meaning”. In: Linguistic Discovery 8.1,
70–95.
Erdmann, K. O. (1900). Die Bedeutung des Wortes. Leipzig: Eduard Avenarius.
François, A. (2008). “Semantic maps and the typology of colexification: intertwining polysemous networks across languages”. In: From polysemy to semantic change. Hrsg. von
M. Vanhove. Amsterdam: Benjamins, 163–215.
Frege, G. (1892). “Über Sinn und Bedeutung”. In: Zeitschrift für Philosophie und philosophische Kritik 100, 25–50.
Girvan, M. und M. E. Newman (2002). “Community structure in social and biological networks”. In: Proceedings of the National Academy of Sciences of the United States of
America 99.12, 7821–7826.
List, J.-M., A. Terhalle und M. Urban (forthcoming). “Using network approaches to enhance
the analysis of cross-linguistic polysemies”. In: Proceedings of the IWCS.
Newman, M. E. J. (2004). “Analysis of weighted networks”. In: Physical Review E 70.5,
056131.
Paul, H. (1880 [1886]). Principien der Sprachgeschichte. 2. Aufl. Halle: Max Niemeyer.
prinzipiendersp01paulgoog: ia.
Perrin, L.-M. (2010). “Polysemous qualities and universal networks, invariance and diversity”. In: Linguistic Discovery 8.1, 259–280.
Sperber, H. (1923). Einführung in die Bedeutungslehre. Bonn und Leipzig: Kurt Schroeder.
Steiner, L., P. F. Stadler und M. Cysouw (2011). “A pipeline for computational historical
linguistics”. In: Language Dynamics and Change 1.1, 89–127.
Traugott, E. C. und R. B. Dasher (2002). Regularity in semantic change. Cambridge: Cambridge University Press.
8
83
5 Zukunftsmusik
Johann-Mattis List
Lehnworterkennung
22.02.2013
Lehnworterkennung
1 Allgemeines zur Entlehnung
Entlehnung (engl. borrowing) bezeichnet in einem engen Sinne, die Übertragung von Wörtern einer Sprache in eine andere Sprache.
Narrowly, the transfer of a word from one language into a second language, as a result
of some kind of contact [...] between speakers of the two. (Trask 2000: 44)
In einem weiteren Sinne bezeichnet Entlehnung auch die allgemeine Übertragung linguistischer Merkmale von einer Sprache in eine andere.
Broadly, the transfer of linguistic features of any kind from one language to another as
a result of contact. (ebd.)
Nenne je ein Beispiel für Entlehnung im engeren und im weiteren
Sinne des Wortes.
1.1 Terminologisches
Der Terminus Entlehnung bezeichnet meist einen konkreten Prozess. Alternativ kann auch
das etwas allgemeinere Wort Übertragung (transfer) verwendet werden. Entlehnung im
engeren Sinne würde dann als lexikalische Übertragung (lexical transfer) bezeichnet. Soll
auf das generelle Phänomen verwiesen werden, bietet sich der von Weinreich (1953[1974])
verwendete Terminus lexikalische Interferenz (lexical interference) an.
Im Folgenden betrachten wir Entlehnung vereinfacht als Übertragung von linguistischem Material von einer in eine andere Sprache. Die Sprache, die Material liefert, nennen wir die Donorsprache (donor language), die Sprache, die Material aufnimmt, nennen
wir die Empfängersprache (recipient language). Das linguistische Material, das übertragen wird, nennen wir Ursprungsmaterial (source material), wenn auf die Form, in der das
Material in der Donorsprache vorliegt, verwiesen wird, und Zielmaterial (target material),
wenn auf die Form des Materials in der Empfängersprache verwiesen wird.
Schön und gut, aber was ist, wenn wir nun in einem bestimmten
Fall nicht wissen, welche Sprache die Donorsprache und welche
die Empfängersprache ist? Wie sollen wir sie dann nennen? Und
wie sollen wir das Ursprungs- und das Zielmaterial dann nennen?
Moment mal, hatten wir darüber nicht schon früher geredet?
Das war doch so…
1.2 Mechanismen
Wenn wir im Sinne von Saussure von einem bilateralen Zeichenmodell ausgehen, so können grob zwei Fälle lexikalischer Übertragung unterschieden werden, nämlich die Fälle
der direkten Übertragung (direct transfer), in denen ein Wort als Ganzes übertragen wird,
und die Fälle der indirekten Übertragung (auch semantische Entlehnung, semantic borrowing), in denen die Bedeutung eines in der Empfängersprache bereits vorhandenen Wortes erweitert oder umgestaltet wird, um die Form-Bedeutungs-Einheit des Ursprungswortes in der Donorsprache nachzubilden. In Bezug auf einfache Wörter sind diese Fälle mehr
1
84
Johann-Mattis List
Lehnworterkennung
22.02.2013
oder weniger eindeutig auseinanderzuhalten, im Falle von Komposita können sich jedoch
Mischformen ergeben.
The ways in which one vocabulary can interfere with another are various. Given two
languages, A and B, morphemes may be transferred from A into B, or B-morphemes
may be used in new designative functions on the model of A-morphemes with whose content they are identified; finally, in the case of compound lexical elements, both
processes may be combined. (Weinreich 1953[1974]: 47)
Basierend auf Weinreich (ebd.: 47-62) können diese Prozesse in dem folgenden Schema
dargestellt werden:
transfer
meaning
form
simple
direct
transfer
hybrid
transfer
loan
transfer
compound
hybrid
transfer
loan
transfer
stem
transfer
direct
transfer
affix
transfer
loan
translation
loan
rendition
loan
creation
Die wichtigsten Prozesse mit ihren entsprechenden deutschen Termini sind dabei:
• Übertragung einfacher Wörter
– Übertragung (transfer): Direkte Übertragung von Form und Bedeutung eines
sprachlichen Zeichens von der Donor- in die Empfängersprache.
1
– Reproduktion (reproduction): Erweiterung des Denotationsbereiches eines sprachlichen Zeichens der Empfängersprache in Anlehnung an die Bedeutung eines
sprachlichen Zeichens in der Donorsprache.
– Hybride Übertragung (hybrid transfer): Erweiterung des Denotationsbereiches
eines einem linguistischen Zeichen der Donorsprache homophonen sprachlichen Zeichens der Empfängersprache.
2
85
5 Zukunftsmusik
Johann-Mattis List
Lehnworterkennung
22.02.2013
• Übertragung komplexer Wörter
– Übertragung (transfer): Direkte Übertragung von Form und Bedeutung eines
komplexen sprachlichen Zeichens von der Donor- in die Empfängersprache.
– Reproduktion (reproduction): Nachbildung komplexer sprachlicher Zeichen der
Donorsprache durch sprachliche Zeichen der Akzeptorsprache.
* Lehnübersetzung (loan translation): Exakte Nachbildung des komplexen
sprachlichen Zeichens der Donorsprache in der Empfängersprache.
* Lehnübertragung (loan rendition): Nachbildung des komplexen sprachlichen Zeichens in der Donorsprache, die das Zeichen nicht vollständig als
Modell annimmt.
* Lehnschöpfung (loan creation): Bildung eines komplexen sprachlichen Zeichens in der Empfängersprache, dessen Denotationsbereich einem komplexen sprachlichen Zeichen der Donorsprache entspricht.
– Hybride Übertragung (hybrid transfer): Bildung eines komplexen sprachlichen
Zeichens in der Akzeptorsprache, die teils auf direkter Übertragung, teils auf
Reproduktion sprachlicher Zeichen der Donorsprache beruht.
Unten sind Beispiele für mögliche Resultate von lexikalischer
Interferenz gegeben. Versuche, diese Fälle mit Hilfe des oben
wiedergegebenen Klassifikationsschemas genauer zu charakterisieren.
No. Wort
1
Russisch futbol „Fußball”
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Russisch gol „Tor”
Chinesisch kěkǒukělè „Coca
Cola”
Deutsch Handy
Deutsch Job
Russisch bruderšaft „Bruderschaft”
Deutsch Rechner
Deutsch Maus (für Comuter)
Deutsch Festplatte
Deutsch Wolkenkratzer
Chinesisch xīngqīyī „Montag”
Deutsch Fenster
Deutsch Kopf
Chinesisch kù „bitter, cool”
Chinesisch xǐnǎo „einer Gehirnwäsche unterziehen”
Hinweise
Russisch mjač „Ball”, noga „Fuß,
Bein”
Russisch vorota „Tor”
wörtl. „mundet – genießbar”
Mechan.
Englisch cellphone „Handy”
Russisch brat „Bruder”
Englisch Computer
Englisch mouse
Englisch hard disk
Englisch sky scraper
wörtl.
„Woche-eins”,
xīngqīèr
„Dienstag”, wörtl. „Woche-zwei”
Latein fenestra „Fenster”
Englisch cup, Latain cūpa „Gefäß”
wörtl. „waschen Gehirn”
1.3 Prozesse
Mit der Übertragung allein enden die Prozesse der Entlehnung zumeist nicht. In der Empfängersprache schließen sich meist Folgeprozesse an. Aus semantischer Perspektive tre-
3
86
Johann-Mattis List
Lehnworterkennung
22.02.2013
ten diese Folgeprozesse insbesondere dann auf, wenn die Bedeutung des Zielwortes bereits von einem indigenen Wort in der Empfängersprache ausgedrückt wird und somit zwei
Wörter miteinander in „Konkurrenz” treten. Weinreich (1953[1974]: 54) unterscheidet hier
zwischen Unschärfe (confusion), Schwund (disappearance) und Spezialisierung (specialisation) als Folge von Entlehnung.
Except for loanwords with entirely new content, the transfer or reproduction of foreign
words must affect the existing vocabulary in one of three ways: (1) confusion between
the content of the new and old word; (2) disappearance of the old words; (3) survival
of both the new and old word, with a specialisation in content. (ebd.)
Aus Perspektive der übertragenen Form kann man als Folge von lexikalischer Interferenz
zwei weitere Prozesse feststellen, nämlich die Nativisierung (nativization) und die ihr entgegengesetzte Hyperverfremdung (hyper-foreignization, vgl. Hock und Joseph 1995[2009]:
257f). Nativisierung bezeichnet dabei die Anpassung der Ursprungsform an die phonotaktischen Gegebenheiten der Empfängersprache (ebd.: 247-257). Hyperverfremdung ist ein
umgekehrter Prozess, der dazu führt, dass der fremde „Klang” der Ursprungsform in der
Zielform in einem derartigen Maße von den Sprechern zu bewahren versucht wird, dass
er von ihr abweicht.
Nenne Beispiele für Nativisierung und Hyperverfremdung im
Deutschen.
1.4 Zahlen
Wie groß ist der Einfluss von lexikalischer Interferenz auf die Sprachgeschichte? Wie häufig sind Fälle der Entlehnung? Da die Häufigkeit von Entlehnungsprozessen vorwiegend
von soziokulturellen Faktoren abhängt, zu denen die soziokulturelle Situation, in der Sprachen gebraucht werden, die geographische Distanz zwischen interferierenden Sprachen
und das Prestige spezifischer Sprachvarietäten innerhalb einer Sprachgemeinschaft gehören, können Entlehnungsprozesse unterschiedlich große Teile des Lexikons einer Sprache
erfassen. Diese reichen vom einfachen Austausch bestimmter kultureller Begriffe bis hin
zu einer massiven Ersetzung des ursprünglichen Vokabulars. In der World Loanword Database (Haspelmath und Tadmor 2009) wurde die Häufigkeit direkter Entlehnung in einer
Probe von 1460 Glossen („Konzepte”), die in 41 verschiedene Sprachen übersetzt wurden,
untersucht. Laut der Datenbank gibt es große Unterschiede zwischen den Entlehnungshäufigkeiten der einzelnen Sprachen. Diese reichen von 1.2% (Mandarin-Chinesisch) bis
hin zu 67% (Selice Romani). Auf der englischen Wortliste wurden dabei 41% der Wörter
als Entlehnungen identifiziert. Die Gründe für die unterschiedlichen Entlehnungshäufigkeiten sind sehr unterschiedlich. Im Falle des Chinesischen ist die Entlehnungsresistenz zum
Beispiel auf die sehr restriktive phonologische und phonotaktische Struktur der Sprache
zurückzuführen, die es den Sprechern stark erschwert, fremdes Formmaterial in ihre Sprache aufzunehmen. Aus diesem Grund entlehnen chinesische Sprecher neue Wörter vorwiegend indirekt, also semantisch. Da die Datenbank nur Fälle direkter Entlehnung auflistet, bleiben diese Fälle verborgen. Ein Beispiel ist das Wort fēiqùláiqì 飞去来器„Bumerang”,
das wohl kaum ein indigenes chinesisches Wort sein dürfte, obwohl der Bumerang selbst
auch unabhängig von den australischen Ureinwohnern erfunden wurde. Dieses beruht auf
einer Lehnprägung, wie die wörtliche Übersetzung des Wortes als „hin-zurück-flieg-Gerät”
deutlich macht.
4
87
5 Zukunftsmusik
Johann-Mattis List
Lehnworterkennung
22.02.2013
Die niedrige Zahl an Entlehnungen im Chinesischen wurde durch
dessen restriktive phonologische und phonotaktische Struktur
erklärt. Gibt es weitere Gründe, die zu niedrigen (oder umgekehrt hohen) Entlehnungsraten führen können, und wenn ja,
welche sind dies?
2 Traditionelle Methoden der Lehnworterkennung
Traditionell werden Lehnwörter im Rahmen der historischen Linguistik durch Sequenzvergleiche ermittelt. Entscheidend sind für das Gelingen dieses Unterfangens dabei zwei
Punkte:
1. Lehnwörter müssen den Ursprungswörtern phonetisch ähneln, da ansonsten keine
Ursprungswörter identifiziert werden könnten.
2. Wenn die genetische Verwandtschaft der interferierenden Sprachen erwiesen ist,
muss die Ähnlichkeit zwischen Lehn- und Ursprungswort von den korrespondenzbasierten Ähnlichkeiten zwischen den kognaten Wörtern der interferierenden Sprachen
abweichen, da es ansonsten ja plausibler wäre, die möglichen Lehnwörter und Ursprungswörter als Kognaten zu identifizieren.
In der folgenden Tabelle werden etymologisch verwandte Wörter im Deutschen und Englischen einander gegenübergestellt.
Zusätzlich zu den neuhochdeutschen Wörtern werden auch die
jeweils etymologisch verwandten Mittelhochdeutschen Formen
angegeben. Was fällt auf, wenn man die Wortpaare miteinander vergleicht? Bei welchen Wortpaaren könnte es sich um
Entlehnungen handeln?
No.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Deutsch
Dach
Daumen
Degen
Dill
Ding
drei
Dunst
Durst
denken
Damm
dumm
Dieb
Dorn
dreschen
Drossel
Englisch
thatch
thumb
thane
dill
thing
three
dunst
thirst
think
dam
dumb
thief
thorn
thresh
throat
Mittelhochd.
dah
dūm
degan
tilli
ding
drī
tunst
durst
denken
tam
tumb
diob
dorn
dreskan
drozze
5
88
Notiz
Johann-Mattis List
Lehnworterkennung
22.02.2013
3 Quantitative Methoden der Lehnworterkennung
Obwohl es einige neuere Ansätze in der historischen Linguistik gibt, in denen versucht
wird, von den Stammbaum-basierten Analysen wegzukommen, sind tatsächliche Methoden zur Lehnworterkennung bisher sehr rar. Prinzipiell wäre es dabei möglich, wie im oben
gezeigten Beispiel auch automatisch vorzugehen, also Lautkorrespondenzen zu stratifizieren und Unterschiede festzustellen. Diese Ansätze wurden bisher aber noch nicht genauer verfolgt, da bisher noch keine ausreichend guten Methoden zur Entdeckung regulärer
Lautkorrespondenzen entwickelt wurden. Ein alternativer Ansatz, der bisher in einer veröffentlichten Studie verwendet wurde, kommt aus der Biologie und besteht im Vergleich
von sogenannten phyletischen Mustern vor dem Hintergrund von Referenzbäumen. Dieser
wird im Folgenden genauer vorgestellt (Nelson-Sathi u. a. 2011).
Ist die Methode von McMahon u. a. (2005) eine Methode zur
Entdeckung von Entlehnungen?
3.1 Gain-Loss Mapping
Die Gain-Loss-Mapping-Methode stammt aus der Biologie, sie kann jedoch auch mehr
oder weniger direkt für Sprachen angewandt werden. Die Grundidee der Methode ist es,
phyletische Muster (phyletic patterns) genauer zu untersuchen. Ein phyletisches Muster ist
eine Matrix-Repräsentation von Kognatensets in einer bestimmten Menge von Sprachen.
Dabei gibt die Matrix wieder, ob ein Kognatenset einen Reflex in der jeweiligen Sprache
aufweist. Für eine bestimmte Sprache werden also zwei verschiedene Zustände hinsichtlich eines Kognatensets unterschieden: presence (1) oder absence (0). Je nachdem, welche Kognatensets nun analysiert werden, kann man verschiedene Muster vergleichen, wie
die folgende Darstellung zweier phylogenetischer Muster zeigt.
Language
“mountain”
Pattern mountain
Pattern berg
Spanish
montaña
1
0
Portuguese
montanha
1
0
French
montagne
1
0
English
mountain
1
0
German
Berg
0
1
Swedish
berg
0
1
Die Gain-Loss-Mapping-Methode versucht nun, mit Hilfe eines Referenzbaumes, zu erklären, wie bestimmte phyletische Muster entstanden sind. Dabei wird von einem sehr
einfachen Prozess ausgegangen, in dessen Verlauf Sprachen Reflexe eines bestimmten
Kognatensets entweder verlieren, oder erwerben können. Ein Gain-Loss-Szenario stellt dabei eine spezifische Hypothese bezüglich der Entwicklung eines phyletischen Musters auf.
Dabei sind für verschiedene phyletische Muster durchaus verschiene Gain-Loss-Szenarien
denkbar, wie man an den folgenden Abbildungen (b) und (c) sehen kann, die beide das
Muster für mountain „erklären”.
(a) Kein Szenario
(b) 1 Ursprung
(c) 2 Ursprünge
6
89
5 Zukunftsmusik
Johann-Mattis List
Lehnworterkennung
22.02.2013
Ein Gain-Loss-Szenario unterscheidet nicht nur die beiden Zustände von Sprachen hinsichtlich eines Kognatensets, es zeigt auch an, wo sich Zustände im Verlauf der Entwicklung (repräsentiert durch den Referenzbaum) verändern, also Übergänge stattfinden. Dabei gibt es zwei mögliche Übergänge: Ursprung (origin, gain) und Schwund (loss). Wenn
nun für ein Gain-Loss-Szenario zwei unabhängige Ursprünge angesetzt werden, dann ist
es plausibel anzunehmen, dass die Ursprünge nicht unabhängig voneinander stattgefunden haben, sondern mitunter durch eine Entlehnung entstanden sind.
War das soweit verständlich? Wenn ja, ist die Annahme plausibel,
und trifft sie auf das Beispielmuster mountain auch zu?
3.2 Beispiel
Wendet man diese Methoden auf große Datensätze an, kann man zeigen, welche Knoten in den Referenzbäumen am häufigsten unabhängig voneinander Ursprungsereignisse
aufweisen. Das Ergebnis ist ein Netzwerk, in dem die vertikale Entwicklung durch den Referenzbaum dargestellt wird, und die horizontale durch „Interferenzkanten”. Das folgende
Beispiel beruht auf lexikalischen Daten für 40 verschiedene chinesische Dialekte (Hóu
2004).
Shèxiàn
Táoyuán Měixiàn Guǎngzhōu
Hongkong
Nánníng
Tūnxī
Jiàn'ǒu
Wénzhōu
Shànghǎi
Fùzhōu
Hǎikǒu
Sùzhōu
Hángzhōu
14
Shāntóu
Xiāngtàn
Chángshā
Táiběi
Nánchàng
Hohhot
Nánjīng
Píngyáo
7
Inferred Links
Xiàmén
Tàiyuán
Héfèi
Xī'ān
Wǔhàn
Kùnmíng
Xīníng
Chéngdū
1
Zhèngzhōu
Guìyáng
Ürümqi
Qīngdǎo
Lánzhōu
Jìnán
Tiānjìn
Harbin
Běijīng
Yīnchuàn
.
In ähnlicher Weise können diese Ergebnisse dann auch verwendet werden, um mögliche
areale Beziehungen zwischen Sprachen zu ermitteln, wie der geographische Plot der 40
chinesischen Dialekte zeigt.
7
90
Johann-Mattis List
.
22.02.2013
7
21
33
11
1
29
39
27
20
13
38
21
15
40
10
34
18
10
25 22
32
3
24
9
30
2
17
31
37
12
23
6
4
26
14
35
16
28
5
19
36
8
Inferred Links
Běijīng 北京
1
Chángshā 长沙
2
Chéngdū 成都
3
4
Fùzhōu 福州
5 Guǎngzhōu 广州
Guìyáng 贵阳
6
7
Harbin 哈尔滨
8
Hǎikǒu 海口
Hángzhōu 杭州
9
10
Héfèi 合肥
11 Hohhot 呼和浩特
12
Jiàn'ǒu 建瓯
13
Jìnán 济南
Kùnmíng 昆明
14
15
Lánzhōu 兰州
16
Měixiàn 梅县
Nánchàng 南昌
17
Nánjīng 南京
18
Nánníng 南宁
19
Píngyáo 平遥
20
Qīngdǎo 青岛
21
Shànghǎi 上海
22
23
Shāntóu 汕头
24
Shèxiàn 歙县
25
Sùzhōu 苏州
26
Táiběi 台北
Tàiyuán 太原
27
Táoyuán 桃园
28
Tiānjìn 天津
29
30
Tūnxī 屯溪
31
Wénzhōu 温州
32
Wǔhàn 武汉
33 Ürümqi 乌鲁木齐
34
Xī'ān 西安
35
Xiàmén 厦门
Hongkong 香港
36
Xiāngtàn 湘潭
37
Xīníng 西宁
38
39
Yīnchuàn 银川
40 Zhèngzhōu 郑州
Lehnworterkennung
Mandarin
Xiàng
Mǐn
Cantonese
Wú
Jìn
Hakka
Gàn
Huī
1
Worin mögen die Schwächen in der Gain-Loss-Mapping-Methode
liegen?
Literatur
Haspelmath, M. und U. Tadmor, Hrsg. (2009). World Loanword Database. URL: http:
//wold.livingsources.org.
Hock, H. H. und B. D. Joseph (1995 [2009]). Language history, language change and
language relationship. An introduction to historical and comparative linguistics. 2. Aufl.
Berlin und New York: Mouton de Gruyter.
Hóu, J., Hrsg. (2004). Xiàndài Hànyǔ fāngyán yīnkù [Phonological database of Chinese
dialects] 现 代 汉 语 方 言 音 库 [Phonological database of Chinese dialects]. Shanghai:
Shànghǎi Jiàoyǔ.
McMahon, A., P. Heggarty, R. McMahon und N. Slaska (2005). “Swadesh sublists and
the benefits of borrowing: An Andean case study”. In: Transactions of the Philological
Society 103, 147–170.
Nelson-Sathi, S., J.-M. List, H. Geisler, H. Fangerau, R. D. Gray, W. Martin und T. Dagan
(2011). “Networks uncover hidden lexical borrowing in Indo-European language evolution”. In: Proceedings of the Royal Society B. Biological Sciences 278.1713, 1794–1803.
PMID: 21106583.
Trask, R. L., Hrsg. (2000). The dictionary of historical and comparative linguistics. Edinburgh: Edinburgh University Press.
Weinreich, U. (1953 [1974]). Languages in contact. With a preface by André Martinet.
8. Aufl. The Hague und Paris: Mouton.
8
91