handouts
Transcription
handouts
Neue Ansätze in der historischen Sprachwissenschaft Johann-Mattis List [email protected] Institut für Sprache und Information Heinrich Heine Universität Düsseldorf Wintersemester 2012 Inhaltsverzeichnis 1 Einführung 3 Grundlegende Konzepte der historischen Linguistik . . . . . . . . . . . . . . . . . . 3 Historische Aspekte der historischen Sprachwissenschaft . . . . . . . . . . . . . . 12 Übung zur Vertiefung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2 Wandel und Relationen 21 Zeichenwandel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Zeichenrelationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Übung zur Vertiefung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3 Rekonstruktion von Zeichenbeziehungen Sequenzalinierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kognatenerkennung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übung zur Vertiefung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 39 48 56 4 Rekonstruktion von Sprachbeziehungen 57 Phylogenetische Rekonstruktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Nachweis von Sprachverwandtschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 Übung zur Vertiefung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 5 Zukunftsmusik 75 Quantitative Aspekte von Bedeutungswandel . . . . . . . . . . . . . . . . . . . . . . 75 Lehnworterkennung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 2 1 Einführung In diesem Block werden grundlegende Aspekte besprochen, die für ein Verständnis der folgenden Blöcke wichtig sind. Dazu gehören grundlegende Konzepte in der historischen Linguistik, historische Aspekte der historischen Sprachwissenschaft und eine kleine Übung zur Vertiefung. 3 1 Einführung Johann-Mattis List Grundlagen 2012-11-30 Grundlegende Konzepte der historischen Linguistik 1 Gegenstand 1.1 Sprachen Was ist eine Sprache? Was als Sprache gilt, d. h. welche Sprechtraditionen zu einer Sprache gezählt werden, hängt nicht von rein linguistischen, sondern insbesondere auch von sozialen und kulturellen Kriterien ab (Barbour und Stevenson 1998: 8). Demzufolge geht man bspw. davon aus, dass die Menschen in Shanghai, Peking und Meixian alle Dialekte des “Chinesischen” sprechen, während die Menschen in Skandinavien eine der Sprachen “Norwegisch”, “Schwedisch” oder “Dänisch” sprechen. Dies bedeutet jedoch nicht, dass sich die chinesischen Varietäten weniger voneinander unterscheiden als die skandinavischen, wie Tabelle 1 deutlich macht: Beijing Chinese Hakka Chinese iou²¹ i⁵⁵ iu³³ xuei³⁵ 1 Shanghai Chinese 1 ɦi²² tʰɑ̃⁵⁵ ʦɿ²¹ poʔ³foŋ⁴⁴ Beijing Chinese 2 ʂei³⁵ Hakka Chinese 1 2 Shanghai Chinese 2 Norwegian 1 Swedish 1 Danish man³³ sa³³ it⁵⁵ pei²¹fəŋ⁵⁵ pai³³a¹¹ pet³³fuŋ³³ də⁵⁵ ɲin¹¹ ɲiŋ⁵⁵ ɦəʔ²¹ nuːɾɑʋinˑn̩ ɔ suːln̩ 1 noʌ̯ʌnvenˀn̩ ʌ soːl ̩ˀn Norwegian 2 ʋem ɑ dem Swedish Danish 2 2 vɛm vɛmˀ ɑv a dɔm b̥m̩ nuːɖanvɪndən ɔ suːlən kʷɔ⁵⁵ kʰʌm sɱ̩ kən⁵⁵ tʰuŋ¹¹ taʔ⁵ tʰai⁵¹iaŋ¹¹ ɲit¹¹tʰeu¹¹ tʰa³³ɦiã⁴⁴ pən³⁵ liŋ²¹ ta⁵¹ pəŋ³³ zɿ⁴⁴ du¹³ vɔi⁵³ tv̥ɪstadə ʋɑː sɔm vɑ d̥ vɑ ən gɔŋ eŋg̊ɑŋ ɖɳ̩ d̥n̩ t͡ʂəŋ⁵⁵ ʦai⁵³ naɚ⁵¹ hɔk³³ e⁵³ ʦəŋ³³ hɔ⁴⁴ kɾɑŋlət i sd̥ʁiðˀ t͡ʂəŋ⁵⁵luən⁵¹ au⁵⁵ ləʔ¹lə²³ʦa⁵³ ɔm ɔm ʌmˀ stæɾ̥kəstə staɹkast sd̥æʌ̯g̊əsd̥ə Tabelle 1: “Der Nordwind und die Sonne” in verschiedenen Sprachvarietäten Die Tabelle zeigt phonetische Transkriptionen der Übersetzung des Satzes "Der Nordwind und die Sonne stritten sich, wer von ihnen der stärkere sei" in sechs verschiedenen sprachlichen Varietäten. Leider gibt es keine weiteren Angaben zur Struktur der Tabelle. Wie lässt sich diese erklären? Welche Schlussfolgerungen in Bezug auf die Einteilung der chinesischen Varietäten in Dialekte und der skandinavischen Varietäten in Sprachen lassen sich aus der Tabelle ziehen? Das Konzept des Diasystems Um den komplexen, heterogenen Charakter von Sprachen im Rahmen der Linguistik realistischer widerzuspiegeln wird in der Soziolinguistik gewöhnlich vom Modell des Diasystems (Bussmann 1996: 312) Gebrauch gemacht. Gemäß diesem Modell sind Sprachen komplexe Aggregate verschiedener linguistischer Systeme, “die miteinander koexistieren und sich gegenseitig beeinflussen” (Coseriu 1973: 40). Ein wichtiger Aspekt ist dabei das Vorhandensein einer sogenannten Dachsprache, d. h. einer linguistischen Varietät, die als 1 4 Johann-Mattis List Grundlagen 2012-11-30 Standard für interdialektale Kommunikation dient (Goossens 1973: 11). Die unterschiedlichen linguistischen Varietäten (Dialekte, Soziolekte), welche durch einen solchen Standard verbunden werden, bilden den Varietätenraum einer Sprache (Oesterreicher 2001), wie in Abbildung 1 dargestellt. Standard Language Diatopic Varieties Diastratic Varieties Diaphasic Varieties Abbildung 1: Sprache als Diasystem Wie lässt sich mit Hilfe des Modells des Diasystems die unterschiedliche Einteilung der chinesischen und der skandinavischen Varietäten erklären? Vereinfachtes Sprachmodell der historischen Linguistik In der historischen Linguistik wird ein sehr vereinfachtes Sprachmodell zugrunde gelegt. Es interessiert dabei weniger, was eine Sprache tatsächlich “ist” als vielmehr, wie eine Sprache sich verändert. Dabei wird Sprache als System angesehen. In einem weiten Sinne besteht ein System aus einer Menge von Elementen und einer Menge von Relationen, die sich auf die Menge der Elemente beziehen (Marchal 1975: 462f). Für das Sprachmodell in der historischen Linguistik bedeutet dies, dass sprachliche Systeme Laute (Phone, Phoneme) und Zeichen (Wörter, Morpheme) als Elemente aufweisen und phonotaktische und syntaktische Regeln als Relationen. Reicht ein dermaßen vereinfachtes Sprachmodell für eine Behandlung der wichtigen Probleme der historischen Linguistik aus? 1.2 Zeichen Das klassische Zeichenmodell Sprachliche Zeichen werden in der historischen Linguistik gewöhnlich im Rahmen des traditionellen Zeichenmodells von Saussure (1916) beschrieben. Es wird also die Ausdrucksseite von der Inhaltsseite des sprachlichen Zeichens unterschieden, oder, wie Roman Jakobson es ausdrückt: 2 5 1 Einführung Johann-Mattis List Grundlagen 2012-11-30 The sign has two sides: the sound, or the material side on the one hand, and meaning, or the intelligible side on the other. Every word, and more generally every verbal sign, is a combination of sound and meaning, or to put it another way, a combination of signifier and signified [...]. (Jakobson 1976[1978]: 3) Was mein Jakobson mit ``material" und ``intelligible"? Nachtrag Normalerweise wird das klassische Zeichenmodell Saussure’s wie folgt verbildlicht: ↑ ↓ ↑ [kop͡f] “head” ↓ [kʌp] “cup” Konstituierend für das sprachliche Zeichen ist neben der Form (Signifikant) und der Bedeutung (Signifikat) aber auch das sprachliche System, in dem das Zeichen seine Geltung hat. Eine genauere Verbildlichung des Zeichenmodells sollte daher auch dem System Rechnung tragen: [kɔp͡f] “head” [kʌp] MEANING FORM “cup” FORM Kopf MEANING cup LANGUAGE LANGUAGE German English Betrachtet man die Struktur von Zeichenform und Zeichenbedeutung, so lassen sich grundlegende Unterschiede zwischen den beiden feststellen. Bei der Zeichenform handelt es sich um eine (phonetische) Sequenz, also eine Abfolge distinktiver Laute. Diese Laute sind materiell, insofern als sie bspw. als Schwingungen in der Luft gemessen werden können, oder als Spuren von Tinte auf einem Blatt Papier. Wichtig ist für die Zeichenform ferner ihre Linearität, denn nicht die bloße Anhäufung an Lauten, sondern ihre Abfolge ist entscheidend für die Unterscheidung von Zeichenformen. Man kann daher sagen, dass die Zeichenform (a) substantiell, (b) segmentierbar, und (c) linear ist. Wie aber verhält es sich mit der Zeichenbedeutung? Trage die Entsprechungen in der jeweiligen Spalte in der Tabelle ein. No. (a) (b) (c) Form substantiell segmentierbar linear Bedeutung 3 6 Johann-Mattis List Grundlagen 2012-11-30 2 Wandel Wandel als Katastrophe Schon früh in der Geschichte der Linguistik war den Forschern in Europa bewusst, dass Sprachen sich wandeln können. Vorherrschend war dabei jedoch die Ansicht, dass alle Formen des Wandels “katastrophisch” abliefen, dass Wandel also im Rahmen eines unberechenbaren, chaotischen “Verfalls” vor sich ginge. Erst spät (zu Beginn des 19. Jahrhunderts) wurde erstmals klar, dass sich bestimmte Phänomene des Sprachwandels, insbesondere der Lautwandel, durch eine beachtliche Regelmäßigkeit auszeichnen. Die katastrophische Theorie des Sprachwandels wird zuweilen auch als das "hebräische Paradigma" bezeichnet. Womit mag diese Benennung zusammenhängen? Wandel als Prozess Dass Lautwandel gerade nicht zwangsläufig katastrophisch verläuft, kann schnell gezeigt werden, wenn man Wörter des Lateinischen mit Wörtern einer seiner Nachfolgersprachen (wie bspw. des Italienischen) vergleicht. Dabei stellen die Daten in Tabelle 2 jeweils nur Beispiele dar, die sich nahezu beliebig erweitern lassen. Bedeutung “Feder” “flach” “Platz” Latein pluːma plaːnus plateːa Italienisch pjuma pjano pjaʦːa Bedeutung “Zunge” “Mond” “langsam” Latein liŋgua lu:na lentus Italienisch liŋgwa luna lento Tabelle 2: Lateinische und Italienische Wörter Wenn die Daten in Tabelle 2 tatsächlich nur einen Ausschnitt für eine viel größere Anzahl von Beispielen von Wortvergleichen zwischen dem Lateinischen und dem Italienischen darstellen, welche grundlegenden Eigenschaften des Lautwandels lassen sich dann daraus ableiten? Wandel als Gesetz Die Erkenntnis, dass Lautwandel zu großen Teilen regelmäßig verläuft, wurde enthusiastisch von den Sprachforschern zu Beginn des 19. Jahrhunderts aufgenommen, und führte von der Regularitätsannahme schnell zum Terminus des Lautgesetzes. Das Phänomen des Lautwandels wurde dabei bewusst mit einem den Naturgesetzen vergleichbaren gemeingültigen Prozess in Beziehung gesetzt. Die stärkste Hypothese in Bezug auf den Lautwandel wurde dabei von den sogenannten Junggrammatikern (einer Gruppe von Linguisten in Leipzig, die durchschnittlich jünger als andere Linguisten in Deutschland waren) formuliert, welche als “Junggrammatische Hypothese” in die Geschichte einging: Aller lautwandel, soweit er mechanisch vor sich geht, vollzieht sich nach ausnahmslosen gesetzen, d.h. die richtung der lautbewegung ist bei allen angehörigen einer sprachgenossenschaft, ausser dem Fall, dass dialektspaltung eintritt, stets dieselbe, und alle wörter, in denen der der lautbewegung unterworfene laut unter gleichen verhältnissen erscheint, werden ohne ausnahme von der änderung ergriffen. (Osthoff und Brugmann 1878: XIII) 4 7 1 Einführung Johann-Mattis List Grundlagen 2012-11-30 Was genau besagt die junggrammatische Hypothese in ihren Einzelheiten? Ausblick Wenn man sich mit Sprachwandel beschäftigt, lassen sich verschiedene Ebenen unterscheiden. Die bisherigen Beispiele orientieren sich primär am Lautwandel. Lautwandel an sich lässt sich jedoch wiederum im Hinblick auf verschiedene Aspekte untersuchen. Die prozedurale Perspektive beschäftigt sich mit dem Prozess und dessen Geltungsbereich, wobei unterschiedliche Mechanismen des Lautwandels untersucht werden. Diese Perspektive wird in der Sitzung “Zeichenwandel” in Block II im Vordergrund stehen. Die substantielle Perspektive beschäftigt sich mit dem Wandel hinsichtlich der lautlichen Substanz, wobei unterschiedliche Typen des Lautwandels unterschieden werden. Diese Perspektive wird in der Sitzung “Sequenzalinierung” in Block III genauer behandelt werden. Lautwandel ist jedoch nicht die einzige Form von Wandel, die in der historischen Linguistik untersucht wird, denn auch die Bedeutungsseite des sprachlichen Zeichens kann sich im Laufe der Zeit wandeln. Phänomene des semantischen Wandels werden in der Sitzung “Bedeutungswandel” genauer untersucht werden. Eine weitere und allgemeinere Form des sprachlichen Wandels, die eine wichtige Rolle in der historischen Linguistik spielt, ist der lexikalische Wandel. Dieser wird vor allem in der Sitzung “Lexikostatistik” in Block IV wieder aufgegriffen. 3 Relationen Wandel und Resultate des Wandels Ausgehend von der Annahme, dass Lautwandel regelmäßig verläuft, lassen sich bestimmte Rückschlüsse in Bezug auf mögliche Resultate des Lautwandels postulieren. Tabelle 3 zeigt Beispiele für diese Resultate anhand der genetisch verwandten Sprachen Sanskrit, Latein, Griechisch und Gotisch. Nummer 1 2 3 4 5 6 7 8 9 10 11 12 Sanskrit padpi'tarpardateː ta'noːti 'trajas tu *ka'put*kalnkra'vis kaʧʲi-'raø Latein peːdpater ø tendere tres tu kaput ø kruor kʷoj kʷieːs s-kʷalus Griechisch podpa'teːr 'perdomai 'teinein treis ty ø ø 'kreas po-tʰen ø a's-palos Gotisch foːtfadrs *firtan θanjan θreis θu hawbiθ hals *hreːwa hʷas hʷiː-la *hʷalas Bedeutung Fuß Vater furzen dehnen drei du Kopf Hals Fleisch, Blut wie?, was? Ruhe Wal, Fisch Tabelle 3: Lautkorrespondenzen verschiedener indogerman. Sprachen Bezeichnend für die Anfänge der historischen Linguistik, aber auch nach wie vor für viele neuere Darstellungen, ist ein Vermischen der Phänomene mit den Resultaten des 5 8 Johann-Mattis List Grundlagen 2012-11-30 Lautwandels. Während sich die Phänomene mit Hinblick auf einen Anfangs- und Endpunkt beschreiben lassen, müssen Anfangs- und Endpunkt aus den Resultaten des Lautwandels erst erschlossen werden. Wie der von Jacob Grimm (1785 – 1863) geprägte Terminus “Lautverschiebung” jedoch schon andeutet, war diese strikte Trennung alles andere als selbstverständlich für die Pioniere der historischen Linguistik. So interpretiert Grimm seine Daten direkt historisch als Prozess, ohne deutlich zu machen, dass der Prozess nicht zwangsläufig aus den Daten ersichtlich wird: Noch merkwürdiger als die einstimmung der liq. und spir. ist die abweichung der lippenzungen- und kehllaute nicht allein von der gothischen, sondern auch der alth. einrichtung. Nämlich genau wie das alth. in allen drei graden von der goth. ordnung eine stufe abwärts gesunken ist, war bereits das goth. selbst eine stufe von der lateinischen (griech. indischen) herabgewichen. Das goth. verhält sich zum lat. gerade wie das alth. zum goth. (Grimm 1822: 584) Das Gleiche gilt für Rasmus Rask (1787 – 1832), der die “Lautverschiebung” bereits vor Grimm entdeckte: Aber nicht nur in den Endungen, auch im Wort selbst gehen vielfältige Veränderungen vor sich. Es ist vielleicht nicht unangebracht, auf die häufigsten von diesen Übergängen vom Griechischen und Lateinischen zum Isländischen hinzuweisen.(Rask 1818: 169)1 Ähnliche Beispiele für die Resultate des Lautwandels wie die in Tabelle 3 dargestellten lassen sich auch in den Werken von Grimm und Rask finden. Worin besteht die grundlegende Vermengung der Resultate mit den Phänomenen des Lautwandels in den Werken der beiden Forscher? Ausblick Die Unterscheidung zwischen “Wandel” und den “Resultaten des Wandels” spiegelt sich in unterschiedlichen, grundlegenden Relationen zwischen Zeichen und Sprachen wieder. Mit Relationen zwischen Zeichen werden wir uns in der Sitzung “Zeichenrelationen” in Block II genauer befassen. Relationen zwischen Sprachen werden eine wichtige Rolle in den Sitzungen “Lexikostatistik” und “Nachweis von Sprachverwandtschaft” in Block III spielen. 4 Ähnlichkeiten Strukturelle Ähnlichkeiten und Lautkorrespondenzen Wenn, wie die Arbeitshypothese der historischen Linguistik dies besagt, Sprachen sich hinsichtlich ihres Lautsystems regelmäßig ändern, so muss diese regelmäßige Änderung sich in Sprachen, die genetisch verwandt sind, in Form von Ähnlichkeiten in Lexemen widerspiegeln. Wenn bspw. eine hypothetische Sprache X die Worte [lambada] ”tanzen” und [limbo] ”Bauch” aufweist und sich dann im Verlaufe ihrer Geschichte in zwei Tochtersprachen Y und Z aufspaltet, und in diesen Tochtersprachen beide Wörter noch erhalten sind, dann kann man davon ausgehen, dass die Wörter in den Tochtersprachen sich zwar unterscheiden, weil sich ihre Lautgestalt gewandelt hat, sie aber dennoch strukturelle Ähnlichkeiten aufweisen. In Sprache Y könnten die Wörter bspw. als [ləmfəθ] ”feiern” und [limf] 1 Meine Übersetzung, Originaltext: “Men ikke blot i Endelserne, ogsaa i Ordene selv foregas mangfoldige Forandringer, det vil maaskje ikke være af Vejen her at mærke sig de hyppigste af disse Overgange fra Græsk og Latin til Islandsk.” 6 9 1 Einführung Johann-Mattis List Grundlagen 2012-11-30 ”Wampe” erhalten sein und in Sprache Z als [rãbda] ”hüpfen” und [ri ̃bɔ] ”Magen”, wie die folgende Abbildung zeigt: lambada ”tanzen” ləmfəθ ”feiern” limbo ”Bauch” rãbda ”hüpfen” limf ”Wampe” ri ̃bɔ ”Magen” In Sprache Y hätte entsprechend Lautwandel von [a] zu [ə], von [b, d] zu [f, θ], stattgefunden, und ein Schwund von Vokalen in Endsilben. In Sprache Z hätte ein Verlust von [m] nach Vokal mit gleichzeitiger Nasalierung des Vokals, ein Wandel von [l] zu [r], und ein Schwund aller Vokale in Mittelsilben stattgefunden. In einem solchen Fall würden die beiden Wörter in den beiden Tochtersprachen zwar sehr unterschiedlich aussehen, sie würden aber strukturelle Ähnlichkeiten aufweisen, die sich am besten aufzeigen lassen, indem man die Wörter aliniert, d.h. indem man die Segmente, die sich entsprechen, einander gegenüberstellt: Sprache Y Z Y Z Wort ləmpət rãbda limp ri ̃bɔ Bedeutung ”feiern” ”hüpfen” ”Wampe” ”Magen” Alinierung l ə m r ã l i m r ĩ - f b f b ə ɔ θ d a Wenn man sich diese Tabelle genauer anguckt, kann man sehr leicht erkennen, dass bestimmte Segmente miteinander ”korrespondieren”: obwohl sie unterschiedlich sind, so wie [l] und [r], treten sie doch an den gleichen Stellen in den Wörtern auf, und zwar nicht nur in einem Fall. Die Wörter sind somit strukturell ähnlich. Die Lautsegmente, die in diesen Wörtern korrespondieren, werden Lautkorrespondenzen genannt. Wörter unterschiedlicher Sprachen, die auf eine gemeinsame Vorform in einer gemeinsamen Vorgängersprache zurückgehen, nennt man Kognaten. Dt. <Zeh> und en. <toe> sind Kognaten, genauso wie dt. <Zahn> und en. <tooth> und dt. <Zaun> und en. <town>. Welche Lautkorrespondenz lässt sich aufgrund der Beispiele postulieren? Ausblick Ähnlichkeiten zwischen Zeichen und Sprachen werden eine große Rolle in den Sitzungen “Sequenzalinierung” und “Kognatenerkennung” in Block III spielen. 5 Beweise Schlussverfahren Schlussverfahren sind wichtig, um “zu einem Schluss zu kommen”, also etwas zu beweisen. Sie sind daher auch wichtig für die historische Linguistik, da diese schließlich wie alle Wissenschaften irgendetwas beweisen will. Die drei grundlegende Schlussverfahren Deduktion, Induktion und Abduktion lassen sich am besten unterscheiden, indem man sie als eine Kombination von Regel, Ereignis, und :::::::: Resultat auffasst: 7 10 Johann-Mattis List Grundlagen 2012-11-30 Deduktion: “All bunnies have long ears, and the thing that brings the Easter eggs is a bunny. Therefore, the thing that brings the Easter eggs has long ears.” ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: Induktion: “The thing that brings the Easter eggs is a bunny, and ::: the:::::: thing :::: that :::::: brings:::: the Easter eggs has long ears. Therefore, all bunnies have long ears.” :::::::::::::::::::::::::: Abduktion: “All bunnies have long ears, and the thing that brings the Easter eggs has :::::::::::::::::::::::::::::::::::::::: long ears. Therefore, the thing that brings the Easter eggs is a bunny.” ::::::::: Das abduktive Schlussverfahren wird gemeinhin als das schwächste der drei Verfahren angesehen. Warum ist das so, und warum findet es dennoch vor allem in historischen Wissenschaften Verwendung? Ausblick Mit Beweisen, Indizien und Schlussverfahren werden wir uns explizit in der Sitzung “Nachweis von Sprachverwandtschaft” in Block IV auseinandersetzen. Literatur Barbour, S. und P. Stevenson (1998). Variation im Deutschen. Soziolinguistische Perspektiven. Berlin: de Gruyter. Bussmann, H., Hrsg. (1996). Routledge dictionary of language and linguistics. A. d. Deutschen übers. von G. Trauth und K. Kazzazi. London und New York: Routledge. Coseriu, E. (1973). Probleme der strukturellen Semantik. Vorlesung gehalten im Wintersemester 1965/66 an der Universität Tübingen. Tübingen: Narr. Goossens, J. (1973). Niederdeutsch. Sprache und Literatur. Eine Einführung. Neumünster: Karl Wachholtz. Grimm, J. (1822). Deutsche Grammatik. 2. Aufl. Bd. 1. Göttingen: Dieterichsche Buchhandlung. Google Books: MnsKAAAAIAAJ. Jakobson, R. (1976 [1978]). Six lectures on sound and meaning. A. d. Französischen übers. von J. Mepham. Mit einer Einl. von C. Lévi-Strauss. Cambridge und London: MIT Press. Marchal, J. H. (1975). “On the concept of a system”. English. In: Philosophy of Science 42.4, 448–468. JSTOR: 187223. Oesterreicher, W. (2001). “Historizität, Sprachvariation, Sprachverschiedenheit, Sprachwandel”. In: Language typology and language universals. An international handbook. Hrsg. von M. Haspelmath. Berlin und New York: Walter de Gruyter, 1554–1595. Osthoff, H. und K. Brugmann (1878). Morphologische Untersuchungen auf dem Gebiete der indogermanischen Sprachen. Bd. 1. Leipzig: Hirzel. Rask, R. K. (1818). Undersögelse om det gamle Nordiske eller Islandske sprogs oprindelse [Investigation of the origin of the Old Norse or Icelandic language]. Copenhagen: Gyldendalske Boghandlings Forlag. GoogleBooks: cWgJAAAAQAAJ; Englische Übersetzung: – (1993). Investigation of the origin of the Old Norse or Icelandic language. Übers. von N. Ege. Travaux du Cercle Linguistique de Copenhague 26. Copenhagen: The Linguistic Circle of Copenhagen. Saussure, F. de (1916). Cours de linguistique générale. Hrsg. von C. Bally. Lausanne: Payot; Deutsche Übersetzung: – (1967). Grundfragen der allgemeinen Sprachwissenschaft. A. d. Französischen übers. von H. Lommel. 2. Aufl. Berlin: Walter de Gruyter & Co. 8 11 1 Einführung Johann-Mattis List Historische Aspekte 2012-11-30 Historische Aspekte der historischen Sprachwissenschaft 1 Allgemeine Punkte vorweg Sprachvergleich Wenn man sich mit den historischen Aspekten der historischen Sprachwissenschaft befasst, so stellt sich zu allererst die Frage, was man eigentlich unter historischer Sprachwissenschaft versteht. Fasst man den Rahmen sehr eng, so beginnt die Geschichte der historischen Sprachwissenschaft eigentlich erst ab dem 19. Jahrhundert, parallel mit der Entwicklung der Evolutionstheorie und der Erforschung der Geschichte der Erde in der Geologie, denn davor wurden Sprachen nicht aus einem explizit historischen Blickwinkel betrachtet. Fasst man den Rahmen weiter, so kann man die Frage nach den Wurzeln des historischen Denkens in Bezug auf Sprachen stellen, und erforschen, wie Sprachen im Laufe der Geschichte verglichen wurden, wann genau die „moderne” historische Sprachwissenschaft begann, und worin die entscheidenden Unterschiede zur „vormodernen” Sprachforschung liegen. In der Sprachtypologie werden Sprachen generell nicht-historisch betrachtet. Weshalb lässt sich die historische Sprachbetrachtung dennoch auch in der synchronen Typologie nicht gänzlich ignorieren? Periodisierung Eine gängige grobe Periodisierung der Geschichte der historischen Sprachwissenschaft teilt diese in drei Phasen ein: (a) Antike und Mittelalter, (b) die Zeit vom 16. bis zum 18. Jahrhundert, und (c) den Beginn der historischen Linguistik im 19. Jahrhundert. Was mag der Grund sein, dass gerade die Zeit vom 16. bis zum 18. Jahrhundert als eine gesonderte Phase angesetzt wird? Am 26. Juli 1581 schlug ein Meteorit in Thüringen ein (Wikipedia: ,,1581"). Welche weiteren ,,makrohistorischen" Ereignisse fallen in diese Zeit? 2 Antike und Mittelalter Kein Bock auf Fremdsprachen Die Antike, vor allem das alte Griechenland, zeichnet sich durch ein nahezu vollständiges Desinteresse an fremden Sprachen und Sprachvergleich aus (Pedersen 1983: 10, Robins 1973: 5). Etymologische Betrachtungen wurden zuweilen angestellt, waren jedoch meist mit der Absicht verbunden, die „wahre” Bedeutung der Wörter zu finden (Diderichsen 1974: 278-280), und nicht mit einem Interesse an der Bedeutungsentwicklung sprachlicher Zeichen an sich. Woran mag es liegen, dass die so geistverliebten Griechen und Römer kein Interesse zeigten, sich mit dem Vergleich von Sprachen zu befassen? 1 12 Johann-Mattis List Historische Aspekte 2012-11-30 Die physei-thesei-Debatte Grundlage der physei-thesei-Debatte, die ausführlich in Platons Krátylos beschrieben wird, ist die Frage nach der Beziehung von Zeichenform und Zeichenbedeutung. Der grundsätzliche Streitpunkt der physei-thesei-Debatte ist dabei, ob die Struktur der Sprache durch die Natur (altgr. φύσει physei) oder durch die Konvention (altgr. θέσει, thesei) bestimmt sei. Die Beantwortung dieser Frage hat unmittelbare Folgen für die Etymologie: Wenn die Beziehung zwischen Bezeichnendem und Bezeichnetem natürlich ist, so stellt die ursprüngliche Bedeutung der Wörter deren „wahre” Bedeutung dar. Die Etymologie könnte also also den wahren Kern eines Wortes enthüllen. Wenn die Beziehung nicht natürlich ist, so sollte sie schleunigst aus allen Diskussionen verbannt werden, in denen die „wahre Bedeutung” als Argument für eine bestimmte Überzeugung angeführt wird. Es heißt oft, die physei-thesei-Debatte wurde in gewisser Weise von Ferdinand de Saussure (1857 -- 1913) wieder aufgegriffen, als er sein berühmtest Postulat von der `Arbitrarität des sprachlichen Zeichens' machte, und der Debatte zugunsten der `Konvention' ein Ende bereitete. Unten sind zwei Zitate, eins von Saussure selbst, und eins von Roman Jakobson (1896 -- 1982) abgedruckt. Bestätigen diese Zitate die Behauptung, dass Saussure sich ausnahmslos auf die Seite der `Konventionalisten' geschlagen habe? Das Wort beliebig erfordert hierbei eine Bemerkung. Es soll nicht die Vorstellung erwecken, als ob die Bezeichnung von der freien Wahl der sprechenden Person abhinge [...]; es soll besagen, daß es unmotiviert ist, d.h. beliebig im Verhältnis zum Bezeichneten, mit welchem es in Wirklichkeit keinerlei natürliche Zugehörigkeit hat. (Saussure 1916: 80) Der Zusammenhang zwischen einem signans und einem signatum, den Saussure willkürlicherweise arbiträr nennt, ist in Wirklichkeit eine ge- wohnheitsmäßige, erlernte Kontiguität, die für alle Mitglieder der gegebenen Sprachgemeinschaft obligat ist. Aber neben dieser Kontiguität behauptet sich auch das Ähnlichkeitsprinzip, la ressemblance. [Dieses] Prinzip [spielt] eine gewaltige Rolle in der Frage der Derivation, in der Frage der Wortsippen, wo die Ähnlichkeit der Wörter einer gemeinsamen Wurzen so entscheidend ist, und wo man schon gang und gar nicht mehr vom Willkürlichen sprechen darf. (Jakobson 1962[1971]: 272f) Das hebräische Paradigma Die Verbreitung des Christentums führte zur Literalisierung vieler bis dahin nicht verschriftlichter Sprachen und weckte damit auch allmählich das Interesse der Europäer an diesen Sprachen (Pedersen 1972: 4). Die Verbreitung des Christentums führte gleichzeitig dazu, dass das Hebräische entsprechend der biblischen Geschichte von Turmbau zu Babel als die älteste Sprache, oder „Mutter aller Sprachen”angesehen wurde (Arens 1955: 72-80, Klein 1999, Klein 2004). Unten ist ein Zitat aus Isidors Etymologiae sive origines wiedergegeben, dass als frühes Beispiel für das ,hebräische Paradigma' dienen kann. Inwiefern mag Isidors Argumentation typisch sein für die damalige Zeit? „Die lateinischen und griechischen Buchstaben sind offensichtlich aus den Griechischen entstanden. Dort nämlich steht das Aleph an erster Stelle. Aus diesem wurde 2 13 1 Einführung Johann-Mattis List Historische Aspekte 2012-11-30 dann aufgrund ähnlicher Aussprache von den Griechen das Alpha abgeleitet, und daraufhin von den Lateinern das A. Der Übersetzer hat nämlich aufgrund des ähnlichen Klangs der anderen Sprache die Buchstaben erschaffen, woraus ersichtlich wird, dass die hebräische Sprache die Mutter aller Sprachen und Schriften ist.” (Etymologiae: 1.3.4) 1 Sprachbeziehungen Während vor dem Beginn der historischen Linguistik eine genealogische Perspektive auf Sprachbeziehungen nur sporadisch angenommen wurde, waren sich die Gelehrten recht früh der Tatsache bewusst, dass Sprachen einander auf weit andere Art beeinflussen können. Dies ist sicherlich der Tatsache geschuldet, dass die Folgen von Sprachkontakt sehr viel einfacher zu erkennen sind als die Folgen von Sprachverwandtschaft, nicht nur für diejenigen, die sich besonders für Sprachen interessieren, sondern auch für die „normalen” Sprecher, die in Kontakt mit Sprechern anderer Sprachen sind. Ähnlichkeiten zwischen Sprachen als Folge von Sprachkontakt und nicht als Folge von genetischer Sprachverwandtschaft anzusehen, war eine Perspektive, die von der Mehrheit der Gelehrten in der Antike bis hinein ins Mittelalter eingenommen wurde (Allen 1953: 57). Sprachbeziehungen wurden also weitestgehend als derivationell angesehen. Was mag der Grund sein, dass derivationelle Sprachbeziehungen problemlos von Gelehrten erkannt und anerkannt wurden, während man genealogische Beziehungen meist ignorierte? Inwiefern können die beiden unten wiedergegebenen Zitate in diesem Zusammenhang als ,typisch' für antikes Denken bezeichnet werden? Ich denke nämlich, daß die Hellenen, zumal die in der Nähe der Barbaren wohnenden, gar viele Worte von den Barbaren angenommen haben. [...] Wenn nun einer aus der hellenischen Sprache erklären will, inwiefern diese mögen richtig gebildet sein, und nicht aus jener, der das Wort wirklich angehört, so siehst du wohl, daß er nichts schaffen wird. (Krátylos: 409d-e) In continuation, that I may follow the course which I prescribed to myself, let me repeat that words are either Latin or foreign. Foreign words, like men, and like many of our institutions, have come to us, I might almost say, from all nations. [...] But this division of mine is intended to refer chiefly to the Greek language, for it is from thence that the Roman language is, in a very great degree, derived, and we use even pure Greek words where our own fail, as they also sometimes borrow from us. (Institutio oratoria: I.5.55-58) 3 Vom 16. bis zum 18. Jahrhundert Sprachvergleich Ab dem 16. Jahrhundert wurden erste Grammatiken semitischer Sprachen in Europa veröffentlicht. Hebräisch wurde dadurch neben Latein und Griechisch zur dritten Gelehrtensprache. Beflügelt durch das durch die Erfindung der Druckkunst rasch anwachsende grammatische und lexikalische Sprachmaterial (Pedersen 1972: 6), versuchten viele Forscher nun 1 Meine Übersetzung, Originaltext: „Litterae Latinae et Graecae ab Hebraeis videntur exortae. Apud illos enim prius dictum est aleph, deinde ex simili enuntiatione apud Graecos tractum est alpha, inde apud Latinos A. Translator enim ex simili sono alterius linguae litteram condidit, ut nosse possimus linguam Hebraicam omnium linguarum et litterarum esse matrem.” 3 14 Johann-Mattis List Historische Aspekte 2012-11-30 auch, den etymologischen Nachweis für das Alter des Hebräischen und die Abstammung aller Sprachen von diesem zu erbringen. Begriffe aus der hebräischen Grammatik beeinflussten auch die Sprachforschung. So scheint auch das Konzept der „Wurzel”, dem als Vergleichsgegenstand in der historischvergleichenden Sprachwissenschaft nach wie vor zentrale Bedeutung zukommt, auf die Erforschung der semitischen Sprachen und der traditionellen semitischen Grammatiken zurückzugehen (Campbell und Poser 2008: 95). Die Art und Weise, wie der Nachweis der Verwandtschaft des Hebräischen mit allen anderen erbracht wurde, war allerdings – aufgrund der Tatsache, dass er ja durch die biblische Geschichte ohnehin schon „bewiesen”war – noch sehr weit von dem entfernt, was man heutzutage wissenschaftlich nennen würde. Einzelne Wörter wurden aus Wortlisten herausgepickt und verglichen, wobei meist schon eine geringe Ähnlichkeit Vokalen und Konsonanten ausreichte, um die These der Sprachenharmonie als bestätigt anzusehen. Unten sind einige beispielhafte Zitate zu Wortvergleichen, sowie Wortvergleiche selbst in Tabellen wiedergegeben. In der vorherigen Sitzung wurden kurz Beispiele für ,richtige' Wortvergleiche gegeben. Worin besteht der grundlegende Unterschied? Hebräisch ʔēm māḥār Deutsch Am Morn Bedeutung „Mutter” [E]inige hebräische Wörter sind (auch) in unserer deutschen Sprache verblieben. (Münster 1523: 27f) 2 Was die Ableitung der Wörter durch Addition, Subtraktion, Transposition und Inversion der Buchstaben anlangt, so steht fest, dass man so verfahren kann und muss, wenn wir bedenken, dass die Hebräer von rechts nach links schreiben und die Griechen und die übrigen von links nach rechts. (Guichard 1606, zitiert nach Arens 1955: 76) Webb-Chinesisch keûen niu gin yuen xue Mittelchinesisch kʰwen² ɳjo²-ȵin ŋjon³-ɣæwk Griechisch kūōn gunē fa-iēn Bedeutung „Hund” „Frau” „wollen (lernen, sprechen)” But was not γυνη compounded of niu gin under the customary licence of transposition? (Webb 1787: 50) Die Skythenhypothese Im Zuge der etymologischen Forschungen unter dem hebräischen Paradigma stießen verschiedene Forscher zwangsläufig auch auf “tatsächliche” Ähnlichkeiten zwischen den europäischen Sprachen. Es war in bewisser Weise also nur eine Frage der Zeit, bis die Forscher bemerken sollten, dass auch ohne abstruse Vergleiche auffällige Ähnlichkeiten zwischen verschiedenen Sprachen entdeckt werden konnten, die weit zwingender waren, als die Vergleiche mit dem Hebräischen. Die Skythenhypothese (vgl. insbes. Metcalf 1974: 234-240, Muller 1986: 9-12, Campbell und Poser 2008: 18-23), die in diesem Zusammenhang besondere Beachtung verdient, kann dabei als Vorläufer der “IndogermanenHypothese” angesehen werden. 2 Meine Übersetzung, Originaltext: „[...] aliquot Hebraeas voces in nostram Germanicam receptas esse linguam.” 4 15 1 Einführung Johann-Mattis List Historische Aspekte 2012-11-30 Im unten wiedergegebenen Zitat wird der Skythenhypothese ein ,abstrakter' Charakter zugewiesen. Lässt sich der Grund für diese Argumentation aus dem Zitat selbst erschließen? Wenn ja, worin besteht er? Wenn nein, worin könnte er bestehen? Since the early 17th century there had been formulated, first in the Netherlands, a theory of the common origin of the main languages of Europe from the somewhat mythical language of the Scythians. This principle of a linguistic unity of the European languages, classical and modern, reaching far into the East, soon gained the abstract character of a prototype.(Muller 1986: 10) 4 Der Beginn der historischen Linguistik Lautkorrespondenzen Lautkorrespondenzen zwischen miteinander verwandten Sprachen wurden bereits vor dem 19. Jahrhundert für eine Reihe von Sprachen entdeckt. Ihre Bedeutung für den Nachweis von Sprachverwandtschaft erlangten sie jedoch erst durch die Werke von Jacob Grimm (1785 – 1863, vgl. Grimm (1822)), und Rasmus Rask (1787 – 1832, vgl. Rask 1818) zu Beginn des 19. Jahrhunderts. Mit den Lautkorrespondenzen ist gleichzeitig ein Übergang von einer auf oberflächlichen Ähnlichkeiten beruhenden „phänotypischen” Betrachtungsweise hin zu einer „genotypischen” Betrachtungsweise von Kognaten verbunden (vgl. Lass 1997: 130). Dies heißt, dass Ähnlichkeit nicht mehr als Kriterium für das Auffinden von kognaten Wörtern in miteinander verwandthen Sprachen verwendet wird, sondern Regelmäßgkeit der Korrespondenz. Das unten wiedergegebene Zitat zur Wichtigkeit der Regelmäßigkeit der Lautkorrespondenzen ist in seiner Radikalität typisch, auch für heutige historische Linguistik. Worin besteht die Radikalität, und warum wird sie von vielen historischen Linguisten befürwortet? Das bedeutet, dass bei Vergleichen der Form und bedingt der Vorzug gegeben werden muss. Wenn zwei Formen sich genau - oder den Regeln nach - entsprechen, wiegt das auch gewisse Abweichungen in der Bedeutung auf. Szemerényi 1970: 15f Bäume und Sterne Nach Jacob Grimm und Rasmus Rask war August Schleicher (1821 – 1868) eine der einflussreichsten Persönlichkeiten der Linguistik des 19. Jahrhunderts. Er prägte durch seine Arbeiten wie kein anderer den wissenschaftlichen Stil der Forschung in der historischen Sprachwissenschaft. Schleicher entwickelte das Verfahren der linguistischen Rekonstruktion, indem er Protoformen an die Stelle von Lautkorrespondenzen setzte und damit die „Grundlosigkeit der noch immer nicht ganz verschollenen Annahme, daß auch die nicht indischen indogermanischen indogermanischen Sprachen vom altindischen (Sanskrit) abstammen” (Schleicher 1861[1866]: 8) untermauerte. Schleicher etablierte die neue Fassung der Verwandtschaftsmetapher, die ihren Ausdruck in dem berühmten Stammbaummodell fand, welches er erstmals im Jahr 1853 publizierte (Schleicher 1853a, Schleicher 1853b). 5 16 Johann-Mattis List Historische Aspekte 2012-11-30 Für Schleichers Ansichten finden sich oben viele Zitate. Welche Überschrift könnte man jedem von diesen am besten geben, und wie könnte man Schleichers Auffassung von "Vererbung", "Wandel" und "Ursprung" charakterisieren? Der Verfall ist wirklich ein allmählicher wie die geschichtliche Entwicklung, er ist in Perioden theilbar, wie diese, je nach dem grösseren oder geringeren Grade der Entfernung vom Ursprünglichen und er verläuft bei allen Sprachen in analoger Weise, wie die Geschichte. Aus letzterem Satze folgt die Möglichkeit und der Vortheil einer vergleichenden Behandlung der Sprachengeschichte. (Schleicher 1848: 25) Dennoch würde es eben so falsch sein das Lettische eine slawische Sprache zu nennen, als das Ossetische mit den Mingrelischen, Suarischen, u.s.w. zu einer Klasse zu rechnen. Dass dergleichen Färbungen von einer zur anderen Sprache sich verpflanzen können, scheint daher durch die Erfahrung gerechtfertigt und ist auf diese Erscheinung bei der Eintheilung der Sprachen gebührende Rücksicht zu nehmen. (ebd.: 30) Das Wichtigste und Entscheidende aber ist, dass das Ossetische die das Iranische charakterisierenden, es von den andern indogermanischen Familien unterscheidenden Lautgesetze aufzuweisen hat. (ebd.: 67) Von Sprachsippen, die uns genau bekannt sind, stellen wir eben so Stammbäume auf, wie diess Darwin (S. 121) für die Arten von Pflanzen und Thieren versucht. (Schleicher 1863: 14) Abbildung 1: Sprachstammbäume in Schleicher (1853a und 1853b) Literatur Allen, W. S. (1953). “Relationship in comparative linguistics”. In: Transactions of the Phylological Society, 52–108. Arens, H. (1955). Sprachwissenschaft. Der Gang ihrer Entwicklung von der Antike bis zur Gegenwart. Freiburg: Alber. 6 17 1 Einführung Johann-Mattis List Historische Aspekte 2012-11-30 Campbell, L. und W. J. Poser (2008). Language classification: History and method. Cambridge: Cambridge University Press. Diderichsen, P. (1974). “The foundation of comparative linguistics: Revolution or Continuation?” In: Studies in the history of linguistics: Traditions and paradigms. Hrsg. von D. H. Hymes. Indiana University studies in the history and theory of linguistics. Bloomington: Indiana University Press, 277306. Grimm, J. (1822). Deutsche Grammatik. 2. Aufl. Bd. 1. Göttingen: Dieterichsche Buchhandlung. Google Books: MnsKAAAAIAAJ. Guichard, E. (1606). L’Harmonie etymologique des Langues: HebraiÌ�que, ChaldaiÌ�que, Syrique, Greque, Harmonie étymologique des langues hébrai’que, chaldai’que, syriaque, grecque, latine, francoise, italienne, espagnole, allemande, flamande, angloise, où se démontre que toutes les langues sont descendues de l’hébraïque. Paris: Le Noir. Jakobson, R. (1962 [1971]). Zeichen und System der Sprache. Diskussionsbeitrag. In: Selected writings. Bd. 2: Word and language. Berlin: Mouton, 272–279. Klein, W. P. (1999). “Die ursprüngliche Einheit der Sprachen in der philologisch-grammatischen Sicht der frühen Neuzeit”. In: The Language of Adam. Proceedings of a conference held at the Herzog August Bibliothek (Wolfenbüttel, 30.–31. Mai 1995). Hrsg. von A. P. Coudert. Wolfenbütteler Forschungen 84. Wiesbaden: Harrassowitz, 25–56. – (2004). “Was wurde aus den Wörtern der hebräischen Ursprache? Zur Entstehung der komparativen Linguistik aus dem Geist etymologischer Spekulation”. In: Gottes Sprache in der philologischen Werkstatt. Hebraistik vom 15. bis zum 19. Jahrhundert. Tagungsbericht der Tagung “Die Geburt der Philologie aus dem Geist der Hebraistik” (Wittenberg, 6.–6. Okt. 2002). Hrsg. von G. Veltri und G. Necker. Studies in European Judaism 11. Leiden: Brill, 3–23. Lass, R. (1997). Historical linguistics and language change. Cambridge: Cambridge University Press. Metcalf, G. J. (1974). “The Indo-European hypothesis in the sixteenth and seventeenth centuries”. In: Studies in the history of linguistics: Traditions and paradigms. Hrsg. von D. H. Hymes. Indiana University studies in the history and theory of linguistics. Bloomington: Indiana University Press, 233–257. Muller, J.-C. (1986). “Early stages of language comparison from Sassetti to Sir William Jones (1786)”. In: Kratylos 31, 1–31. Münster, S. (1523). Dictionarium Hebraicum, nunc primum editum et typis excusum, adiectis Chaldaicis vocabulis non parum multis. Latin. apud Frobenium. Gallica: ark:/12148/ bpt6k929970. Pedersen, H. (1972). The discovery of language. Linguistic science in the nineteenth century. 5. print. Bd. 40. Indiana University studies in the history and theory of linguistics. Bloomington: Indiana University Press. – (1983). A Glance at the History of Linguistics, with Particular Regard to the Historical Study of Phonology. John Benjamins. Englische Übersetzung: Rask, R. K. (1993). Investigation of the origin of the Old Norse or Icelandic language. Übers. von N. Ege. Travaux du Cercle Linguistique de Copenhague 26. Copenhagen: The Linguistic Circle of Copenhagen. Robins, R. H. (1973). “The history of language classification”. In: Diachronic, areal and typological linguistics. Hrsg. von H. M. Hoenigswald und R. H. Langacre. Current Trends in Linguistics 11. The Hague und Paris: Mouton, 3–41. Saussure, F. de (1916). Cours de linguistique générale. Hrsg. von C. Bally. Lausanne: Payot; Deutsche Übersetzung: – (1967). Grundfragen der allgemeinen Sprachwissen- 7 18 Johann-Mattis List Historische Aspekte 2012-11-30 schaft. A. d. Französischen übers. von H. Lommel. 2. Aufl. Berlin: Walter de Gruyter & Co. Schleicher, A. (1848). Zur vergleichenden Sprachengeschichte. Bonn: König. – (1853a). “Die ersten Spaltungen des indogermanischen Urvolkes”. In: Allgemeine Monatsschrift für Wissenschaft und Literatur, 786–787. – (1853b). “O jazyku litevském, zvlástě na slovanský. Čteno v posezení sekcí filologické král. České Společnosti Nauk dne 6. června 1853.” In: Časopis Čsekého Museum 27, 320–334. – (1863). Die Darwinsche Theorie und die Sprachwissenschaft. Offenes Sendschreiben an Herrn Dr. Ernst Haeckel. Weimar: Hermann Böhlau. ZVDD: urn:nbn:de:bvb:12bsb10588615-5. – (1861 [1866]). Compendium der vergleichenden Grammatik der indogermanischen Sprache. I: Kurzer Abriss einer Lautlehre der indogermanischen Ursprache, des Altindischen (Sanskrit), Alteranischen (Altbaktrischen), Altgriechischen, Altitalischen (Lateinischen, Umbrischen, Oskischen), Altkeltischen (Altirischen), Altslawischen (Altbulgarischen), Litauischen und Altdeutschen (Gotischen). 2. Aufl. Weimar: Böhlau. Szemerényi, O. (1970). Einführung in die vergleichende Sprachwissenschaft. Darmstadt: Wissenschaftliche Buchgesellschaft. Webb, D. (1787). Some reasons for thinking, that the Greek language was borrowed from the Chinese. In: Notes on the Grammatica Sinica of Mons. Fourmont. London: Dodsley. Wikipedia. Wikipedia. The Free Encyclopedia. URL: http : / / en . wikipedia . org; Deutsche Ausgabe: Wikipedia. Die freie Enzyklopädie. URL: http://de.wikipedia. org. Quellen Etymologiae Institutio oratoria Krátylos Etymologiae sive origines [Etymologies or origins] (ca. 623 n. Chr.). Von Isidorus Hispalensis (ca. 560–636 n. Chr.); Kritische Edition: W. M. Lindsay, Hrsg. und Komm. (1911). Isidori Hispalensis episcopi etymologiarvm sive originvm libri XX [The twenty books on the origins and etymologies of the bishop IsidorusHispalensis]. Bd. 1: Libri I-XX [Books 1 - 10]. Scriptorum classicorum bibliotheca Oxoniensis. Oxford: Clarendon Press. Institutio oratoria [Institutes of oratory] (ca. 95 n. Chr.). Von Quintilian (35–100); Englische Übersetzung: Quintilian (2006). Institutes of oratory. Hrsg. von L. Honeycutt. Übers. von J. S. Watson. Iowa. URL: http: //honeyl.public.iastate.edu/quintilian/. Krátylos (nach 399 v. Chr.). Von Plátōn (424–348 v. Chr.); Englische Übersetzung: Cratylus (1921). In: Plato in twelve volumes. Bd. 4: Cratylus. Parmenides. Greater Hippias. Lesser Hippias. Aus dem Griechischen übers. von H. N. Fowler. London: William Heinemann Ltd.; Deutsche Übersetzung: Kratylos (2001). In: Platon. Werke in acht Bänden. Griechisch und Deutsch. Bd. 3: Phaidon. Das Gastmahl. Kratylos. Hrsg. von G. Eigler. Bearb. von D. Kurz. Griechischer Text von L. Robin und L. Méridier. Aus dem Griechischen übers. von F. Schleiermacher. Darmstadt: Wissenschaftliche Buchgesellschaft. 8 19 1 Einführung Johann-Mattis List 2012-11-30 Übungen Übungen In der Tabelle unten sind Wörter aus dem Deutschen und dem Niederländischen mit gleicher, bzw. ähnlicher, Bedeutung in allgemeiner Orthographie und in IPA-Transkription wiedergegeben. Versuche, die Wörter in der Tabelle zu alinieren. Sprache Wort Bedeutung IPA Alinierung dt. ndl. Apfel appel ”Apfel” ”Apfel” ap͡fəl ɑpəl dt ndl. Pflug ploeg ”Pflug” ”Pflug” dt ndl. Zunge tong ”Zunge” ”Zunge” dt ndl. dt ndl. dt ndl. zu toe tun doen Tochter dochter ”zu” ”zu” ”tun” ”tun” ”Tochter” ”Tochter” p͡fluːk pluːx t͡sʊŋə tɔŋ t͡suː tuː tuːn duːn tɔxtər dɔxtər Aus den oben vorgenommenen Alinierungen lassen sich gewisse Lautkorrespondenzen erschließen. Nutze die Erkenntnisse, die aus den Daten in der obigen Tabelle gewonnen werden können, um die korrespondierenden Elemente in der Tabelle unten zu ergänzen. Wenn man nun annimmt, dass jeweils eine der Formen ,ursprünglicher' ist als die anderen, sich also im Verlaufe der Geschichte weniger verändert hat, welche ist dies wohl? Trage diese Form in der Spalte ,Rekonstrukt' ein. dt. p͡f t͡s ndl. <=> <=> <=> <=> Rekonstrukt uː d Nutze das aus der Alinierung der Wörter und der Erschließung der Lautgesetze gewonnene Wissen, um die fehlenden Wörter in der Tabelle zu ergänzen. Dt. <ei> entspricht dabei ndl. <ij> [ɛɪ]. Dt. IPA Kampf Pfeife kamp͡f p͡faɪfə Ndl. IPA tal pal tɑl pɑl 1 20 2 Wandel und Relationen In diesem Block werden Grundlagen zum Wandel von Zeichensystemen und daraus resultierende Relationen zwischen Zeichensystemen besprochen. 21 2 Wandel und Relationen Johann-Mattis List Zeichenwandel 11.01.2013 Zeichenwandel 1 Sprachwandel Reim dich oder ich fress dich... Dass Sprachen sich im Laufe ihrer Geschichte verändern können, war keine notwendige Entdeckung, welche die Gelehrten im Laufe der Geschichte machen mussten. Dies gilt insbesondere für die sich weniger offensichtlich verändernden Bereiche der Sprache, wie bspw. die Laute. Die folgende Tabelle gibt ein Beispiel für die Folgen des Lautwandels: Das chinesische Gedicht, entnommen aus dem Buch der Oden (ca. 1050–600 v. Chr., Shījīng: 28.3) und wiedergegeben in moderner Pīnyīn-Transliteration mitsamt einer Übersetzung von Bernhard Karlgren 1950, reimt nicht durchgängig in allen Reimwörtern, die grau unterlegt sind. 燕 yān 之 zhī 瞻 zhān 燕 yān 子 zǐ 望 wàng 于 yú 于 yú 弗 fú 飛, fēi 歸, guī, 及, jí, 下 xià 遠 yuǎn 實 shí 上 shàng 送 sòng 勞 láo 其 qí 于 yú 我 wǒ 音。 yīn 南。 nán 心。 xīn The swallows go flying, falling and rising are their voices; This young lady goes to her new home, far I accompany her to the south. I gaze after her, can no longer see her, truly it grieves my heart. Angesichts der Tatsache, dass zwischen der ursprünglichen Fassung des Gedichts und der jetzigen Form über 2000 Jahre vergangen sind, ist dies nicht verwunderlich. Für chinesische Gelehrte war es jedoch lange Zeit nicht die offensichtlichste Erklärung, warum die alten Gedichte zuweilen komische Reime aufwiesen. So wurden die komischen Reime zunächst alternativ erklärt als Folge von a) laxen Reimkonventionen der Vorfahren (Baxter 1992: 153-157), oder b) von sogenannten „Lautharmonisierungen” (xiéyīn 叶 音), welche die Vorfahren aus ästhetischen Gründen vorgenommen hätten (ebd.). Ohne irgendeine Vorstellung von Sprachwandel zu haben, begannen die chinesischen Gelehrten die verschiedenen „komischen” Reime zu systematisieren. Das Ergebnis waren erste Rekonstruktionen eines – wenn auch nicht als solchen erkannten – abstrakten Systems der Reime des Altchinesischen. Erst der chinesische Gelehrte Chén Dì (1541 – 1606) stellte die Hypothese auf, dass die komischen Reime tatsächlich eine Folge von Sprachwandel seien: The writings of scholars must be made of adequate sounds. Even in the rural areas everybody orders the sounds harmonically. Can it be that the ancients solely did not have rhymes? One can say that in the same way in which ancient times differ from modern times, and places in the North differ from places in the South, characters change and sounds shift. This is a natural tendency. Therefore, it is inevitable that reading the ancient writings with modern pronunciation will sound improper and wrong. (Máoshī Gǔyīnkǎo: 原序)1 In China entdeckte man den Sprachwandel recht spät, wie sah es im Westen aus? 1 Meine Übersetzung, Original: 故士人篇章,必有音節,田野俚典,亦名諧聲,豈以古人之詩而獨無韻乎?蓋 時有古今, 地有南北,字有更革,音有轉移,亦埶所必至。故以今之音讀古之作,不免乖剌而不入。 1 22 Johann-Mattis List Zeichenwandel 11.01.2013 Wandel und Regelmäßigkeit Während den Menschen im Verlaufe der Geschichte bereits relativ lange bewusst war, dass Sprachen sich ändern können, war es eine radikal neue Erkenntnis, die sich zu Beginn des 19. Jahrhunderts herauskristallisierte, dass Sprachen sich in Prozessen ändern, von denen bestimmte sogar regelmäßig verlaufen können. Mit der Entdeckung der Regelmäßigkeit einher festigte sich ebenfalls die Erkenntnis, dass Sprachen miteinander verwandt sein können, wobei Verwandtschaft von Sprachen dadurch definiert ist, dass miteinander verwandte Sprachen aus einer gemeinsamen Vorgängersprache entstanden sind, wie bspw. das Englische und das Deutsche, die beide aus dem Protogermanischen hervorgegangen sind. Warum ist die "Entdeckung der Regelmäßigkeit" so wichtig für das Postulieren von Verwandtschaftsbeziehungen zwischen Sprachen (oder ist sie das überhaupt?)? 2 Lautwandel Wandel als Gesetz Rufen wir uns zunächst noch mal in Erinnerung, was die These der Junggrammatiker in Bezug auf den Lautwandel war: Aller lautwandel, soweit er mechanisch vor sich geht, vollzieht sich nach ausnahmslosen gesetzen, d.h. die richtung der lautbewegung ist bei allen angehörigen einer sprachgenossenschaft, ausser dem Fall, dass dialektspaltung eintritt, stets dieselbe, und alle wörter, in denen der der lautbewegung unterworfene laut unter gleichen verhältnissen erscheint, werden ohne ausnahme von der änderung ergriffen. (Osthoff und Brugmann 1878: XIII) Wang (1969) trifft, wie zwischen verschiedenen dieses Zitat aus, die bestimmen? Begründe Text. wir inzwischen wissen, die Unterscheidung Perspektiven auf den Lautwandel. Reicht junggrammatische Position eindeutig zu Deine Meinung mit Rückgriff auf den Von Wörtern und Geschichten Nicht alle Linguisten waren der Meinung der Junggrammatiker. Besonders Dialektologen folgten dem berühmten Slogan „chaque mot a son histoire” („jedes Wort hat seine Geschichte”), der gewöhnlich Jules Gilliéron (1854 – 1926) zugeschrieben wird (Campbell 1998: 189). Die Bedenken der Dialektologen standen jedoch strengenommen nicht direkt im Widerspruch zur junggrammatischen Doktrin, schließlich besagte die junggrammatische Theorie ja nicht, dass sich zwangsläufig alle Wörter einer Sprache regelmäßig änderten, sondern lediglich, dass idiosynkratischer Wandel „could be accounted for [...] by certain less obvious mechanisms of borrowing and analogy” (Kiparsky 1988: 368). Dennoch begann die linguistische Gemeinschaft sich zu spalten, während die Diskussion selbst in eine Sackgasse geraten war, da keines der beiden Lager vollkommen überzeugende Argument für sich in Anspruch nehmen konnte. Was meint Herr Kiparsky in diesem Zusammenhang mit "Analogie"? 2 23 2 Wandel und Relationen Johann-Mattis List Zeichenwandel 11.01.2013 Von der Diffusion Die Situation änderte sich erst in den 60er Jahren des 20. Jahrhunderts, als neue Forschungen – die vorwiegend im Bereich der chinesischen Dialekte stattfanden – zur Beschreibung eines neuen Wandelmechanismus führten, der gewissermaßen das Gegenteil der junggrammatischen Hypothese darstellte. Diese nämlich hattne angenommen, dass Lautwandel lexikalisch abrupt und phonetisch graduell verläuft: Regarding the lexicon [they assumed] that a change always affects the whole lexicon, and can therefore be seen as an abrupt change. Regarding the sounds [they assumed] that the change proceeded step by step, and can therefore be seen as a gradual change. (Wang 2006: 109) 2 Die Ergebnisse der chinesischen Dialektologen jedoch legten den Schluss nahe, dass ein bestimmter Mechanismus des Lautwandels, der später lexikalische Diffusion genannt wurde, genau umgekehrt verläuft, nämlich lexikalisch graduell und phonetisch abrupt: Phonological change may be implemented in a manner that is phonetically abrupt but lexically gradual. As the change diffuses across the lexicon, it may not reach all the morphemes to which it is applicable. If there is another change competing for part of the lexicon, residue may result. (Wang 1969: 9) Die folgende Tabelle gibt ein Beispiel für die Phänomene der lexikalischen Diffusion. Die Tabelle listen Zeichenpaare mit identischer mittelchinesischer Lesung (ca. 600 n. Chr.), die mit ihren modernen Reflexen im Shuangfeng Dialekt, der zur Gruppe der Min-Dialekte gehört, kontrastiert worden sind. Character 步 捕 刨 跑 盜 導 Pīnyīn bù bǔ páo páo dào dǎo Meaning „to walk” „to grasp” „to dig” „to scrape” „to rob” „to lead” Middle Chinese bo³ bo³ bæw¹ bæw¹ daw³ daw³ Shuāngfēng bu³³ pʰu²¹ bə³³ pʰə²¹ də³³ tʰə³⁵ Warum sind die mittelchinesischen Zeichenlesungen mit ihren Reflexen im Shuangfeng-Dialekt ein Beispiel für lexikalische Diffusion? Wie könnten die Beispiele alternativ erklärt werden? In Dubio pro Diffusione Als Einzelfall sind Beispiele wie die in der Tabelle oben nur Beispiele für wie auch immer motivierten „irregulären” Lautwandel, die leicht mit Hilfe externer Faktoren erklärt werden können. Dies scheint im Shangfeng-Dialekt jedoch nicht der Fall zu sein, wie eine umfangreiche Studie Chen (1972) der 616 Zeichen, deren Lesung im Mittelchinesischen einen stimmhaften Initial aufwies, zeigt: Zwar zeigen sich viele Beispiele für die Prozesse der Anlautverhärtung (devoicing) und Aspiration der stimmhaften Initiale, jedoch gibt es ebenfalls viele Fälle, in denen die stimmhaften Initiale bewahrt wurden. Dies spricht eher für eine Tendenz hin zur Anlautverhärtung und Aspiration im Shuangfeng-Dialekt, denn für 2 Meine Übersetzung, Original: „作為詞彙,要變就都變,因而是一種突變。作為語音,變化是逐漸的,因而 是一種漸變”. 3 24 Johann-Mattis List Zeichenwandel 11.01.2013 ein ausnahmsloses Gesetz. Eine derartige Tendenz kann recht gut erklärt werden, wenn man annimmt, dass Lautwandeln nicht notwendigerweise das ganze Lexikon simultan erfasst, sondern in unterschiedlichen Geschwindigkeiten von Wort zu Wort „springt”: When a phonological innovation enters a language it begins as a minor rule, affecting a small number of words [...]. As the phonological innovation gradually spreads across the lexicon, however, there comes a point when the minor rule gathers momentum and begins to serve as a basis for extrapolation. At this critical cross-over point, the minor rule becomes a major rule, and we would expect diffusion to be much more rapid. The change may, however, reach a second point of inflection and eventually taper off before it completes its course, leaving behind a handful of words unaltered. Ist die lexikalische Diffusion eine notwendige Schlussfolgerung aus den Daten? Tertium datur Die lexikalische Diffusion ist dem junggrammatischen Lautwandelkonzept nicht nur in chronologischer Hinsicht entgegengesetzt, sondern greift auch dessen wichtigste Implikation für die linguistische Rekonstruktion an: Lautwandel verläuft der Theorie zufolge nicht ausnahmslos. Während einige Forscher dar- aufhin die junggrammatische „Hypothese” vollständig verwarfen, wies Labov (1981) jedoch nach, dass bestimmte Formen von Lautwandel phonologisch graduell und lexikalisch einheitlich verlaufen, dass also lexikalische Diffusion und „junggrammatisches Lautgesetz” zwei verschiedene Mechanismen von Lautwandel darstellen: There is no basis for contending that lexical diffusion is somehow more fundamental than regular, phonetically motivated sound change. On the contrary, if we were to decide the issue by counting cases, there appear to be far more substantially documented cases of Neogrammarian sound change than of lexical diffusion. (Labov 1994: 471) Warum wohl wurde in diesem Zusammenhang das Wort "Mechanismus" gewählt, um den Geltungsbereich von lexikalischer Diffusion und junggrammatischem Lautwandel abzustecken? Welche "Aspekte des Lautwandels" werden hierbei hervorgehoben? 3 Bedeutungswandel It’s the Meaning, Stupid! Während die Erforschung von Lautwandel sich großer Beliebtheit erfreut, und die Linguistik hier auch große Erfolge vorweisen kann, sieht es um die Erforschung des Bedeutungswandels weit weniger gut aus. Dies hängt sicher vor allem damit zusammen, dass man zwar weiß (und zuweilen sogar beobachten kann), dass Bedeutungen von Wörtern sich ändern, dass die Regelmäßigkeit, mit der sich die Lautgestalt von Wörtern ändert, jedoch keine Entsprechung in der Semantik findet: There is [...] little in semantic change which bears any relationship to regularity in phonological change’ (Fox 1995: 111). Welche Beispiele für semantischen Wandel kennst Du? Welche Regelmäßigkeiten (wie marginal sie auch sein mögen) lassen sich zuweilen antreffen? 4 25 2 Wandel und Relationen Johann-Mattis List Zeichenwandel 11.01.2013 Alternation, Akkumulation, Reduktion Ein Grund für die Unterschiede zwischen Lautwandel und Bedeutungswandel in Bezug auf die Regelmäßigkeit lässt sich in der grundlegend unterschiedlichen Struktur der Formund der Bedeutungsseite des sprachlichen Zeichens finden. Während die Formseite des sprachlichen Zeichens eine sequenzielle Struktur aufweist, und Lautwandel durch die Alternation von Segmenten gekennzeichnet ist, ist die Bedeutungsseite wohl eher als konzeptuelles “Netzwerk” zu beschreiben, und Bedeutungswandel ist nicht durch Alternation gekennzeichnet, sondern durch Akkumulation und Reduktion. German “head” . Kopf k ɔ p͡f Pre-German “head” *kop k ɔ p – “vessel” ProtoGermanic *kuppaz k u pː a z “vessel” In der oben abgebildeten Grafik ist versucht worden, die Unterschiede zwischen Lautwandel und Bedeutungswandel anhand eines Beispiels zu kontrastieren. Wie lässt sich das Beispiel näher erläutern? Welche weiteren Beispiele gibt es für die Prozesse der Reduktion und der Akkumulation? Referenzpotential Im Gegensatz zur Form des sprachlichen Zeichens mangelt es der Zeichenbedeutung and Substanz und Linearität. Es mangelt ihr an Linearität, weil sie nicht sinnlich erfassbar ist, und es mangelt ihr an Linearität, da sie nicht von der Zeit abhängt. Ein weiteres Problem ist, dass – aufgrund der Arbitrarität der Verbindung zwischen Zeichenform und Zeichenbedeutung – „meaning is inherently fuzzy and non-systematic” (Hock und Joseph 1995[2009]: 206). Bis heute gibt es daher leider noch keine semantische Theorie, die von einem breiten Teil der linguistischen Gemeinschaft unterstützt würde. Saussures Zeichenmodell ist indifferent hinsichtlich der Frage, ob ein Zeichen verwendet wird, um auf die „reale Welt” Bezug zu nehmen. Es wird lediglich betont, dass der 5 26 1 Johann-Mattis List Zeichenwandel 11.01.2013 Bedeutungsteil nicht mit dem Objekt, dass er denotiert, verwechselt werden sollte (Saussure 1916: 98). Triadische Zeichenmodelle versuchen, diese Lücke zu schließen, indem die Bedeutung eines Wortes (meaning) von dessen Referenz (reference) unterschieden wird, wobei erstere eine Kategorie und letztere ein mögliches Referenzobjekt determiniert (Löbner 2003: 257). MEANING REFERENT REFERENT FORM REFERENT Da die Referenz eines sprachlichen Zeichens jedoch nur dann eindeutig ist, wenn das Zeichen in einem bestimmten Kontext verwendet wird, ist es sinnvoll eine weitere Unterscheidung zwischen Referenz und Referenzpotential zu machen (Schwarz 1996: 175). Das Referenzpotential eines sprachlichen Zeichens wird dabei verstanden als die Menge aller Möglichen Referenten, die von dem Zeichen denotiert werden können (siehe Grafik oben). Dabei hängt das Referenzpotential eines Zeichens von seiner Bedeutung ab: Je spezifischer diese ist, desto eingeschränkter ist die Anzahl (unterschiedlicher) möglicher Referenten (Löbner 2003: 306). Wenn man bspw. die Wörter Deutsch Stein [ʃtain] und Deutsch Ding [dɪŋ] vergleicht, dann kann man sagen, dass das Referenzpotential von Stein eingeschränkter ist, als das von Ding, da das erste ja nur Steine oder steinartige Objekte denotieren kann, während das andere zur Denotation aller möglichen Arten (meist greifbarer) Objekte verwendet werden kann. Warum ist es so schwer, das Referenzpotential eines sprachlichen Zeichens zu messen? Bedeutungswandel als Wandel von Referenzpotentialen Mit Hilfe der Idee vom Referenzpotential kann man das, was beim semantischen Wandel vor sich geht, zuweilen ein wenig erhellen. Wenn wir nur die am häufigsten auftretenden Referenten der Wörter Englisch cup „Tasse”, Niederländisch kop „Kopf, Tasse” und Deutsch Kopf betrachten, so lässt sich ein bestimmtes Kontinuum bezüglich der häufigsten Referenten der Wörter feststellen. Dieses Kontinuum spiegelt nicht nur frühere Prozesse semantischen Wandels wider, sondern vermag eventuell auch auf zukünftige Prozesse oder generelle Trends zu verweisen. Der Wandel von KOPF zu CHEF, bspw., der wahrscheinlich über eine Zwischenstufe OBERER TEIL vonstatten ging, ist auch im Chinesischen attestiert, wo shǒu 首 [ʂou₂₁₄] „erster, Chef” ursprünglich „Kopf” hieß, wie man an der Orakelknochenversion des Zeichens noch gut erkennen kann: 首. 6 27 2 Wandel und Relationen Johann-Mattis List Zeichenwandel 11.01.2013 Das Konzept des Referenzpotentials mag vielleicht helfen, semantischen Wandel genauer zu beschreiben. Es hilf jedoch zwangsläufig nicht, ihn regelmäßig zu machen. Angenommen, semantischer Wandel wiese tatsächlich regelmäßige Züge auf, wie würden diese sich äußern, d.h. welcher Art wären diese Regelmäßigkeiten wohl? “cup” CONTEST TROPHY [kʌp] CUP (a) Englisch “head, cup” CUP HEAD [kɔp] TOP (b) Niederländisch “head” HEAD TOP [kɔp͡f] CHIEF (c) Deutsch 7 28 Johann-Mattis List Zeichenwandel 11.01.2013 Literatur Baxter, W. H. (1992). A handbook of Old Chinese phonology. Berlin: Mouton de Gruyter. Campbell, L. (1998). Historical linguistics: An introduction. 2. Aufl. Edinburgh: Edinburgh Univ. Press. Chen, M. (1972). “The Time Dimension. Contribution toward a Theory of Sound Change”. In: Foundations of Language 8.4, 457–498. JSTOR: 25000618. Máoshī Gǔyīnkǎo 毛 詩 古 音 攷 [Investigation of the old sounds in Mao’s compilation of the Book of Odes] (1606). Von Chén Dì 陳第 (1541–1617); Kritische Edition: Chén Dì 陳 第 (1606). Máoshī Gǔyīnkǎo 毛 詩 古 音 攷 [Investigation of the old sounds in Mao’s compilation of the Book of Odes]. Sìkù Quánshū 四庫全書 [Complete Library of the Four Treasuries]; Jīngbù 經部; Xiǎoxuélèi 小學類; Míng 明. Internet Archive: 06048676.cn. Fox, A. (1995). Linguistic reconstruction. An introduction to theory and method. Oxford: Oxford University Press. Hock, H. H. und B. D. Joseph (1995 [2009]). Language history, language change and language relationship. An introduction to historical and comparative linguistics. 2. Aufl. Berlin und New York: Mouton de Gruyter. Karlgren, B. (1950). The book of odes. Chinese text, transcription and translation. Stockholm: Museum of Far Eastern Antiquities. Kiparsky, P. (1988). “Phonological change”. In: Linguistics. The Cambridge survey. Bd. 1: Linguistic theory. Foundations. Hrsg. von F. J. Newmeyer. Cambridge u. a.: Cambridge University Press, 363–415. Labov, W. (1981). “Resolving the Neogrammarian Controversy”. In: Language 57.2, 267– 308. JSTOR: 413692. – (1994). Principles of Linguistic Change. Bd. 2: Internal Factors. Blackwell. Löbner, S. (2003). Semantik. Eine Einführung. Berlin: de Gruyter. Osthoff, H. und K. Brugmann (1878). Morphologische Untersuchungen auf dem Gebiete der indogermanischen Sprachen. Bd. 1. Leipzig: Hirzel. Saussure, F. de (1916). Cours de linguistique générale. Hrsg. von C. Bally. Lausanne: Payot; Deutsche Übersetzung: – (1967). Grundfragen der allgemeinen Sprachwissenschaft. A. d. Französischen übers. von H. Lommel. 2. Aufl. Berlin: Walter de Gruyter & Co. Schwarz, M. (1996). Einführung in die kognitive Linguistik. Basel und Tübingen: Francke. Shījīng 詩經 [The book of odes] (ca. 1050 BC); Kritische Edition: Máoshī (1922). Máoshī 毛詩 [Mao’s compilation of the Book of Odes]. Komm. von Máo Hēng 毛亨 (Hàn Dynasty: 207 BC–9 AD). Sìbù Cóngkān 四部叢刊 [The collected publications from the Four Categories]. Shanghai: Shāngwù 商务; Englische Übersetzung: Karlgren, B. (1950). The book of odes. Chinese text, transcription and translation. Stockholm: Museum of Far Eastern Antiquities. Wang, W. S.-Y. (1969). “Competing changes as a cause of residue”. In: Language 45.1, 9–25. JSTOR: 411748. – (2006). Yǔyán, yǔyīn yǔ jìshù 語言,語音與技術 [Language, phonology and technology]. Shanghai: Xiānggǎng Chéngshì Dàxué. 8 29 2 Wandel und Relationen Johann-Mattis List Zeichenrelationen 11.01.2013 Zeichenrelationen 1 Termini 1.1 Biologische Schlüsseltermini Im Folgenden wollen wir versuchen, uns mit einigen Schlüsseltermini der Biologie vertraut zu machen, welche mitunter helfen können, linguistische Konzepte von Sprachverwandtschaft und Sprachgeschichte besser und klarer zu fassen. Merkmal Eines der wichtigsten Konzepte in der Evolutionsbiologie ist das Konzept des Merkmals (engl. character). Dieses kann allgemein in etwa wie folgt definiert werden: A biological character can be thought of as a part of an organism that exhibits causal coherence to have a well-defined identity and that plays a (causal) role in some biological processes. (Wagner 2000: 3) Nenne Beispiele für mögliche biologische Merkmale. Homologie Homologie (engl. homology) ist der allgemeine Terminus für die zentralste Relation in der Evolutionsbiologie: die Relation der gemeinsamen Abstammung (engl. common descent) zwischen zwei Merkmalen oder Organismen. Homology is the relationship of two characters that have descended, usually with divergence, from a common ancestral character. This is important because most of the terminological problems stem from different definitions of homology. Characters can be any genic, structural or behavioral feature of an organism. (Fitch 2000: 227) Der Terminus "Homologie" beschreibt eine Relation zwischen zwei gleichartigen Objekten. Wie bei den meisten wissenschaftlichen Termini lassen sich auch von diesem Terminus unterschiedliche Ableitungen bilden. So sind die Ableitungen "Homologe" und "homolog" durchaus gebräuchlich. Worauf sollte man bei der Verwendung dieser abgeleiteten Termini allerdings strikt achten, wenn man von deren eigentlicher Bedeutung ausgeht? Orthologie, Paralogie, Xenologie Homologie beschreibt allgemein Fälle von von gemeinsamer Abstammung zwischen Merkmalen. In der molekularen Biologie, deren grundlegende Vergleichseinheit genetische Sequenzen sind, können Untertypen von gemeinsamer Abstammung Unterschieden werden, deren gebräuchlichste die Orthologie (engl. orthology), die Paralogie (engl. paralogy) und die Xenologie (engl. xenology) sind. Diese Untertypen der Homologie wurden in Bezug auf den Genotypen definiert, sie haben keine eindeutige Entsprechung im Phänotypen. Die Bedeutung der Termini kann man wie folgt zusammenfassen: 1 30 Johann-Mattis List Zeichenrelationen 11.01.2013 • Orthologie ist die Relation, die für „genes related via speciation” (Koonin 2005: 311) gilt; • Paralogie bezeichnet die Relation zwischen „genes related via duplication” (ebd.); und • Xenologie bezieht sich auf die Relation zwischen Genen, „whose history, since their common ancestor, involves an interspecies (horizontal) transfer of the genetic material for at least one of those characters” (Fitch 2000: 229). Weiter unten werden wir uns mit der "Entlehnung" als Schlüsselkonzept der historischen Sprachwissenschaft beschäftigen. Mit welchem der drei in diesem Abschnitt eingeführten biologischen Termini wäre diese wohl am besten zu vergleichen, und warum besteht dennoch ein unüberwindlicher Unterschied zwischen dem biologischen und dem linguistischen Konzept? Analogie Wir Linguisten werden wahrscheinlich denken, dass wir diesen Terminus kennen, insbesondere, wenn wir in der letzten Sitzung aufgepasst haben. Leider ist dies jedoch nicht ganz richtig, denn Analogie bezeichnet in der Evolutionsbiologie etwas anderes als in der historischen Linguistik und auch im Allgemeinen: The relationship of any two characters that have descended convergently from unrelated ancestors. (ebd.) Es mag sein, dass das Zitat von Fitch den Leser keinen Deut klüger macht. Wenn dem so sein sollte, liegt dies vermutlich an dem Wort "convergently", welches auf Deutsch "konvergent" oder einfacher "aufeinander zulaufend" (also "in die selbe Richtung") lautet. Was bezeichnet Analogie in der Evolutionsbiologie also genau? Isologie Als wären es nicht genug Logien, denen wir uns bisher widmen mussten! Die Biologen setzen aber trotzdem einen drauf und führen gleich noch das Konzept der Isologie (engl. isology) ein: When dealing with molecular data concepts of homology have often been rather confused [...] with the word homology being used to mean several unrelated things, which could perhaps better be given alternative names. In particular,‘sequence homology’ is often used as a synonym for‘sequence identity’(i.e. the number of nucleotides or amino acids that are inferred to be held in common between two sequences). These are not necessarily the same thing [...], since similarity can be the result either of common ancestry or of chance convergence, parallelism or reversal; and‘isology’may be a better term to use (Wegnez 1987). (Morrison 2006: 488) To use the same word, “homology”, for structures with the same ancestry, either in comparative morphology or in molecular biology, is not itself a bad choice. Problems have arisen because the term has been used to express what it was not supposed to 2 31 2 Wandel und Relationen Johann-Mattis List Zeichenrelationen 11.01.2013 express. It is very difficult to quantify to what extent homologous morphological structures are identical. On the other hand, it si very easy to quantify the degree of identity of two proteins or genes – indeed, this is usually the first interpretative step following seuqence analysis. Most of the scientists concerned with sequence comparison have forgotten the morphological, embryological, and evolutionary origins of “homology”, and the word has lost in the process its all-or-none concept status. Today the problem ist first to restore the true meaning of the word “homology”, and then to find an appropriate term for quantitative sequence comparisons. (Wegnez 1987: 516) Kurz und schmerzlos: Warum brauchen wir (oder besser: die Biologen) einen solchen Terminus, und in welcher Beziehung steht er zu "Homologie" und "Analogie"? 1.2 Linguistische Schlüsseltermini Sprachverwandtschaft Sprachverwandtschaft (engl. genetic [language] relationship) ist das zentrale Konzept der historischen Sprachwissenschaft und bestimmt die Forschung in all ihren Grundzügen. The relationship between languages that have a common ancestor; languages that are languages of the same language family. (Campbell und Mixco 2007: 68) Sprachverwandtschaft wurde im Laufe des Seminars bereits mehrfach angesprochen. Welches ist das traditionelle Modell, mit dessen Hilfe Sprachgeschichte -- und damit auch die Entwicklung von Sprachverwandtschaften -- dargestellt wird, und warum ist dieses Modell so problematisch? Kognazität Nicht weniger wichtig, aber leider weitaus komplizierter und verwirrender, was den Gebrauch des Terminus betrifft, ist das Konzept der Kognazität (engl. cognacy). In der historischen Sprachwissenschaft bezeichnet Kognazität primär eine Relation der gemeinsamen Abstammung zwischen zwei Merkmalen. Dieser Terminus selbst ist jedoch weit weniger gebräuchlich als der Terminus Kognate (engl. cognate), der im Glossar von Campbell und Mixco folgendermaßen erläutert wird: A word (or morpheme) that is related to a word (morpheme) in sister languages by reason of these words (morphemes) having been inherited by the related languages from a common word (morpheme) of the proto-language from which they descend. For example, Italian cane /kane/, Portuguese cã o /kãõ/, French chien /šyɛ̃/ ‘dog’ are all cognates, since they descend in these Romance languages from the same original word in Latin (ancestor of the Romance languages): canis ‘dog’. (ebd.: 33f) Seien wir ehrlich und schonungslos: Die Beschreibung von Campbell und Mixco ist schrecklich ungenau, fehlerhaft und ungeschickt. Es stellt sich nur die Frage: Warum ist das so? Oder auch: Muss das so sein? 3 32 Johann-Mattis List Zeichenrelationen 11.01.2013 Entlehnung Wo von Relationen zwischen Sprachen die Rede ist, darf die Entlehnung (engl. borrowing) natürlich nicht fehlen. The process in which a language takes linguistic elements from another language and makes them part of its own. The borrowed elements are typically loanwords, but borrowing is not restricted just to lexical items taken from one language into another: any linguistic material – sounds, phonological rules, grammatical morphemes, syntactic patterns, semantic associations, discourse strategies – can be borrowed, that is, can be taken over so as to become part of the borrowing language. (Campbell und Mixco 2007: 25f) Die Definition von Campbell und Mixco weist einen schlimmen Denkfehler auf, der im Prinzip unverzeihlich ist. Welcher Fehler ist das? 2 Historische Relationen Im Folgenden wollen wir versuchen, uns unabhängig von der Frage, ob es nun um die Linguistik oder die Biologie oder dergleichen geht, klarzumachen, welche historischen Relationen wichtig für die historischen Wissenschaften sind. Die grundlegende Frage, von der wir uns dabei leiten lassen wollen, ist die, ob, und wenn ja welche, „Geschichte” zwei oder mehr Objekte (seien es nun Wörter oder Gene) miteinander teilen. Welche Wissenschaften können angeführt werden, um das oben genannte "dergleichen" mit Inhalt zu füllen? 2.1 Ontologische Relationen Mit ontologischen Relationen sollen im Folgenden diejenigen Relationen bezeichnet werden, die, wenn wir gesunden Menschenverstand annehmen, für Merkmale von historischen Objekten gelten, ob wir diese Relationen nun epistemologisch entdecken können, oder nicht. Da die grundlegende Frage ist, ob zwei oder mehr Merkmale historischer Objekte eine gemeinsame Geschichte miteinander teilen, und wenn dies der Fall ist, welcher Art diese gemeinsame Geschichte ist, können wir für diese Merkmale eine Reihe grundlegender ontologischer Relationen ansetzen. Gemeinsame Abstammung Für zwei oder mehr Merkmale characters unterschiedlicher Objekte gilt die Relation gemeinsamer Abstammung, wenn diese Merkmale zu einem früheren Zeitpunkt in der Geschichte einmal die Merkmale eines einzigen Objekts waren. Nenne Beispiele für gemeinsame Abstammung in a) der Linguistik, b) der Biologie, und c) der Theologie. Untertypen der gemeinsamen Abstammung Wir können die grundlegende Relation der gemeinsamen Abstammung weiter ergänzen, indem wir die folgenden Untertypen ansetzen: 4 33 2 Wandel und Relationen Johann-Mattis List Zeichenrelationen 11.01.2013 • direkte gemeinsame Abstammung bezeichnet eine Abstammungsrelation zwischen Merkmalen, die lediglich aus der Auseinanderentwicklung („Spaltung”) der Objekte, welche diese Merkmale aufweisen, resultiert und keine weitere Veränderung der Merkmale einschließt; • indirekte gemeinsame Abstammung bezeichnet eine Abstammungsrelation zwischen Merkmalen, die eine nach der Auseinanderentwicklung der Objekte, welche die Merkmale aufweisen, unabhängige Weiterentwicklung von mindestens einem der Merkmale aufweist; und • nicht-vertikale gemeinsame Abstammung bezeichnet eine Abstammungsrelation zwischen Merkmalen, die durch den (horizontalen) Transfer von mindestens einem der Merkmale zwischen den Objekten, die die Merkmale aufweisen, gekennzeichnet ist. Es ist sicher klar, dass diese Relationen sich stark an den biologischen Konzepten der "Orthologie", "Paralogie" und "Xenologie" orientieren. Welche Beispiele gibt es nun aber in der historischen Linguistik für diese drei Untertypen der gemeinsamen Abstammung? 2.2 Epistemologische Relationen Was (ontologisch) der Fall ist, kann uns (epistemologisch) durchaus verborgen bleiben! Um die ontologischen Relationen zwischen Merkmalen zu erschließen, müssen wir immer dann, wenn die Vorfahren der Objekte (wie Sprachen oder Spezies), die wir untersuchen, nicht erhalten sind, auf Indizien zurückgreifen. Das grundlegende Prinzip, mit dem Geschichte in der Biologie, der Linguistik und anderen historischen Wissenschaften dabei rekonstruiert wird, ist der Vergleich von Objekten, welcher realisiert wird als Vergleich von Merkmalen. Die grundlegende Relation, auf die wir uns als Indiz stützen, ist eine Ähnlichkeitsrelation, wobei die Frage, wie Ähnlichkeit konkret in der Praxis der jeweiligen Wissenschaften definiert ist, durchaus variieren kann. similarities coincidental Grk. θεός Spa. dios “god” non-coincidental natural non-natural Chi. māma Ger. Mama genealogical contact-induced “mother” Eng. tooth Eng. mountain Ger. Zahn Fre. montagne “tooth” “mountain” 5 34 Johann-Mattis List Zeichenrelationen 11.01.2013 Die oben wiedergegebene Abbildung zeigt grundlegende Typen von Ähnlichkeiten zwischen Wörtern verschiedener Sprachen mit Hilfe einer Entscheidungsbaum-Struktur. Bisher wurden unterschiedlichste Konzepte und Termini zur Beschreibung historischer Relationen besprochen. Welche Termini bieten sich an, um die Knoten des Baumes als Relationen zu fassen? 3 Zeichenrelationen Wenn wir die gängigen, in der Literatur verwendeten Zeichenrelationen in der Linguistik denen in der Biologie gegenüberstellen, und diese wiederum mit den ontologischen historischen Relationen vergleichen, fällt auf, dass die linguistische Terminologie nicht sehr gut geeignet ist, diese ontologischen Relationen auf systematisch ansprechende Weise abzudecken. Während jede der grundlegenden historischen ontologischen Relationen ihren Terminus in der Biologie hat, weist die Linguistik lediglich den Terminus „Kognazität” auf, der darüber hinaus sowohl direkte als auch indirekte gemeinsame Abstammung bezeichnet. Es ist an der Zeit, diese terminologische Armut zu bekämpfen. indirect due to lateral transfer homology.......... common descent..... direct orthology paralogy xenology cognacy.... Terminology Biology Linguistics Relations ? oblique cognacy ? Könnte man beim Betrachten der Tabelle nicht den Eindruck gewinnen, dass die Gegenüberstellung der biologischen und der linguistischen Termini der Linguistik nicht ganz gerecht wird, da die Phänomene, die zu den Relationen führen, Linguisten ja nicht unbekannt sind? 3.1 Kognatenrelationen Die Kognazitätsrelation stellt eine wichtige Relation in der historischen Linguistik dar. Im konkreten Fall von sprachlichen Zeichen setzt sie voraus, dass kognate Zeichen direkt von der gemeinsamen Vorgängersprache geerbt wurden, wie das Beispiel auf der folgenden Abbildung zeigt. Voraussetzung für die Kognazität zweier Wörter A und B ist somit, dass für diese Wörter selbst eine Vorgänger-Nachfolger-Relation (engl. ancestor-descendant relation) zu einem Wort C einer Vorgängersprache nachweisbar ist. 6 35 2 Wandel und Relationen Johann-Mattis List Zeichenrelationen [kɔp͡f] “head” 11.01.2013 [kʌp] COGNATE Kopf “cup” cup German English ANCESTOR ANCESTOR *[kupːaz] “vessel” *kuppaz ProtoGermanic Worin unterscheidet sich die Vorgänger-Nachfolger-Relation von der Relation der Kognazität? Welche Beispiele kann man für direkte und indirekte (oblique) Kognazität anführen? 3.2 Etymologische Relationen Wenn zwei Zeichen A und B nicht über ein Zeichen C miteinander verbunden werden können, zu dem sowohl A als auch B in einer Vorgänger-Nachfolger-Relation stehen, dann heißt das noch nicht, dass nicht eine historische Relation zwischen A und B bestehen könnte. Die folgende Abbildung illustriert einen solchen Fall. Die beiden Zeichen Deutsch Kopf und Französisch coupe sind nicht mehr kognat, ihre Entstehungsgeschichte verlief jedoch nicht vollkommen unabhängig voneinander, da Kopf der Nachfolger von Proto-Germanisch *kuppaz ist, welches wiederum von Latein cūpa entlehnt wurde. Um diese Beziehung zu benennen, schlage ich den Terminus „oblique etymologische Relation” vor. [kɔp͡f] “head” [kup] “cup” DONOR ETYM. RELATION Kopf coupe German French ANCESTOR ANCESTOR *[kupːaz] [kuːpa] *kuppaz ProtoGermanic cūpa DONOR “vessel” “vessel” Latin Der Terminus ,,oblique etymologische Relation" wurde relativ unvermittelt eingeführt. Gibt es eine Möglichkeit, aus dem bisher gelernten zu erschließen, warum der Terminus gewählt wurde? 7 36 Johann-Mattis List Zeichenrelationen 11.01.2013 3.3 Zusammenfassung In der folgenden Tabelle werden die neuen Termini zusammengefasst und den ontologischen Relationen gegenübergestellt. Um deutlich zu machen, dass es sich um Relationen handelt, werden die Termini auch als solche benannt, wobei die traditionelle Relation der Kognazität nicht ersetzt, sondern durch zwei Spezialfälle ergänzt wird. Der „Homologie” in der Biologie entsprechend wurde der Terminus „etymologische Relation” gewählt, da in einer dem Gebrauch des Terminus „Homologie” analogen Weise – nicht nur in der Linguistik – häufig von einer „etymologischen Beziehung zwischen Wörtern” gesprochen wird. indirect due to lateral transfer cognate relation direct Terminology etymological relation.. common descent..... Relations direct cognate relation oblique cognate relation oblique etymological relation In dieser Sitzung wurde versucht, strikt darauf zu achten, die historischen Relationen jeweils strikt für Merkmale (im Gegensatz zu taxonomischen ,,Objekten") zu definieren. Ist das gerechtfertigt, oder könnte man die Beziehungen nicht vielleicht gewinnbringend auf historische Beziehungen zwischen Sprachen übertragen? Literatur Campbell, L. und M. Mixco (2007). A glossary of historical linguistics. Edinburgh: Edinburgh University Press. Fitch, W. M. (2000). “Homology. A personal view on some of the problems”. In: Trends in Genetics 16.5, 227–231. Koonin, E. V. (2005). “Orthologs, paralogs, and evolutionary genomics”. In: Annual Review of Genetics 39, 309–338. Morrison, D. A. (2006). “Multiple sequence alignment for phylogenetic purposes”. In: Australian Systematic Botany 19, 479–539. Wagner, G. P. (2000). “Characters, unit and natural kinds. An introduction”. In: Hrsg. von G. P. Wagner. San Diego u. a.: Academic Press, 1–12. Wegnez, M. (1987). “Letter to the editor”. In: Cell 51, 516. 8 37 2 Wandel und Relationen Johann-Mattis List Übungen 2013-01-11 Übungen In der letzten Sitzung haben wir uns eingängig mit Zeichenrelationen beschäftigt. Dabei wurde deutlich, dass nicht allen Relationen auch ein Terminus in der Linguistik entspricht. Ferner wurde (hoffentlich) klar, dass die ontologische und die epistemologische Perspektive nicht immer strikt genug voneinander getrennt werden. Dies soll geändert werden, indem im Folgenden der Versuch unternommen werden soll, ein neues Schema zu entwickeln, das, wenn auch die Termini fehlen mögen, dieses zu füllen, den grundlegenden historischen Relationen und Prozessen in der historischen Linguistik gerecht wird. Relationen sind eine Folge spezifischer Prozesse sind. Erstelle ein ontologisches Schema historischer Prozesse analog zu dem besprochenen ontologischen Schema historischer Relationen, und füge dieses in tabellarischer Form im unteren Kasten ein. Versuche, die grundlegenden Ähnlichkeitsrelationen, die unter Punkt 2.2 in der letzten Sitzung besprochen wurden, in tabellarischer Form den ontologischen Relationen gegenüberzustellen. Ziel ist dabei, dass aus einer solchen Darstellung unmittelbar ersichtlich wird, welcher "Grund" für Ähnlichkeiten welcher ontologischen Relation gegenübersteht. 1 38 3 Rekonstruktion von Zeichenbeziehungen In diesem Block geht es um die Rekonstruktion von Zeichenbeziehungen, also um die phonologische Rekonstruktion, und um das Entdecken von kognaten Wörtern. 39 3 Rekonstruktion Johann-Mattisvon List Zeichenbeziehungen 18.01.2013 Alinierung Sequenzalinierung 1 Allgemeines vorweg 1.1 Sequenzen Viele Strukturen, mit denen wir es im Alltag und in der Wissenschaft zu tun haben, können als Sequenzen dargestellt werden. Der Vogelgesang, der uns morgens weckt, ist eine Sequenz von Schallwellen, die Filme, die wir anschauen, sind Sequenzen von Bildern, und die Gerichte, die wir kochen, basieren auf den Sequenzen von Instruktionen, die wir einem Rezept entnommen haben. Was haben Rezepte, Vogelgesang und Filme gemein? Diskrete und kontinuierliche Entitäten Oft sind die Objekte, die wir als Sequenzen modellieren, nicht diskret, sondern das Ergebnis kontinuierlicher Variablen (Raum, Zeit, etc., vgl. Kruskal 1983: 130). In der Linguistik hat das „Diskretmachen” des Kontinuierlichen eine lange Tradition. Da unser Blick auf Sprache normalerweise geblendet wird vom alphabetischen Denken, wird häufig ignoriert, dass die natürliche Erscheinungsform des Sprechens ein Kontinuum ist und dass die Segmentierung der Rede in Lauteinheiten das Ergebnis einer expliziten Analyse ist: „Neither the movements of the speech organs nor the acoustic signal offers a clear division of speech into successsive phonetic units” (IPA Handbook 1999: 5). Frequency (Hz) Frequency (Hz) 5000 5000 00 00 0.8 0.8 Time (s) Time (s) tʰ a ɦ i ã Die Graphik zeigt das Spektogramm der Aussprache von Shanghainesisch tàiyáng 太阳[tʰa₃₃ɦiã₄₄] ``Sonne". Was fällt auf, wenn man die IPA-Transkription des Wortes mit dessen Widerspiegelung im Spektogramm vergleicht? Formale Definition von Sequenzen Definition: Ein Alphabet ist eine nicht-leere endliche Menge deren Elemente Buchstaben genannt werden. Eine Sequenz ist eine geordnete Liste von Buchstaben, die aus dem Alphabet gezogen werden. Die Elemente von Sequenzen werden Segmente 1 40 Johann-Mattis List 18.01.2013 Alinierung genannt, die Mächtigkeit einer Sequenz ist die Anzahl ihrer unterschiedlichen Buchstaben, und die Länge einer Sequenz ist die Anzahl ihrer Segmente. (vgl. Böckenbauer und Bongartz 2003: 30f) Was hat die Abbildung mit den Perlen auf der Schnur mit Sequenzen und Mengen zu tun? 1.2 Sequenzvergleiche Sequenzvergleiche können mitunter recht kompliziert werden. Es genügt nicht, Sequenzen als einfache Menge aufzufassen und bspw. festzustellen, aus welchen Segmenten sie bestehen. Da Sequenzen sowohl eine Struktur als auch einen Gehalt haben, muss ein Vergleich von Sequenzen auf eben diese Tatsache Rücksicht nehmen. Bevor man also einzelne Segmente miteinander vergleicht, muss immer auch festgestellt werden, ob sich diese Segmente überhaupt entsprechen. Das ist leicht, wenn beide Sequenzen die gleiche Struktur haben. Dann muss man nämlich lediglich vergleichen, an welchen Positionen die Sequenzen sich unterscheiden. Dies lässt sich sogar relativ leicht quantifizieren, indem man einfach die unterschiedlichen Positionen zählt. 0 H H H H H 0 0 H H H H H 0 Die Anzahl unterschiedlicher Positionen zwischen zwei Sequenzen gleicher Struktur ist auch bekannt als die sogenannte HammingDistanz, benannt nach R. W. Hamming (1915 -- 1998), der sie erstmals in einem Aufsatz aus dem Jahre 1950 einführte (Hamming 1950). Wie groß ist die Hamming-Distanz zwischen den beiden Perlenketten auf der Abbildung oben? Die Korrespondenzperspektive Um Sequenzen mit unterschiedlicher Struktur vergleichen zu können, reicht die HammingDistanz allein nicht aus. Will man zwei oder mehr Sequenzen unterschiedlicher Struktur 2 41 3 Rekonstruktion Johann-Mattisvon List Zeichenbeziehungen 18.01.2013 Alinierung vergleichen, ist es zunächst notwendig, zu ermitteln, wie die Segmente miteinander korrespondieren. Dabei ist es zunächst wichtig, festzustellen, ob die Segmente überhaupt korrespondieren. Wenn zwei Segmente miteinander korrespondieren, so wird dies als Match bezeichnet. Wenn ein Element zu keinem anderen Segment korrespondiert, wird dies als leeres Match (empty match) bezeichnet. Die Matches selbst können wiederum unterteilt werden in unterschiedliche Typen, und zwar in solche, bei denen die korrespondierenden Segmente identisch sind (einheitliches Match, uniform match) und solche, bei denen die korrespondierenden Segmente unterschiedlich sind (divergierendes Match, divergent match). 0 H H H H H 0 uniform match 0 H H H H 0 divergent match empty match Die obige Abbildung fasst die grundlegenden Typen von Segment-Korrespondenzen zusammen. Mit diesen kann man prinzipiell alle Unterschiede zwischen Sequenzen beschreiben. Man könnte die grundlegenden Typen von Sequenzkorrespondenzen jedoch auch um mindestens zwei weitere Typen erweitern. Welche sind dies wohl? Die Editierperspektive Die zuvor besprochene Korrespondenzperspektive stellt nur eine mögliche Perspektive dar, um Unterschiede zwischen Sequenzen zu modellieren. Eine in der Literatur weit verbreitetere Perspektive ist die sogenannte Editierperspektive. Die grundlegende Idee dieser Perspektive ist es, Unterschiede zwischen Sequenzen mit Hilfe von Editieroperationen darzustellen, also den Basisoperationen, die man benötigt, um die eine Sequenz in die andere zu transformieren. Die grundlegenden Editieroperationen sind hierbei die Substitution, die Insertion, und die Deletion (zusammengefasst auch als Indel bezeichnet). Sie wurden zuerst von dem russischen Mathematiker V. I. Levenshtein (? – ?) eingeführt (Levenshtein 1965). Perspective Correspondence Edit uniform match continuation divergent match substitution insertion empty match deletion crossed match transposition compression complex match expansion Oh weh! Flix der Felertäufel hat wieder zugeschlagen und in der obigen Tabelle eine Reihe von Zellen geweißt. Schaffst Du es, die ursprünglichen Zelleninhalte wiederherzustellen? 3 42 Johann-Mattis List 18.01.2013 Alinierung 1.3 Alinierung Formale Definition Die Alinierung stellt die gebräuchlichste Form dar, um Unterschiede zwischen Sequenzen aufzuzeigen. Formal kann man eine Alinierung in etwa wie folgt definieren: Eine Alinierung von n (n > 1) Sequenzen ist eine n-reihige Matrix, in der alle Sequenzen dergestalt angeordnet werden, dass alle matchenden Segmente in derselben Spalte erscheinen, während nicht-matchende Segmente, die aus leeren Matches resultieren, durch Gap-Symbole angezeigt werden. (vgl. Gusfield 1997: 216) 0 H H H H H 0 H H H H 0 0 0 H H H H H 0 0 H H H H H 0 Die Levenshtein-Distanz zwischen zwei Sequenzen S1 und S2 ist definiert als die Anzahl von Editieroperationen, die notwendig ist, um S₁ in S2 zu transformieren. Mit Hilfe des Konzepts der Alinierung lässt sich dieses Distanzmaß leicht auf die HammingDistanz zurückführen. Wie genau? Alinierungsmodi Wir haben bei der Beschreibung der Alinierung bisher stets angenommen, dass diese sich auf die Sequenzen in ihrer ganzen Länge beziehen muss. Eine lediglich teilweise Alinierung ist jedoch genau so gut möglich und zuweilen sogar durchaus sinnvoll. Je nachdem, welche Teile von Sequenzen bei der Alinierung genau berücksichtigt werden, lassen sich unterschiedliche Alinierungsmodi unterscheiden: • semi-globale Alinierung beruht nicht notwendigerweise auf dem vollständigen Vergleich zweier Sequenzen. Stattdessen ist es möglich, Präfixe und Suffixe zu ignorieren, wenn diese die Kosten einer optimalen Alinierung zu stark erhöhen würden, • lokale Alinierung berücksichtigt nur die Alinierung von Subsequenzen, wobei der Rest der Sequenzen ignoriert wird, • diagonale Alinierung setzt eine globale Alinierung aus lokalen Teilalinierungen von Diagonalen, also Alinierungen, die keine Lücken enthalten, zusammen. Modus global semi-global lokal diagonal Alinierung G R E E N A F A T G R E E N - - - - GREEN CATFISH A FAT CAT - - - - A F A T C C A T F I S A T - - C A T F I A F A T C H U N T E R H U N T E R G R E E N C - - - - C H S A H H H T A A T T U U H H F - I - N N U U T T N N S - E E T T H - R R E E R R H H U U N N T T E E R R Die obige Tabelle zeigt, wie im Rahmen der vier Alinierungsmodi zwei Beispielsequenzen aliniert werden. Versuche, die Unterschiede darzustellen. 4 43 3 Rekonstruktion Johann-Mattisvon List Zeichenbeziehungen 18.01.2013 Alinierung 2 Phonetische Alinierung Obwohl Alinierungsanalysen eine der allgemeinsten Möglichkeiten darstellen, Sequenzen zu vergleichen, steckt ihre Verwendung in der historischen Linguistik noch in den Kinderschuhen. Natürlich alinieren historische Linguisten eigentlich immer Wörter und haben dies auch schon immer getan, da ohne Alinierung überhaupt keine regulären Lautkorrespondenzen ermittelt werden könnten. Der Sprachvergleich basierte lange Zeit jedoch eher auf einer impliziten Alinierung, die selten visualisiert wurde, und wenn doch, dann nur aus illustrativen Zwecken. Language Russian Polish French Italian German Swedish Alignment s ɔ s w ɔ s ɔ s o s ɔ s uː n nʲ l l n l ʦ ʦ - ə ɛ ɛ e ə - Language Russian Polish French Italian German Swedish j - (a) Globale Alinierung Alignment s ɔ s w s ɔ l s o l s ɔ s uː l ɔ - n nʲ - ʦ ʦ - ə ɛ - ɛj e nə (b) Lokale Alinierung Die obige Tabelle stellt zwei verschiedene Alinierungen von einzelsprachlichen Reflexen von Urindogermanisch *séh₂u̯el- dar, eine scheinbar naheliegende globale Alinierung, und eine realistische lokale Alinierung. Was fällt beim Vergleich der beiden Alinierungen auf? Welche Gründe mag es geben, dass eine korrekte Alinierung in der historischen Linguistik so verdammt schwierig ist? Warum sind Alinierungen dennoch so unheimlich wichtig für die historische Linguistik? 2.1 Die zwei Arten von Ähnlichkeit Die deutschen Wörter schlafen und Flaschen sind recht ähnlich, da sie – phonetisch gesehen – aus sechs verschiedenen Lauten bestehen, die einander recht ähnlich sind. Ähnliche Ähnlichkeit besteht zwischen den Wörtern Obst und Post. Eine andere Form von Ähnlichkeit besteht zwischen den Wörtern Kerker und Tanten. Die Ähnlichkeit besteht hier nicht in der Substanz der Lautsequenzen, sondern in der Struktur: beide Wörter bestehen aus einer identischen Kette unterschiedlicher Zeichen, wie man leicht sehen kann, wenn man die Wörter aliniert: Jedes distinkte Element korrespondiert direkt mit einem distinkten Element des anderen Wortes, und das Umwandeln der einen Lautsequenz in die andere kann durch eine einfache Ersetzungstabelle erreicht werden, was nicht möglich ist für schlafen und Flaschen, da die beiden Lautsequenzen nicht strukturell äquivalent sind. Basierend auf diesen Überlegungen können wir zwei grundlegende Arten von Ähnlichkeiten zwischen Wörtern unterscheiden: substantielle und strukturelle Ähnlichkeit. Lass (1997: 130) verwendet die Termini phänotypische und genotypische Ähnlichkeit um zufällige oberflächliche Ähnlichkeiten zwischen Wörtern von Ähnlichkeiten zu unterscheiden, die aus der Kognazität von Wörtern resultieren. In welchem Zusammenhang steht dieses Ähnlichkeitskonzept zu dem von substantieller und struktureller Ähnlichkeit? 5 44 Johann-Mattis List 18.01.2013 Alinierung 2.2 Typen des Lautwandels Die lange Forschungstradition in der historischen Linguistik hat dazu geführt, dass eine beträchtliche Reihe von Lautwandeltypen von verschiedenen Forschern postuliert wurde. Leider liegt diesen Lautwandeltypen eine unstete Terminologie zugrunde, die von sehr konkreten Termini, die sehr konkrete Arten von Lautwandel beschreiben, bis hin zu sehr generellen Termini, die sehr abstrakte Klassen von Lauten abdecken, reicht. Was in der Literatur als „Lautwandeltyp” bezeichnet wird, reicht von Phänomenen wie dem „Rhotazismus” (Trask 2000: 288), der, einfach gesagt, auf den Wandel von [s] zu [r] referiert, bis hin zur Lenisierung (engl. lenition), die einen Wandeltyp bezeichnet, „in which a segment becomes less consonant-like than previously” (ebd.: 190). Manche Termini sind ferner eher „erklärend” denn „beschreibend”, da sie gleichzeitig einen Grund dafür nennen, warum sich ein Laut gemäß einem bestimmten Typ wandelt. So wird Assimilierung in vielen Textbüchern nicht nur beschreiben als „[a] change in which one sound becomes more similar to another”, sondern es wird gleichzeitig betont, dass dies „through the influence of a neighboring, usually adjacent, sound” geschieht (Campbell und Mixco 2007: 16). Dies ist natürlich problematisch, da eine Beschreibung einer Erklärung immer vorangehen sollte. In der folgenden Tabelle werden fünf mehr oder weniger triviale Lautwandeltypen abgeleitet, indem, basierend auf der Gleichsetzung von Lautwandel mit einer Funktion, lediglich das Verhältnis zwischen Eingabe und Ausgabe als Klassifikationskriterium zugrunde gelegt wird. Da Lautwandel kontextabhängig verlaufen kann, ist es gut möglich, dass eine solche Funktion zusätzliche Parameter benötigt (wie die Silbenumgebung, den vorangehenden oder nachfolgenden Laut, usw.). Typ Kontinuation Beschreibung absence of change Darstellung x>x Substitution Ersetzung eines Lauts x>y Insertion Gewinn eines Lauts ∅>y Deletion Verlust eines Lauts x>∅ Metathesis change in the order of sounds xy > yx Beispiel Althochdeutsch hant > Deutsch Hand Althochdeutsch snēo > Deutsch Schnee Althochdeutsch ioman > Deutsch jemand Althochdeutsch angust > Deutsch Angst Urslavisch *žьltъ > Tschechisch žlutý “gelb” Flix der Felertäufel treibt es aber heute wirklich mal wieder zu bunt! Da hat er schon wieder einige Zellen geweißt. Kannst Du sie fachgerecht rekonstruieren? Woran erinnern Dich diese Typen des Lautwandels? 2.3 Lautklassen Beim Alinieren in der historischen Linguistik ist es wichtig, der Tatsache Rechnung zu tragen, dass substantielle Ähnlichkeit zwischen Lauten nicht notwendigerweise auch auf deren Kognazität hinweist. Nur, wenn zwei Segmente auch systematisch (also in den Sprachsystemen) korrespondieren, sollten sie tatsächlich als ähnlich angesehen werden. In den Schritten des Sprachvergleichs kann diese systematische Ähnlichkeit jedoch schwer ermittelt werden, denn zu Beginn eines Sprachvergleichs sind weder die kognaten Wörter 6 45 3 Rekonstruktion Johann-Mattisvon List Zeichenbeziehungen 18.01.2013 Alinierung bekannt, noch die regulär korrespondierenden Laute. Für automatische Ansätze zur phonetischen Alinierung und zur automatischen Kognatenerkennung ist es daher wichtig, einen heuristischen Ansatz zu entwickeln, der nicht nach absolut korrespondierenden Segmenten sucht, sondern nach wahrscheinlich korrespondierenden. Theoretische Grundlage eines solchen Ansatzes ist die von vielen Autoren geteilte Überzeugung, dass die unterschiedlichen Typen von Sprachwandel mit unterschiedlicher Häufigkeit und Wahrscheinlichkeit auftreten. Daraus folgt weiter, dass sich in den Sprachen der Welt bestimmte Muster von Lautkorrespondenzen häufiger finden lassen, als andere. Um dieser „Korrespondenzwahrscheinlichkeit” im automatischen Sprachvergleich Rechnung zu tragen, bietet sich das Konzept der „Lautklassen” an, das erstmals von Dolgopolsky (1964) vorgeschlagen wurde. Grundlegende Idee dabei ist, dass Laute, die häufig in Korrespondenzbeziehung in genetisch verwandten Sprachen auftreten, in Klassen (Typen) eingeteilt werden können. Es wird dabei angenommen, dass „phonetic correspondences inside a ,type’ are more regular than those between different ,types’” (ebd.: 35). No. 1 2 3 4 5 6 7 8 9 10 Cl. "P" "T" "S" "K" "M" "N" "R" "W" "J" "Ø" Description labial obstruents dental obstruents sibilants velar obstruents, dental and alveolar affricates labial nasal remaining nasals liquids voiced labial fricative and initial rounded vowels palatal approximant laryngeals and initial velar nasal Examples p, b, f d, t, θ, ð s, z, ʃ, ʒ k, g, ʦ, ʧ m n, ɲ, ŋ r, l v, u j h, ɦ, ŋ Die Tabelle oben zeigt Dolgopolskys ursprüngliches Lautklassenschema. Was fällt auf, wenn man die oben wiedergegebenen Reflexe des Urindogermanischen Worts für Sonne entsprechend diesem Schema in Lautklassensequenzen umwandelt? 2.4 Sekundärstrukturen Abgesehen von einer primären Struktur können Sequenzen auch eine sekundäre Struktur haben. Primäre Struktur meint hier die Ordnung der Segmente. Unter sekundärer Struktur wird die Anordnung sekundärer Segmente, d. h. von Segmenten, die aus dem Gruppieren von primären Segmenten zu höheren Einheiten resultieren, verstanden. Worauf genau die sekundäre Struktur basiert, ist dabei nebensächlich. Im Zusammenhang mit phonetischen Sequenzen spielen jedoch sekundäre Segmente wie Silben, Morpheme, Wörter und Sätze, eine mitunter wichtige Rolle. In der phonetischen Alinierungen kommt die wichtigste Rolle dabei der Morphemstruktur von Wörtern zu, da diese bei der manuellen Alinierung ohnehin meist implizit angewendet wird, und erst hilft eine realistische Alinierung von Lautsequenzen vorzunehmen. Die Tabelle unten gibt ein ein Beispiel für die Unterschiede zwischen primärer und sekundärer Alinierung. Während die primäre Alinierung eine falsche Korrespondenz zwischen dem finalen [t] und dem initialen [tʰ] ansetzt, setzt die sekundäre im Falle von Yinchuan richtig zwei Morpheme ʐʅ⁵¹ ”Sonne” und tʰou¹ ”Kopf (Suffix)” an, denen ein Morphem zit³ ”Sonne” in Haikou gegenübersteht. 7 46 Johann-Mattis List 18.01.2013 Alinierung Primäre Alinierung Haikou z i Beijing ʐ ʅ ⁵¹ t tʰ ou ³ ¹ Sekundäre Alinierung Haikou z i t Beijing ʐ ʅ - ³ ⁵¹ tʰ ou ¹ Da die Morphemstruktur chinesischer Wörter meist eindeutig mit deren Silbenstruktur gleichzusetzen ist (eine Silbe = ein Morphem), ist die sekundäre Alinierung in diesen Fällen einfach. Wie sieht dies bei anderen Sprachen aus? Literatur Böckenbauer, H.-J. und D. Bongartz (2003). Algorithmische Grundlagen der Bioinformatik. German. Stuttgart, Leipzig und Wiesbaden: Teubner. Campbell, L. und M. Mixco (2007). A glossary of historical linguistics. Edinburgh: Edinburgh University Press. Dolgopolsky, A. B. (1964). “Gipoteza drevnejšego rodstva jazykovych semej Severnoj Evrazii s verojatnostej točky zrenija [A probabilistic hypothesis concering the oldest relationships among the language families of Northern Eurasia]”. In: Voprosy Jazykoznanija 2, 53–63. Gusfield, D. (1997). Algorithms on strings, trees and sequences. Cambridge: Cambridge University Press. Hamming, R. W. (1950). “Error detection and error detection codes”. In: Bell System Technical Journal 29.2, 147–160. IPA Handbook (1999). Handbook of the International Phonetic Association. A guide to the use of the international phonetic alphabet. Cambridge: Cambridge University Press. Kruskal, J. B. (1983). “An overview of sequence comparison. Time warps, string edits, and macromolecules”. In: SIAM Review 25.2, 201–237. JSTOR: 2030214. Lass, R. (1997). Historical linguistics and language change. Cambridge: Cambridge University Press. Levenshtein, V. I. (1965). “Dvoičnye kody s ispravleniem vypadenij, vstavok i zameščenij simvolov [Binary codes with correction of deletions, insertions and replacements]”. In: Doklady Akademij Nauk SSSR 163.4, 845–848; English translation: – (1966). “Binary codes capable of correcting deletions, insertions, and reversals”. In: Soviet Physics Doklady 10.8, 707–710. Trask, R. L., Hrsg. (2000). The dictionary of historical and comparative linguistics. Edinburgh: Edinburgh University Press. 8 47 3 Rekonstruktion Johann-Mattisvon List Zeichenbeziehungen 18.01.2013 Kognatenerkennung Kognatenerkennung 1 Die komparative Methode Die Methode der heutigen Komparativistik, welche allgemein unter dem nicht sehr glücklichen Terminus „vergleichend-historische Methode” bekannt ist, stellt eine große Gesamtheit an abstrakten und konkreten Verfahren zur Untersuchung der Geschichte verwandter Sprachen dar, die genetisch auf eine bestimmte einheitliche Tradition der Vergangenheit zurückgehen, welche man üblicherweise als Proto-Sprache oder Grundsprache qualifiziert. Dieses methodische Instrumentarium, auf welches zurückgegriffen wird, um eine große Menge verschiedener Probleme zu lösen, wird verwendet, um ein Erkenntnissystem über die historische Entwicklung von Sprachfamilien aufzubauen, welches seine endgültige Gestalt in From historisch-vergleichender Grammatiken erhält. (Klimov 1990: 6)1 Ja, nee, is klar! Eine Methode, die aus einem Sammelsurium unterschiedlichster Verfahren besteht? Manchmal haben die historischen Linguisten wirklich ein paar Knoten locker. Wenn das ultimative Ziel dieser Methode darin bestehen soll, die historische Entwicklung von Sprachfamilien aufzuzeigen, dann kann man ja sicher eine ganze Menge Unterverfahren ansetzen, aus denen diese "Methode" besteht. Und die wären? 1.1 Grundannahmen Zu den unumstößlichen Grundannahmen der komparativen Methode zählen die Annahme der Regelmäßigkeit von Lautwandel (Regularitätspostulat), der Universalität von Sprachwandel (Universalitätspostulat), und der Möglichkeit von Sprachspaltung (Postulat der baumartigen Sprachentwicklung). Entsprechend der ersten Annahme verläuft Lautwandel demnach dergestalt, dass er große Teile des Lexikons einer Sprache erfasst und lediglich vom phonetischen Kontext abhängt, nicht jedoch von anderen Faktoren, wie bspw. der Bedeutung der Wörter. Die zweite Annahme besagt, dass Sprachwandel unabhängig vom Ort, der Zeit und der Sprache eintritt, und die dritte besagt, dass unabhängiger Sprachwandel bei geographischer Trennung der Sprecher einer Sprache im Laufe der Zeit zu Sprachspaltung führen kann. Welcher linguistischen Tradition lässt sich das Regularitätspostulat der komparativen Methode zuschreiben und worin bestehen die Probleme dieser Tradition? Ist das dritte Postulat wirklich wichtig genug, dass es in diesem Zusammenhang extra genannt werden muss? 1 Meine Übersetzung, Originaltext: «Методика современной компаративистики, щироко известная в лингвистической литературе под довольно неудачным термином ”сравнительно-исторический метод”, представляет собой больщую совокупность методов и конкретных приемов изучения истории родственных языков,генетически восходящих к некоторой единой традиции прощлого, обычно квалифицируемой в качестве праязыка или языка-основой. Этот методический инструментарий, призванный обслуживать рещение множества задач, используется для построения системы знаний об историческом развитии языковых семей, формируемой в конечном счете в виде сравнительно-исторических грамматик». 1 48 Johann-Mattis List 18.01.2013 Kognatenerkennung 1.2 Arbeitsweise Allgemeine Arbeitsweise Hinsichtlich der allgemeinen Arbeitsweise der komparativen Methode sind sich die Forscher nicht immer einig. Eine der explizitesten Zusammenfassungen, die ich bisher finden konnte, stammt von Ross und Durie (1996: 6f): 1. Determine on the strength of diagnostic evidence that a set of languages are genetically related, that is, that they constitute a ‘family’; 2. Collect putative cognate sets for the family (both morphological paradigms and lexical items). 3. Work out the sound correspondences from the cognate sets, putting ‘irregular’ cognate sets on one side; 4. Reconstruct the protolanguage of the family as follows: a Reconstruct the protophonology from the sound correspondences worked out in (3), using conventional wisdom regarding the directions of sound changes. b Reconstruct protomorphemes (both morphological paradigms and lexical items) from the cognate sets collected in (2), using the protophonology reconstructed in (4a). 5. Establish innovations (phonological, lexical, semantic, morphological, morphosyntactic) shared by groups of languages within the family relative to the reconstructed protolanguage. 6. Tabulate the innovations established in (5) to arrive at an internal classification of the family, a ‘family tree’. 7. Construct an etymological dictionary, tracing borrowings, semantic change, and so forth, for the lexicon of the family (or of one language of the family). Nicht, dass das die einzige Frage wäre, die hier offen bleiben kann, aber was verstehen die Autoren wohl unter "diagnostischer Evidenz", und warum ist es wichtig, Sprachverwandtschaft zu Beginn der komparativen Methode bereits nachgewiesen zu haben? 1.2.1 Der Versuch eines Arbeitsschemas Jeder historische Linguist hat wohl eine etwas andere Auffassung von dem, was die komparative Methode denn eigentlich sei. Daher ist es schwierig, einen verbindlichen Konsens zu finden. Basierend auf den bekanntesten Beschreibungen in der Literatur lässt sich jedoch ein fünfstufiges Arbeitsschema festlegen, wie es auf der Graphik zur Rechten zu sehen ist. Die gestrichelten Linien zwischen den unterschiedlichen Arbeitsschritten deuten dabei den iterativen Charakter der Methode an. proof of relationship revise identification of cognates identification of sound correspondences revise revise reconstruction of proto-forms internal classification revise 2 49 3 Rekonstruktion Johann-Mattisvon List Zeichenbeziehungen 18.01.2013 Kognatenerkennung Die komparative Methode wird oft als iteratives Verfahren beschrieben, wobei der iterative Charakter als eine große Stärke der Methode hervorgehoben wird. Was bedeutet "iterativ" überhaupt, und warum sollte das eine Stärke sein? Kognatenerkennung Wenn wir nur das Verfahren zur Kognatenerkennung betrachten, das in der komparativen Methode zur Anwendung kommt, so lässt sich dieses in etwa wie folgt beschreiben: • Erstelle eine erste Liste möglicher Kognatensets. • Aliniere die Wörter in der Kognatenliste. • Extrahiere eine erste Liste möglicher Lautkorrespondenzen aus den Alinierungen. • Verbessere die Kognatenliste und die Korrespondenzliste durch – Hinzufügen von mit der Korrespondenzliste kompatiblen und Entfernen von mit der Korrespondenzliste nicht kompatiblen Kognatensets, – Hinzufügen von mit der Kognatenlisteliste kompatiblen und Entfernen von mit der Kognatenliste nicht kompatiblen Korrespondenzsets. • Hör auf, wenn die Resultate publikationsreif sind. Der iterative Charakter der komparativen Methode erstreckt sich streng genommen durch alle ihre Arbeitsschritte. Somit hängt auch das Verfahren zur Kognatenerkennung von den ihm im Schema vorangehenden (Nachweis von Sprachverwandtschaft) und den ihm nachfolgenden Schritten (Rekonstruktion und interne Klassifikation) ab. Versuche, zu erläutern, wie man sich diese gegenseitige Abhängigkeit vorstellen kann. Zusammenfassung Die komparative Methode ist ein iteratives Verfahren zur Kognatenerkennung, sowie zur linguistischen und zur phylogenetischen Rekonstruktion. Grundlage des Verfahrens zur Kognatenerkennung sind Verfahren zur phonetischen Alinierung und zur Endeckung regulärer Lautkorrespondenzen. Die Vorteile der komparativen Methode bestehen in ihrer Flexibilität und ihrer Zuverlässigkeit. Die Methode ist flexibel, insofern als sie gleichzeitig auf viele Sprachen (multilingualer Aspekt) und auf unterschiedlichste Sprachdaten angewendet werden kann (multimodaler (?) Aspekt). Ihre Verlässlichkeit begründet sich dadurch, dass die Wirksamkeit der Methode im Verlaufe der Geschichte inzwischen an vielen Beispielen aufgezeigt werden konnte. Derzeit gibt es noch keine wirkliche Alternative zu diesem Verfahren. Bisher wurden nur die Vorteile der komparativen Methode aufgezeigt. Wie sieht es aber mit den Nachteilen aus? 3 50 Johann-Mattis List 18.01.2013 Kognatenerkennung 2 Automatische Kognatenerkennung 2.1 Kognatenerkennung als Problem In der Mathematik und Algorithmik ist es üblich, bestimmte Aufgaben als „Probleme” zu klassifizieren. Der Gedanke, der wahrscheinlich dahintersteht ist, dass es leichter ist, etwas zu lösen, wenn man sich vorher klar darüber geworden ist, was eigentlich gelöst werden soll. In diesem Sinne können wir auch im Zusammenhang mit der automatischen Kognatenerkennung von einem „Problem” sprechen, wobei wir zwischen unterschiedlichen Problemstufen unterscheiden können. Bevor wir zu den richtigen Problemen kommen, sollten wir uns noch einmal kurz in Erinnerung rufen, was Kognaten eigentlich sind. Generelles Problem der Kognatenidentifikation Gegeben sind Wortlisten verschiedener Sprachen. Finde alle Wörter in diesen Listen, die kognat sind. Charakteristik Unterscheidung von Lehn- und Erbwörtern Semantische Ähnlichkeit wird vorausgesetzt Auf unbegrenzte Anzahl von Sprachen anwendbar Ja Nein Die Tabelle enthält drei Charakteristika des Problems der Kognatenidentifikation. Ob diese Charakteristika jedoch vorliegen, oder nicht, wurde offengelassen. Kreuze die Ausprägungen der Charakteristika an, die sich aus der Beschreibung des generellen Problems der Kognatenidentifikation ableiten lassen. Generelles Problem der Identifikation etymologisch verwandter Wörter Gegeben sind Wortlisten verschiedener Sprachen. Finde alle Wörter in diesen Listen, die etymologisch verwandt sind. Charakteristik Unterscheidung von Lehn- und Erbwörtern Semantische Ähnlichkeit wird vorausgesetzt Auf unbegrenzte Anzahl von Sprachen anwendbar Ja Nein Kreuze die entsprechenden Ausprägungen der Charakteristika des generellen Problems der Identifikation etymologisch verwandter Wörter an. Wie könnte man dieses Problem alternativ nennen? Spezielles Problem der Identifikation etymologisch verwandter Wörter Gegeben ist eine mehrsprachige Wortliste, also eine Wortliste, die semantisch alinierte Wörter verschiedener Sprachen enthält. Finde alle Wörter in dieser Liste, die etymologisch verwandt sind. 4 51 3 Rekonstruktion Johann-Mattisvon List Zeichenbeziehungen 18.01.2013 Charakteristik Unterscheidung von Lehn- und Erbwörtern Semantische Ähnlichkeit wird vorausgesetzt Auf unbegrenzte Anzahl von Sprachen anwendbar Kognatenerkennung Ja Nein Kreuze die entsprechenden Ausprägungen der Charakteristika des speziellen Problems der Identifikation etymologisch verwandter Wörter an. Woran mag es liegen, dass von den bisher postulierten Algorithmen zur automatischen Kognatenerkennung vorwiegend dieses Problem im Gegensatz zu den beiden zuvor genannten allgemeineren Problemen adressiert wurde? 2.2 Die Entdeckung von Lautkorrespondenzen Signifikanz und Gradualität Die Entdeckung von Lautkorrespondenzen ist ein stochastisches Problem. Es geht dabei weniger um die absolute An- zahl an Korrespondenzen, die im Rahmen eines Sprachvergleichs aufgefunden werden können, als vielmehr darum, ob diese Anzahl tatsächlich signifikant ist. Dies wiederum führt automatisch zu einer Abkehr vom üblicherweise bemühten „Absolutheitspostulat”: Traditionell werden Lautkorrespondenzen nämlich meist als absolut angesehen: Entweder treten sie auf, oder nicht. Tatsächlich aber sollten Lautkorrespondenzen angesichts der für die historische Linguistik typischen sich ständig ändernden Datenlage als graduell angesehen werden, wobei manche Lautkorrespondenzen wahrscheinlicher und manche weniger wahrscheinlich sind. Manche Wissenschaften haben sich im Laufe ihrer Geschichte eine absolutierende Attitüde zugelegt. Die historische Linguistik gehört zweifellos auch dazu. Womit mag dies zusammenhängen? Lassen sich gute Gründe leichter erkennen, wenn man die historische Linguistik mit ähnlichen Wissenschaften vergleicht? Quantifizieren von Lautkorrespondenzen In der Bioinformatik ist es üblich, die Wahrscheinlichkeit von Korrespondenzen zu ermitteln, indem man attestierte mit erwarteten (zufälligen) Verteilungen vergleicht. Auf die Linguistik übertragen bedeutet das, dass wir eine attestierte Verteilung korrespondierender Laute vergleichen mit einer Verteilung, die wir erwarten würden, wenn zwei oder mehr Sprachen nicht miteinander verwandt sind. Normalerweise werden in der historischen Linguistik dabei lange Listen möglicher Kognaten angeführt, wie in der folgenden Liste, die Beispielwörter aus dem Italienischen und dem Französischen aufführt: Meaning “square” “feather” “flat” Italian pjaʦːa pjuma pjano French plas plym plɑ̃ Meaning “tear” “tongue” “moon” Italian lakrima liŋgwa luna French laʀm lɑ̃ɡ lyn Tatsächlich sind es aber nicht nur mögliche Kognaten, auf denen die Identifizierung erster möglicher Lautkorrespondenzen beruht, sondern mögliche alinierte Kognaten, wie sie die folgende Liste zeigt: 5 52 Johann-Mattis List 18.01.2013 “square” “feather” “flat” | pp | pp | pp j l j l j l a a u y a ɑ̃ ʦː a s -. m a m -. n o - -. | | | Kognatenerkennung | ll | ll | ll “tear” “tongue” “moon” a ɑ i ɑ̃ u y k ŋ n n r i m ʀ - m w a g -. a -. a -. | | | Das Quantifizieren von Lautkorrespondenzen könnte man nun als einfachen Prozess des Zählens darstellen, für den man eine einfache Matrix anlegt, und in dieser alle Kookkurrenzen aller Lautkombinationen auflistet (siehe linke Tabelle unten). Tatsächlich wird man damit dem oben erwähnten Regularitätspostulat des Lautwandels nur unzulänglich gerecht, da Lautwandel ja nur selten unabhängig vom phonetischen Kontext stattfindet. Daher ist es sinnvoller, auch den Kontext in die Quantifizierung miteinzubeziehen, indem man Laute nicht nur durch ihre Substanz, sondern auch durch ihren sonorischen Kontext (initial, steigende, fallende Sonorität, final, etc.) charakterisiert (Tabelle links). Basierend auf derartigen Überlegungen lässt sich bereits ein der manuellen komparativen Methode recht nahe kommendes automatisches Modell der Kognatenerkennung erstellen. p l a ... p 3 0 0 ... j 0 3 0 ... a 0 0 1 ... l 0 3 0 ... ... ... ... ... ... p/# l/# l/C a/V ... p/# 3 0 0 0 ... j/C 0 0 3 0 ... a/C 0 0 0 1 ... l/C 0 3 0 0 ... ... ... ... ... ... ... Ist die Einbeziehung des phonetischen Kontexts für die Entdeckung regulärer Lautkorrespondenzen tatsächlich so entscheidend? Begründe Deine Meinung mit Rückgriff auf die Beispielwörter aus dem Italienischen und Französischen. 2.3 Clusterung Unter Clusterung versteht man normalerweise die Einteilung von Objekten in Gruppen. Somit stellt die Unterteilung von Deutsch, Englisch, Italienisch und Französisch in germanische und romanische Sprachen eine Clusterung dar. Wenn wir uns die Probleme der Kognatenerkennung genauer anschauen, fällt auf, dass es sich auch hierbei primär um Clusteraufgaben handelt. Es geht nämlich darum, Wörter in Gruppen einzuteilen, wobei Wörter, die der gleichen Gruppe zugeordnet werden, jeweils als miteinander „kognat” oder „etymologisch verwandt” klassifiziert werden. Die Wörter Deutsch Zahn [ʦaːn], Italienisch dente [dɛnte], Niederländisch tand [tand], Russisch zub [zup], und Englisch tooth [tʊːθ] würde man dabei beispielsweise zwei verschiedenen Clustern zuschreiben, einem, dem alle Wörter angehören, die ein Reflex von Urindogermanisch *deh₃nt- „Zahn” sind (Zahn, dente, tand und tooth), und einem, dem die Wörter angehören, die ein Reflex von Urindogermanisch *ǵombʰ-o- „Nagel” sind (zub) (DERKSEN: 549). ʦaːn dɛnte tand zub tʊːθ ʦaːn 0.00 0.53 0.35 0.57 0.57 dɛnte 0.53 0.00 0.10 0.97 0.52 tand 0.35 0.10 0.00 0.86 0.39 zup 0.57 0.97 0.86 0.00 0.70 tʊːθ 0.57 0.52 0.39 0.70 0.00 6 53 3 Rekonstruktion Johann-Mattisvon List Zeichenbeziehungen 18.01.2013 Kognatenerkennung In automatischen Analysen haben Clusterverfahren den großen Vorteil, dass die Evidenz, die beim Vergleich von lediglich einem Sprachpaar fehlen mag, durch allgemeine Evidenz ausgeglichen werden kann. Die Verwendung multipler Evidenz (Sturtevant 1920: 11) ist ein grundlegendes Charakteristikum der komparativen Methode, dem auf diese Weise Rechnung getragen werden kann. Die Tabelle zeigt die paarweisen Distanzen, die mit Hilfe der SCAAlinierungsmethode (List 2012b) errechnet wurden, zwischen den oben erwähnten fünf unterschiedlichen Wörtern für "Zahn" auf. Inwiefern lässt sich anhand dieser Tabelle zeigen, wie wichtig es ist, sich beim Sprachvergleich auf multiple Evidenz zu stützen? Beachte dabei die in hellgrau und grau unterlegten Zellen. 2.4 LexStat INPUT word lists (semantically aligned) CONVERSION convert words into sound classes and prosodic strings PREPROCESSING calculate preliminary cognates using a simple distance method repeat 1000 SCORING SCHEME CREATION times ATTESTED EXPECTED align all preliminary cognates using global and local alignment analyses shuffle word lists, align word pairs, and count correspondences LOG-ODDS merge the distributions by calculating the logodds scores DISTANCE calculate pairwise distances between all language pairs CLUSTERING cluster all words into cognate sets whose distance is beyond the threshold OUTPUT write the cluster decisions and the alignments to text file Die Graphik zeigt das Schema der LexStat-Methode zur automatischen Kognatenerkennung (List 2012a). Diese Methode nimmt die meisten der bisher erwähnten Ideen zur au- 7 54 Johann-Mattis List 18.01.2013 Kognatenerkennung tomatischen Kognatenerkennung auf und vereint sie in einem Rahmenwerk, das recht nah den grundlegenden Ideen der traditionellen komparativen Methode folgt. LexStat basiert auf einer alinierungsbasierten Strategie zur automatischen Identifikation von Lautkorrespondenzen und bietet einen Lösungsansatz für das spezielle Problem der Identifikation etymologisch verwandter Wörter. Phonetische Alinierung kommt in zwei Schritten des Programms zum Tragen: als anfängliche Heuristik, die helfen soll, auch nur „verheißungsvolle Wortpaare” in die engere Auswahl möglicher Kognaten zu nehmen, und als abschließendes Evaluierungsverfahren, mit dessen Hilfe die Distanzen zwischen den Wörtern der Eingabe berechnet werden, die dann mit Hilfe des Clusterverfahrens in eindeutige „Kognazitätspostulate” überführt werden. Die phonetische Alinierung selbst basiert in der anfänglichen Heuristik auf dem Lautklassen-Verfahren. Es werden also nicht direkt phonetische Sequenzen aliniert, sondern durch Umwandlung der IPA-Zeichen in ein erweitertes Lautklassenschema erzeugte Lautklassensequenzen. Die folgende Abbildung verdeutlicht das zugrundeliegende Schema. INPUT tɔxtər dɔːtər TOKENIZATION CONVERSION ALIGNMENT CONVERSION t, ɔ, x, t, ə, r d, ɔː, t, ə, r t ɔx… → T O G … d ɔː t … → T O T … T O G … → tɔx… T O - … → d oː - … T O G T E R T O - T E R OUTPUT t ɔ x t ə r d ɔː - t ə r Obwohl die LexStat-Methode auf der automatischen Identifikation regulärer Lautkorrespondenzen basiert, ist sie prinzipiell nicht in der1 Lage, zwischen Xenologen und Kognaten zu unterscheiden. Woran liegt das? Literatur Klimov, G. A. (1990). Osnovy lingvističeskoj komparativistiki [Foundations of comparative linguistics]. Moscow: Nauka. List, J.-M. (2012a). “LexStat. Automatic Detection of Cognates in Multilingual Wordlists”. In: Proceedings of the EACL 2012 Joint Workshop of LINGVIS & UNCLH. (Avignon, France, 23.–24. Apr. 2012). Association for Computational Linguistics, 117–125. – (2012b). “SCA. Phonetic alignment based on sound classes”. In: New directions in logic, language, and computation. Hrsg. von M. Slavkovik und D. Lassiter. LNCS 7415. Berlin und Heidelberg: Springer, 32–51. Ross, M. D. und M. Durie (1996). “Introduction”. In: The comparative method reviewed: Regularity and irregularity in language change. Hrsg. von M. Durie. New York: Oxford University Press, 3–38. Sturtevant, E. H. (1920). The pronunciation of Greek and Latin. Chicago: University of Chicago Press. Internet Archive: pronunciationgr00unkngoog. Wörterbücher DERKSEN R. Derksen, Hrsg. (2008). Etymological dictionary of the Slavic inherited lexicon. Leiden Indo-European Etymological Dictionary Series 4. Leiden und Boston: Brill. 8 55 3 Rekonstruktion Johann-Mattisvon List Zeichenbeziehungen Übungen 2013-01-18 Übungen: Tocharisch A und B (S. A. Burlak) 1 1 Ausgangspunkt Gegeben sind Wörter aus Tocharisch B 2 , die in einer nicht-traditionellen lateinischen Transkription wiedergegeben werden und ihre Übersetzungen für die meisten von ihnen in Tocharisch A (vgl. Tabelle 1). Toch. B tapre šaŋkʷ sark kare sakʷ yat taŋkʷ ratre Toch. A tpär šuŋk särk kär suk yät ? ? Toch. B ñakte yalce yarke yakʷ šal´pe yakne l´am kante Toch. A ñkät wälc yärk yuk ? wkäṇ l´äm känt Tabelle 1: Wörter in Toch. B und ihre Entsprechungen in Toch. A 2 Aufgaben A 1: Füllen Sie die Lücken aus. A 2: Wie könnte Tocharisch A l´äk in der Übersetzung nach Tocharisch B aussehen? Und wie Tocharisch B yarm in der Übersetzung nach Tocharisch A? 3 Anmerkungen Im Tocharischen wird y ungefähr wie dt. <ü> ausgesprochen, c ungefähr wie dt. <z>, l ´ ungefähr wie dt. <lj>, ñ ungefähr wie dt. <nj>, š ungefähr wie dt. <sch>, ŋ in etwa wie dt. <ng>, kʷ wie <qu>, ṇ stellt einen schwachen nasalen Anlaut dar, ä einen besonderen tocharischen Vokal. Literatur Burlak, S. A. und S. A. Starostin (2005). Sravnitel’no-istoričeskoe jazykoznanie [Comparativehistorical linguistics]. Moscow: Akademia. 1 2 Aufgabe aus: Burlak und Starostin (2005: 390). Meine Übersetzung. Tocharisch A und Tocharisch B sind tote Sprachen, die eine besondere Gruppe innerhalb der indogermanischen Sprachfamilie darstellen. Sie waren verbreitet im chinesischen Turkestan vom 6. bis zum 8. Jh. unserer Zeit. 1 56 4 Rekonstruktion von Sprachbeziehungen Hat man die Beziehungen zwischen Zeichen rekonstruiert, so kann in einem weiteren Schritt die Beziehung zwischen Sprachsystemen rekonstruiert werden. Hier sind zwei Aspekte zu unterscheiden: Die Rekonstruktion externer Sprachgeschichte, und der Nachweis von Sprachverwandtschaft. 57 4 Rekonstruktion Johann-Mattisvon List Sprachbeziehungen Phylogenetische Rekonstruktion 21.02.2013 Phylogenetische Rekonstruktion 1 Allgemeines zur phylogenetischen Rekonstruktion 1.1 Innere und äußere Sprachgeschichte Georg von der Gabelentz (1840 – 1893) war ein genialer Sprachwissenschaftler, dessen Werk in der modernen Sprachforschung leider allzu oft ignoriert wird. Da 2013 nicht nur Grimm-Jahr, sondern auch Gabelentz-Jahr ist, rufen wir uns noch einmal einige seiner berühmtesten Sätze in Erinnerung. Der Zweig der Sprachforschung, der uns hier beschäftigt, hat es zunächst mit den trockensten Einzelthatsachen zu thun: Sind die Sprachen A und B miteinander verwandt, und in welchem Grade? Giebt es dieses Wort oder jene Form in der und der Sprache oder in der und der Zeit der Sprachgeschichte? wie lautet es da? Welche Gesetzmässigkeit herrscht in den lautlichen Abweichungen? Besteht im einzelnen Falle Urgemeinschaft oder Entlehnung? Was ist alles Gemeingut, was neu hinzu erworben? u. s. w. Alles das klingt und is auch wirklich sehr trocken. Was die menschliche Rede im Innersten bewegt, was sonst die Wissenschaft von den Sprachen der Völker zu einer der lebensvollsten macht, das tritt hier zunächst zurück: nur einige ihrer Ausläufer ranken in das Seelen- und Sittenleben der Völker hinüber. Der einzelsprachliche Forscher kann gar nicht schnell genug die fremde Sprache in’s eigene Ich aufnehmen: der Sprachhistoriker steht draussen vor seinem Gegenstande: hier der Anatom, da der Cadaver. (Gabelentz 1891: 145) Wir werden, um Missverständnisse zu vermeiden, gut thun, zwischen äusserer und innerer Sprachgeschichte zu unterscheiden. Die äussere Geschichte einer Sprache ist die Geschichte ihrer räumlichen und zeitlichen Verbreitung, ihrer Verzweigungen und etwaigen Mischungen (Genealogie). Die innere Sprachgeschichte erzählt und sucht zu erklären, wie sich die Sprache in Rücksicht auf Stoff und Form allmählich verändert hat. (ebd.: 146) In der Biologie unterscheidet man zwischen Phylogenese und Ontogenese, wobei Phylogenese die (ausschnittsweise) Geschichte aller Arten bezeichnet, und Ontogenese die Geschichte einzelner Organismen. Lassen sich diese Termini mit der inneren und der äußeren Sprachgeschichte Gabelentz' vergleichen, und wenn nicht Welche grundlegenden Probleme und Unterschiede lassen sich festhalten? 1.2 Bäume, Wellen, Netze Bäume Es wurde bereits in der zweiten Sitzung darauf hingewiesen, dass August Schleicher eine herausragende Persönlichkeit in der Geschichte der Linguistik war und wir ihm insbesondere die sogenannte Stammbaumtheorie verdanken, die er in zwei frühen Werken erstmals im Jahre 1853 veröffentlichte (Schleicher 1853a, Schleicher 1853b). Schleichers Theorie zur äußeren Sprachgeschichte war wahrscheinlich direkt beeinflusst von František Čelakovský (1799 – 1852), den er während einer Professur in Prag kennengelernt hatte, und der noch vor Schleicher einen ersten Stammbaum der slawischen Sprachen veröffentlichte (Čelakovský 1853). 1 58 Johann-Mattis List Phylogenetische Rekonstruktion 21.02.2013 Die ältesten teilungen des indogermanischen bis zum entstehen der grundsprachen der den sprachstamm bildenden sprachfamilien laßen sich durch folgendes schema anschaulich machen. Die länge der linien deutet die zeitdauer an, die entfernung derselben von einander den verwantschaftsgrad. (Schleicher 1861: 6) Oben sind eine Abbildung und ein Zitat aus Schleichers berühmtem Werk "Compendium der vergleichenden Grammatik der indogermanischen Sprachen" wiedergegeben. Auf welchen Grundannahmen beruht die Stammbaumtheorie? Welchen Anspruch hat sie in Bezug auf die Darstellung von Sprachgeschichte? Welle Nicht lange, nachdem August Schleicher seine berühmte Stammbaumtheorie erstmals postuliert hatte, regte sich Widerspruch in den Kreisen der Indogermanisten und historischen Linguisten. Am bekanntesten ist in diesem Zusammenhang das Werk von Johannes Schmidt (1843 – 1901), der die Stammbaumtheorie verwarf, und an ihrer Stelle seine nicht minder berühmte Wellentheorie propagierte. Es bleibt also keine Wahl, wir müssen anerkennen, dass das lituslawische einerseits untrennbar mit dem deutschen, andererseits ebenso untrennbar mit dem arischen verkettet ist. Die europäischen, deutschen und arischen charakterzüge durchdringen einander so vollständig, dass eine ganze reihe von erscheinungen nur durch ir organisches zusammenwirken hervorgerufen ist, und dass es worte gibt, deren form weder ganz europäisch noch ganz arisch ist und nur als ergebniss diser beiden einander durchkreuzenden strömungen begreiflich wird. (Schmidt 1872: 16) Wollen wir nun die verwantschaftsverhältnisse der indogermanischen sprachen in einem bilde darstellen, welches die entstehung irer verschidenheiten veranschaulicht, so müssen wir die idee des stammbaumes gänzlich aufgeben. Ich möchte an seine stelle das bild der welle setzen, welche sich in concentrischen mit der entfernung vom 2 59 4 Rekonstruktion Johann-Mattisvon List Sprachbeziehungen Phylogenetische Rekonstruktion 21.02.2013 mittelpunkte immer schwächer werdenden ringen ausbreitet. Dass unser sprachgebiet keinen kreis bildet, sondern höchstens einen kreissector, dass die ursprünglichste sprache nicht im mittelpunkte, sondern an dem einen ende des gebietes ligt, tut nichts zur sache. Mir scheint auch das bild einer schiefen vom sanskrit zum keltischen in ununterbrochener linie geneigten ebene nicht unpassend. (Schmidt 1872: 27) Die oben wiedergegebenen zwei Ausschnitte aus Schmidts Werk sollen seine Argumente gegen die Stammbaum- und für die Wellentheorie illustrieren. Worin genau bestehen diese Argumente gegen die Stammbaumtheorie? Wie genau hat man sich die Wellentheorie vorzustellen? Netze und anderes Gewirr Das größte Problem von Schmidts Wellentheorie war, das niemand genau wusste, wie er die äußere Sprachgeschichte denn nun schematisch darstellen sollte. Und so finden wir im Laufe der Geschichte eine Vielzahl von Versuchen zur Visualisierung der Wellentheorie. (a) Hirt (1905) (b) Meillet (1908) (c) Bonfante (1931) (d) Bloomfield (1933) Oben sind vier unterschiedliche Versuche, die Wellentheorie zu visualisieren, wiedergegeben. Was haben alle diese Versuche gemein und worin bestehen ihre Unterschiede? Worin unterscheiden sich die alternativen (Wellen-)Modelle in ganz prägnanter Weise von der Stammbaumtheorie? 1.3 Perspektiven Ein grundlegender Unterschied zwischen Stammbaum- und Wellentheorie liegt in ihrer unterschiedlichen Ausrichtung: Während sich die Wellentheorie, wie man an den späteren 3 60 Johann-Mattis List Phylogenetische Rekonstruktion 21.02.2013 Visualisierungsversuchen und auch an Äußerungen Schmidts sehen kann, an der epistemologischen Perspektive der äußeren Sprachgeschichte orientiert, orientiert sich die Stammbaumtheorie stark an der ontologischen Perspektive derselben. Dass es wichtig ist, diese beiden Perspektiven zu unterscheiden, wurde nun schon oft in diesem Seminar angedeutet. In Bezug auf die äußere Sprachgeschichte ist die Unterscheidung deshalb so relevant, weil der Unterschied zwischen dem, was man wissen kann, und dem, was man gern wissen würde, mitunter sehr groß sein kann. Schmidt begründet seine Ablehnung der Stammbaumtheorie mit dem Hinweis auf die Unmöglichkeit, die Fakten mit Hilfe eines Baums darzustellen. Man mag sich also drehen und wenden wie man will, so lange man an der anschauung fest hält, dass die in historischer zeit erscheinenden sprachen durch merfache gabelungena us der ursprache hervorgegangen seien, d. h. so lange man einen stammbaum der indogermanischen sprachen annimmt, wird man nie dazu gelangen alle die hier in frage stehenden tatsachen wissenschaftlich zu erklären. (Schmidt 1872: 17) Seine Fakten sind dabei vor allem Auflistungen geteilter Wurzeln (Kognaten im weiten Sinne) zwischen verschiedenen indogermanischen Sprachen. Das Problem dieser „Fakten” ist jedoch, dass sie selbst vom jeweiligen Forschungsstand abhängen. Wenn man zum Beispiel Schmidts Zählungen zu geteilten Wurzeln zwischen Griechisch, Altindisch und Latein mit der Anzahl an Wurzeln in Nicholaev (2007) vergleicht, so fällt auf, dass die starke Nähe zwischen Latein und Griechisch, die Schmidts Daten vermuten lassen, vor dem Hintergrund der Daten Nicholaevs gar nicht mehr so ausgeprägt erscheinen. Ähnliches gilt für die bei Schmidt sehr geringe Anzahl an Ähnlichkeiten zwischen Altindisch und Latein. (a) Schmidt (1872) (b) Nicholaev (2007) Johannes Schmidt würde wahrscheinlich sagen, dass man die Daten in der Abbildung oben nicht mit Hilfe eines Baumes darstellen kann. Stimmt das? Und wenn nicht, welche Unterschiede zeigen dann der Baum von Schmidt und der von Nicholaev? 1.4 Darstellung Wir müssen unterscheiden zwischen Schemata (seien es Wellen oder Bäume) zur Darstellung von Daten, und Schemata zur Darstellung von Geschichte (vgl. die Unterscheidung zwischen data-display und evolutionary in Morrison 2011: 42f). Schleichers Baum von 1861 ist dabei ein klares Beispiel für ein Schema, das den Anspruch hat, ein geschichtliches Schema zu sein, während die Beispiele für die Visualisierung der Wellentheorie wohl eher als Datendarstellungsschemata bezeichnet werden sollten, da sie nicht für sich in Anspruch nehmen, äußere Sprachgeschichte zu modellieren. Schemata zur Darstellung 4 61 4 Rekonstruktion Johann-Mattisvon List Sprachbeziehungen Phylogenetische Rekonstruktion 21.02.2013 von Daten können unter Umständen in Schemata zur Darstellung von Geschichte überführt werden, jedoch hängt die Überführbarkeit davon ab, ob die Daten die Rekonstruktion von Geschichte auch erlauben. Die Frage ist also, wenn man Sprachen miteinander vergleicht, welche Unterschiede zwischen Sprachen tatsächlich eine Rekonstruktion der äußeren Sprachgeschichte erlauben, wie schon Karl Brugmann (1849 – 1919) in seinen Ausführungen zur Problematik der genealogischen Klassifikation der acht großen indogermanischen Sprachgruppen deutlich machte: Im ganzen ist also nur wenig, was aus den spezielleren Übereinstimmungen zwischen einzelnen von den acht Hauptgruppen für die Beziehungen der Völker zu einander in sogen. voreinzelsprachlicher Zeit mit grösserer Wahrscheinlichkeit entnommen werden kann. Und jedenfalls treten, so viel wir heute wissen, nirgends speziellere Gemeinsamkeiten, die als gemeinsame Neuerungen erscheinen, in so grosser Anzahl entegegen, dass man auf Grund derselben die betreffenden Sprachzweige in derselben Art zu Einheiten zusammenschliessen dürfte [...]. Dies gilt selbst für den Fall, dass man keine von diesen Übereinstimmungen als nur zufällig und keine als auf Entlehnung beruhend betrachten wollte. (Brugmann 1904[1970]: 21f) Brugmann äußert sich vordergründig über das Problem der genealogischen Klassifikation der indogermanischen Sprachen. Dabei nennt er jedoch auch einige sehr wichtige Prinzipien, die bei der phylogenetischen Rekonstruktion (= genealogische Klassifikation) beachtet werden müssen. Welche sind dies? 2 Lexikostatistik 2.1 Hintergrund Die Lexikostatistik stellt ein statistisch basiertes Verfahren zur Ermittlung von Verwandtschaftsbeziehungen zwischen Sprachen (und damit zur phylogenetischen Rekonstruktion) dar. Sie wurde von Morris Swadesh (1909 – 1967) in einer Reihe von Artikeln zu Beginn der 50er Jahre des 20. Jahrhunderts vorgestellt und weiterentwickelt (Swadesh 1950, Swadesh 1952, Swadesh 1955). In der Folgezeit mehrte sich jedoch die Kritik an der Methode (Bergsland und Vogt 1962, Hoijer 1956, Rea 1973) und kam am Ende aus der Mode. Grundsätzlich werden im Rahmen der Lexikostatistik historisch relevante Gemeinsamkeiten zwischen Sprachen ausgezählt. Die zugrunde liegenden Zahlen können dann weiterverwendet werden, um genealogische Bäume automatisch zu rekonstruieren, oder um (unter der Annahme konstanten Wandels) Sprachspaltungszeitpunkte zu ermitteln. Die Methode erlebte zu Beginn des 21. Jahrhunderts eine Wiedergeburt im Rahmen neuer quantitativer biologischer Ansätze, mit deren Hilfe genealogische Bäume automatisch aus spezifischen Sprachdaten gewonnen werden können (Atkinson und Gray 2006, Gray und Atkinson 2003). Um Spekulation wird gebeten: Aus welchen Gründen wurde die Lexikostatistik so schnell wieder verworfen? Aus welchen Gründen wurde sie so euphorisch wiedereingeführt? 2.2 Grundannahmen Die Grundannahmen der Lexikostatistik wurden in einer Vielzahl von Arbeiten besprochen (Gudschinsky 1956, Sankoff 1969). Basierend auf diesen Arbeiten lassen sie sich in etwa wie folgt zusammenfassen (vgl. Geisler und List im Druck): 5 62 Johann-Mattis List Phylogenetische Rekonstruktion 21.02.2013 1. The lexicon of every human language contains words which are relatively resistant to borrowing and relatively stable over time due to the meaning they express: these words constitute the basic vocabulary of languages. 2. Shared retentions in the basic vocabulary of different languages reflect their degree of genetic relationship, i.e. they are representative for the reconstruction of language phylogenies. Zwei kurze Fragen: (1) Welche Wörter gehören wohl zum Basisvokabular? (2) Worin besteht der Unterschied zwischen Punkt 2 und den Punkten, die Brugmann (siehe oben) angesprochen hatte? 2.3 Praktische Umsetzung Was theoretisch sehr abstrakt und wohlüberlegt klingen mag, zeigt sich in der Praxis als ein recht einfaches Verfahren, das wohl am besten in fünf Schritte unterteilt werden kann (vgl. Geisler und List im Druck): 1. Compilation: Compile a list of basic vocabulary items (a Swadesh-list). 2. Translation: Translate the items into the languages that shall be investigated. 3. Cognate Judgments: Search the language entries for cognates. 4. Coding: Convert the cognate information into a numerical format. 5. Computation: Perform a computational analysis (cluster analysis, tree calculation) of the numerical data, which allows to make conclusions regarding the phylogeny of the languages under investigation. Es gibt unterschiedliche Swadesh-Listen, auf denen lexikostatistische Analysen beruhen. Die folgende Tabelle zeigt eine sehr kleine Liste von 35 Items, die von Sergej Jachontov vorgeschlagen wurde (Burlak und Starostin 2005: 13): 1 6 11 16 21 26 31 BLOOD EGG GIVE LOUSE ONE THOU WHAT 2 7 12 17 22 27 32 BONE EYE HAND MOON STONE TONGUE WHO 3 8 13 18 23 28 33 DIE FIRE HORN NAME SUN TOOTH SALT 4 9 14 19 24 29 34 DOG FISH I NEW TAIL TOOTH WIND 5 10 15 20 25 30 35 EAR FULL KNOW NOSE THIS WATER YEAR Kurzes Hirnstürmen: In welchen Arbeitsschritten kann man wohl bei einem solchen Verfahren die größten Probleme erwarten? Welche Probleme können aus Konzeptlisten wie der von Jachontov entstehen? 6 63 4 Rekonstruktion Johann-Mattisvon List Sprachbeziehungen Phylogenetische Rekonstruktion 21.02.2013 2.4 Kritik Auf grundlegende Probleme wurde bereits kurz nach dem Erscheinen von Swadeshs ersten Veröffentlichungen zur Lexikostatistik hingewiesen. Diese betrafen Punkte, die auch aus den traditionellen Methoden zur genealogischen Klassifikation von Sprachen gut bekannt sind. Die wichtigsten Punkte sind dabei: • Entlehnung: Unentdeckte Entlehnungen können die Ergebnisse verfälschen. • Aussagekraft: Lexikalische Ersetzung ist als Prozess nicht aussagekräftig für Sprachgeschichte. • Fehleranfälligkeit: Die Methode ist fehleranfällig, da die Daten auf eine problematische Weise erstellt werden. Während die ersten beiden Punkte in der Literatur von oben bis untern durchgekaut wurden, ohne dass sie den Befürwortern der Lexikostatistik tatsächlich argumentatorisch entgegentreten konnten, wurde der letzte Punkt nur wenig beachtet, obwohl er das größte Problem der Lexikostatistik und ihrer Nachfolgermethoden anspricht: Das Problem der Subjektivität der Daten, die eine lexikostatistische Analyse produziert. Neuere Vergleiche haben dabei zeigen können, dass die Daten, die von Forscherteams unabhängig produziert werden, derartig große Unterschiede aufweisen, dass dies zu Unterschieden von über 30% in von den Daten automatisch berechneten Baumtopologien führt (Geisler und List im Druck). Die größten Probleme liegen dabei weniger im Bereich der Kognatenzuweisungen (Schritt 3, obwohl auch dieser problematisch ist), sondern bereits im Bereich der Übersetzung (Schritt 2). Denn bereits hier zeigen sich große Unterschiede zwischen unabhängig erstellten Datensätzen, die zeigen, dass mangelnde Kompetenz der Forscher in den Einzelsprachen, aber auch mangelnde Beschreibung der Konzepte in den Konzeptlisten, zu einer Vielzahl von Unterschieden bereits in den Ausgangsdaten führen können. Wie lassen sich die vielen Unterschiede in den Übersetzungen (Schritt 2) erklären? Literatur Atkinson, Q. D. und R. D. Gray (2006). “How old is the Indo-European language family? Illumination or more moths to the flame?” In: Phylogenetic methods and the prehistory of languages. Hrsg. von P. Forster und C. Renfrew. McDonald Institute monographs. Cambridge, Oxford und Oakville: McDonald Institute for Archaeological Research; Distributed by Orbow Books, 91–109. Bergsland, K. und H. Vogt (1962). “On the Validity of Glottochronology”. In: Current Anthropology 3.2, 115–153. JSTOR: 2739527. Bloomfield, L. (1933 [1973]). Language. London: Allen & Unwin. Bonfante, G. (1931). “I dialetti indoeuropei”. In: Annali del R. Istituto Orientale di Napoli 4, 69–185. Brugmann, K. (1904[1970]). Kurze vergleichende Grammatik der indogermanischen Sprachen. Auf Grund des fünfbändigen ’Grundrisses der vergleichenden Grammatik der indogermanischen Sprachen von K. Brugmann und B. Delbrück’ verfasst. Photomechanischer Nachdruck 1970. Walter de Gruyter & Co., Berlin. Strassburg: Karl J. Trübner. Burlak, S. A. und S. A. Starostin (2005). Sravnitel’no-istoričeskoe jazykoznanie [Comparativehistorical linguistics]. Moscow: Akademia. 7 64 Johann-Mattis List Phylogenetische Rekonstruktion 21.02.2013 Gabelentz, H. G. C. (1891). Die Sprachwissenschaft. Ihre Aufgaben, Methoden und bisherigen Ergebnisse. Leipzig: T. O. Weigel. Internet Archive: diesprachwissen00gabegoog. Geisler, H. und J.-M. List. “Beautiful trees on unstable ground. Notes on the data problem in lexicostatistics”. In: Die Ausbreitung des Indogermanischen. Thesen aus Sprachwissenschaft, Archäologie und Genetik. Hrsg. von H. Hettrich. Wiesbaden: Reichert. Gray, R. D. und Q. D. Atkinson (2003). “Language-tree divergence times support the Anatolian theory of Indo-European origin”. In: Nature 426.6965, 435–439. Gudschinsky, S. C. (1956). “Three Disturbing Questions concerning Lexicostatistics”. In: International Journal of American Linguistics 22.3, 212–213. JSTOR: 1264017. Hirt, H. (1905). Die Indogermanen. Ihre Verbreitung, ihre Urheimat und ihre Kultur. Bd. 1. Strassburg: Trübner. Internet Archive: dieindogermaneni01hirtuoft. Hoijer, H. (1956). “Lexicostatistics. A critique”. In: Language 32.1, 49–60. JSTOR: 410652. Meillet, A. (1922 [1908]). Les dialectes Indo-Européens. Paris: Librairie Ancienne Honoré Champion. Internet Archive: lesdialectesindo00meil. Morrison, D. A. (2011). An introduction to phylogenetic networks. Uppsala: RJR Productions. Nicholaev, S. (2007). Indo-European etymology. Available online: http://starling.rinet.ru/. Rea, J. A. (1973). “The Romance data of pilot studies for glottochronology”. In: Diachronic, areal and typological linguistics. Hrsg. von H. M. Hoenigswald und R. H. Langacre. Bd. 11. Current Trends in Linguistics. The Hague; Paris: Mouton, 355–367. Sankoff, D. (1969). “Historical linguistics as stochastic process”. (A thesis submitted to the Faculty of Graduate Studies and Research in partial fulfillment of the requirements for the degree of Doctor of Philosophy). Diss. Montreal: McGill University. Schleicher, A. (1853a). “Die ersten Spaltungen des indogermanischen Urvolkes”. In: Allgemeine Monatsschrift für Wissenschaft und Literatur, 786–787. – (1853b). “O jazyku litevském, zvlástě na slovanský. Čteno v posezení sekcí filologické král. České Společnosti Nauk dne 6. června 1853.” In: Časopis Čsekého Museum 27, 320–334. – (1861). Compendium der vergleichenden Grammatik der indogermanischen Sprache. Bd. 1: Kurzer Abriss einer Lautlehre der indogermanischen Ursprache, des Altindischen (Sanskrit), Alteranischen (Altbaktrischen), Altgriechischen, Altitalischen (Lateinischen, Umbrischen, Oskischen), Altkeltischen (Altirischen), Altslawischen (Altbulgarischen), Litauischen und Altdeutschen (Gotischen). Weimar: Böhlau. Schmidt, J. (1872). Die Verwantschaftsverhältnisse der indogermanischen Sprachen. Weimar: Hermann Böhlau. Swadesh, M. (1950). “Salish internal relationships”. In: International Journal of American Linguistics 16.4, 157–167. JSTOR: 1262898. – (1952). “Lexico-statistic dating of prehistoric ethnic contacts. With special reference to North American Indians and Eskimos”. In: Proceedings of the American Philosophical Society 96.4, 452–463. JSTOR: 3143802. – (1955). “Towards greater accuracy in lexicostatistic dating”. In: International Journal of American Linguistics 21.2, 121–137. JSTOR: 1263939. Čelakovský, F. L. (1853). Čtení o srovnavací mluvnici slovanské. Prague. 8 65 4 Rekonstruktion Johann-Mattisvon List Sprachbeziehungen Nachweis von Sprachverwandtschaft 21.02.2013 Nachweis von Sprachverwandtschaft 1 Allgemeines 1.1 Das Grundproblem Historische Linguisten würden am liebsten den ganzen Tag Sprachen vergleichen und Ursprachen rekonstruieren. Das Problem dabei ist aber, dass man als historischer Linguist nicht wild drauf los vergleichen darf, sondern nur solche Sprachen vergleichen sollte, von denen man weiß, dass sie miteinander verwandt sind. Daher stellt sich für jeden historischen Linguisten das Problem, nachweisen zu müssen, dass zwei oder mehr Sprachen tatsächlich miteinander verwandt sind. Dieses Grundproblem des Nachweises von Sprachverwandtschaft wird in der historischen Linguistik auf sehr unterschiedliche Weise angegangen. Nach wie vor herrscht keine Einigkeit darüber, wie der Verwandtschaftsbeweis tatsächlich erbracht werden sollte. Die Diskussion über die Unterschiedlichen Indizien, die als Beweismittel angeführt werden, nimmt zuweilen Formen von Grabenkämpfen an. Warum kann ein historischer Linguist nicht einfach drauf los vergleichen? Warum muss überhaupt erst nachgewiesen worden sein, dass die Sprachen, die verglichen werden, auf einen gemeinsamen Vorgänger zurückgehen? 1.2 Historisches Der im Zusammenhang mit Sprachverwandtschaftsnachweisen meistzitierte Forscher ist wohl Sir William Jones (1746 – 1794), der in Indien tätig war, wo er mit dem Sanskrit in Berührung kam und auf dessen überraschende Ähnlichkeit mit dem Griechischen und Lateinischen aufmerksam wurde. In dem Third anniversary discourse, on the Hindus aus dem Jahre 1786 liest sich dies wie folgt: The Sanscrit language, whatever be its antiquity, is of a wonderful structure; more perfect than the Greek, more copious than the Latin, and more exquisitely refined than either, yet bearing to both of them a stronger affinity, both in the roots of verbs and the forms of grammar, than could possibly have been produced by accident; so strong indeed, that no philologer could examine them all three, without believing them to have sprung from some common source, which, perhaps, no longer exists. (Jones 1798: 422f) Obwohl Jones oft als „Entdecker des Indogermanischen” gepriesen wird, war er keineswegs der erste, dem die Ähnlichkeiten zwischen Sanskrit und den europäischen Sprachen auffiel. Der Italiener Filippo Sassetti (1540 – 1588) zum Beispiel hatte bereits 200 Jahre vor Jones darauf hingewiesen, dass es auffällige Ähnlichkeiten zwischen dem Sanskrit und dem Italienischen gebe: Alles Wissenschaftliche ist in einer Sprache verfasst, die sie „Sanscruta” nennen, was soviel heißt wie „gut artikuliert”. Unsere Sprache hat viele Gemeinsamkeiten mit dieser, darunter viele unserer Wörter, insbesondere die Zahlen 6, 7, 8, und 9, „Gott”, „Schlange”, und viele andere. (Sassetti 1855: 415)1 1 Meine Übersetzung, Originaltext: „Sono scritte le loro scienze tutte in una lingua, che dimandano Sanscruta, che vuol dire bene articolata. [...] et ha la lingua d’oggi molte cose comuni con quella, nella quale sono molti de’nostri nomi, e particularmente de’numeri il 6, 7, 8 e 9, Dio, serpe, et altri assai.” 1 66 Johann-Mattis List Nachweis von Sprachverwandtschaft 21.02.2013 Woran Sassetti dabei dachte, waren Ähnlichkeiten zwischen Wörtern, wie sie in der folgenden Tabelle wiedergegeben sind: Sanscruta Italienisch Sanscruta Italienisch Sanscruta Italienisch sarpáserpe deváDio saptásette s s d d s s a ɛ e i a ɛ r r v p - p p a o t tː a ə a ə Was genau fällt auf beim Betrachten der Wortpaare, die Sassetti als Beispiele anführte, und den Ausführungen von Jones? Worauf genau fußt das, was als "Beweis" der Verwandtschaft angeführt wird? 2 Probleme 2.1 Zirkularität Ein grundlegendes und vieldiskutiertes Problem des Verwandtschaftsbeweises ist das Problem der Zirkularität. Georg von der Gabelentz (1840 – 1893) fasst dieses wie folgt zusammen: Es leuchtet ein, dass man, solange man nur sprachgeschichtliche Zwecke verfolgt, nur genetisch verwandte Sprachen miteinander vergleichen darf. Und umgekehrt ist es einleuchtend, dass der Beweis der Verwandtschaft, wo er nöthig ist, nur im Wege der Vergleichung geführt werden kann. So scheint es, als drehten wir uns im Kreise. In der That ist aber die vergleichende Arbeit, die nur die Familienzugehörigkeit erweisen will, summarisch im Gegensatze zu jenen minutiösen Untersuchungen, die die innere Sprachgeschichte erheischt. Zudem ist jene Arbeit die vorbereitende, und schon darum muss sie zuerst betrachtet werden. (Gabelentz 1891: 150) Moment mal: Zirkularität ist uns doch auch schon früher begegnet, aber wo nur? Und was genau schlägt Gabelentz jetzt eigentlich vor, um dieses Problem zu umgehen? 2.2 Comparanda Neben dem Problem der Zirkularität stellt insbesondere auch das Problem der Wahl der Comparanda eines der Hauptprobleme beim Nachweis von Sprachverwandtschaft dar. Gabelentz lässt uns diesbezüglich wissen: Dass der Wolf zum Hundegeschlechte gehört, lehrt uns ein einziger Blick. Dass aber die Blindschleiche nicht eine Schlange, sondern eine Eidechsenart ist, erfahren wir erst, wenn wir dem Thiere die Haut abstreifen und es anatomisch untersuchen. Beiderlei kommt auch in der Sprachenwelt vor, nur dass hier noch viel öfter die Verwandtschaftsmerkmale unter der Haut zu suchen sind. (ebd.: 151) Alles schön und gut, Sprachverwandtschaft liegt Haut, wie Gabelentz sagt. Aber was sind den jetzt vergleichbare Comparanda in der Linguistik, und wie Sprachen aufschneiden, um ihnen unter die Haut zu unter der bitteschön können wir schauen? 2 67 4 Rekonstruktion Johann-Mattisvon List Sprachbeziehungen Nachweis von Sprachverwandtschaft 21.02.2013 2.3 Monogenese oder Polygenese Ein großer Streitpunkt war im Laufe der Geschichte schon immer die Frage nach dem Ursprung der Sprache, die, um hipper zu klingen, heute zuweilen auch als die Frage nach der „Evolution von Sprache” (evolution of language) gestellt wird. Viele Arbeiten, die die Wörter „Evolution” und „Sprache” im Titel haben, beschäftigen sich mit ebendieser Frage. Zuweilen gibt es Probleme aufgrund dieser Terminologie, da auch etwas hippere historische Linguisten anfangen, von „Sprachevolution” zu reden, darunter jedoch eigentlich die innere oder äußere Sprachgeschichte, also die Frage der genealogischen Sprachklassifikation oder die Frage des Sprachwandels, verstehen. Die grundsätzliche Frage bezüglich des Sprachursprungs ist die, ob Sprache nur einmal, oder an mehrmals und unabhängig voneinander entstanden ist: Woher noch immer die Menge der Sprachstämme? und woher die grosse Menge der Sprachen, die noch keinem bekannten Stamme zugeordnet sind? War es wirklich so, wie Manche glauben, dass an mehreren Orden der Erde, unabhängig von einander sich sprachlose Anthropoiden zu sprachbegabten Menschen entwickelt haben? [...] Wie aber, wenn jene Anderen Recht hätten, die da annehmen, die sprechende Menschheit, also auch die menschliche Sprache habe sich aus einer ursprünglichen Einheit differenziert? (Gabelentz 1891: 151) Wie immer dem auch sein mag, ob also eine Monogenese oder eine Polygenese für den Sprachursprung zutreffen mag, Linguisten haben die Frage strenggenommen schon sehr früh dergestalt entschieden, dass sie fortan nicht wieder gestellt werden darf. Und zwar bereits im Jahre 1866, in dem die Statuten der Zeitschrift der linguistischen Gesellschaft von Paris genau dies zum Ausdruck brachten: Die Gesellschaft lässt keine Art von Mitteilungen – weder bezüglich des Ursprungs von Sprache, noch bezüglich der Schaffung einer Universalsprache – zu. (Société de Linguistique de Paris 1871: „Statuts”, III)2 Schön und gut, aber was soll das Problem des Sprachursprungs jetzt eigentlich mit dem Problem des Nachweises von Sprachverwandtschaft zu tun haben? Sind das nicht zwei verschiedene Tassen Tee? 3 Lösungsansätze 3.1 Ähnlichkeiten Genealogische und kontaktinduzierte Ähnlichkeiten Das erste Teilproblem, das im Rahmen des Nachweises von Sprachverwandtschaft gelöst werden muss, ist das der Indizien. Grundlegend gilt hier, dass nur Ähnlichkeiten zwischen Sprachen als Indizien in Frage kommen können. Ferner gilt auch, dass nicht alle Ähnlichkeiten zwischen Sprachen aufgrund von Sprachverwandtschaft entstanden sind, wie wir rasch feststellen können, wenn wir uns noch mal den Entscheidungsbaum aus Sitzung 5 in Erinnerung rufen: 2 Meine Übersetzung, Originaltext: „La Société n’admet aucune communication concernant, soit l’origine du langage, soit la création d’une langue universelle.” 3 68 Johann-Mattis List Nachweis von Sprachverwandtschaft 21.02.2013 similarities coincidental Grk. θεός Spa. dios “god” non-coincidental natural non-natural Chi. māma Ger. Mama genealogical contact-induced “mother” Eng. tooth Eng. mountain Ger. Zahn Fre. montagne “tooth” “mountain” Warum ist es so viel schwieriger, nicht-natürliche Ähnlichkeiten auseinanderzuhalten, als nicht-zufällige, oder zufällige? Skala der Entlehnbarkeit Das Problem des Nachweises von Sprachverwandtschaft ist, dass, während natürliche und zufällige Ähnlichkeiten relativ leicht von den nicht-natürlichen zu unterscheiden sind, die nicht-natürlichen Ähnlichkeiten selbst nicht eindeutig voneinander getrennt werden können. Sprachverwandtschaft liegt nur dann vor, wenn die Ähnlichkeiten aus der Verwandtschaft resultieren, nicht hingegen, wenn sie die Folge von Sprachkontakt sind. Leider gibt es diesbezüglich keine absoluten Universalien, es lassen sich jedoch gewisse grundlegende Tendenzen aufzeigen, die in den meisten Fällen verlässlich sind. So schlägt Aikhenvald (2006: 5) beispielsweise die folgende Skala vor: more similar to genetic relatives inflectional (or core) morphology (form/function) core lexicon syntactic construction types discourse structure structure of idioms more similar to neighbouring languages Moment mal, was war noch mal das "core lexicon"? Irgendwie klingt das komisch vertraut… 1 3.2 Grabenkämpfe Die Frage nach den „richtigen” Ähnlichkeiten für den Nachweis von Sprachverwandtschaft führte zu einem regelrechten Grabenkampf in der historischen Linguistik, der sich um die 4 69 4 Rekonstruktion Johann-Mattisvon List Sprachbeziehungen Nachweis von Sprachverwandtschaft 21.02.2013 Frage zündete, welche Teile des sprachlichen Systems als Grundlage für den Nachweis von Sprachverwandtschaft eigentlich in Frage kämen. In diesem Zusammenhang stehen sich nachwievor zwei Lager in hasserfüllter Rivalität gegenüber: das Lager der „Grammatikalisten”, die der Ansicht sind, dass Sprachverwandtschaft nur durch „Grammatik” (oder vielmehr paradigmatische Morphologie als Spezialfall von Grammatik) nachgewiesen werden kann, und das Lager der „Lexikalisten”, welche der Ansicht sind, Grammatik sei für den Nachweis von Sprachverwandtschaft weniger bedeutsam als durch Lautkorrespondenzen abgesicherte Entsprechungen (nachgewiesene Kognaten) in stabilen Teilen des Lexikons. In den traditionell stark vertretenen Disziplinen der historischen Sprachwissenschaft (insbesondere der Indogermanistik) überwiegt dabei die Zahl derer, welche nur, oder vorwiegend, grammatische Evidenz als Nachweis von Sprachverwandtschaft einfordern und gestatten. Die beiden unten wiedergegebenen Zitate aus einem Aufsatz von Dybo und Starostin nennen zwei offensichtliche Gründe, die für die Grammatik als Grundlage des Nachweises von Sprachverwandtschaft zu sprechen scheinen. Welche sind das? One major reason for this is historical: it is no big secret that the Indo-European family was recognized primarily on the basis of the amazing similarity between the paradigmatic systems of Old Indian and classic European languages like Greek or Latin, and, since the general methodology of comparative linguistics grew out of working with Indo-European languages, morphological comparison, by the very force of tradition, is still held in high esteem and frequently suggested as a universal means for establishing relationship. (Dybo und Starostin 2008: 124f) Another reason lies in the intuitive sphere. Morphology (and grammar in general) is traditionally seen as the “skeleton” of the language, its main constituent which, in comparison with lexics that “comes and goes”, is relatively stable and thus far more valid for the first stage of comparison. Thus, if the languages compared do not seem to share much common morphology, but are nevertheless quite close lexically, for many linguists the obvious explanation will be that the languages are not related, but show traces of extensive contacts (“convergence”). (ebd.: 125) Die Grammatikalisten Gewöhnlich gilt in der Indogermanistik Franz Bopp (1791 – 1867) mit seinem 1816 erschienenen Buch „Über das Conjugationssystem der Sanskritsprache, in Vergleichung mit jenem der griechischen, lateinischen, persischen und germanischen (insbesondere gothischen) Sprache” als Begründer des Verfahrens zum grammatischen Nachweis von Sprachverwandtschaft. „Während vorher Vermutungen nur durch einzelne Wortvergleiche gestützt waren, erfolgte Bopps Nachweis der Verwandtschaft über den Vergleich der Grammatik” (Meier-Brügger 2002: 12). Der prägende Einfluss auf die Indogermanistik und auch Teile der allgemeinen historischen Sprachwissenschaft stammt jedoch von Antoine Meillet (1866 – 1936), der sich in seinem Buch „La méthode comparative en linguistique historique” aus dem Jahre 1925 betont, dass der Nachweis von Sprachverwandtschaft vorwiegend auf grammatischen Ähnlichkeiten zwischen Sprachen beruhen sollte. 5 70 Johann-Mattis List Nachweis von Sprachverwandtschaft 21.02.2013 In einem neueren Artikel, der bewusst auf den Aussagen Meillets aufbaut, prägte Nichols (1996) als moderne Vertreterin der Grammatikalisten den Begriff der „individuellidentifizierenden Evidenz” (individual-identifying evidence) als oberstem Kriterium für den Nachweis von Sprachverwandtschaft. Gemeint ist damit „evidence that identifies a unique individual proto-language rather than [...] evidence that identifies a set of languages or a type of language” (ebd.: 48), also Evidenz, die nicht typologishcer sondern sehr spezifischer Natur ist, die also auf eine Ursprache mit individuellen Strukturen verweist und nicht auf eine Sprachen mit bestimmten typologischen Eigentschaften. Diese Evidenz ist laut Nichols „primarily grammatical and includes morphological material with complex paradigmatic and syntagmatic organization” (ebd.: 41). Unten ist ein Zitat von Meillet wiedergegeben, in dem er erläutert, worin die Beweiskraft grammatischer Indizien besteht. Worin genau besteht das, was Meillet als "grammatische Korrespondenzen" bezeichnet? Kann man die Wortgleichungen Deutsch gut, besser, (am) best(en) [guːt, bɛsər, bɛst] = Englisch good, better, best [gʊd, bɛtər, bɛst] als Beispiel für diese Art von Evidenz ansehen? Welche Schwachstellen hat die grammatikalistische Position? Grammatical correspondences are proof, and only they are rigorous proof, provided one makes use of the material detail of the forms and that it is established that particular grammatical forms used in the languages under consideration go back to a common source. (Meillet 1925, Übersetzung übernommen von Nichols 1996: 47) Die Lexikalisten Im Gegensatz zum offiziellen Mantra der Indogermanistik, dass Sprachverwandtschaft nur auf Basis von Grammatik (also paradigmatischer Morphologie) nachgewiesen werden könnte, ist es interessant, sich die Argumentationen einiger prominenter Vertreter der Disziplin ein wenig genauer anzuschauen. In vielen Fällen, in denen von Sprachverwandtschaft die Rede ist, wird nämlich gerade nicht paradigmatische Morphologie als Indiz für diese angeführt, sondern lexikalische Entsprechungen, die durch reguläre Lautkorrespondenzen abgesichert sind. Obwohl in der Indogermanistik allgemein die Annahme vorherrscht, dass nur paradigmatische Morphologie tatsächlich den Nachweis von Sprachverwandtschaft erbringen könne, findet man doch in den Argumentationen verschiedenster Grammatikalisten immer wieder Verweise auf lexikalische Übereinstimmungen, die als (zusätzliche) Indizien für Sprachverwandtschaft angeführt werden. Das gesamte Verfahren der linguistischen Rekonstruktion schließlich, beruht zum großen Teil auf lexikalischen Gleichungen. Man kann davon ausgehen, dass - wenn zwei Sprachen erwiesenermaßen miteinander verwandt sind - immer auch lexikalische Entsprechungen gefunden werden können. Der Grund, warum lexikalische Evidenzen von den Grammatikalisten verworfen werden, besteht darin, dass das Lexikon üblicherweise als der instabilste Teil von Sprachen angesehen wird. Wörter lassen sich leicht entlehnen, werden durch andere ersetzt, oder verschwinden völlig aus dem Wortschatz. Dem Misstrauen in das Lexikon als tragfähigen Indizienlieferanten für Sprachverwandtschaftsnachweise stellen Vertreter der Lexikalisten das Konzept des Basisvokabulars gegenüber. Grundannahme ist dabei, dass es „einige Bereiche der Lexik [gibt], in denen Entlehnung fast unmöglich ist, bspw. Pronomen, Be- 6 71 4 Rekonstruktion Johann-Mattisvon List Sprachbeziehungen Nachweis von Sprachverwandtschaft 21.02.2013 zeichnungen für Körperteile, Verwandtschaftsbeziehungen, wichtige Naturerscheinungen, einige häufig verwendete Verben und Adjektive” (Jachontov 1965: 14).3 Das Konzept des Basisvokabulars wird traditionell mit dem Namen von Morris Swadesh (1909 -- 1967) in Verbindung gebracht (vgl. die vorherige Sitzung). Welche der Konzepte HAND, FRIDGE, FOOT, NOSE, SUN, SNOW, STONE, SUNDAY und EXCREMENT gehören wohl eher zum Basisvokabular, welche nicht, und warum? Wer hat Recht? Am Ende haben wahrscheinlich beide Lager ein bisschen Recht: Nichols (1996) liegt sicher richtig, wenn sie betont, dass Suppletiv-Paradigmen mitunter mehr Überzeugungskraft besitzen als einfache Paare von Lexemen. Dybo und Starostin (2008) haben aber sicherlich auch Recht, wenn sie betonen, dass es oftmals die lexikalischen Entsprechungen sind, die zum Nachweis von Sprachverwandtschaft angeführt werden, und dass ganz ohne diese wohl auch schwer nachzuweisen wäre, dass zwei Sprachen wirklich verwandt sind. Was von den meisten Diskutanten in diesem Zusammenhang leider übersehen wird, ist, dass die Trennung in das grammatische und das lexikalische Lager an sich gar nicht vollzogen wird, denn auch der „grammatische Nachweis” der Sprachverwandtschaft setzt ja voraus, dass Lautkorrespondenzen ermittelt werden können. Allein die Tatsache, dass eine Sprache ein suppletives Komparationsparadigma für ein Wort mit der Bedeutung „gut” aufweist, genügt nicht. Nur im Zusammenhang mit den nachweisbaren Lautkorrespondenzen erlangt es unmittelbare Beweiskraft. Anstelle der leidigen Unterscheidung von grammatischen und lexikalischen Indizien kann daher meines Erachtens der Nachweis von „systematisch-funktionalen” Ähnlichkeiten als Grundlage für den Nachweis von Sprachverwandtschaft angesehen werden. Unter „systematisch-funktional” wird dabei verstanden, dass die Ähnlichkeiten einerseits auf einem Vergleich ganzer (Teil-)Systeme von Sprachen beruhen, und andererseits als funktionale Entsprechungen (also ähnlich in Bezug auf das „Funktionieren” sprachlicher Elemente) aufgezeigt werden können. Konkret sind damit vorwiegend regelmäßige Lautkorrespondenzen in kognaten Wörtern und Morphemen gemeint. Das lässt sich in etwa wie folgt zusammenfassen: Systematische Ähnlichkeiten: Als Folge regelmäßigen Lautwandels lassen sich bis zu einer gewissen Zeittiefe systematische Ähnlichkeiten im Lexikon miteinander verwandter Sprachen auffinden. Systematisch impliziert hierbei, dass die Ähnlichkeiten sprachspezifisch sind. Reguläre Lautkorrespondenzen: Die grundlegenden Sprachspezifischen Ähnlichkeiten, welche nachweisbar sind, sind sich funktional entsprechende Laute im lexikalischen System miteinander verwandter Sprachen. Funktional meint hierbei, dass die einander entsprechenden Laute in den jeweiligen Systemen die gleiche distinktive Funktion innehaben. Sie dienen also auf ähnliche Weise der Bedeutungsunterscheidung, insofern als sie in ähnlichen Positionen in kognaten Wörtern auftauchen. Eine substantielle Ähnlichkeit der Lautsegmente ist dabei nicht zwingend erforderlich, auch wenn sich korrespondierende Lautsegmente in nah miteinander verwandten Sprachen meist auch substantiell ähneln. 3 Meine Übersetzung, Originaltext: „[Но есть] некоторые области лексики, где заимствования почти невозможны, например: местоимения, названия частей тела, родственных отношений, важнейших явлений природы, некоторые наиболее употребительные глаголы и прилагательные и т. п.” 7 72 Johann-Mattis List Nachweis von Sprachverwandtschaft 21.02.2013 Kognaten: Können reguläre Lautkorrespondenzen für zwei oder mehr Sprachen nachgewiesen werden, lassen sich zwangsläufig auch Kognaten identifizieren. Kognaten sind Wörter, die von den Sprachen aus einer gemeinsamen Vorgängersprache geerbt wurden. Kognaten lassen sich nur mit Rückgriff auf reguläre Lautkorrespondenzen nachweisen, jedoch sind die Lautkorrespondenzen keine zwingende Voraussetzung dafür, dass zwei Wörter kognat sind, denn die Sprachen könnten sich auch so weit auseinanderentwickelt haben, dass keine Kognazität mehr nachgewiesen werden kann. In diesem Falle kann eine Sprachverwandtschaft jedoch auch nicht mehr nachgewiesen werden. In der Indogermanistik wird oft betont, dass Sprachverwandtschaft nicht die beste, sondern die einzige Erklärung für die gegebenen Indizien sei. Inwiefern ist dies problematisch und woran mag es liegen, dass gerade dies in der historischen Linguistik so oft betont wird? Literatur Aikhenvald, A. Y. (2006). “Grammars in contact. A cross-linguistic perspective”. In: Grammars in contact. Hrsg. von A. Y. Aikhenvald und R. M. W. Dixon. Oxford: Oxford University Press, 1–66. Dybo, A. und G. Starostin (2008). “In defense of the comparative method, or the end of the Vovin controversy”. In: Aspekty komparativistiki. Bd. 3. Hrsg. von I. S. Smirnov. Orientalia et Classica XI. Moscow: RGGU, 119–258. PDF: http : / / starling . rinet . ru / Texts/compmeth.pdf. Gabelentz, H. G. C. (1891). Die Sprachwissenschaft. Ihre Aufgaben, Methoden und bisherigen Ergebnisse. Leipzig: T. O. Weigel. Internet Archive: diesprachwissen00gabegoog. Jachontov, S. E. (1965). Drevnekitajskij jazyk [Old Chinese]. Moscow: Nauka. Jones, W. (1798). “The third anniversary discourse, delivered 2 February, 1786, by the president. On the Hindus”. In: Asiatick Researches: or, Transactions of the Society Instituted in Bengal for Inquiring into the History and Antiquities, the Arts, Sciences, and Literature, of Asia 1, 415–431. Google Books: iSsoAAAAYAAJ. Meier-Brügger, M. (2002). Indogermanische Sprachwissenschaft. Unter Mitarb. von M. Fritz und M. Mayrhofer. 8. Aufl. Berlin und New York: de Gruyter. Meillet, A. (1925). La méthode comparative en linguistique historique. Oslo und Leipzig: Aschehoug. Nichols, J. (1996). “The comparative method as heuristic”. In: The comparative method reviewed. Regularity and irregularity in language change. Hrsg. von M. Durie. Mit einer Einl. von M. D. Ross und M. Durie. New York: Oxford University Press, 39–71. Sassetti, P. (1855). “Lettere edite e inedite di Filippo Sassetti: Raccolte e annotate da Ettore Marcucci”. In: Google Book Search. “Statuts” (1871). “Statuts. Approuvés par décision ministérielle du 8 Mars 1866”. In: Bulletin de la Société de Linguistique de Paris 1, III–IV. 8 73 4 Rekonstruktion von Sprachbeziehungen Johann-Mattis List Übungen 21.02.2013 Mikronesische Sprachen (V. I. Belikov)¹ 1 Ausgangspunkt Die karolinischen Inseln gehören zu Mikronesien. Zu diesen gehören, u. a., die Inseln Voleai, Puluvat, Satava, Sonsorol, Truk und Uliti. Diese Gruppe von Inseln bewohnen die Nachfolger eines ehemals einheitlichen Volkes, welche einander nah verwandte Sprachen sprechen. In diesen Sprachen gibt es selbstverständlich viele gemeinsame Wörter. Unten werden die Prozente der gemeinsamen Wörter für einige Sprachen aufgezeigt, die von den Bewohnern der sechs genannten Inseln gesprochen werden. Voleai Puluvat Sataval Sonsorol Truk Uliti 70-80 60-70 60-70 60-70 50-60 Truk 60-70 70-80 70-80 50-60 Sonsorol 50-60 50-60 50-60 Sataval 70-80 70-80 Puluvat 60-70 Gegeben ist ferner ein Fragment einer Karte dieses Gebietes. Auf ihm sind die Namen der Inseln Voleai, Puluvat, Sonsorol und Truk durch Ziffern von 1 bis 4 ersetzt worden. Außerdem sind die Namen dreier weiterer Inseln (darunter auch die Insel Sataval) mit Lateinischen Buchstaben A,B und C ersetzt worden. 2 Aufgaben • Finden Sie heraus, welche Inselns ich hinter den Ziffern von 1 bis 4 verbergen. • Finden sie heraus, mit welchem lateinischen Buchstaben die Insel Sataval kodiert wurde. References B ,S A ’ ,&S A ’ S koznanie. Moskva: Akademia, ucebnoe izd. edition. ¹Aufgabe aus: Burlak & Starostin 2005, 404f, meine Übersetzung 1 74 . 2005. Sravnitel’no-istoričeskoe jazy- 5 Zukunftsmusik Zwei weitere Punkte, die in der historischen Linguistik eine große rolle spielen, aber selten beachtet wurden, werden noch erwähnt: die quantitative Behandlung semantischen Wandels, und die automatische Erkennung von Lehnwörtern. 75 5 Zukunftsmusik Johann-Mattis List Bedeutungswandel 22.02.2012 Quantitative Aspekte von Bedeutungswandel 1 Bedeutungsprobleme 1.1 Was ist Bedeutung? Bedeutung für Sprachforscher Die Aufgabe, die Bedeutung eines Wortes festzustellen, mag für den Logiker besagen: seinen begrifflichen Inhalt möglichst genau erfassen und abgrenzen, eine Definition liefern, die nach altbewährtem Rezept die übergeordnete Art und die unterscheidenden Merkmale angibt. Für den Sprachforscher bedeutet sie etwas anderes und in der Regel weit Schwierigeres, denn er ist schon hier, wie in allen weiteren Stadien seiner Arbeit, genötigt, neben den klar erfaßbaren logischen auch psychologische Faktoren von oft schwer greif- und wägbarer Natur in Betracht zu ziehen. (Sperber 1923: 1) Ungeachtet der Tatsache, ob Sperber Recht hat, oder nicht. Wenn man an einen dieser unheimlich berühmten Sätze von Saussure denkt, sollte es eigentlich leicht sein, zu sagen, worin der Unterschied zwischen der Bedeutung eines Wortes in der Logik und der Bedeutung eines Wortes in der Linguistik besteht. Welcher Satz ist gemeint? Wenn Bedeutung allein keinen Sinn mehr macht Bedeutung ist nicht alles... „Worte sind Zeichen für Begriffe.” Dieser Satz bedarf – wie schon dargelegt – in mehr als einer Hinsicht der Einschränkung. Aber auch wenn man den Sinn des Wortes „Begriff” so weit faßt wie nur irgend möglich, giebt der Satz keinesfalls eine erschöpfende Definition. Worte sind noch anderes und mehr als Zeichen für Begriffe. Sie enthalten Werthe, die nichts mit dem zu schaffen haben, was wir bisher an den Wortbedeutungen beachtet und untersucht haben; Werthe, auf denen gerade die feinsten Wirkungen der Sprache beruhen. Es empfielt sich, sie von dem gewöhnlichen, dem begrifflichen Wortsinne abzusondern und ihm gegenüber zu stellen. (Erdmann 1900: 78) Sinn macht Bedeutung Es liegt nun nahe, mit einem Zeichen (Namen, Wortverbindung, Schriftzeichen) außer dem Bezeichneten, was die Bedeutung des Zeichens heißen möge, noch das verbunden zu denken, was ich den Sinn des Zeichens nennen möchte, worin die Art des Gegebenseins enthalten ist. Es würde danach in unserm Beispiele zwar die Bedeutung der Ausdrücke „der Schnittpunkt von a und b” und „der Schnittpunkt von b und c” dieselbe sein, aber nicht ihr Sinn. Es würde die Bedeutung von „Abendstern” und „Morgenstern” dieselbe sein, aber nicht der Sinn. (Frege 1892: 26f) Bedeutung hat Hintersinn Um eine bequeme Verständigung zu erzielen, wird es sich empfehlen, wie ich schon andeutete, scharf zwischen dem begrifflichen Inhalt und der Gesammtbedeutung des Wortes zu unterscheiden; zwischen dem begrifflichen Inhalt, der alle objectiven Merkmale einschließt, und der allgemeinen Wortbedeutung, die außer dem Begriff noch alle anderen Werthe enthält, die das Wort zum Ausdruck bringt. Diese Werthe sondere ich also von der Wortbedeutung ab, stelle sie dem Begriff gegenüber und fixiere sie sprachlich als „Nebensinn” und „Gefühlswerth” (Stimmungsgehalt). Nach dieser Auffassuns- und Ausdrucksweise ist es dann eindeutig zu sagen, dass Leu und Löwe 1 76 Johann-Mattis List Bedeutungswandel 22.02.2012 einerseits und Hose und Beinkleid andererseits Worte von verschiedener Bedeutung aber gleichem begrifflichen Inhalt seien. (Erdmann 1900: 80) Die oben wiedergegebenen Zitate stehen repräsentativ für typische Debatten, die in der Semantik geführt wurden und immer noch geführt werden. Welche Debatten verbergen sich hinter den letzten beiden Zitaten und mit welchen Termini würde man das, was dort gesagt wird, heute bezeichnen? 1.2 Mehrdeutigkeit Zunächst gehören hierher alle die fälle, in denen die lautliche übereinstimmung bei verschiedenheit der bedeutung nur auf zufall beruht, wie bei nhd. acht = diligentia [Aufmerksamkeit] – proscriptio [Bann]– octo [acht]. [...] lautlich besteht [...] identität, und derjenige, welcher einen solchen lautcomplex ausser zusammenhang aussprechen hört, hat kein mittel zu erkennen, welche von den verschiedenen damit verknüpften bedeutungen der sprechende im sinne hat. [...] Wirkliche mehrheit von bedeutungen muss man aber auch in sehr vielen fällen anerkennen, wo nicht bloss lautliche, sondern auch etymologische identität besteht. Man vergleiche z.b. nhd. fuchs vulpes – pferd von fuchsiger farbe – rothaariger mensch – schlauer mensch – goldstück – student im ersten semester, boc hircus – bock der kutsche – fehler, futter pabulum – überzug oder unterzug, [...]. In den meisten der angeführten fälle ist es ohne geschichtliche studien überhaupt nicht möglich den ursprünglichen zusammenhang zwischen den einzelnen bedeutungen zu erkennen, und dieselben verhalten sich dann gar nicht anders zu einander, als wenn die lautliche identität nur zufällig wäre. (Paul 1880[1886]: 68) Die folgenden Beispielsätze sind mehrdeutig, wobei die Mehrdeutigkeit jeweils auf die Mehrdeutigkeit eines Lexems zurückzuführen ist. Identifiziere das mehrdeutige Wort in den Sätzen und charakterisiere es mit Hilfe der Termini "Polysemie", "Homonymie", "Homophonie", "Homographie" und "Vagheit". 1. ER SCHEINT DAS HINDERNIS UMFAHREN ZU WOLLEN. 2. ER IST AN DER RUHR ERKRANKT. 3. HAST DU DIE ARME GESEHEN? 4. HAST DU DIE FLIEGEN GESEHEN? 5. ICH HAB EIN NEUES SCHLOSS. 6. ER HATTE LEIDER KEINE STIMME MEHR. 7. MEIN OPA WAR SEHR STRENG. 8. DAS WIRD ZU LANG. 9. WAS FÜR EIN DUMMER AUGUST. 10. eːɐ hat aŋst diː fɛlə ʦuː veɐliːɐn 2 77 5 Zukunftsmusik Johann-Mattis List Bedeutungswandel 22.02.2012 2 Bedeutungswandel 2.1 Bedeutungswandel und Lautwandel Während der lautwandel durch eine widerholte unterschiebung von etwas unmerklich verschiedenem zu stande kommt, wobei also das alte untergeht, zugleich mit der entstehung des neuen, ist beim bedeutungswandel die erhaltung des alten durch die entstehung des neuen nicht ausgeschlossen. Er besteht immer in einer erweiterung oder einer verengung des umfangs der bedeutung, denen eine verarmung oder bereicherung des inhalts entspricht. Erst durch die aufeinanderfolge von erweiterung und verengung kann eine von der ursprünglichen völlig verschiedene bedeutung sich bilden. (Paul 1880[1886]: 66) Wir haben bereits in einer früheren Sitzung von den grundliegenden Unterschieden zwischen Bedeutungs- und Lautwandel gesprochen. Worin bestehen diese? Welches waren die Schlagworte, mit denen die unterschiedlichen Prozesse beschrieben wurden? 2.2 Bedeutungswandel und lexikalischer Wandel Wenn es keinen semantischen Wandel gäbe, würden sich die Lexika der Sprachen der Welt nicht ändern und in allen Zeiten gleich bleiben. Wörter würden zwar ihre Form ändern, es würde aber immer eine ungebrochene Tradition identischer Denotation geben. Da dies nicht so ist, wandeln sich die Lexika unserer Sprachen ständig. Wörter gehen verloren, wenn die Sprecher sie nicht mehr verwenden, neue Wörter treten ins Lexikon ein, wenn neue Konzepte geschaffen werden, sei es durch Entlehnung oder durch Neuschöpfung. Diese Prozesse des Worterwerbs (word gain) und des Wortverlustes (word loss) sind sehr häufig und können zuweilen sogar direkt durch die Sprecher einer Sprache bemerkt werden. Der wichtigste Prozess des lexikalischen Wandels ist der Prozess der lexikalischen Ersetzung (lexical replacement). Lexikalische Ersetzung meint den Prozess, durch den ein Wort A, das normalerweise verwendet wird, um eine Bedeutung x auszudrücken, diese Bedeutung nicht weiter ausdrückt, da zur selben Zeit ein Wort B, das zuvor die Bedeutung y ausdrückte, fortan verwendet wird, um die Bedeutung x auszudrücken. Nenne ein Beispiel für den Prozess der lexikalischen Ersetzung. Worin besteht der Unterschied dieses Prozesses zum semantischen Wandel? 2.3 Das ewig Abstrakte zieht uns hinab Sehr häufig entdeckt man, daß einem Wort bloß deshalb ein Bedeutungswandel zugeschrieben wird, weil seine tatsächliche Bedeutung sich nicht oder nicht völlig mit derjenigen deckt, die der etymologische Wortsinn anzudeuten scheint. Z. B. liegt in dem Wort Schneider kein Hinweis darauf, daß das, was der so bezeichnete Handwerker schneidet, gerade zu Kleidern bestimmte Stoffe sein müssen. Es sieht vielmehr ganz so aus, als habe hier ein Wort, das ursprünglich ganz allgemein „Mensch, welcher (etwas beliebiges) schneidet” bedeutete, sekundär eine Einschränkung seines Begriffsumfanges erlitten, die zur Entwicklung seines heutigen engbegrenzten Sinnes führte. Oder: Gewehr bedeutet etymologisch nicht „Handfeuerwaffe von einem bestimmten Typus” sondern „irgendetwas, womit man sich wehrt” usw. ins Unendliche. Schon Paul hat mit Recht darauf hingewiesen, daß in solchen Fällen immer 3 78 Johann-Mattis List Bedeutungswandel 22.02.2012 erst untersucht werden muss, ob die durch die Etymologie angedeutete allgemeinere Bedeutung jemals bestanden hat, oder ob nicht das betreffende Wort vom ersten Augenblick and nur die engere Bedeutung besessen hat, eine Einschränkung seines Begriffsumfanges also gar nicht erfolgt ist. [...] Die erste Bedingung für die Ansetzung eines Bedeutungsübergangs ist doch offenbar, daß mindestens zwei Bedeutungen eine ursprüngliche und eine abgeleitete, im Sprachbewußtsein wirklich vorhanden sind oder waren. Bevor man von einem Bedeutungswandel spricht, muß man sich daher immer zuerst überzeugen, daß nicht die eine dieser Bedeutungen auf einem unbefugten Rückschluß aus dem buchstäblichen Sinn des Wortes beruht. (Sperber 1923: 11f) Wow, wieder ein langes Zitat. Scheint aber wichtig zu sein, wenn der Dozent das in voller Länge abdruckt. Er will wahrscheinlich auf die Indizien hinaus, die erlauben, Bedeutungswandel zu rekonstruieren, also … 3 Netzwerke aus sprachübergreifenden Polysemien Wir könnten uns Fragen, warum wir uns überhaupt mit Bedeutungswandel beschäftigen. Könnte man diese ganze Thematik nicht einfach ignorieren? Nun, von einem allgemeinen Standpunkt her kann sie natürlich ignoriert werden, und zwar dann, wenn wir die historische Linguistik generell als ein unsinniges Betreiben abtun. Wenn wir uns diese Ansicht jedoch nicht zu eigen machen, ist eine genauere Erforschung des semantischen Wandels von großer Bedeutung für die historische Linguistik: Sie hilft uns, wenn wir sie sinnvoll betreiben, im Rahmen der semantischen Rekonstruktion die ursprünglichen Bedeutungen von Wörtern zu rekonstruieren. Sie hilft uns, allgemeine Tendenzen semantischen Wandels zu ermitteln, falls es diese gibt. Und sie kann uns helfen, Kognaten zwischen genetisch verwandten Sprachen auch dort zu identifizieren, wo sich die Bedeutung von Formen gewandelt hat. Moment mal, die Lexikostatistik beruht doch auf dieser Annahme, dass es Basisvokabular gibt, also eine Liste von stabilen Konzepten. In dem Zusammenhang wäre es doch auch wichtig, wenn wir mehr über Bedeutungswandel wüssten, denn dann könnten wir ja … 3.1 Milch und Euter Was haben „Milch” und „Euter” miteinander gemein? Konzeptuell stehen sie in enger Beziehung, da „Milch” das ist, was aus dem „Euter” rauskommt. Auch sprachlich können beide Wörter ähnlich sein, denn in viele Sprachen werden sie durch ein und dieselbe Wortform ausgedrückt. Historisch kann man sich vorstellen, dass die Beziehung zwischen „Milch” und „Euter” als semantischer Wandel auftritt. Im Standardchinesischen ist das Wort [niou³⁵nai²¹⁴] „Milch” beispielsweise ein Kompositum aus [niou³⁵] „Kuh” und [nai²¹⁴] „Milch”, das ursprünglich selbst „Euter” und „Brust” bedeutete. Wie nennt man das Phänomen in der Linguistik, wenn konzeptuell verwandte Bedeutungen in einer Sprache durch dasselbe Wort ausgedrückt werden? Welches Problem ist mit diesem Terminus verbunden? 4 79 5 Zukunftsmusik Johann-Mattis List Bedeutungswandel 22.02.2012 3.2 Polysemie als Indiz für semantischen Wandel Der Terminus Polysemie wurde zuerst von Bréal (1897: 154) verwendet, der dabei explizit betonte, dass Polysemie eine Folge semantischen Wandels sei. Semantischer Wandel wird heute meist als ein Prozess angesehen, der eine polyseme Phase einschließt (Traugott und Dasher 2002). Dies heißt wiederum, das Fälle von Polysemie umgekehrt als Indiz für semantische Wandelprozesse genommen werden können. Natürlich kann man die Wandelprozesse nicht direkt aus Polysemien ablesen, man kann jedoch durch die Suche nach Polysemien diejenigen Konzepte identifizieren, die in konzeptueller Nähe zueinander stehen, weil sie häufig entweder den Ausgangs- oder den Endpunkt von Wandelprozessen darstellen. Die Idee, Polysemien explizit zu verwenden, um einen quantitativen Zugang zum semantischen Wandel zu bekommen, wurde in einer Reihe von Arbeiten von verschiedenen Autoren verfolgt (Croft u. a. 2009, Cysouw 2010, François 2008, Perrin 2010, Steiner u. a. 2011). Diese Darstellung war jetzt ein bisschen unscharf. Was genau verbirgt sich hinter den Ansätzen, die Polysemie als Indiz für semantischen Wandel nehmen? Wie muss man sich das vorstellen? 3.3 Netzwerke Wenn man genug Daten hat, ist es recht einfach, Konzeptnetzwerke aus sprachübergreifenden Polysemien zu rekonstruieren. Alles, was man braucht, sind semantisch alinierte Wortlisten, die in möglichst viele verschiedene Sprachen übersetzt wurden. Wenn wir uns beispielsweise eine Wortliste wie die folgende anschauen, dann fällt auf, dass in dieser Liste zwei „Polysemien” auftauchen, nämlich Russisch derevo „tree + wood” und Deutsch Erde „earth, land + ground, soil”. Wenn wir uns nun ein Netzwerk vorstellen, in dem alle Konzepte in unserer Wortliste Knoten sind, dann können wir Kanten zwischen allen Knoten ziehen, die in einer der Sprachen durch die gleiche Wortform ausgedrückt werden. Das Gewicht dieser Kanten kann ferner bestimmt werden, indem man zählt, wie oft ein bestimmtes Konzeptpaar durch dieselbe Wortform in den Sprachen auf der Wortliste ausgedrückt wird. Key 1.1 1.21 1.212 1.420 1.430 ... Concept world earth, land ground, soil tree wood ... Russian mir, svet zemlja počva derevo derevo ... German Welt Erde, Land Erde, Boden Baum Wald ... ... ... ... ... ... ... ... Gewichte von Kanten werden in Netzwerken durch die Dicke der Kanten visualisiert. Somit ergibt sich für Konzepte rund um ,,Euter" und ,,Milch" beispielsweise unten abgebildete Netzwerk. Worin besteht das prinzipielle Problem des Wortlisten-Ansatzes, wenn man sich die traditionelle Definition von "Polysemie" ins Gedächtnis ruft? 5 80 Johann-Mattis List Bedeutungswandel 22.02.2012 udder nipple, teat breast (of woman) milk (noun) chest 3.4 Netzwerkanalyse Polysemienetzwerke allein bringen wenig, wenn man keine Möglichkeit hat, sie richtig zu analysieren. Denn Polysemienetzwerke können mitunter sehr komplex sein, so dass durch das bloße Betrachten dieser Netzwerke keine neuen Erkenntnisse gewonnen werden können. Die folgende Grafik zeigt beispielsweise ein Netzwerk, das aus der Analyse von 1289 Konzepten, übersetzt in 195 Sprachen aus 44 Sprachfamilien erstellt wurde List u. a. (forthcoming). Sehen kann man in einem solchen Netzwerk nicht viel. Netzwerkanalysen mit Hilfe von speziellen Algorithmen helfen im Falle von Polysemiedaten jedoch, die Struktur von Netzwerken genauer zu analysieren und spezifische Gruppen (sogenannte Communities) zu isolieren, die für die Struktur des Netzwerks bedeutsam sind. Communities sind definiert als „groups of vertices [Knoten] within which the connections are dense but between which they are sparser” (Newman 2004: 4). Eine Analyse des Netzwerks aus List u. a. (forthcoming) mit Hilfe des Algorithmus zur Community-Entdeckung 6 81 5 Zukunftsmusik Johann-Mattis List Bedeutungswandel 22.02.2012 von Girvan und Newman (2002), teilt dieses beispielsweise in 337 Communities auf, wobei 104 relativ groß sind (5 und mehr Knoten), und einen Großteil der Konzepte abdecken (879 von 1289, 68%). Das Schöne an dieser Analyse ist, dass die meisten dieser großen Communities Konzepte auf intuitiv einleuchtende, sinnvolle Art gruppieren. Eine Community, bspw. deckt Bedeutungen ab, die mit der Bedeckung von Körpern zu tun haben („Feder”, „Haar”, „Rinde”, etc.), eine weiter Community deckt Bedeutungen ab, die mit „Lernen” zu tun haben („studieren”, „zählen”, „versuchen”), und eine Community deckt gruppiert Fahrzeuge („Kanu”, „Boot”, „Wagen”). Unten ist eine Community aus dem Netzwerk abgebildet, in der Bedeutungen gruppiert werden, die den Konzepten "Baum" und "Holz" nahe stehen. Was lässt sich durch die Betrachtung des Netzwerkes erfahren? Welche Schlüsse kann man aus dem Netzwerk ziehen, welche nicht? Wie kann man sich die konkrete Verwendung von dieser Art von Netzwerken im Dienste von Algorithmen zur Kognatenerkennung vorstellen? tree stump tree trunk tree doorpost, jamb plant (noun) post, pole beam wood woods, forest firewood rafter shelf club board staff, walking stick table 7 82 Johann-Mattis List Bedeutungswandel 22.02.2012 Literatur Bréal, M. (1897). Essai de sémantique. Science des significations. Paris: Hachette. Internet Archive: essaidesmantiq00bruoft; Englische Übersetzung: – (1900). Semantics. Studies in the science of meaning. A. d. Französischen übers. von H. Cust. Mit einer Einl. von J. P. Postgate. New York: Henry Holt & Company. Internet Archive: semanticsstudie02postgoog. Croft, W., C. Beckner, L. Sutton, T. Wilkins J.and Bhattacharya und D. Hruschka (2009). Quantifying semantic shift for reconstructing language families. Vortrag, gehalten auf der Konferenz “83rd Annual Meeting of the Linguistic Society of America” (San Francisco). Cysouw, M. (2010). “Semantic maps as metrics on meaning”. In: Linguistic Discovery 8.1, 70–95. Erdmann, K. O. (1900). Die Bedeutung des Wortes. Leipzig: Eduard Avenarius. François, A. (2008). “Semantic maps and the typology of colexification: intertwining polysemous networks across languages”. In: From polysemy to semantic change. Hrsg. von M. Vanhove. Amsterdam: Benjamins, 163–215. Frege, G. (1892). “Über Sinn und Bedeutung”. In: Zeitschrift für Philosophie und philosophische Kritik 100, 25–50. Girvan, M. und M. E. Newman (2002). “Community structure in social and biological networks”. In: Proceedings of the National Academy of Sciences of the United States of America 99.12, 7821–7826. List, J.-M., A. Terhalle und M. Urban (forthcoming). “Using network approaches to enhance the analysis of cross-linguistic polysemies”. In: Proceedings of the IWCS. Newman, M. E. J. (2004). “Analysis of weighted networks”. In: Physical Review E 70.5, 056131. Paul, H. (1880 [1886]). Principien der Sprachgeschichte. 2. Aufl. Halle: Max Niemeyer. prinzipiendersp01paulgoog: ia. Perrin, L.-M. (2010). “Polysemous qualities and universal networks, invariance and diversity”. In: Linguistic Discovery 8.1, 259–280. Sperber, H. (1923). Einführung in die Bedeutungslehre. Bonn und Leipzig: Kurt Schroeder. Steiner, L., P. F. Stadler und M. Cysouw (2011). “A pipeline for computational historical linguistics”. In: Language Dynamics and Change 1.1, 89–127. Traugott, E. C. und R. B. Dasher (2002). Regularity in semantic change. Cambridge: Cambridge University Press. 8 83 5 Zukunftsmusik Johann-Mattis List Lehnworterkennung 22.02.2013 Lehnworterkennung 1 Allgemeines zur Entlehnung Entlehnung (engl. borrowing) bezeichnet in einem engen Sinne, die Übertragung von Wörtern einer Sprache in eine andere Sprache. Narrowly, the transfer of a word from one language into a second language, as a result of some kind of contact [...] between speakers of the two. (Trask 2000: 44) In einem weiteren Sinne bezeichnet Entlehnung auch die allgemeine Übertragung linguistischer Merkmale von einer Sprache in eine andere. Broadly, the transfer of linguistic features of any kind from one language to another as a result of contact. (ebd.) Nenne je ein Beispiel für Entlehnung im engeren und im weiteren Sinne des Wortes. 1.1 Terminologisches Der Terminus Entlehnung bezeichnet meist einen konkreten Prozess. Alternativ kann auch das etwas allgemeinere Wort Übertragung (transfer) verwendet werden. Entlehnung im engeren Sinne würde dann als lexikalische Übertragung (lexical transfer) bezeichnet. Soll auf das generelle Phänomen verwiesen werden, bietet sich der von Weinreich (1953[1974]) verwendete Terminus lexikalische Interferenz (lexical interference) an. Im Folgenden betrachten wir Entlehnung vereinfacht als Übertragung von linguistischem Material von einer in eine andere Sprache. Die Sprache, die Material liefert, nennen wir die Donorsprache (donor language), die Sprache, die Material aufnimmt, nennen wir die Empfängersprache (recipient language). Das linguistische Material, das übertragen wird, nennen wir Ursprungsmaterial (source material), wenn auf die Form, in der das Material in der Donorsprache vorliegt, verwiesen wird, und Zielmaterial (target material), wenn auf die Form des Materials in der Empfängersprache verwiesen wird. Schön und gut, aber was ist, wenn wir nun in einem bestimmten Fall nicht wissen, welche Sprache die Donorsprache und welche die Empfängersprache ist? Wie sollen wir sie dann nennen? Und wie sollen wir das Ursprungs- und das Zielmaterial dann nennen? Moment mal, hatten wir darüber nicht schon früher geredet? Das war doch so… 1.2 Mechanismen Wenn wir im Sinne von Saussure von einem bilateralen Zeichenmodell ausgehen, so können grob zwei Fälle lexikalischer Übertragung unterschieden werden, nämlich die Fälle der direkten Übertragung (direct transfer), in denen ein Wort als Ganzes übertragen wird, und die Fälle der indirekten Übertragung (auch semantische Entlehnung, semantic borrowing), in denen die Bedeutung eines in der Empfängersprache bereits vorhandenen Wortes erweitert oder umgestaltet wird, um die Form-Bedeutungs-Einheit des Ursprungswortes in der Donorsprache nachzubilden. In Bezug auf einfache Wörter sind diese Fälle mehr 1 84 Johann-Mattis List Lehnworterkennung 22.02.2013 oder weniger eindeutig auseinanderzuhalten, im Falle von Komposita können sich jedoch Mischformen ergeben. The ways in which one vocabulary can interfere with another are various. Given two languages, A and B, morphemes may be transferred from A into B, or B-morphemes may be used in new designative functions on the model of A-morphemes with whose content they are identified; finally, in the case of compound lexical elements, both processes may be combined. (Weinreich 1953[1974]: 47) Basierend auf Weinreich (ebd.: 47-62) können diese Prozesse in dem folgenden Schema dargestellt werden: transfer meaning form simple direct transfer hybrid transfer loan transfer compound hybrid transfer loan transfer stem transfer direct transfer affix transfer loan translation loan rendition loan creation Die wichtigsten Prozesse mit ihren entsprechenden deutschen Termini sind dabei: • Übertragung einfacher Wörter – Übertragung (transfer): Direkte Übertragung von Form und Bedeutung eines sprachlichen Zeichens von der Donor- in die Empfängersprache. 1 – Reproduktion (reproduction): Erweiterung des Denotationsbereiches eines sprachlichen Zeichens der Empfängersprache in Anlehnung an die Bedeutung eines sprachlichen Zeichens in der Donorsprache. – Hybride Übertragung (hybrid transfer): Erweiterung des Denotationsbereiches eines einem linguistischen Zeichen der Donorsprache homophonen sprachlichen Zeichens der Empfängersprache. 2 85 5 Zukunftsmusik Johann-Mattis List Lehnworterkennung 22.02.2013 • Übertragung komplexer Wörter – Übertragung (transfer): Direkte Übertragung von Form und Bedeutung eines komplexen sprachlichen Zeichens von der Donor- in die Empfängersprache. – Reproduktion (reproduction): Nachbildung komplexer sprachlicher Zeichen der Donorsprache durch sprachliche Zeichen der Akzeptorsprache. * Lehnübersetzung (loan translation): Exakte Nachbildung des komplexen sprachlichen Zeichens der Donorsprache in der Empfängersprache. * Lehnübertragung (loan rendition): Nachbildung des komplexen sprachlichen Zeichens in der Donorsprache, die das Zeichen nicht vollständig als Modell annimmt. * Lehnschöpfung (loan creation): Bildung eines komplexen sprachlichen Zeichens in der Empfängersprache, dessen Denotationsbereich einem komplexen sprachlichen Zeichen der Donorsprache entspricht. – Hybride Übertragung (hybrid transfer): Bildung eines komplexen sprachlichen Zeichens in der Akzeptorsprache, die teils auf direkter Übertragung, teils auf Reproduktion sprachlicher Zeichen der Donorsprache beruht. Unten sind Beispiele für mögliche Resultate von lexikalischer Interferenz gegeben. Versuche, diese Fälle mit Hilfe des oben wiedergegebenen Klassifikationsschemas genauer zu charakterisieren. No. Wort 1 Russisch futbol „Fußball” 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Russisch gol „Tor” Chinesisch kěkǒukělè „Coca Cola” Deutsch Handy Deutsch Job Russisch bruderšaft „Bruderschaft” Deutsch Rechner Deutsch Maus (für Comuter) Deutsch Festplatte Deutsch Wolkenkratzer Chinesisch xīngqīyī „Montag” Deutsch Fenster Deutsch Kopf Chinesisch kù „bitter, cool” Chinesisch xǐnǎo „einer Gehirnwäsche unterziehen” Hinweise Russisch mjač „Ball”, noga „Fuß, Bein” Russisch vorota „Tor” wörtl. „mundet – genießbar” Mechan. Englisch cellphone „Handy” Russisch brat „Bruder” Englisch Computer Englisch mouse Englisch hard disk Englisch sky scraper wörtl. „Woche-eins”, xīngqīèr „Dienstag”, wörtl. „Woche-zwei” Latein fenestra „Fenster” Englisch cup, Latain cūpa „Gefäß” wörtl. „waschen Gehirn” 1.3 Prozesse Mit der Übertragung allein enden die Prozesse der Entlehnung zumeist nicht. In der Empfängersprache schließen sich meist Folgeprozesse an. Aus semantischer Perspektive tre- 3 86 Johann-Mattis List Lehnworterkennung 22.02.2013 ten diese Folgeprozesse insbesondere dann auf, wenn die Bedeutung des Zielwortes bereits von einem indigenen Wort in der Empfängersprache ausgedrückt wird und somit zwei Wörter miteinander in „Konkurrenz” treten. Weinreich (1953[1974]: 54) unterscheidet hier zwischen Unschärfe (confusion), Schwund (disappearance) und Spezialisierung (specialisation) als Folge von Entlehnung. Except for loanwords with entirely new content, the transfer or reproduction of foreign words must affect the existing vocabulary in one of three ways: (1) confusion between the content of the new and old word; (2) disappearance of the old words; (3) survival of both the new and old word, with a specialisation in content. (ebd.) Aus Perspektive der übertragenen Form kann man als Folge von lexikalischer Interferenz zwei weitere Prozesse feststellen, nämlich die Nativisierung (nativization) und die ihr entgegengesetzte Hyperverfremdung (hyper-foreignization, vgl. Hock und Joseph 1995[2009]: 257f). Nativisierung bezeichnet dabei die Anpassung der Ursprungsform an die phonotaktischen Gegebenheiten der Empfängersprache (ebd.: 247-257). Hyperverfremdung ist ein umgekehrter Prozess, der dazu führt, dass der fremde „Klang” der Ursprungsform in der Zielform in einem derartigen Maße von den Sprechern zu bewahren versucht wird, dass er von ihr abweicht. Nenne Beispiele für Nativisierung und Hyperverfremdung im Deutschen. 1.4 Zahlen Wie groß ist der Einfluss von lexikalischer Interferenz auf die Sprachgeschichte? Wie häufig sind Fälle der Entlehnung? Da die Häufigkeit von Entlehnungsprozessen vorwiegend von soziokulturellen Faktoren abhängt, zu denen die soziokulturelle Situation, in der Sprachen gebraucht werden, die geographische Distanz zwischen interferierenden Sprachen und das Prestige spezifischer Sprachvarietäten innerhalb einer Sprachgemeinschaft gehören, können Entlehnungsprozesse unterschiedlich große Teile des Lexikons einer Sprache erfassen. Diese reichen vom einfachen Austausch bestimmter kultureller Begriffe bis hin zu einer massiven Ersetzung des ursprünglichen Vokabulars. In der World Loanword Database (Haspelmath und Tadmor 2009) wurde die Häufigkeit direkter Entlehnung in einer Probe von 1460 Glossen („Konzepte”), die in 41 verschiedene Sprachen übersetzt wurden, untersucht. Laut der Datenbank gibt es große Unterschiede zwischen den Entlehnungshäufigkeiten der einzelnen Sprachen. Diese reichen von 1.2% (Mandarin-Chinesisch) bis hin zu 67% (Selice Romani). Auf der englischen Wortliste wurden dabei 41% der Wörter als Entlehnungen identifiziert. Die Gründe für die unterschiedlichen Entlehnungshäufigkeiten sind sehr unterschiedlich. Im Falle des Chinesischen ist die Entlehnungsresistenz zum Beispiel auf die sehr restriktive phonologische und phonotaktische Struktur der Sprache zurückzuführen, die es den Sprechern stark erschwert, fremdes Formmaterial in ihre Sprache aufzunehmen. Aus diesem Grund entlehnen chinesische Sprecher neue Wörter vorwiegend indirekt, also semantisch. Da die Datenbank nur Fälle direkter Entlehnung auflistet, bleiben diese Fälle verborgen. Ein Beispiel ist das Wort fēiqùláiqì 飞去来器„Bumerang”, das wohl kaum ein indigenes chinesisches Wort sein dürfte, obwohl der Bumerang selbst auch unabhängig von den australischen Ureinwohnern erfunden wurde. Dieses beruht auf einer Lehnprägung, wie die wörtliche Übersetzung des Wortes als „hin-zurück-flieg-Gerät” deutlich macht. 4 87 5 Zukunftsmusik Johann-Mattis List Lehnworterkennung 22.02.2013 Die niedrige Zahl an Entlehnungen im Chinesischen wurde durch dessen restriktive phonologische und phonotaktische Struktur erklärt. Gibt es weitere Gründe, die zu niedrigen (oder umgekehrt hohen) Entlehnungsraten führen können, und wenn ja, welche sind dies? 2 Traditionelle Methoden der Lehnworterkennung Traditionell werden Lehnwörter im Rahmen der historischen Linguistik durch Sequenzvergleiche ermittelt. Entscheidend sind für das Gelingen dieses Unterfangens dabei zwei Punkte: 1. Lehnwörter müssen den Ursprungswörtern phonetisch ähneln, da ansonsten keine Ursprungswörter identifiziert werden könnten. 2. Wenn die genetische Verwandtschaft der interferierenden Sprachen erwiesen ist, muss die Ähnlichkeit zwischen Lehn- und Ursprungswort von den korrespondenzbasierten Ähnlichkeiten zwischen den kognaten Wörtern der interferierenden Sprachen abweichen, da es ansonsten ja plausibler wäre, die möglichen Lehnwörter und Ursprungswörter als Kognaten zu identifizieren. In der folgenden Tabelle werden etymologisch verwandte Wörter im Deutschen und Englischen einander gegenübergestellt. Zusätzlich zu den neuhochdeutschen Wörtern werden auch die jeweils etymologisch verwandten Mittelhochdeutschen Formen angegeben. Was fällt auf, wenn man die Wortpaare miteinander vergleicht? Bei welchen Wortpaaren könnte es sich um Entlehnungen handeln? No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Deutsch Dach Daumen Degen Dill Ding drei Dunst Durst denken Damm dumm Dieb Dorn dreschen Drossel Englisch thatch thumb thane dill thing three dunst thirst think dam dumb thief thorn thresh throat Mittelhochd. dah dūm degan tilli ding drī tunst durst denken tam tumb diob dorn dreskan drozze 5 88 Notiz Johann-Mattis List Lehnworterkennung 22.02.2013 3 Quantitative Methoden der Lehnworterkennung Obwohl es einige neuere Ansätze in der historischen Linguistik gibt, in denen versucht wird, von den Stammbaum-basierten Analysen wegzukommen, sind tatsächliche Methoden zur Lehnworterkennung bisher sehr rar. Prinzipiell wäre es dabei möglich, wie im oben gezeigten Beispiel auch automatisch vorzugehen, also Lautkorrespondenzen zu stratifizieren und Unterschiede festzustellen. Diese Ansätze wurden bisher aber noch nicht genauer verfolgt, da bisher noch keine ausreichend guten Methoden zur Entdeckung regulärer Lautkorrespondenzen entwickelt wurden. Ein alternativer Ansatz, der bisher in einer veröffentlichten Studie verwendet wurde, kommt aus der Biologie und besteht im Vergleich von sogenannten phyletischen Mustern vor dem Hintergrund von Referenzbäumen. Dieser wird im Folgenden genauer vorgestellt (Nelson-Sathi u. a. 2011). Ist die Methode von McMahon u. a. (2005) eine Methode zur Entdeckung von Entlehnungen? 3.1 Gain-Loss Mapping Die Gain-Loss-Mapping-Methode stammt aus der Biologie, sie kann jedoch auch mehr oder weniger direkt für Sprachen angewandt werden. Die Grundidee der Methode ist es, phyletische Muster (phyletic patterns) genauer zu untersuchen. Ein phyletisches Muster ist eine Matrix-Repräsentation von Kognatensets in einer bestimmten Menge von Sprachen. Dabei gibt die Matrix wieder, ob ein Kognatenset einen Reflex in der jeweiligen Sprache aufweist. Für eine bestimmte Sprache werden also zwei verschiedene Zustände hinsichtlich eines Kognatensets unterschieden: presence (1) oder absence (0). Je nachdem, welche Kognatensets nun analysiert werden, kann man verschiedene Muster vergleichen, wie die folgende Darstellung zweier phylogenetischer Muster zeigt. Language “mountain” Pattern mountain Pattern berg Spanish montaña 1 0 Portuguese montanha 1 0 French montagne 1 0 English mountain 1 0 German Berg 0 1 Swedish berg 0 1 Die Gain-Loss-Mapping-Methode versucht nun, mit Hilfe eines Referenzbaumes, zu erklären, wie bestimmte phyletische Muster entstanden sind. Dabei wird von einem sehr einfachen Prozess ausgegangen, in dessen Verlauf Sprachen Reflexe eines bestimmten Kognatensets entweder verlieren, oder erwerben können. Ein Gain-Loss-Szenario stellt dabei eine spezifische Hypothese bezüglich der Entwicklung eines phyletischen Musters auf. Dabei sind für verschiedene phyletische Muster durchaus verschiene Gain-Loss-Szenarien denkbar, wie man an den folgenden Abbildungen (b) und (c) sehen kann, die beide das Muster für mountain „erklären”. (a) Kein Szenario (b) 1 Ursprung (c) 2 Ursprünge 6 89 5 Zukunftsmusik Johann-Mattis List Lehnworterkennung 22.02.2013 Ein Gain-Loss-Szenario unterscheidet nicht nur die beiden Zustände von Sprachen hinsichtlich eines Kognatensets, es zeigt auch an, wo sich Zustände im Verlauf der Entwicklung (repräsentiert durch den Referenzbaum) verändern, also Übergänge stattfinden. Dabei gibt es zwei mögliche Übergänge: Ursprung (origin, gain) und Schwund (loss). Wenn nun für ein Gain-Loss-Szenario zwei unabhängige Ursprünge angesetzt werden, dann ist es plausibel anzunehmen, dass die Ursprünge nicht unabhängig voneinander stattgefunden haben, sondern mitunter durch eine Entlehnung entstanden sind. War das soweit verständlich? Wenn ja, ist die Annahme plausibel, und trifft sie auf das Beispielmuster mountain auch zu? 3.2 Beispiel Wendet man diese Methoden auf große Datensätze an, kann man zeigen, welche Knoten in den Referenzbäumen am häufigsten unabhängig voneinander Ursprungsereignisse aufweisen. Das Ergebnis ist ein Netzwerk, in dem die vertikale Entwicklung durch den Referenzbaum dargestellt wird, und die horizontale durch „Interferenzkanten”. Das folgende Beispiel beruht auf lexikalischen Daten für 40 verschiedene chinesische Dialekte (Hóu 2004). Shèxiàn Táoyuán Měixiàn Guǎngzhōu Hongkong Nánníng Tūnxī Jiàn'ǒu Wénzhōu Shànghǎi Fùzhōu Hǎikǒu Sùzhōu Hángzhōu 14 Shāntóu Xiāngtàn Chángshā Táiběi Nánchàng Hohhot Nánjīng Píngyáo 7 Inferred Links Xiàmén Tàiyuán Héfèi Xī'ān Wǔhàn Kùnmíng Xīníng Chéngdū 1 Zhèngzhōu Guìyáng Ürümqi Qīngdǎo Lánzhōu Jìnán Tiānjìn Harbin Běijīng Yīnchuàn . In ähnlicher Weise können diese Ergebnisse dann auch verwendet werden, um mögliche areale Beziehungen zwischen Sprachen zu ermitteln, wie der geographische Plot der 40 chinesischen Dialekte zeigt. 7 90 Johann-Mattis List . 22.02.2013 7 21 33 11 1 29 39 27 20 13 38 21 15 40 10 34 18 10 25 22 32 3 24 9 30 2 17 31 37 12 23 6 4 26 14 35 16 28 5 19 36 8 Inferred Links Běijīng 北京 1 Chángshā 长沙 2 Chéngdū 成都 3 4 Fùzhōu 福州 5 Guǎngzhōu 广州 Guìyáng 贵阳 6 7 Harbin 哈尔滨 8 Hǎikǒu 海口 Hángzhōu 杭州 9 10 Héfèi 合肥 11 Hohhot 呼和浩特 12 Jiàn'ǒu 建瓯 13 Jìnán 济南 Kùnmíng 昆明 14 15 Lánzhōu 兰州 16 Měixiàn 梅县 Nánchàng 南昌 17 Nánjīng 南京 18 Nánníng 南宁 19 Píngyáo 平遥 20 Qīngdǎo 青岛 21 Shànghǎi 上海 22 23 Shāntóu 汕头 24 Shèxiàn 歙县 25 Sùzhōu 苏州 26 Táiběi 台北 Tàiyuán 太原 27 Táoyuán 桃园 28 Tiānjìn 天津 29 30 Tūnxī 屯溪 31 Wénzhōu 温州 32 Wǔhàn 武汉 33 Ürümqi 乌鲁木齐 34 Xī'ān 西安 35 Xiàmén 厦门 Hongkong 香港 36 Xiāngtàn 湘潭 37 Xīníng 西宁 38 39 Yīnchuàn 银川 40 Zhèngzhōu 郑州 Lehnworterkennung Mandarin Xiàng Mǐn Cantonese Wú Jìn Hakka Gàn Huī 1 Worin mögen die Schwächen in der Gain-Loss-Mapping-Methode liegen? Literatur Haspelmath, M. und U. Tadmor, Hrsg. (2009). World Loanword Database. URL: http: //wold.livingsources.org. Hock, H. H. und B. D. Joseph (1995 [2009]). Language history, language change and language relationship. An introduction to historical and comparative linguistics. 2. Aufl. Berlin und New York: Mouton de Gruyter. Hóu, J., Hrsg. (2004). Xiàndài Hànyǔ fāngyán yīnkù [Phonological database of Chinese dialects] 现 代 汉 语 方 言 音 库 [Phonological database of Chinese dialects]. Shanghai: Shànghǎi Jiàoyǔ. McMahon, A., P. Heggarty, R. McMahon und N. Slaska (2005). “Swadesh sublists and the benefits of borrowing: An Andean case study”. In: Transactions of the Philological Society 103, 147–170. Nelson-Sathi, S., J.-M. List, H. Geisler, H. Fangerau, R. D. Gray, W. Martin und T. Dagan (2011). “Networks uncover hidden lexical borrowing in Indo-European language evolution”. In: Proceedings of the Royal Society B. Biological Sciences 278.1713, 1794–1803. PMID: 21106583. Trask, R. L., Hrsg. (2000). The dictionary of historical and comparative linguistics. Edinburgh: Edinburgh University Press. Weinreich, U. (1953 [1974]). Languages in contact. With a preface by André Martinet. 8. Aufl. The Hague und Paris: Mouton. 8 91