Übersetzung [Kompatibilitätsmodus]
Transcription
Übersetzung [Kompatibilitätsmodus]
Übersetzung »Übersetzen ist ein schwieriges Problem. Computer besitzen nun mal keinerlei Intelligenz. Ein Mensch kann eine Sprache schon mit tausend Wörtern sprechen. Wir haben Computermodelle mit über einer Million Wörtern - und trotzdem können sie nicht mit einem Menschen mithalten.« (Systran-Chef Dimitris Sabatakakis ) Alexander Brunsbach Anwendung Rechnernetze 0. Inhalt 1. 2. 3. 4. 5. 6. 7. Wozu maschinelle Übersetzung? Idee Geschichte Übersetzungsmethoden Übersetzungsprogramme 1. Verbmobil Statistics-Based Machine Translation Fazit 06.12.2007 Alexander Brunsbach 2 1. Wozu maschinelle Übersetzung? viele Texte sind digital verfügbar Globalisierung Wirtschaftlich wichtige, schwer erlernbare Sprachen einfache Übersetzung möglich chinesisch, japanisch, koreanisch, usw. Militärisch wichtige, schwer erlernbare Sprachen 06.12.2007 arabisch, paschtu, usw. Alexander Brunsbach 3 Inhalt 1. 2. 3. 4. 5. 6. 7. Wozu maschinelle Übersetzung? Idee Geschichte Übersetzungsmethoden Übersetzungsprogramme 1. Verbmobil Statistics-Based Machine Translation Fazit 06.12.2007 Alexander Brunsbach 4 2. Idee Verstehen einer Sprache, ohne sie selbst zu beherrschen Erfordert 06.12.2007 Künstliche Intelligenz Computerlinguistik Mathematik Informatik Alexander Brunsbach 5 Inhalt 1. 2. 3. 4. 5. 6. 7. Wozu maschinelle Übersetzung? Idee Geschichte Übersetzungsmethoden Übersetzungsprogramme 1. Verbmobil Statistics-Based Machine Translation Fazit 06.12.2007 Alexander Brunsbach 6 3. Geschichte Erstes große Projekt vom US-Militär Russisch-Englisch-Übersetzungsprogramm 1966: Pentagon bescheinigt grundsätzliche Unrealisierbarkeit der maschinellen Übersetzung 1980: Siemens AG greift MÜ – Forschung wieder auf 1980er: Japan entwickelt erstes kommerzielle MÜ – Programm (in Prolog) 06.12.2007 Alexander Brunsbach 7 3. Geschichte 1990er: „Verbmobil“ wird von deutscher Industrie und Akademik entwickelt (Spracherkennung, Direktübersetzung, Satzgenerierung) 2000/01: „Dotcom-Crash“ viele kleine MÜ-Firmen melden Konkurs an 2007: nur 1% des Gesamtumsatzes auf dem Übersetzungsmarkt durch MÜ „Die maschinelle Übersetzung befindet sich in Kinderschuhen“ (google) 06.12.2007 Alexander Brunsbach 8 Inhalt 1. 2. 3. 4. 5. 6. 7. Wozu maschinelle Übersetzung? Idee Geschichte Übersetzungsmethoden Übersetzungsprogramme 1. Verbmobil Statistics-Based Machine Translation Fazit 06.12.2007 Alexander Brunsbach 9 4. Übersetzungsmethoden Datei / Datenbank mit „Vokabel-“ Einträgen Direkte MÜ Quelltext 06.12.2007 Wort-für-Wort-Übersetzung Anschließende Satzgenierung Robust und schnell Morphologische Analyse Bilinguales Wörterbuch Alexander Brunsbach Wortstellungskorrektur Zieltext 10 4. Übersetzungsmethoden Transfer Quelltext 06.12.2007 Satzanalyse (Baumstruktur) Transfer (Übersetzung) Generierung (Satzbildung nach grammatikalischen Regeln der Zielsprache) Analyse Transfer Alexander Brunsbach Generierung Zieltext 11 4. Übersetzungsmethoden Interlingua Quelltext 06.12.2007 Grammatische Information der Quellsprache, wird in neutraler Zwischensprache ausgedrückt Erzeugung grammatischer Information der Zielsprache „einfache“ Übersetzung komplexer Ausdrücke Analyse Generierung Alexander Brunsbach Zieltext 12 4. Übersetzungsmethoden Example-Based Machine Translation (EBMT) Speicherung von häufig vorkommenden Sätzen Ableitung ähnlicher Sätze Statistics-Based Machine Translation (SBMT) 06.12.2007 Einlesen von zweisprachigem Textfundus Vergleich mit Quelltext Alexander Brunsbach 13 4. Übersetzungsmethoden Human-Aided Machine Translation (HAMT) Programm fordert Benutzer zur Teilübersetzung auf Die meisten Systeme in der Praxis sind eine Mischung aus mehreren Methoden (oft Dominanz des Transfersystems mit Interlingua und EBMT-Elementen) 06.12.2007 Alexander Brunsbach 14 4. Übersetzungsmethoden 06.12.2007 Alexander Brunsbach 15 Inhalt 1. 2. 3. 4. 5. 6. 7. Wozu maschinelle Übersetzung? Idee Geschichte Übersetzungsmethoden Übersetzungsprogramme 1. Verbmobil Statistics-Based Machine Translation Fazit 06.12.2007 Alexander Brunsbach 16 5. Übersetzungsprogramme Systran übersetzt täglich 30 Millionen Web-Seiten 06.12.2007 Alexander Brunsbach 17 5. Übersetzungsprogramme Test diverser, freier Übersetzungstools, anhand des Beispielsatzes: „John lässt sich einen Bart wachsen“ Deutsch → Englisch → Deutsch 06.12.2007 Alexander Brunsbach 18 5. Übersetzungsprogramme 06.12.2007 Alexander Brunsbach 19 5. Übersetzungsprogramme 06.12.2007 Alexander Brunsbach 20 5. Übersetzungsprogramme 06.12.2007 Alexander Brunsbach 21 5. Übersetzungsprogramme 06.12.2007 Alexander Brunsbach 22 5. Übersetzungsprogramme Google überzeugt beim Wettbewerb automatischer Dolmetscher 06.12.2007 Google verzichtet auf linguistische Regeln und setzt auf Statistik 1000 Rechner mit einem Sprachschatz von 200 Milliarden Wörtern »das größte Sprachmodell in der Geschichte der Menschheit« (Franz Och) Alexander Brunsbach 23 5. Übersetzungsprogramme Beispielübersetzung einer arabischen Zeitungsschlagzeile Google: »ElBaradei: Inspektoren brauchen ›einige Monate‹, um ihre Aufgabe zu erfüllen«, Systran: »Der Bradi: Die Inspektoren brauchen zu ›einige Monate‹ für Ende wichtige ihr.« »Die Infrastruktur ist fantastisch. Hier werden acht Milliarden Web-Seiten erfasst und ständig aktualisiert. Die liegen einfach da, und mit denen kann man dann rechnen.« Franz Och (google) 06.12.2007 Alexander Brunsbach 24 5.1 Verbmobil Sprachübersetzung für deutsch, englisch und japanisch Sprecherunabhängig „Echtzeit“ – Berechnung Beschränkung auf Terminabsprache Reiseplanung Hotelreservierung Forschungsgelder von 170 000 000 DM 06.12.2007 Alexander Brunsbach 25 5.1 Verbmobil 06.12.2007 Alexander Brunsbach 26 5.1 Verbmobil Gleichzeitige Anwendung von fünf Übersetzungsverfahren Über stochastisches Verfahren, wird die wahrscheinlichste Übersetzung gewählt Wortschatz von 10 000 Wörtern Umgang mit „Spontansprache“ 06.12.2007 „Ja, ich weil also würde mal sagen äh vorschlagen, wir könnten uns am äh 7. treffen so im Mai“ „How about the seventh of May?“ Alexander Brunsbach 27 5.1 Verbmobil 06.12.2007 Alexander Brunsbach 28 Inhalt 1. 2. 3. 4. 5. 6. 7. Wozu maschinelle Übersetzung? Idee Geschichte Übersetzungsmethoden Übersetzungsprogramme 1. Verbmobil Statistics-Based Machine Translation Fazit 06.12.2007 Alexander Brunsbach 29 6. Statistics-Based Machine Translation Statistischer Ansatz 06.12.2007 Maschinelle Sprachverarbeitung = statistische Entscheidungstheorie + linguistische Modellierung 1989-1994: IBM forscht an statistischen Übersetzungsmethoden, als Textfundus dienten die kanadischen Parlamentsaufzeichnungen (bilingual: englisch – französisch) Alexander Brunsbach 30 6. Statistics-Based Machine Translation Language Modell: syntaktische / semantische Struktur der möglichen Sätze der Zielsprache Übersetzungsmodell: Zusammenhang zwischen Quell – und Zielsatz 06.12.2007 Alexander Brunsbach 31 Inhalt 1. 2. 3. 4. 5. 6. 7. Wozu maschinelle Übersetzung? Idee Geschichte Übersetzungsmethoden Übersetzungsprogramme 1. Verbmobil Statistics-Based Machine Translation Fazit 06.12.2007 Alexander Brunsbach 32 7. Fazit 06.12.2007 Alexander Brunsbach 33 7. Fazit Heutige maschinelle Übersetzungssysteme sind sehr unvollkommen Abstraktionsfähigkeit ist beschränkt „Gesprochene und geschriebene Sprache hat es schon gegeben, lange bevor es Grammatiker, Linguisten und Informatiker gab.“ 06.12.2007 Alexander Brunsbach 34 Quellen Grundlagen der Computerlinguistik (Roland Hausser) Computerlinguistik und Sprachtechnologie (K.-U. Carstensen) http://zeus.zeit.de/text/zeit-wissen/2006/03/Maschinelle_Uebersetzung.xml http://www.ifi.unizh.ch/groups/ailab/teaching/semi2000/sprachverarbeitung.pdf Informatik – Spektrum (Mai 2003) http://server02.is.unisb.de/courses/wiki/index.php/Maschinelle_%C3%9Cbersetzung http://de.wikipedia.org/wiki/Maschinelle_%C3%9Cbersetzung http://server02.is.uni-sb.de/courses/wiki/index.php/Verbmobil 06.12.2007 Alexander Brunsbach 35 Fragen Haben Sie noch Fragen? 06.12.2007 Alexander Brunsbach 36