Übersetzung [Kompatibilitätsmodus]

Transcription

Übersetzung [Kompatibilitätsmodus]
Übersetzung
Ȇbersetzen ist ein schwieriges Problem. Computer besitzen nun
mal keinerlei Intelligenz. Ein Mensch kann eine Sprache schon mit
tausend Wörtern sprechen. Wir haben Computermodelle mit über
einer Million Wörtern - und trotzdem können sie nicht mit einem
Menschen mithalten.«
(Systran-Chef Dimitris Sabatakakis )
Alexander Brunsbach
Anwendung Rechnernetze
0. Inhalt
1.
2.
3.
4.
5.
6.
7.
Wozu maschinelle Übersetzung?
Idee
Geschichte
Übersetzungsmethoden
Übersetzungsprogramme
1.
Verbmobil
Statistics-Based Machine Translation
Fazit
06.12.2007
Alexander Brunsbach
2
1. Wozu maschinelle Übersetzung?
viele Texte sind digital verfügbar
Globalisierung
Wirtschaftlich wichtige, schwer erlernbare Sprachen
einfache Übersetzung möglich
chinesisch, japanisch, koreanisch, usw.
Militärisch wichtige, schwer erlernbare Sprachen
06.12.2007
arabisch, paschtu, usw.
Alexander Brunsbach
3
Inhalt
1.
2.
3.
4.
5.
6.
7.
Wozu maschinelle Übersetzung?
Idee
Geschichte
Übersetzungsmethoden
Übersetzungsprogramme
1.
Verbmobil
Statistics-Based Machine Translation
Fazit
06.12.2007
Alexander Brunsbach
4
2. Idee
Verstehen einer Sprache, ohne sie selbst zu
beherrschen
Erfordert
06.12.2007
Künstliche Intelligenz
Computerlinguistik
Mathematik
Informatik
Alexander Brunsbach
5
Inhalt
1.
2.
3.
4.
5.
6.
7.
Wozu maschinelle Übersetzung?
Idee
Geschichte
Übersetzungsmethoden
Übersetzungsprogramme
1.
Verbmobil
Statistics-Based Machine Translation
Fazit
06.12.2007
Alexander Brunsbach
6
3. Geschichte
Erstes große Projekt vom US-Militär
Russisch-Englisch-Übersetzungsprogramm
1966: Pentagon bescheinigt grundsätzliche
Unrealisierbarkeit der maschinellen Übersetzung
1980: Siemens AG greift MÜ – Forschung wieder
auf
1980er: Japan entwickelt erstes kommerzielle MÜ –
Programm (in Prolog)
06.12.2007
Alexander Brunsbach
7
3. Geschichte
1990er: „Verbmobil“ wird von deutscher Industrie
und Akademik entwickelt (Spracherkennung,
Direktübersetzung, Satzgenerierung)
2000/01: „Dotcom-Crash“ viele kleine MÜ-Firmen
melden Konkurs an
2007: nur 1% des Gesamtumsatzes auf dem
Übersetzungsmarkt durch MÜ
„Die maschinelle Übersetzung befindet sich in Kinderschuhen“
(google)
06.12.2007
Alexander Brunsbach
8
Inhalt
1.
2.
3.
4.
5.
6.
7.
Wozu maschinelle Übersetzung?
Idee
Geschichte
Übersetzungsmethoden
Übersetzungsprogramme
1.
Verbmobil
Statistics-Based Machine Translation
Fazit
06.12.2007
Alexander Brunsbach
9
4. Übersetzungsmethoden
Datei / Datenbank mit „Vokabel-“ Einträgen
Direkte MÜ
Quelltext
06.12.2007
Wort-für-Wort-Übersetzung
Anschließende Satzgenierung
Robust und schnell
Morphologische
Analyse
Bilinguales
Wörterbuch
Alexander Brunsbach
Wortstellungskorrektur
Zieltext
10
4. Übersetzungsmethoden
Transfer
Quelltext
06.12.2007
Satzanalyse (Baumstruktur)
Transfer (Übersetzung)
Generierung (Satzbildung nach grammatikalischen
Regeln der Zielsprache)
Analyse
Transfer
Alexander Brunsbach
Generierung
Zieltext
11
4. Übersetzungsmethoden
Interlingua
Quelltext
06.12.2007
Grammatische Information der Quellsprache, wird in
neutraler Zwischensprache ausgedrückt
Erzeugung grammatischer Information der
Zielsprache
„einfache“ Übersetzung komplexer Ausdrücke
Analyse
Generierung
Alexander Brunsbach
Zieltext
12
4. Übersetzungsmethoden
Example-Based Machine Translation (EBMT)
Speicherung von häufig vorkommenden Sätzen
Ableitung ähnlicher Sätze
Statistics-Based Machine Translation (SBMT)
06.12.2007
Einlesen von zweisprachigem Textfundus
Vergleich mit Quelltext
Alexander Brunsbach
13
4. Übersetzungsmethoden
Human-Aided Machine Translation (HAMT)
Programm fordert Benutzer zur Teilübersetzung auf
Die meisten Systeme in der Praxis sind eine Mischung aus
mehreren Methoden (oft Dominanz des Transfersystems mit
Interlingua und EBMT-Elementen)
06.12.2007
Alexander Brunsbach
14
4. Übersetzungsmethoden
06.12.2007
Alexander Brunsbach
15
Inhalt
1.
2.
3.
4.
5.
6.
7.
Wozu maschinelle Übersetzung?
Idee
Geschichte
Übersetzungsmethoden
Übersetzungsprogramme
1.
Verbmobil
Statistics-Based Machine Translation
Fazit
06.12.2007
Alexander Brunsbach
16
5. Übersetzungsprogramme
Systran übersetzt täglich 30 Millionen Web-Seiten
06.12.2007
Alexander Brunsbach
17
5. Übersetzungsprogramme
Test diverser, freier Übersetzungstools,
anhand des Beispielsatzes:
„John lässt sich einen Bart wachsen“
Deutsch → Englisch → Deutsch
06.12.2007
Alexander Brunsbach
18
5. Übersetzungsprogramme
06.12.2007
Alexander Brunsbach
19
5. Übersetzungsprogramme
06.12.2007
Alexander Brunsbach
20
5. Übersetzungsprogramme
06.12.2007
Alexander Brunsbach
21
5. Übersetzungsprogramme
06.12.2007
Alexander Brunsbach
22
5. Übersetzungsprogramme
Google überzeugt beim Wettbewerb automatischer
Dolmetscher
06.12.2007
Google verzichtet auf linguistische Regeln und setzt
auf Statistik
1000 Rechner mit einem Sprachschatz von 200
Milliarden Wörtern
»das größte Sprachmodell in der Geschichte der
Menschheit« (Franz Och)
Alexander Brunsbach
23
5. Übersetzungsprogramme
Beispielübersetzung einer arabischen
Zeitungsschlagzeile
Google: »ElBaradei: Inspektoren brauchen ›einige
Monate‹, um ihre Aufgabe zu erfüllen«,
Systran: »Der Bradi: Die Inspektoren brauchen zu
›einige Monate‹ für Ende wichtige ihr.«
»Die Infrastruktur ist fantastisch. Hier werden acht
Milliarden Web-Seiten erfasst und ständig
aktualisiert. Die liegen einfach da, und mit denen
kann man dann rechnen.« Franz Och (google)
06.12.2007
Alexander Brunsbach
24
5.1 Verbmobil
Sprachübersetzung für deutsch, englisch und
japanisch
Sprecherunabhängig
„Echtzeit“ – Berechnung
Beschränkung auf
Terminabsprache
Reiseplanung
Hotelreservierung
Forschungsgelder von 170 000 000 DM
06.12.2007
Alexander Brunsbach
25
5.1 Verbmobil
06.12.2007
Alexander Brunsbach
26
5.1 Verbmobil
Gleichzeitige Anwendung von fünf
Übersetzungsverfahren
Über stochastisches Verfahren, wird die
wahrscheinlichste Übersetzung gewählt
Wortschatz von 10 000 Wörtern
Umgang mit „Spontansprache“
06.12.2007
„Ja, ich weil also würde mal sagen äh vorschlagen,
wir könnten uns am äh 7. treffen so im Mai“
„How about the seventh of May?“
Alexander Brunsbach
27
5.1 Verbmobil
06.12.2007
Alexander Brunsbach
28
Inhalt
1.
2.
3.
4.
5.
6.
7.
Wozu maschinelle Übersetzung?
Idee
Geschichte
Übersetzungsmethoden
Übersetzungsprogramme
1.
Verbmobil
Statistics-Based Machine Translation
Fazit
06.12.2007
Alexander Brunsbach
29
6. Statistics-Based Machine Translation
Statistischer Ansatz
06.12.2007
Maschinelle Sprachverarbeitung = statistische
Entscheidungstheorie + linguistische Modellierung
1989-1994: IBM forscht an statistischen
Übersetzungsmethoden, als Textfundus dienten die
kanadischen Parlamentsaufzeichnungen
(bilingual: englisch – französisch)
Alexander Brunsbach
30
6. Statistics-Based Machine Translation
Language Modell: syntaktische / semantische Struktur
der möglichen Sätze der Zielsprache
Übersetzungsmodell: Zusammenhang zwischen Quell –
und Zielsatz
06.12.2007
Alexander Brunsbach
31
Inhalt
1.
2.
3.
4.
5.
6.
7.
Wozu maschinelle Übersetzung?
Idee
Geschichte
Übersetzungsmethoden
Übersetzungsprogramme
1.
Verbmobil
Statistics-Based Machine Translation
Fazit
06.12.2007
Alexander Brunsbach
32
7. Fazit
06.12.2007
Alexander Brunsbach
33
7. Fazit
Heutige maschinelle Übersetzungssysteme sind
sehr unvollkommen
Abstraktionsfähigkeit ist beschränkt
„Gesprochene und geschriebene Sprache hat es
schon gegeben, lange bevor es Grammatiker,
Linguisten und Informatiker gab.“
06.12.2007
Alexander Brunsbach
34
Quellen
Grundlagen der Computerlinguistik (Roland Hausser)
Computerlinguistik und Sprachtechnologie (K.-U. Carstensen)
http://zeus.zeit.de/text/zeit-wissen/2006/03/Maschinelle_Uebersetzung.xml
http://www.ifi.unizh.ch/groups/ailab/teaching/semi2000/sprachverarbeitung.pdf
Informatik – Spektrum (Mai 2003)
http://server02.is.unisb.de/courses/wiki/index.php/Maschinelle_%C3%9Cbersetzung
http://de.wikipedia.org/wiki/Maschinelle_%C3%9Cbersetzung
http://server02.is.uni-sb.de/courses/wiki/index.php/Verbmobil
06.12.2007
Alexander Brunsbach
35
Fragen
Haben Sie noch Fragen?
06.12.2007
Alexander Brunsbach
36