Übersicht über die Systembeschreibungen
Transcription
Übersicht über die Systembeschreibungen
Übersicht über die Systembeschreibungen Die Systembeschreibungen dienen dazu, die wichtigsten Eigenschaften der Maschinellen Übersetzungssysteme systematisch zu erfassen. Jede Systembeschreibung gliedert sich in vier Teile: 1. Produktdaten 2. Linguistische Kriterien 3. Benutzerfreundlichkeit 4. Gesamtbeurteilung Diese Einteilung soll im folgenden erklärt werden. 1. Produktdaten Die Produktdaten umfassen die wichtigsten Informationen zum System, zur Computervoraussetzung und zum Hersteller. Neben der Version des aktuellen Programms haben wir nach Möglichkeit auch ältere Versionen kurz aufgelistet, ebenso sämtliche Sprachpaare, die neben den von uns getesteten verfügbar sind. (Wir haben dabei folgende Kürzel verwendet: DE (Deutsch), EN (Englisch), FR (Französisch), ES (Spanisch), RU (Russisch), IT (Italienisch), PT (Portugiesisch), JP (Japanisch), CH (Chinesisch).) 2. Linguistische Kriterien Die Übersetzungsqualität eines Maschinellen Übersetzungssystems beruht vor allem auf Umfang und Qualität des Lexikons und der Grammatik. Wir haben deshalb in diesem Abschnitt sämtliche Herstellerangaben und unsere Testergebnisse (s. oben) zu diesen Bereichen zusammengetragen. Beim Lexikon ist insbesondere zu beachten, dass die häufigste Ursache für Übersetzungsprobleme in der falschen Wortwahl liegt. Dieses Problem kann eingegrenzt werden, wenn der Benutzer1 des Systems zumindest das Sachgebiet (z.B. Finanzwesen, Medizin, Luftfahrt etc.) anwählen kann, aus dem der Quelltext stammt. Alle hier vorgestellten Systeme sehen die Anwahl von Sachwörterbüchern vor, wobei der jeweilige Detaillierungsgrad sehr unterschiedlich ist. Während Langenscheidts T1 und der Personal Translator komplexe Hierarchien von Sachgebieten einsetzen, sind es bei Systran und dem Power Translator nur einfache Listen. In allen Fällen können mehrere Sachgebiete angewählt und in eine Reihenfolge gebracht werden. 1 „Der Benutzer“ ist im Folgenden zu lesen als: „die Benutzerin oder der Benutzer“, resp. „der/die Benutzer/in“. V/1 Übersicht über die Systembeschreibungen Auch bei den für das System schwierigen grammatischen Entscheidungen kann eine Voreinstellung des Benutzers helfen. So ist es für ein MÜ-System schwierig zu entscheiden, ob die deutschen Pronomen er und sie im Englischen mit he/she oder it wiederzugeben sind: Dort ist die Tür. Sie steht offen. => There ist the door. It is open. Eine Voreinstellung des Benutzers kann dem System diese Entscheidung abnehmen, wobei natürlich systematische Fehler entstehen, die vom Benutzer in der Nachbearbeitung korrigiert werden müssen. Andere Einstellungsmöglichkeiten betreffen stilistische Parameter. So kann ein englischer Imperativ im Deutschen je nach Textsorte (z.B. in Gebrauchsanweisungen) besser mit einem Infinitiv wiedergegeben werden. Ein Beispiel: First, open the front panel, then push the left button. Möglich: Öffnen Sie zuerst den Vorderdeckel, dann drücken Sie den linken Knopf. Besser: Zuerst Vorderdeckel öffnen, dann linken Knopf drücken. Einige Systeme erlauben es, zwischen diesen beiden Varianten zu wählen. Ein anderes Beispiel ist die Übersetzung der englischen Anrede you in wahlweise du oder Sie. 3. Benutzerfreundlichkeit Neben der Übersetzungsqualität ist die Benutzerfreundlichkeit das zweite wichtige Kriterium zur Beurteilung der Nutzbarkeit eines Systems. Wir haben dieses Kriterium noch weiter untergliedert. 1. Verbindung nach aussen In diesem Abschnitt beschreiben wir die Schnittstelle des MÜ-Programms zu anderen Programmen. • Aus welchen Programmen (vor allem Textverarbeitungsprogrammen) kann das MÜProgramm aufgerufen werden? • Welche Art von Dateien - nicht nur Textdateien, sondern auch Word-, RTF, SGMLoder HTML-Dateien - kann das System verarbeiten? (Dabei gehen wir davon aus, dass ein Maschinelles Übersetzungsprogramm die Textmarkierung des Quelltextes jeweils automatisch in den Zieltext überträgt.) • Können Daten – insbesondere Benutzerlexika, Sachlexika oder Einträge im Übersetzungsarchiv -–von mehreren Benutzern gemeinsam genutzt werden (z.B. über ein lokales Netzwerk)? • Welche anderen (Hilfs-)Programme kann das MÜ-Programm nutzen? V/2 Übersicht über die Systembeschreibungen Falls ein Übersetzungsarchiv2 integriert ist: • Ist das Archiv unidirektional oder bidirektional organisiert (d.h., stehen die Satzpaare nur für die Übersetzungen in einer speziellen Sprachrichtung zur Verfügung oder für beide Übersetzungsrichtungen eines Sprachpaares)? • Können auch Sätze gefunden werden, die nur ungefähr mit dem gesuchten Satz übereinstimmen? Ist der Grad der Übereinstimmung festlegbar? • Ist das Übersetzungsarchiv auch als Nachschlagewerk nutzbar (z.B. zum Suchen von Verwendungsbeispielen)? • Können die Einträge im Übersetzungsarchiv in Sachgebiete unterteilt werden? 2. Qualität des Handbuchs Ein komplexes Softwareprodukt kann nur dann sinnvoll eingesetzt werden, wenn ein hochwertiges Benutzerhandbuch (und gut organisierte Online-Hilfetexte) vorliegen. Anhand des folgenden Fragenkatalogs soll daher die Qualität des Handbuchs beurteilt werden: • In welcher Sprache liegt das Handbuch vor? • Gibt es einen speziellen Abschnitt im Handbuch, wo dem Erstbenutzer schnell und übersichtlich die Grundfunktionalität des Systems erläutert und er durch die ersten Schritte bei der Benutzung geleitet wird? • Sind wichtige Hinweise im Handbuch typographisch hervorgehoben? • Gibt es Hinweise zur Optimierung des Eingabetextes (und damit zur Verbesserung der Übersetzungsqualität)? • Enthält das Handbuch einen Index und ein Glossar der wichtigsten Fachbegriffe? • Gibt es ein spezielles Kapitel zur Fehlersuche und Fehlerbehebung? 2 Ein Übersetzungsarchiv (auch Übersetzungsspeicher oder Translation Memory genannt) ist eine Datenbank, in der Quelltext-Sätze mit ihren jeweiligen Übersetzungen paarweise abgespeichert werden können. Wird eine Übersetzung für einen bereits übersetzten Quelltext-Satz benötigt, so kann diese aus der Datenbank bezogen werden, was häufig schneller und zuverlässiger ist als eine neue maschinelle Übersetzung. V/3 Übersicht über die Systembeschreibungen 3. Lexikonerweiterung Ein zentrales Mittel zur Verbesserung der Übersetzungsqualität ist die sorgfältige Lexikonpflege. Das kann heissen, dass bestimmteWortbedeutungen (d.h. zielsprachliche Entsprechungen) aus dem Lexikon entfernt werden müssen. Zumeist heisst Lexikonpflege jedoch, dass neue Wörter und Begriffe in das Lexikon aufgenommen werden können. Unsere Kriterien bei der Beurteilung der Möglichkeiten zur Lexikonerweiterung: • Für welche Wortarten (Substantive, Adjektive, Verben, weitere?) sind manuelle Lexikoneinträge möglich? Welche Informationen müssen einem solchen Eintrag jeweils mitgegeben werden? Wird der Benutzer durch die Eingabemenüs gezielt geleitet? • Welche Mehrwortausdrücke (mehrteilige Namen, Funktionsverbgefüge, weitere?) können in das Lexikon eingegeben werden? • Welche Art von automatischem Lexikonimport ist vorgesehen (d.h., kann man Listen von Quelltext- und Zieltext-Wortpaaren hereinladen)? 4. Bildschirmgestaltung • Gibt es eine intuitive Zweiteilung des Bildschirms in Quelltextfenster und Zieltextfenster? • Kann die Bildschirmgestaltung vom Benutzer konfiguriert werden? • Welche Arten von Teildokumenten können übersetzt werden (einzelne Sätze, Abschnitte, ab Cursorposition)? • Wird bei der Übersetzung eines Dokumentes die verbleibende Übersetzungszeit angezeigt (z.B. durch einen Laufbalken)? 5. Zieltextgestaltung • Können Quelltext und Zieltext gemeinsam verwaltet (d.h. abgespeichert und wiederaufgerufen) werden? Bleibt die Satzalignierung (Zuordnung von Quelltextsatz und entsprechendem Zieltextsatz) erhalten? • Sind im Zieltext Übersetzungsalternativen markiert? Sind andere Aspekte im Zieltext markiert (z.B. vom System segmentierte Komposita oder unsicher übersetzte Bereiche), die die Übersetzung dem Benutzer transparent machen? V/4 Übersicht über die Systembeschreibungen 6. Übersetzungsgeschwindigkeit Für die Übersetzung grosser Textmengen ist die Übersetzungsgeschwindigkeit von entscheidender Bedeutung. In diesem Punkt weisen die getesteten Systeme sehr grosse Unterschiede auf. In einem Geschwindkeits-Test haben wir einen deutschen Text mit 10.000 Wörtern (ca. 25 Seiten) ins Englische bzw. Französische übersetzen lassen. Die vom jeweiligen System benötigte Zeitdauer finden Sie in untenstehender Tabelle: T1 Pers. Transl. 5:05 Minuten 37 Minuten Systran Pow. Transl. Reverso 20 Sekunden 5:30 Minuten 35 Sekunden Diese Werte sind naturgemäss von vielen Faktoren abhängig. Zunächst sind sie relativ zur benutzten Hardware, in unserem Fall ein Pentium-II-PC mit 400 MHz unter Windows NT. Weiterhin sind die Werte relativ zur benutzten Textsorte. Wir haben einen Korpus unterschiedlicher Zeitungsartikel gewählt, die sowohl komplexe als auch einfachere Satzkonstruktionen beinhalten. 4. Gesamtbeurteilung In der Gesamtbeurteilung fassen wir zu jedem System kurz die positiven und negativen Punkte zusammen. V/5 Langenscheidts T1 Systembeschreibung 1 Produktdaten Name, Version, Jahr • Getestet: Langenscheidts T1 Professional 3.0 © 1997 • Ältere Version: Langenscheidts T1 Standard 3.0 © 1996 Anwendungszweck/Kurzbeschreibung • T1 Professional: Übersetzungsprogramm mit Langenscheidts Handwörterbuch Englisch und Übersetzungsarchiv • T1 Standard: Übersetzungsprogramm mit Langenscheidts Taschenwörterbuch Englisch Sprachpaare • Getestet: DE <=> EN • Ausserdem verfügbar: EN <=> ES (T1 Standard) Plattformen • T1 Professional: PC (Windows NT; Windows 95) • T1 Standard: PC (Windows 3.x; Windows NT; Windows 95) Erforderlicher Arbeitsspeicher • ab 8 MB (Windows 95) bzw. 16 MB (Windows NT), empfohlen 32 MB Erforderlicher Harddisk-Platz • 115 MB V/6 Langenscheidts T1 Firma • L&H Language Technology München (http://www.lhs-lt.de), und Langenscheidt KG, Berlin und München (http://www.langenscheidt.de) • T1 Standard: DM 298.-/Sfr 289.T1 Standard Plus: DM 398.-/Sfr 389.- (mit Handwörterbuch) T1 Professional: DM 598.-/Sfr 549.- (mit Handwörterbuch und Übersetzungsarchiv) Preis 2 Linguistische Kriterien 2.1 Lexikon Wieviele Einträge? (Herstellerangabe) • Angaben beim T1 Standard: DE => EN 230'000; EN => DE 90'000 Enthält das Lexikon Mehrworteinträge? • ja, mit Kontext und Mehrwort-Verbindungen Umfassen die Lexikoneinträge semantische Angaben? • ja, bei Substantiven: Abstrakt, Konkret, Menschlich, Ort, Eigenname Wieviel Prozent der Testwörter (Adjektive, Substantive und Verben) wurden erkannt? DE => EN: 97,2% der häufigen, 88,2% der mittleren, 62,5% der seltenen Wörter EN => DE: 98,8% der häufigen, 85,7% der mittleren, 40,3% der seltenen Wörter Sind Sachgebietslexika eingebaut/zukaufbar? • eingebaut für 18 Sachgebiete, die teilweise weiter untergliedert sind; ausserdem ist im Handbuch angekündigt, dass „bald“ Aufbaulexika verfügbar sein werden. V/7 Langenscheidts T1 Bemerkungen 2.2 • Übersetzungslexikon und Langenscheidts Taschenwörterbuch bzw. Handwörterbuch sind nicht miteinander verknüpft. • Nicht übersetzte Wörter werden manchmal nicht markiert. • Adjektive werden schlechter analysiert als Verben und Nomen. • Um Verben mit abtrennbarem Präfix im Lexikon zu suchen, müssen diese mit Leerschlag eingegeben werden. Bsp.: Nicht abfahren, sondern ab fahren. Dies ist im Handbuch nicht dokumentiert. Grammatik Erkennt das System die unterschiedlichen grammatischen Konstruktionen? • DE => EN: meist (Notendurchschnitt 1,83 auf einer Skala von 1 bis 3) • EN => DE: meist (Notendurchschnitt 1,99 auf einer Skala von 1 bis 3) Bemerkungen DE => EN • Schwierigkeiten bei Verbalkomplexen: Ich weiss, dass er das Buch hätte holen können. => I white fetch can, that he would have the book. • Das bekommen-Passiv übersetzt das Programm konsequent falsch: Zum Examen hat die Studentin viele Bücher geschenkt bekommen. => For the examination, the student received many books in a <A[given|presented]> manner. • Positiv: Als einziges System beherrscht der T1 folgenden Testsatz - allen anderen Systeme gelingt dieser spezielle Wortstellungs-Transfer nicht: Keine Vorlesung kann die Studentin besuchen. => The student can visit no lecture. V/8 Langenscheidts T1 EN => DE • Probleme beim Übersetzen von Relativsätzen: He explained to his colleagues the importance which he attached to the pursuit of his policy. => Er erklärte dem Streben seiner Richtlinie die Bedeutung an seine Kollegen, die er befestigte. • Namen werden oft übersetzt, wo es nicht wünschenswert ist: Very nice valses have been composed by Chopin. => Sehr schöne valses haben bestanden von hacken in. • Oder auch: Sue has hurt her hand. => Eine Klage einreichen ihre Hand weh tut. • Ein Pluspunkt: Als einziges der getesteten Systeme übersetzt T1 die betonende doForm mit wirklich. Zum Beispiel: I did enjoy that meal! => Ich genoß diese Mahlzeit wirklich! 2.3 Einstellungen zur Übersetzung Grammatische Einstellungen • DE => EN: Anrede (You statt They), Pronomen der 3. Person (He oder She statt It), US/UK Englisch • EN => DE: Infinitiv statt Imperativ, Neue Rechtschreibung Auswahl von Sachgebieten • ja, hierarchisch fein gegliederte Sachgebietsordnung mit breiter Abdeckung; es können mehrere Sachgebiete ausgewählt und in eine zu durchsuchende Reihenfolge gebracht werden. Markierungen • Neue Wörter, Konstanten, Komposita, alternative Übersetzungen V/9 Langenscheidts T1 Bemerkungen • Übersetzung grossgeschriebener Wörter an/ausschaltbar. • Plazierung von Konstanten (Folgen von Grossbuchstaben oder Buchstaben und Ziffern) in Produktnamen einstellbar. 3 Benutzerfreundlichkeit 3.1 Verbindungen nach aussen Aufruf aus Textverarbeitungsprogrammen • Word Import von Dateiformaten • RTF • HTML (Import aus Netscape ) Anbindung an ein Netzwerk • Nein Anbindung an ein Übersetzungsarchiv (Translation-Memory) in T1 Professional • Das Übersetzungsarchiv ist vorgefüllt mit 1. Langenscheidt Geschäftsbriefe Englisch (5000 Einträge) 2. idiomatischen Wendungen aus Langenscheidts Handwörterbuch Englisch (71.000 Einträge) • Das Übersetzungsarchiv enthält eine Funktion zum automatischen Auffüllen mit bereits übersetzten Texten (inkl. Alignierungsfunktion). Bearbeitung des Archivs etwas umständlich über Export, Textdatei und Re-Import. • Das Übersetzungsarchiv ist in Sachgebiets-Module unterteilt. V/10 Langenscheidts T1 3.2 3.3 • Einträge im Übersetzungsarchiv sind bidirektional (d.h. sie stehen für beide Übersetzungsrichtungen zur Verfügung); Nachteil: Entsprechen einem Quellsatz zwei Zielsätze, so werden diese in der umgekehrten Übersetzungsrichtung nicht gefunden. • Das Übersetzungsarchiv enthält eine Nachschlagefunktion (Wort im Kontext). Die Suche kann auf Teile des Übersetzungsarchivs beschränkt, aber auch auf alle grammatischen Formen eines Wortes ausgedehnt werden. • „Option: Frequenz“ liefert Angaben über die Häufigkeit des Auftretens bestimmter Wörter im Übersetzungsarchiv. Etwas umständlich: Die Funktion erzeugt eine Datei, die man manuell in einen Editor/Viewer laden muss. • Automatische Übernahme einer Übersetzung aus dem Übersetzungsarchiv ab einstellbarem Ähnlichkeitsgrad. • Farbliche Kontrastierung von präzis gefundenen, ungefähr gefundenen (fuzzy match) und neu übersetzten Sätzen. Es werden bis zu 3 alternative Übersetzungen geliefert. Qualität der Handbuchs • Sprache: Deutsch. • Gutes, sehr ausführliches aber doch übersichtliches Handbuch (Ringbindung) mit vielen Beispielen und Abbildungen, Schritt-für-Schritt-Erklärungen, Beschreibung sämtlicher Menüs. Allein 65 Seiten zu „Arbeiten mit dem Lexikon“. • Kapitel „Erste Schritte“ für ungeduldige Erstbenutzer3. • Ausführliche Hinweise zur Textoptimierung (Empfehlungen zur Verwendung von Wörtern, zum Satzbau aber auch zum Layout) für DE und EN. • Fachwortglossar (linguistische und informatische Fachtermini) und Index. • Für Probleme gibt es ein Kapitel „Was tun, wenn ...“ Lexikonerweiterung Merkmale: 3 Modi 1. Allgemeine Lexikonpflege über Lexikon-Editor 2. Hinzufügen unbekannter Wörter aus einer vom System ermittelten Liste 3. Import anderer T1 Lexikon-Dateien oder speziell formatierter ASCII-Dateien 3 „Benutzer“ ist im Folgenden zu lesen als „Benutzerin oder Benutzer“ resp. „der/die Benutzer/in“. V/11 Langenscheidts T1 Besondere Eigenschaften: 3.4 • Einträge des Systemlexikons (ausser Funktionswörtern) können modifiziert werden. • Nur Substantive, Adjektive, Adverbien und Verben können hinzugefügt werden. • Jeder Lexikoneintrag kann mit Kommentar und Datum versehen werden. Es wird automatisch ein Protokoll der Lexikonänderungen erstellt. • Lexikoneinträge erfordern (wenige) grammatische und semantische Angaben und Sachgebietszuweisungen (eines oder mehrere). Der Benutzer kann neue Sachgebiete definieren. Die grammatischen Angaben erfolgen abhängig von der Wortart über wenige Auswahlfelder. • Bei allen Wortarten sind komplexe Lexikoneinträge vorgesehen: • Substantive: Komposita, Abkürzungen, Mehrwortverbindungen • Verben: mit trennbarem Präfix, mit Angaben zum Typ des Objekts (belebt/unbelebt) oder einer Präposition • Adjektive: mit geforderter Präposition (nur EN) • Bei allen Einträgen kann zwischen neuer und alter Rechtschreibung gewählt werden. • Spezielle Vorkehrungen wurden getroffen für Lexikoneinträge mit Wortartwechsel (z.B. Quellsprache: Verb -> Zielsprache: Adjektiv). • Nur bestimmte Mehrwortübersetzungen sind möglich ('Zechpreller' = 'person who leaves without paying' geht nicht!) Bildschirmgestaltung • Eigener System-Desktop zur Verwaltung von Übersetzungsprojekten. • Unterscheidung zwischen Arbeitsbereich (für Übersetzungsprojekte) und Übersetzungsfenster (für kleinere Übersetzungsversuche) • Bildschirmoberfläche einstellen: Editor wählen, Browser (für HTML-Dateien) wählen, Symbolleiste konfigurieren • Übersetzbare Einheiten: • im sog. Arbeitsbereich: Dokument • im Übersetzungsfenster: Dokument, Markierter Abschnitt, Satz V/12 Langenscheidts T1 3.5 3.6 Zieltextgestaltung • Quelltext und Zieltext werden in getrennten Dateien gespeichert. Solange sie im Arbeitsbereich des System-Desktops verbleiben, bleibt ihre Zusammengehörigkeit als Übersetzungsprojekt jedoch bestehen (inkl. Liste der unbekannte Wörter). Die Satzalignierung kann nur durch die Aufnahme ins Satzarchiv erhalten werden. • Im Zieltext können nach Wunsch markiert werden: Übersetzungsalternativen, vom System segmentierte Komposita, unbekannte Wörter, Konstanten und Übernahmen aus dem Übersetzungsarchiv. Übersetzungsgeschwindigkeit • 3.7 10.000 Wörter (ca. 25 Seiten) in 5:05 Minuten (auf einem Pentium-II-PC mit 400 MHz unter Windows NT) Bemerkungen Besondere Optionen: • Übersetzungen im Batchbetrieb (Auftragsliste) möglich. • Nachschlagen einzelner Wörter im eingebauten Langenscheidts Handwörterbuch oder im Übersetzungsarchiv möglich. • Erstellen einer Wortliste („Glossar“) zu einem gegebenen Text möglich. • Erstellung eines Übersetzungsprotokolls mit folgenden Angaben: Name des Ausgangs- und Zieldokuments, Übersetzungszeit, Textlänge, Sprachrichtung und Übersetzungseinstellungen • Anzeigen von Analyse- und Transferbäumen (Kenntnisse der Phrasenstrukturgrammatiken zum Verständnis erforderlich, Verzeichnis der verwendeten Abkürzungen im Handbuch) V/13 Langenscheidts T1 4 Gesamtbeurteilung Positiv • Feinkörnige Sachgebietsauswahl mit Festlegung der Suchreihenfolge • Guter Bedienungskomfort (insbes. Anzeigen von Übersetzungsalternativen) • Zweisprachiges Wörterbuch (Langenscheidt) integriert • Integriertes Übersetzungsarchiv • Hervorragendes Handbuch Negativ • Durch grosse Funktionsvielfalt anfänglich unübersichtlich • Wenig Grammatikeinstellungen Kommentar Langenscheidts T1 ist ein Übersetzungssystem mit solider Grammatik und Lexikon. Das Lexikon ist in eine Vielzahl von Sachgebieten und Untergebieten gegliedert. Sehr hilfreich ist die vielfältige Anzeige (Übersetzungsalternativen, vom System segmentierten Komposita, unbekannte Wörtern und Übernahmen aus dem Übersetzungsarchiv). Die vielen Zusatzfunktionen sind attraktiv, insbesondere die gelungene Anbindung an das Übersetzungsarchiv. Die Bedienung des Systems ist aufgrund der Funktionsvielfalt komplex und erfordert eine sorgfältige Einarbeitung und Lektüre des Handbuchs. V/14 Personal Translator Systembeschreibung 1 Produktdaten Name,Version, Jahr Getestet: Personal Translator 2000 Office plus © 1999 Weitere Versionen: Personal Translator 2000 Office © 1999 Personal Translator 2000 Home © 1999 Ältere Versionen: PT Plus V1.0 © 1995 PT Plus V2.0 © 1996 PT Plus 98 © 1998 Anwendungszweck/Kurzbeschreibung Übersetzungsprogramm mit einfacher integrierter Textverarbeitung, integrierter Sprachausgabe, Übersetzungsarchiv, Modul für die Übersetzung von HTML-Seiten (PT Web) und „One-Click-Translator“ (PT Direkt). Netzwerkerweiterung möglich, Sachgebietslexika und Satzarchiv (Business English) zukaufbar. Sprachpaare • DE <=> EN • demnächst auch: DE <=> FR Plattformen • Pentium-PC (Windows NT 4.0 oder Windows 95/98) Erforderlicher Arbeitsspeicher • 16 MB V/15 Personal Translator Erforderlicher Harddisk-Platz • min. 30 MB zusätzlich für Sprachausgabe • Soundkarte • Herstellung, Vertrieb: linguatec GmbH München/Heidelberg (www.linguatec.de); Klett Verlag • DM 498.- (PT 2000 Office plus) • DM 198.- (PT 2000 Office: Bei PT 2000 Office fehlen, im Gegensatz zum PT 2000 Office plus, folgende Funktionen: Idiomatikwörterbuch, Word-Schnittstelle, Satzarchiv, Sprachausgabe, Erweiterungsmöglichkeiten mit linguatec Fachwörterbüchern) • DM 698.- (PT 2000 Office plus Französisch) • Wörterbücher je DM 298.- (Automobiltechnik, Medizin, Physik&Biologie) • Netzwerkversion PT 2000 Office plus für bis zu 5 Lizenzen DM 2.990.-, für jeden weiteren Nutzer DM 398.- Firma Preis 2 Linguistische Kriterien 2.1 Lexikon Wieviele Einträge? (Herstellerangabe) • Gemäss aktueller linguatec-Produktinformation: 360.000 Wörter (PT Office plus) bzw. 280.000 Wörter (PT Office/Home) und 35.000 Redewendungen (negativ: Verwendungsbeispiele nur in Deutsch) Enthält das Lexikon Mehrworteinträge? • ja, im Englischen z.B. Nominalgruppen oder Verben mit Partikel, im Deutschen Adjektive V/16 Personal Translator Umfassen die Lexikoneinträge semantische Angaben? • ja, bei Substantiven: 22 hierarchisch geordnete semantische Merkmale (Bsp: Flüssigkeit, Mensch, Tier, Institution,...) Wieviel Prozent der Testwörter (Adjektive, Substantive und Verben) wurden erkannt? DE => EN: 96,7% der häufigen, 97,3% der mittleren, 71,5% der seltenen Wörter EN => DE: 99,8% der häufigen, 92,3% der mittleren, 72,5% der seltenen Wörter Sind Sachgebietslexika eingebaut/zukaufbar? 2.2 • eingebaut für 9 Sachgebiete (Haushalt&Freizeit, Kunst, Politik, Presse&Medien, Religion, Sport, Technik, Wirtschaft, Wissenschaft), die noch weiter unterteilt sind • zukaufbar für drei Sachgebiete (Automobiltechnik, Medizin, Physik&Biologie) Grammatik Erkennt das System die unterschiedlichen grammatischen Konstruktionen? • DE => EN: sehr häufig (Notendurchschnitt 1,67 auf einer Skala von 1 bis 3) • EN => DE: häufig (Notendurchschnitt 1,78 auf einer Skala von 1 bis 3) Bemerkungen DE => EN • Die Stellung der Adverbien beherrscht Ptplus besser als die übrigen Systeme: Er fährt um fünf Uhr ab mit dem Zug von Basel => He leaves by train from Basel at five o´clock. • Auch subjektlose Sätze übersetzt Ptplus besser als die übrigen Systeme: Vor der Prüfung graute ihm seit Tagen. => He dreaded the exam for days. V/17 Personal Translator • Relativsätze beherrscht das System dagegen weniger gut: Er hielt eine Rede, worin er seinen Sohn mehrfach erwähnte. => He gave a speech, he mentioned his son into what repeatedly. • Gleiches gilt für komplexe Verbalphrasen: Ich weiss, dass er das Buch hätte holen können. => I know, that for him the book would have been able to fetch. EN => DE: • Als einziges System beherrscht Ptplus das Passiv im folgenden Testsatz: I was told that there was nothing wrong with me. => Mir wurde gesagt, daß es nichts falsch mit mir gab. • Probleme bereitet die Unterscheidung von that als Relativpronomen bzw. Konjunktion: It was his leg that Peter broke on his way home from school. => Es war sein Bein, daß Peter auf seinem Heimweg aus der Schule brach. • Städtenamen werden manchmal fälschlicherweise als Adjektive übersetzt: We will be travelling to London next week. => Wir reisen zu Londoner nächster Woche. 2.3 Einstellungen zur Übersetzung Grammatische Einstellungen • Beide Richtungen: Amerikanisches/BritischesEnglisch, Pronomen-Erkennung (Personal- und Possessivpronomen), ss oder ß, unpersönliche Aufforderung: engl. Imperativ <=> deutscher Infinitiv, alte oder neue Rechtschreibung des Deutschen • Anrede (DE=>EN: Sie => you oder they; EN=>DE: you => Sie oder du), Kompositazerlegung an/aus. Auswahl von Sachgebieten • ja, Auswahl mehrerer Gebiete möglich V/18 Personal Translator 3 Benutzerfreundlichkeit 3.1 Verbindungen nach aussen Aufruf aus Textverarbeitungsprogrammen • Word für Windows 6.0/ 7.0/ 8.0 • Ein integriertes Zusatzprogramm (PT Direkt) erlaubt es, auf PCs mit Windows 95 und NT direkt aus anderen Anwendungen heraus auf die Übersetzungs- und Wörterbuchfunktion des PT Plus zuzugreifen, ohne dass PT Plus geöffnet werden muss. Import von Dateiformaten • RTF und HTML Anbindung an ein Netzwerk • Ja, über zukaufbare „Netzwerkerweiterung“ für Personal Translator (gemeinsamer Zugriff auf Wörterbuch- und Archivdateien). Anbindung an ein Übersetzungsarchiv (Translation-Memory) • ist in einfacher Form integriert in den Personal Translator; ist aufgeteilt in: 1. Archiv für automatische Übersetzungen 2. Archiv für nachbearbeitete Sätze • Eigenschaften des Übersetzungsarchivs • unidirektional organisiert (d.h. ein Satzpaar muss zweimal abgespeichert werden, um für beide Übersetzungsrichtungen verfügbar zu sein). • Auffüllen des Übersetzungsarchivs mit bestehenden Übersetzungen ist möglich, jedoch muss die Alignierung manuell gesteuert werden. • Übersetzungsarchiv unterstützt die Funktion „Suchen: Wort im Kontext“ • Beim Übersetzen von Sätzen mit Hilfe des Archivs („Übersetzen“ - „Satz im Archiv suchen“) werden genaue Übersetzungen und nicht gefundene Satzelemente farblich kontrastiert. Im sog. „Satzarchivfenster“ können Sätze mit nicht gefundenen Elementen auch maschinell nachübersetzt und die neue Übersetzung gleich ins Archiv aufgenommen werden. V/19 Personal Translator • Übersetzen ganzer Texte mit Hilfe des Archivs unter „Extras“ – „Satzarchiv“ – „Abgleichen“. • Als zusätzliches Suchkriterium können den Satzpaaren Attribute zugewiesen werden. Gesamtbeurteilung des Übersetzungsarchivs • • Positiv: Abweichungen vom gespeicherten Satz werden übersetzt. • Positiv: Attributzuweisungen bei den Einträgen im Satzarchiv. • Negativ: die unidirektionale Organisation des Archivs. • Negativ: die verwirrende Aufteilung in zwei Archive. Erweiterte Funktionalität durch Satzarchiv „Business English“ • Das Übersetzungsarchiv „Business English“ (Untertitel: „Alles für die Geschäftskorrespondenz“) ist vorgefüllt mit 25.000 deutsch-englischen Satzpaaren, einem Deutsch-Englisch Wörterbuch (10.000 Einträge laut Herstellerangabe) und einem Idiomatikwörterbuch (35.000 Redewendungen). • Bedienung in eigener Programmoberfläche, Word oder Outlook möglich. • Die Suche nach Sätzen in der „Briefstellhilfe“ kann über Themen (z.B. Beanstandungen) und Kategorien (Anfrage/Informationen, Kauf/Verkauf) oder Wörter (z.B. Mängel) erfolgen. • Jedes einzelne Wort eines bereits erstellen Textes kann per Mausklick in Satzarchiv, Wörterbuch oder Idiomatikwörterbuch nachgeschlagen werden. • „Suchen: Wort im Kontext“ ist komfortabler durch Kombination von Themen, Wörtern, ähnlichen Wörtern, Wort am Satzanfang, Wort in Übersetzung, Globalzeichensuche (mit Zeichenvariablen *? im gesuchten Wort). • Einträge im Übersetzungsarchiv können mit Kommentar und Thema versehen und damit selektiert werden. 3.2 Qualität des Handbuchs • Gutes, übersichtliches Handbuch (in DE) mit Beispielen, vielen Screenshots und Schritt-für-Schritt-Erklärungen. • Wichtige Hinweise sind besonders hervorgehoben. V/20 Personal Translator • Übersicht über die Programmkomponenten im ersten Kapitel • Kein Glossar • Keine Liste häufiger Probleme, aber Hinweis auf die linguatec-Homepage und Support per Telefon oder E-Mail 3.3 Lexikonerweiterung • Manuelle Lexikoneinträge sind möglich für 1. Substantive (Angaben des Genus und der Deklinationsklasse, Einschränkung auf Singular oder Plural, Sachgebiet, semantisches Merkmal) 2. Verben (Anzahl der Objekte, Typ des Hilfsverbs (haben oder sein), abtrennbares Präfix, reflexive Verben) 3. Adjektive 4. Eigennamen (Angabe des Genus und der Deklinationsklasse, Einschränkung auf Singular oder Plural) 5. Abkürzungen inkl. Punkt (um Verwechslung mit Satzende-Punkt zu vermeiden) 6. Mehrwortverbindungen • Das Erstellen der Einträge erfolgt über Menüs; es ist nur linguistisches Grundwissen erforderlich; Auswahl der grammatischen Merkmale über Beispiele. • Die Eingabe mehrerer Übersetzungen zu einem gegebenen Wort ist möglich. Die Übersetzungen sollten sich durch Wortart oder Sachgebiet unterscheiden. Hinweis des Handbuchs: „Erfahrene Anwenderinnen und Anwender haben ausserdem die Möglichkeit, die eigenen Einträge mit Hilfe erweiterter Kodierungen noch feiner ... abzustimmen.“ Zu den erweiterten Kodierungen gehören z.B. bei Substantiven die Wahl eines Oberbegriffs oder bei Adjektiven die Wahl einer geforderten Ergänzung (satt mit Akkusativ-NP: ich habe die Arbeit satt). • Neue Sachgebiete können vom Benutzer definiert und in die Hierarchie eingetragen werden. • Innerhalb des Editierfensters ist kein Wechsel der Sprachrichtung möglich. • Das Importieren von Wortlisten ist möglich für 1. Speziell formatierte Textdateien (je in Zeile: Wort, Trennsymbol, Übersetzung). In jeder Import-Textdatei sollten nur Grundformen und Wörter der selben Wortart stehen. Zulässig sind Substantive, Eigennamen, Verben, Adjektive und Adverbien. 2. Bereits erstellte Personal Translator-Benutzerwörterbücher. V/21 Personal Translator 3.4 3.5 3.6 Bildschirmgestaltung • Übersichtliche Zweiteilung in Quell- und Zieltextfenster • Während der Übersetzung vermisst man eine Anzeige der verbleibenden Gesamtübersetzungszeit eines Textes. Bei längeren Texten kann man an der Position des Scrollbalken ungefähr ablesen, wie weit der Übersetzungsvorgang fortgeschritten ist. • Übersetzbare Einheiten: Dokument, Dokument ab Cursorposition, Markierter Abschnitt, Satz Zieltextgestaltung • Quelltext und Zieltext können nicht gemeinsam verwaltet werden. Lediglich die unmittelbare Aufnahme der Übersetzung in das Übersetzungsarchiv bietet die Möglichkeit, die Satzalignierung zu behalten. • Zu einem gegebenen Satz werden bis zu 3 Übersetzungsalternativen erzeugt. ( Die Bank ist gross. => The bank is large. / The bench is big. / The bank is greatly. ) Im Zieltext erscheint immer nur die „wahrscheinlichste“ Übersetzung. Die Alternativen sind über ein spezielles Fenster „Übersetzung überarbeiten“ einsehbar und auswählbar. • Es fehlt eine Markierung unbekannter/unübersetzter Wörter im Zieltext. Allerdings kann man sich unbekannte Wörter über einen Menüpunkt anzeigen lassen. Übersetzungsgeschwindigkeit 10.000 Wörter (ca. 25 Seiten) in 37 Minuten (auf einem Pentium-II-PC mit 400 MHz unter Windows NT). 3.7 Bemerkungen • Markierung von Textpassagen und dadurch Ausschluss aus der Übersetzung möglich. • Einstellung der maximalen Zeit für die Übersetzung eines Satzes. • Probleme bei der Übersetzung werden protokolliert und anschliessend angezeigt. • Mit Hilfe des Sprachausgabemoduls kann sich der Benutzer die deutschen und englischen Texte vorlesen lassen. • Übersetzung von HTML-Seiten (auch online) mit PT Web V/22 Personal Translator 4 Gesamtbeurteilung Positiv • Intuitive Bildschirmoberfläche (Quelltext - Zieltext) • Hierarchische Sachgebietsauswahl • Integriertes Übersetzungsarchiv • Pronomenauflösung über Satzgrenzen hinweg • Umfangreiches Lexikon • Gute Grammatik Negativ • Übersetzung ist extrem langsam im Vergleich zu anderen Systemen, bei langen Texten (ab 8000 Wörter) häufig Programm-/Systemabsturz • Unidirektionales Übersetzungsarchiv • Bedienung des Übersetzungsarchivs ist etwas schwerfällig Kommentar Personal Translator ist ein Übersetzungssystem mit umfangreichem Lexikon und guter Grammatik. In unseren Tests lag das System jeweils unter den besten. Durch klare Bildschirmaufteilung und eine übersichtliche Symbolleiste ist es sehr leicht zu bedienen. Das integrierte Übersetzungsarchiv ist ebenfalls positiv zu verzeichnen, jedoch ist dessen Handhabung unübersichtlich und schwerfällig. Ausserdem ist der Personal Translator immer noch das langsamste der untersuchten Übersetzungssysteme. V/23 SYSTRAN Systembeschreibung 1 Produktdaten Name, Version, Jahr Getestet: Ältere Version: SYSTRAN Professional for Windows Version 2.0 © 1998 SYSTRAN Professional for Windows Version 1.6 © 1995-97 Anwendungszweck/Kurzbeschreibung • Übersetzungssystem Sprachpaare • Getestet: DE <=> EN. • Ausserdem verfügbar: FR <=> EN; ES <=> EN; IT <=> EN; PT <=> EN; JP <=> EN; CH => EN; RU => EN Plattformen • PC (Windows 95; NT) Erforderlicher Arbeitsspeicher 16 MB Erforderlicher Harddisk-Platz 15 MB / Sprachpaar Firma • SYSTRAN S.A.; Soisy sous Montmorency; Frankreich (http://www.systransoft.com) • Sfr 690.- pro Sprachpaar Preis V/24 Systran 2 Linguistische Kriterien 2.1 Lexikon Wieviele Einträge? (Herstellerangabe) • Angabe auf der Verpackung: „Multi-target word/phrase dictionaries with more than 2.5 million entries.“ Es ist jedoch offen, auf wieviele Sprachen diese Einträge verteilt sind. Enthält das Lexikon Mehrworteinträge? • nicht präzise feststellbar, da das System-Lexikon nicht einsehbar ist. Es ist jedoch zu vermuten, dass Mehrworteinträge enthalten sind, da sie im Benutzerlexikon eingegeben werden können (s. Anmerkungen zur Lexikonerweiterung) Umfassen die Lexikoneinträge semantische Angaben? • Vermutlich nicht: Es werden bei neuen Lexikoneinträgen keine semantischen Angaben erfragt. Wieviel Prozent der Testwörter (Adjektive, Substantive und Verben) wurden erkannt? DE => EN: 98% der häufigen, 81,2% der mittleren, 49,5% der seltenen Wörter EN => DE: 99,2% der häufigen, 51,8% der mittleren, 22,2% der seltenen Wörter Sind Sachgebietslexika eingebaut/zukaufbar? • eingebaut für 21 Sachgebiete (Automotive, Aviation/Space, Chemistry, Colloquial, Computers, ...) Bemerkungen • Das System-Lexikon ist nicht einsehbar. Daher kann man nicht nachschlagen, welche Übersetzungsoptionen zu einem gegebenen Wort existieren. V/25 Systran 2.2 Grammatik Erkennt das System die unterschiedlichen grammatischen Konstruktionen? • DE => EN: meist (Notendurchschnitt 1,99 auf einer Skala von 1 bis 3) • EN => DE: meist (Notendurchschnitt 2,10 auf einer Skala von 1 bis 3) Bemerkungen DE => EN • Satzwertige Infinitivkonstruktionen sind in Verbindung mit Negation problematisch: Die Studentin versucht, nicht einzuschlafen. => The student tries to fall asleep not. EN => DE • Eine wesentliche Fehlerquelle stellt der Imperativ dar: Have a cup of tea. => Eine Tasse Tee haben. • Oder auch: Help yourself to sugar and milk. => Sich helfen zu zuckern und zu melken. 2.3 Einstellungen zur Übersetzung Grammatische Einstellungen • Keine Auswahl von Fachgebieten • Ja, Auswahl aus 21 sog. "Topical Glossaries" (Automotive, Aviation/Space, ..., Textiles). Nach der Übersetzung wird angezeigt, welche Topical Glossaries benutzt wurden. Es können mehrere Topical Glossaries ausgewählt und in eine Suchreihenfolge gebracht werden. V/26 Systran Bemerkungen • Auswahl aus 9 Dokumenttypen möglich (Abstract, Correspondence, Journalism, ..., Users Manual). Leider ist nicht klar, welche Auswirkungen diese Auswahl hat. 3 Benutzerfreundlichkeit 3.1 Verbindungen nach aussen Aufruf aus Textverarbeitungsprogrammen • Ja, Word für Windows 7.0 oder höher Import von Dateiformaten (nur im Batchmodus) • WordPerfect • Word (via RTF) • SGML (und damit auch HTML) • FrameMaker • Trados • Translation Manager/2 Anbindung an ein Netzwerk • möglich in der Systemversion SYSTRAN Enterprise (Intranet, Extranet, LAN) Anbindung an ein Übersetzungsarchiv (Translation-Memory) • 3.2 möglich in der Version SYSTRAN Enterprise („Filters for translation memory tools“) Qualität des Handbuchs • Sprache: Englisch • Viele Bildschirmabbildungen • Kapitel für ungeduldige Erstbenutzer sehr knapp gehalten • Hinweise zur Lexikonerweiterung nur für englische und französische Wörter. V/27 Systran 3.3 3.4 • Ausführliche Hinweise zur Texterstellung mit vielen Beispielen, vor allem für englische Texte (Benutzung von Artikeln, Pronomen, Schräg- und Bindestrich; Satzstruktur; Satzzeichen; Listen; Formatierung). • Index und Glossar vorhanden. • Hinweise zur Behebung von Problemen fehlen! • Negativ: Die Auswirkungen der Auswahl eines Dokumententyps (s.o. Abschnitt „Einstellungen zur Übersetzung“) sind nicht dokumentiert. Lexikonerweiterung • Eigenständiges Modul: WinCSD („Customer Specific Dictionary“) • Eintrag von Wortart (Substantiv, Eigennamen, Adjektiv, Adverb, Verb) und einfachen grammatischen Kategorien (bei Nomen z.B. Genus). Eingabe von sog. Verb-Nomen Homographen über spezielles Fenster möglich (nur für Englisch). Das Eintragen von Mehrwortausdrücken (beschränkt auf Nominalphrasen) ist sehr kompliziert. • Für die Kontrolle der Lexikoneinträge gibt es ein „simplified“ Format und ein „complex“ Format. Zu letzterem gibt es die Warnung: This function is to be used by SYSTRAN coders who are familiar with SYSTRAN conventions and procedures or by customers who have attended SYSTRAN training courses. • Nach der Eingabe neuer Lexikoneinträge und vor ihrer Verwendung muss ein Laufzeitlexikon erzeugt werden. • Der Import von Lexika ist via speziell formatierter Textdateien möglich. Bildschirmgestaltung • Übersichtliche Zweiteilung in Quell- und Zieltextfenster. Ins Quelltextfenster können nur Textdateien und RTF-Dateien geladen werden. Die anderen Formate können nur im Stapelmodus verarbeitet werden. • Während der Übersetzung vermisst man eine Anzeige der verbleibenden Gesamtübersetzungszeit eines Textes. • Übersetzbare Einheiten: Ein Dokument oder mehrere Dokumente im Stapelmodus (sowohl bereits geöffnete Dokumente als auch noch ungeöffnete Dateien), Markierter Abschnitt. V/28 Systran 3.5 3.6 Zieltextgestaltung • Quelltext und Zieltext können nur während der Systemlaufzeit als Dokumentenpaar gemeinsam verwaltet werden. Beim Speichern werden sie jedoch in getrennte Dateien gespeichert. • Unbekannte Wörter können markiert werden, Übersetzungsalternativen jedoch nicht. • Systran speichert sog. Buchführungsinformation zu jeder Übersetzung (Übersetzungszeit, Fehlermeldungen/Warnungen). Übersetzungsgeschwindigkeit • 3.7 10.000 Wörter (ca. 25 Seiten) in 20 Sekunden (auf einem Pentium-II-PC mit 400 MHz unter Windows NT) Bemerkungen • Jede Übersetzungsrichtung ist ein eigenes Programm. Übersetzung im Batch-Modus (mehrere Dateien hintereinander) ist möglich. Nur im Batch-Modus erfolgt eine Übernahme des Dokumentformats vom Quelltext in den Zieltext. • Übersetzung von Pronomen (er => he/it) erscheint willkürlich. V/29 Systran 4 Gesamtbeurteilung Positiv • Viele Sprachpaare verfügbar • Extrem hohe Übersetzungsgeschwindigkeit • Auswahl von Sachgebiet und Dokumenttyp Negativ • Zentriert auf Englisch als Quellsprache (s. Anmerkungen unter „Handbuch“) • Vergleichsweise geringer Lexikonumfang • Keine Grammatikeinstellungen • Systemlexikon nicht einsehbar Kommentar Das Systran-Lexikon hat einen vergleichsweise geringen Umfang. Beeindruckend sind die hohe Übersetzungsgeschwindigkeit des Systems und das breite Angebot der verfügbaren Sprachpaare. Vergleicht man jedoch seine Leistung für das Sprachpaar Deutsch <=> Englisch mit den anderen Systemen, so ist Systran zu teuer. Anmerkung Ein Software-Developer's Kit ist von der Firma Systran erhältlich, um das Übersetzungsprogramm in andere Anwendungen einzubauen. V/30 Power Translator Systembeschreibung 1 Produktdaten Name , Version, Jahr Getestet: Power Translator Pro Version 6.5 © 1998 (DE <=> FR) Power Translator Pro Version 6.4 © 1998 (DE <=> EN) Ältere Versionen: Power Translator Pro Version 6.2 © 1997 (ohne DE <=> FR) Anwendungszweck/Kurzbeschreibung • Übersetzungsprogramm mit einfacher integrierter Textverarbeitung für parallele Texte Sprachpaare • Getestet: DE <=> EN und DE <=> FR • Ausserdem verfügbar (V 6.4): ES <=> EN, FR <=> EN, IT <=> EN, PT <=> EN Plattformen • PC (Windows 95, Windows NT) Erforderlicher Arbeitsspeicher • 16 MB Erforderlicher Harddisk-Platz • min. 30 MB pro Sprachpaar (hinzu kommen die speziellen Fachwörterbücher; s. 2.1) • L&H Language Technology München (www.lhsl.com/powertranslator); Vertrieb Schweiz: Firma Innoware, Volketswil (www.innoware.ch) • Sfr. 499.- (Version 6.4) bzw. Sfr. 549.- (Version 6.5) • Sfr. 650.- („SwissEditionPlus“: Versionen 6.4 und 6.5) Firma Preis V/31 Power Translator 2 Linguistische Kriterien 2.1 Lexikon Wieviele Einträge? (Herstellerangabe) • keine Angaben. In der Liste der Frequently Asked Questions der L&H-Homepage heisst es dazu: „Our dictionary counts are part of our trade secret. However thousands of entries can be morphed from the dictionary`s core entries and it is possible to add an unlimited number of words and phrases to the general dictionary and create personalized user dictionaries. There are also 31 specific industry dictionaries available.“ Enthält das Lexikon Mehrworteinträge? • Ja, sog. Wortverbindungen. Also z.B. Nominalphrasen (EN: ice cream = FR: glace) oder Adverbialphrasen (EN: this morning = DE: heute morgen). Umfassen die Lexikoneinträge semantische Angaben? • ja, für alle Wortarten, z.B. bei Substantiven: Belebt, Stadt, Land, Familie, Menschlich, Sprache, Literal, Masse, Material, Nationalität, Beruf, Ort, Eigenname, Zeit, Einheit Wieviel Prozent der Testwörter (Adjektive, Substantive, Verben) wurden erkannt? DE => EN: 95,5% der häufigen, 93,2% der mittleren, 66,2% der seltenen Wörter EN => DE: 98,7% der häufigen, 90,5% der mittleren, 51% der seltenen Wörter DE => FR: 96% der häufigen, 93,2% der mittleren, 62,2% der seltenen Wörter FR => DE: 95,7% der häufigen, 96,2% der mittleren, 90,8% der seltenen Wörter Sind Sachgebietslexika eingebaut/zukaufbar? • nicht eingebaut, aber für DE <=> EN auf zusätzlicher CD-ROM erhältlich. Z.Zt. gibt es für dieses Sprachpaar Lexika für 9 Sachgebiete (Automotive, Banking, Brewing, Cable/ Telecommunications, Computer Science, Environmental Science, Finance, Graphics Design, Legal, Medical/Pharmaceutical). Für DE <=> FR sind noch keine Lexika erhältlich. V/32 Power Translator 2.2 Grammatik Erkennt das System die unterschiedlichen grammatischen Konstruktionen? • DE => EN: meist (Notendurchschnitt 1,81 auf einer Skala von 1 bis 3) • EN => DE: meist (Notendurchschnitt 1,96 auf einer Skala von 1 bis 3) • DE => FR: seltener (Notendurchschnitt 2,03 auf einer Skala von 1 bis 3) • FR => DE: seltener (Notendurchschnitt 2,10 auf einer Skala von 1 bis 3) Bemerkungen DE => EN • Vergleichsweise gut ist der Power Translator bei Infinitivkonstruktionen: Einzuschlafen hat sie gar nicht versucht. => She/it has not at all tried to fall asleep. EN => DE • Häufig wählt der Power Translator bei mehrdeutigen Wörtern die falschen Kategorien: She has to leave at eight on weekdays, but stays in bed until ten o`clock on Sundays. => Sie muß an Wochentagen bei Acht gehen, aber Aufenthalte in Bett bis zehn Uhr sonntags. You need not bring your history books tomorrow. => Sie brauchen, bringen Sie nicht, ihre Geschichte bestellt morgen. DE => FR • Komplexe Nominalphrasen beherrscht das System recht gut: Der Student versteht Karls nette Hinweise. => L'étudiant comprend les indications agréables de Charles. • Problematisch ist die Generierung der Fragepartikel est-ce que oder die Umstellung in französischen Fragen: Auf wessen Blumenstrauss wartet die Sekretärin? => Sur duquel bouquet de fleurs entretient la secrétaire? V/33 Power Translator FR => DE • Die notwendige Umstellung der Verben und Adjektive im Satz gelingt Power Translator gut: Nous avons mangé les fruits les moins verts. => PTr: Wir haben das am wenigsten grüne Obst gegessen. • Ein schwerwiegender Fehler ist jedoch, dass Power Translator die zweiteilige Negation des Französischen häufig nicht in angemesser Weise umwandelt: Peut-être n'a-t-elle pas reçu ta lettre. => Vielleicht hat sie nicht nicht deinen Brief empfangen. 2.3 Einstellungen zur Übersetzung Grammatische Einstellungen • (nur für EN => DE) Geschlecht des Autors (!), Anrede (formell, familiär) Auswahl von Sachgebieten • ja, wenn entsprechende Sachgebietslexika manuell erstellt oder hinzugekauft wurden. Bemerkungen • Kontextregeln können über einen Regeleditor hinzugefügt werden. Die Handhabung dieses Regeleditors ist sehr schwerfällig. • Textteile (Satz/Abschnitt) können als „wörtlich“ markiert und somit von der Übersetzung ausgeschlossen werden. 3 Benutzerfreundlichkeit 3.1 Verbindungen nach aussen Aufruf des Übersetzungssystems aus Textverarbeitungsprogrammen 4 • Word für Windows 6.0 / 7.0 4 • WordPerfect für Windows 6.0 / 6.1 Wenn der PowerTranslator aus Word aufgerufen wird, ist es nicht möglich, Fachwörterbücher zu selektieren. V/34 Power Translator Import von Dateiformaten in das Übersetzungssystem • HTML • Microsoft Write • RTF • Word • WordPerfect Anbindung an ein Netzwerk • Ja, gemeinsamer Gebrauch von Wörterbuchdateien und Regeldateien über ein Netzwerk möglich. Anbindung an ein Übersetzungsarchiv (Translation-Memory) • 3.2 Nein, ist nicht vorgesehen. Qualität des Handbuchs • Anmerkung: Die Handbücher für die Versionen 6.4 (DE – EN) und 6.5 (DE – FR) sind (bis auf den Einband) identisch. • Sprache: Deutsch • Abschnitt für einen Schnellstart (für ungeduldige Erstbenutzer). • Sehr übersichtlich gestaltet mit vielen Bildschirmabbildungen; wichtige Hinweise sind typographisch besonders hervorgehoben. • Hinweise zur Textoptimierung im Kapitel „Bevor Sie übersetzen. Ratschläge für bessere Übersetzungen“. Dieses Kapitel macht vor allem Vorschläge für englische Quelltexte (Vermeiden Sie idiomatische Ausdrücke. Vermeiden Sie implizierte Relativpronomen. Vermeiden Sie Passivkonstruktionen.) und für deutsche Quelltexte (Übersetzung von zusammengesetzten Substantiven und Verben mit trennbarem Präfix, Erstellung von Wörterbucheinträgen). Hinweise zur Optimierung von französischen Texten fehlen. • Kurzes Glossar zur englischen Grammatik • Kapitel zur Behebung von Problemen fehlt! • Die Beschreibung des Regeleditors ist mangelhaft. Das Format von Regeln und Regelsätzen wird dort nicht definiert. Es wird lediglich auf sog. Maskendateien verwiesen. V/35 Power Translator 3.3 Lexikonerweiterung Das System bietet eine Liste unbekannter Wörter zu einem gegebenen Text als Vorabmodul „Wortabtastung“. Dieses Modul erlaubt das Abändern des Textes (Ersetzen unbekannter Wörter durch bekannte Wörter) oder die Aufnahme der Wörter in das Lexikon. Lexikonerweiterung kann erfolgen durch 1. das Hinzufügen neuer Wörter oder Übersetzungsalternativen zum allgemeinen Systemwörterbuch, 2. das Erstellen eigener Benutzerwörterbücher, 3. das Importieren von Benutzerwörterbüchern aus früheren Versionen des Power Translators, 4. das Hinzukaufen von Globalink-Fachwörterbüchern (s. Anmerkung unter 2.1 Lexikon). Neue Lexikoneinträge erfordern: die Auswahl der Wortart (19 Wortarten werden angeboten), grammatische Informationen (Genus, „Beugungsmuster“ über Beispiele), semantische Attribute (unterschieden nach Wortart und Sprachpaar; für Substantive z.B. Belebt, Stadt, Land, Beruf). Der (fortgeschrittene) Benutzer kann eigene Attribute definieren, um sie mit eigenen Regeln zu verwenden. Die Eingabe von Mehrwortausdrücken ist beschränkt auf Nominalphrasen, Adverbialphrasen und Mehrwortpräpositionen (nur sehr knapp im Handbuch beschrieben). Das Modul zur Lexikonerweiterung ist kompliziert integriert mit dem Übersetzungssystem. Wird nach der Übersetzung eines Textes eine Lexikonerweiterung durchgeführt, so kann der Text nicht unmittelbar neu übersetzt werden. Das System meldet: „Text already translated!“ Lösung: der Text muss zunächst „rückübersetzt“ oder neu geladen werden. V/36 Power Translator 3.4 3.5 3.6 Bildschirmgestaltung • Übersichtliche Zweiteilung in Quell- und Zieltextfenster; • Fenstermenü ermöglicht individuelle Organisation der Bildschirm-Oberfläche. • Übersetzbare Einheiten: Dokument, Markierter Abschnitt, Satz Zieltextgestaltung • Quell- und Zieltext können als „Projekt“ gemeinsam verwaltet werden. D.h. die Zuordnung der quellsprachlichen Sätze zu den jeweiligen zielsprachlichen Sätzen bleibt auch bei Speicherung erhalten. Ein abgespeichertes Projekt umfasst auch Informationen zum gewählten Sprachpaar und die gewählten Übersetzungseinstellungen. Die Projektorganisation erlaubt paralleles (d.h. gleichzeitiges) Scrollen in Quell- und Zieltext. • Spezielle Option: „Drucken: Zeile für Zeile“ ermöglicht das verzahnte Drucken von Quell- und Zieltext. • Im Zieltext werden unbekannte Wörter markiert, Übersetzungsalternativen werden nur im interaktiven Modus angezeigt. Übersetzungsgeschwindigkeit 10.000 Wörter (ca. 25 Seiten) in 5:30 Minuten (auf einem Pentium-II-PC mit 400 MHz unter Windows NT). V/37 Power Translator 3.7 Bemerkungen • Spezielle Option: „Beugungen“ liefert alle Flexionsformen eines gegebenen Wortes. • Spezielle Option: „Konversationsmodus“ erlaubt Text schnell einzugeben und zu übersetzen. Das System ermittelt nach der Angabe des Sprachpaares selbständig, was Quell- und was Zielsprache ist. • Spezielle Option: „Interaktive Übersetzung“ befragt den Benutzer während der Übersetzung bzgl. der Wortauswahl. Es kann jedoch nur aus den im Lexikon enthaltenen Wörter gewählt werden. • Das System hat manchmal Schwierigkeiten, die Satzgrenzen korrekt zu erkennen (z.B. in Datumsangaben). • Übersetzen von Web-Seiten in einem WWW-Browser (Netscape Navigator oder Microsoft Internet Explorer). In unserem Test zeigte sich, dass Text innerhalb bestimmter HTML-Marken nicht übersetzt wird (z.B. zwischen <ADDRESS> Marken). Das ist zu begrüssen, setzt aber eine solide inhaltliche HTML-Markierung voraus. Leider zeigte sich im Test auch, dass Überschriften (zwischen <Hx> Marken) nicht gesondert übersetzt werden (wie das linguistisch plausibel wäre), sondern wie normale Sätze interpretiert werden. V/38 Power Translator 4 Gesamtbeurteilung Positiv • Verwaltung von Quell- und Zieltext als „Projekt“ • Viele Zusatzfunktionen (z.B. interaktives Übersetzen) • Viele Sprachpaare erhältlich. • Gutes Lexikon (gute zusätzliche Fachwörterbücher erhältlich) Negativ • Wenig Grammatikeinstellungen • Handhabung des Regeleditors zu kompliziert • Keine Aufteilung des Systemlexikons in Sachgebiete Kommentar Der PowerTranslator ist empfehlenswert, wenn man auf andere Globalink-Produkte aufbauen möchte (z.B. Wörterbuch-Import). In Lexikonumfang und Grammatik liegt PowerTranslator in der Sprachrichtung DE <=> EN im Mittelfeld; in der Sprachrichtung DE <=> FR liegt das System im Lexikontest vor dem Konkurrenten Reverso. Leider ist das eingebaute Lexikon nicht in Sachgebiete unterteilt, die guten zukaufbaren Sachwörterbücher machen diesen Nachteil aber teilweise wieder wett. Die vielen Zusatzfunktionen sind attraktiv (insbes. die Projektorganisation). Zur wirklich professionellen Arbeit fehlt jedoch die Verbindung zu einem Übersetzungsarchiv. V/39 Reverso Systembeschreibung 1 Produktdaten Name,Version, Jahr • Getestet: Reverso/PROject MT 98 © 1998 Anwendungszweck/Kurzbeschreibung • Textübersetzungssystem unterteilt in 4 Module: Qtrans (Direktübersetzer für nicht formatierten Text), komplette Übersetzungsoberfläche, File Translator (mehrere Dateien werden hintereinander übersetzt), WebView (für Internetseiten). Sprachpaare • Getestet: • Ausserdem verfügbar: DE <=> RU, FR <=> RU, EN <=> RU DE <=> FR Plattformen • PC (Windows 95, Windows NT) Erforderlicher Arbeitsspeicher • min. 8 MB (empfohlen: 16 MB) Erforderlicher Harddisk-Platz 15 MB pro Sprachpaar Firma • Softissimo, Paris, Frankreich (http://www.softissimo.com) und HEISOFT Publishing, Köln, Deutschland (http://www.heisoft.de) Preis • EVK netto 599 Euro; Unverb. Preisempfehlung 695 Euro V/40 Reverso 2 Linguistische Kriterien 2.1 Lexikon Wieviele Einträge? (Herstellerangabe) • keine Angaben Enthält das Lexikon Mehrworteinträge? • ja Umfassen die Lexikoneinträge semantische Angaben? • Ja (belebt/unbelebt, Währungen, Masseinheiten, Person (kein Eigenname), Name, Land, Stadt, Abstraktum, Aktivität, Stoff, Anderes) Wieviel Prozent der Testwörter (Adjektive, Substantive, Verben) wurden erkannt? DE => FR: 93,8% der häufigen, 89,8% der mittleren, 52,8% der seltenen Wörter FR=> DE: 95,5% der häufigen, 93,8% der mittleren, 86,7% der seltenen Wörter Sind Sachgebietslexika eingebaut/zukaufbar? • zukaufbare Lexika sind für DE <=> FR in Vorbereitung Bemerkungen • 2.2 Eintrag ins Wörterbuch: Wortverbindungen möglich (max. 2 deklinierbare Wörter) Grammatik Erkennt das System die unterschiedlichen grammatischen Konstruktionen? • DE => FR: seltener (Notendurchschnitt 2,05 auf einer Skala von 1 bis 3) • FR => DE: seltener (Notendurchschnitt 2,13 auf einer Skala von 1 bis 3) V/41 Reverso Bemerkungen DE=> FR • Reverso beherrscht komplexe Nominalphrasen gut: Der Student versteht Karls nette Hinweise. => L'étudiant comprend les instructions gentilles de Karl. • Probleme bereitet die Generierung des Fragepartikels est-ce que oder die Umstellung in französischen Fragen: Auf wessen Blumenstrauss wartet die Sekretärin? => Rev: La secrétaire attend à qui le bouquet? FR => DE • Reverso gelingt die notwendige Umstellung von Verben und Adjektiven im Satz recht gut: Nous avons mangé les fruits les moins verts. => Rev: Wir haben die am wenigsten grünen Früchte gegessen. • Problematisch ist die Behandlung persönlicher Verben im Französischen, die im Deutschen unpersönlich übersetzt werden müssen: Je ne parviens pas à le convaincre. => Rev: Ich erreiche ihn zu überzeugen nicht. • Ein offenbar systematischer Fehler ist die fehlende Inversion in Fragen: Où vas-tu? => Wo du gehst? • oder auch: Où est-ce que tu vas? => Wo du gehst? • Ausnahmen bilden aus unerklärlichen Gründen Fragen mit pourquoi: Pourquoi as-tu vendu ta voiture? => Warum hast Du dein Auto verkauft? V/42 Reverso 2.3 Einstellungen zur Übersetzung Grammatische Einstellungen • keine Auswahl von Sachgebieten • Es können mehrere (bisher nur selbst erstellte) Sachgebietslexika ausgewählt und in eine Reihenfolge gebracht werden. Bemerkungen • Transliterieren von Wörtern möglich • Wörter, die nicht übersetzt werden sollen (z.B. Eigennamen), können „reserviert“ werden, damit sie unübersetzt bleiben. In Quell- und Zieltext werden diese Wörter grün markiert. • Die Liste der reservierten Wörter, die für ein Dokument erstellt wurde, kann gespeichert und so für andere Dokumentationen verwendet werden. • Praktisch: Sofortübersetzung eines Wortes aus dem Quelltext, wenn man mit dem Cursor eine Weile daraufstehen bleibt (Minifensterchen mit Übersetzung geht auf) • Vom Modul Qtrans aus sind die Wörterbücher zwar nicht einsehbar, wohl aber veränderbar: scheint unsinnig. 3 Benutzerfreundlichkeit 3.1 Verbindungen nach aussen Aufruf aus Textverarbeitungsprogrammen • Ja (Word für Windows, Excel) V/43 Reverso Import von Dateiformaten • WordPerfect • Word (via DOC und RTF) • HTML • Write-Dateien 3.x Anbindung an ein Netzwerk • Ja. Anbindung an ein Übersetzungsarchiv (Translation-Memory) • 3. 2 Nein, nicht vorgesehen. Qualität des Handbuchs • Sprache: Deutsch, aber abgebildete Bildschirme französisch beschriftet. • 39 Seiten dünnes Heft: sehr knapp, nur wichtigste Funktionen erklärt. Es fehlen bspw. Angaben zur Installation, technische Daten, dafür etwas lapidarer Hinweis auf angebotene Kurse / Schulung und URL. • Oft stimmen Schlüsselwörter im Handbuch nicht mit denjenigen auf dem Bildschirm überein. Nicht nur deshalb verlangt das Handbuch vom Benutzer sehr viel Eigenleistung und Phantasie. Dagegen sind die Hilfeseiten im System sehr nützlich. • Ebenfalls im Hilfemenü findet man eine Karteikarte für ungeduldige Erstbenutzer „Für Anfänger - das schrittweise Übersetzen“; dort findet sich eine Seite „Schneller Start“. Ist nachvollziehbar. • Hinweise zur Optimierung der Übersetzungsqualität sind aufgeführt, sie bleiben jedoch sehr allgemein (Keine Absätze ans Ende jeder Linie einfügen. Auf korrekte Zeichensetzung achten. Die Sätze nach Möglichkeit kurz und klar abfassen. ...) • Der Hersteller verspricht ein besseres Handbuch für die nächste Systemversion. V/44 Reverso 3.3 Lexikonerweiterung • Nebst den zukaufbaren Fachwörterbüchern (in Vorbereitung) kann der Benutzer eigene Wörterbücher erstellen (Anwenderwörterbücher). Lexikoneinträge und modifikationen sind möglich für: 1. Substantive (im Singular, ausser wenn das Wort immer im Plural steht, Angaben zur Deklination, Genus, Zahl, Belebtheit) 2. Verben (im Infinitiv, Angaben zur Konjugation, Verbformen, Transitivität, Reflexivität) 3. Adjektive/Adverbien (im Singular ohne Endung, im Französischen die männliche Form; Angaben zu den Komparationsstufen) 4. Mehrwortverbindungen; funktioniert allerdings nicht einwandfrei. Bsp: „schwerfallen“ kann mit seiner Übersetzung zwar ins Wörterbuch (als Verb) eingetragen werden. Bei der Übersetzung von „Es fällt schwer“ wird der Wörterbucheintrag jedoch nicht berücksichtigt und darum als „Cela tombe difficile“ übersetzt. • Zusammengesetzte Substantive müssen nicht unbedingt eingegeben werden. Das System segmentiert Komposita und übersetzt sie, wenn es alle Teilwörter erkennt. • Konstruktionsformen (Valenzbedingungen, z.B. Anforderungen an das Präpositionalobjekt) für Verb und Substantiv können eingegeben werden, allerdings nur im Expertenmodus. • Nur linguistisches Grundwissen ist erforderlich, da das System bei jedem Schritt Vorschläge macht (Deklination, Konjugation, semantische Klassen....). • Import von bereits erstellten Wörterbüchern ist nicht möglich. • Anwenderwörterbücher können in RTF-, Text- oder MS-DOS-Textdateien gespeichert (exportiert) werden. • Wörterbücher zum manuellen Nachschlagen können angeschlossen werden (genannt werden 'Lingvo', 'Context' und 'MultiLex', die von anderen Firmen angeboten werden). Sie werden bei der Maschinellen Übersetzung nicht genutzt. V/45 Reverso 3.4 3.5 3.6 Bildschirmgestaltung • Dreiteilung in Quell- und Zieltextfenster und ein Fenster, das anzeigt, welche Wörterbücher angeschlossen (aktiviert) sind, welche Wörter reserviert sind und welche Wörter nicht übersetzt - weil unbekannt - sind. Dieses dritte Fenster kann ausgeblendet werden. • Übersetzbare Einheiten: Nächster Absatz, aktueller Absatz, ganzer Text, nach Oben, nach Unten Zieltextgestaltung • Quell- und Zieltext können sowohl als Einheit in einem Projekt als auch einzeln gespeichert werden. Praktisch ist auch die Speicherart „Text in zweisprachiger Form“: Jeder Quellabsatz, gefolgt von seiner Übersetzung, kann in einer Datei abgespeichert werden. • Nicht übersetzte Wörter werden rot, reservierte Wörter grün markiert. • Alternativen werden angezeigt. • Absatzmarken (ausblendbar) in verschiedenen Farben zeigen, in welchem Zustand sich ein Absatz befindet: weiss - Absatz nicht übersetzt, blau - Absatz ist übersetzt, etc. • Übersetzungsmodul 'Komplette Übersetzungsoberfläche' behält Formatierungen nur teilweise bei. Beispiele von Mängeln: Fettdruck und Schriftgrössenänderung einzelner Wörter werden nicht übernommen. Einzelnes Wort in anderer Schriftart bewirkt Schriftartänderung des ganzen Absatzes. Übersetzungsgeschwindigkeit • 3.7 10.000 Wörter (ca. 25 Seiten) in 35 Sekunden (auf einem Pentium-II-PC mit 400 MHz unter Windows NT) Bemerkungen • Mit dem eingebauten WebView können Web-Seiten übersetzt werden. V/46 Reverso 4 Gesamtbeurteilung Positiv • Intuitive Bildschirmoberfläche (Quelltext - Zieltext - aktivierte Wörterbücher etc.) • hohe Übersetzungsgeschwindigkeit • Lexikonerweiterung: Erstellen verschiedener eigener Lexika möglich (Anwenderwörterbücher). Leichtes Eintragen neuer Wörter dank Vorschlägen durch das System für Deklination, Konjugation, semantische Klassen, ... • Lexikonauswahl mit Festlegung der Suchreihenfolge • Guter Bedienungskomfort (insbesondere Anzeigen von Alternativen, direktes Anzeigen von Übersetzungen einzelner Wörter durch Anwählen mit Cursor) Negativ • Handbuch viel zu knapp und sehr fehlerhaft; die Online-Hilfetexte sind ausführlicher und besser, haben aber auch orthographische und stilistische Mängel • Import von selbsterstellten Wörterbüchern nicht möglich • Keine Grammatikeinstellungen, geringe Korrektheit • Geringer Lexikonumfang Kommentar Besonders ärgerlich ist das schlechte Handbuch des Reverso. Und auch in der Übersetzungsleistung kann das System noch nicht überzeugen. Positiv ist der Bedienungskomfort und beeindruckend auch die hohe Übersetzungsgeschwindigkeit des Systems. Vergleicht man jedoch die Gesamtleistung mit den anderen Systemen, so ist Reverso zu teuer. V/47