Übersetzen automatisch

abstract: Erfahrungen mit Google Translate

Kürzlich brauchte ich für einen Vortrag Unterlagen (Präsentation, Beitrag für Proceedings), zu einem Thema, über das ich ein paar Jahre vorher vorgetragen und geschrieben hatte. Eigentlich musste ich nur die alten Unterlagen hervor suchen und auf den neusten Stand bringen - was nicht besonders schwierig war: der Vortrag war über die Geschichte von GIS, und Geschichte (sollte sich) ändert sich nicht mit der Zeit, allenfalls sind neueste Ereignisse nach zutragen

Nur: die Unterlagen waren deutsch geschrieben, der Vortrag war aber auf Englisch zu halten. Eine Gelegenheit, Google Translate zu testen.

Vortrags-Präsentation

Ich hatte die Präsentation mit Latex für Beamer erstellt. Mit google search fand ich ein Angebot zum Übersetzen von formatierten Text: DocTranslatoer. Die etwas nervige Webpage bot Uebersetzen für PDF, aber nicht für Latex an.

Das Ergebnis war nicht sofort brauchbar - der vom Beamer Paket eingefügte rechte Rand zur Navigation verwirrte das Übersetzungsprogramm heftig. Aber mit cut&paste konnte ich die übersetzten Texte in eine Kopie des Latex Datei hin einkopiere und gleich angemessen korrigieren und anpassen.

Fazit: Der Service war einfach zu verwenden:

  1. PDF Datei hochladen liefert übersetzte Texte
  2. cut&paste in Beamer tex Datei.

und die Zeitersparnis relevant.

Text für Proceedings

Hier lag eine Datei in .docx Format vor (die Herausgeber hatten dieses Format verlangt), das der Service anbot. Das Ergebnis war ein übersetzte Datei im gleichen .docx Format Das Ergebnis war gleich formatiert und die Übersetzung im grossen ganzen gut.

Typisch war die, hier falsche, Übersetzung von "Raum" in "room" (statt "space"); erstaunlicherweise wurden deutsche Titel in der Bibliographie auch übersetzt (englische blieben gleich).

Das Produkt war als Rohfassung geeignet; für die Publikation war eine umfassende Überarbeitung nötig um eine etwas andere Perspektive in die Behandlung einzubringen. Als Ausgabeformat war diesmal Latex (Springer template) gefordert, was ich durch pandoc Übertragung und dann einfügen in die Springer Vorlage erreichte.

Was kann man besser machen?

Für die Präsentation hätte ich wohl besser die TeX Dateien mit pandoc zu .pptx übersetzt und dies als Eingabe für die automatische Übersetzung verwendet.

Google Translator und Pandoc verbinden?

Der von mir genutzte Service ist ein Frontend zu Google Translator. Es scheint möglich zu sein, Googles Angebot direkt zu nutzen - erfordert Eingabe als HTML web page. Am einfachsten mit pandoc zusammen spannen, so dass jedes Pandoc Eingabe und Ausgabeformat in HTML verwandelt wird, an Google zum Übersetzen geschickt und das Ergebnis in das gewünschte Format ausgegeben wird.

Ich habe jedenfalls gesehen, dass verschiedene Paket zum Zugang zu Google Translator in Haskell vorliegen; ich habe noch keines ausprobiert, werde aber bald mit einem andern Artikel Gelegenheit dazu haben.

Verbessern von Grammatik und Stil

Ich habe rasch zwei "Gratis" Dienste für die Verbesserung von Grammatik und Stil prüfen wollen:

Produced with SGG on with master5.dtpl.