Übersetzen mit OmegaT – Open Source TMS (Teil1)

OmegaT
Image via Wikipedia

Ein Translation Memory System (TMS) bzw. Cat-System (Computer aided translation) kostet richtig Geld – für „Nebenbei-eher-schlecht-als-recht“ Übersetzer, als die sich manche technische Redakteure betätigen (müssen) im Normalfall eine zu große Investition, die sich nur in Ausnahmefällen rechnen würde. Trotzdem sind die Vorteile eines TM nicht von der Hand zu weisen: Im Idealfall hat eine Standardisierung der Ausgangstexte dazu geführt, dass identische Prozesse auch identisch beschrieben werden (Klicken Sie OK, etc.). Wer noch keine Single-Source-Umgebung bis auf Satzebene hat, übersetzt diesen oder ähnliche Sätze immer wieder – aber nicht zwangsläufig immer gleich!
Hier hilft das TM durch die „Fuzzy“-Matches bzw. die sofortige Ersetzung von 100% Matches. Da wir im Unternehmen leider keine 3.000 € übrig hatten, kam allerdings für die Übersetzung von ein paar Dokumenten und Wiki-Artikeln die Anschaffung eines professionellen CAT-Tools nicht in Frage.
Wie üblich, habe ich mich auf die Suche nach einer brauchbaren Open Source-Alternative gemacht – und denke, in OmegaT eine gute Software gefunden zu haben, die für meine überschaubaren Ansprüche völlig ausreicht. Andere Tools, die ich mir angeschaut habe, waren leider nicht besonders gut geeignet: das Google Translator Toolkit sieht zwar auf den ersten Blick recht viel versprechend aus – allerdings ist bislang nur die Übersetzungsrichtung von Englisch in ein Zielsprache vorgesehen – ich benötige derzeit allerdings Deutsch nach Englisch.
OmegaT erlaubt freie Auswahl von Ausgangs- und Zielsprache (sonst wäre die Funktionalität ja auch sehr eingeschränkt) und kann von Haus aus mit etlichen Dateiformaten sehr gut umgehen. Meine Wiki-Dateien (dokuwiki) liegen als reine Textfiles vor – ich musste nur in den Optionen von OmegaT die Codierung auf UTF-8 umstellen, da es ansonsten die üblichen Probleme mit den Umlauten gibt.

Die automatische Segmentierung funktioniert soweit ganz gut – selbstverständlich bekommt man ohne Anpassungen keine „reinen“ Sätze – man hat also per default übersetzte Segmente mit Wiki-Auszeichnungen. Für 80% Matches reicht das in den meisten Fällen allemal. Was mit perönlich die Arbeit erleichtert ist die Vorschau von google Translate: in einem separaten Fenster kann man sich anzeigen lassen, wie google das Segment übersetzen würde. Natürlich oftmals ziemlicher Quatsch, aber man kann sich doch öfter mal das Nachschlagen einzelner Vokabeln sparen.

Im nächsten Teil gehe ich ein wenig näher auf das Glossar und den eigentlichen Übersetzungsprozess ein – sonst wird der Artikel ja auch zu lang 🙂 Vielleicht habe ich bis dahin auch Gelegenheit gehabt, mir mal das Zusammenspiel mit xmlGlossary anzuschauen…

Reblog this post [with Zemanta]

Einen Kommentar schreiben