Segmentierung
Wenn ein Projekt geöffnet wird, dann wird der Text vor der Anzeige im Editor-Fenster vorsegmentiert. Dabei werden die Segmentgrenzen festgelegt, die danach innerhalb von OmegaT (während der Übersetzung) nicht mehr geändert werden können.
Wenn die Segmentierung in einer Datei fehlerhaft ist, dann schließen Sie das Projekt, ändern Sie die entsprechende Datei und öffnen Sie das Projekt erneut.
Die Segmentierung von OmegaT hängt von den Dateitypen in dem jeweiligen Projekt ab.
Textdateien
Textdateien werden in OmegaT an den Zeilenumbrüchen segmentiert. Diese sind manchmal am Satzende und manchmal am Ende eines Absatzes zu finden.
Ob die Segmentierung auf Absatzebenen, Satzebene oder auch unterhalb der Satzebene erfolgt, hängt davon ab, wie die Textdatei formatiert ist. Daher kann die Segmentierung auf jeder Ebene erzwungen werden, indem man vor Beginn der Arbeit in der entsprechenden Datei Zeilenumbrüche einfügt.
Wenn ein Ausgangstext manuelle Zeilenumbrüche, Wagenrückläufe oder sonstige Formatierungen an ungewöhnlichen Stellen enthält, dann kann es sich durchaus lohnen, den Text vor dem Öffnen des Projekts zu bearbeiten. Solche Formatierungen können zu ungünstiger Segmentierung oder einer schlechten Darstellung führen. Zum Zwecke der Vorbearbeitung können ein externer Texteditor oder eine Textverarbeitung verwendet werden (z.B. OpenOffice.org). Damit die so vorgenommenen Änderungen wirksam werden, muss das Projekt neu geladen werden.
Dateien mit Tags (formatiert)
OmegaT kann die folgenden Dateien mit Tags bearbeiten: HTML, XHTML, OpenDocument, OpenOffice.org und StarOffice. Allgemein gesprochen enthalten diese Dateien zwei Arten von Tags:
- "in line" (in der Zeile) – gibt normalerweise die Formatierung des Textes an;
- Blockebene - beschreibt den logischen Aufbau des Dokuments.
Die Segmentierung der mit Tags formatierten Dateien geschieht auf Ebene der Block-Tags.
Um bei mit Tags versehenen Dateien eine Segmentierung auf Satzebene zu erzielen, stehen Konvertierungsmakros von OpenOffice.org zur Verfügung. Diese Makros konvertieren Sätze (stilistische Einheiten) in OpenDocument-/OpenOffice.org-Dateien in Absätze (logische Einheiten). Dadurch wird eine Datei, die in OmegaT geöffnet wird, nach Sätzen und nicht auf Absatzebene segmentiert. Die Makros können Sie von folgender Website downloaden: http://www.omegat.org/omegat/index.html.
Andere Dateitypen
Zusätzlich zu Textdateien und Tagged Dateien unterstützt OmegaT auch Java Resource Bundle. Diese Dateien verwenden eine Zeile für jede zu übersetzende Zeichenkette. Die Segmentierung ist derjenigen der Textdateien sehr ähnlich, mit dem Unterschied, dass die Formatierung der Datei nicht geändert werden muss.
Anmerkungen
In älteren Versionen dieser Anleitung wurde fälschlicherweise der Eindruck vermittelt, dass die Segmentierung von OmegaT auf Absatzebene vorgenommen wird. Richtig ist hingegen, dass die logische Struktur einer Datei festlegt, wie die Segmentierung durchgeführt wird. Beachten Sie bitte ebenfalls, dass Interpunktionszeichen (. ! ; und so weiter) nicht als Segmentgrenzen angesehen werden.
Bei der Segmentierung wird nur der geschriebene Text in Betracht gezogen. Elemente aus Tabellenkalkulationen, Tabellen, Präsentationen oder andere nicht textbasierte Dateiformate können nicht berücksichtigt werden. Textelemente in diesen oder anderen, ähnlichen Dokumenten, mit denen der Übersetzer üblicherweise arbeitet, sind logisch auf Satzebene strukturiert. In diesem Falle gibt die Segmentierung von OmegaT die ursprüngliche Struktur auf der Satzebene wieder. In solchen Dokumenten ist die Unterscheidung zwischen Absatz und Satz daher nicht mehr relevant.
Falls die Segmentierung einer Datei nicht zufriedenstellend ist, dann muss sie vor der Übersetzung in einem OmegaT-Projekt extern bearbeitet werden.