As informações de formatação presentes no arquivo fonte geralmente precisam ser reproduzidas no arquivo destino. O OmegaT exibe as informações de formatação in-line dos formatos que suporta (no momento DocBook, HTML, XHTML, Open Document e OpenOffice.org) como tags, ou etiquetas com códigos de formatação. As tags geralmente não são consideradas na comparação entre as seqüências de caracteres para fins de correspondência. As tags que você reproduziu no segmento traduzido estarão presentes no documento traduzido.
As tags consistem de um a três caracteres e um número. Um número exclusivo permite agrupar aquelas tags que se correspondem e diferenciar as tags que possam ter o mesmo caractere de atalho, mas na verdade são diferentes.
Os caracteres podem ou não refletir o valor da formatação que a tag representa (por exemplo negrito, itálico, etc.)
As tags são numeradas de forma seqüencial e crescente por grupo de tags.
O que nós chamamos de "grupos de tags" pode ser uma única tag (como <br1>
), sozinha, ou 2 tags formando um par (como <f3>
e </f3>
).
Dentro de um segmento, o primeiro grupo (par ou singleton) recebe o número 0, o segundo o número 1, etc.
O primeiro exemplo acima tem 3 grupos de tags (um par, um singleton e depois, um outro par), o segundo exemplo tem apenas um grupo (um par).
As tags sempre são apresentadas em singletons ou em pares.
Tags únicas indicam informações de formatação que não interferem no texto (espaço extra ou quebra de linha, por exemplo).
<segment 2132><b0><Ctr+N></b0>, <br1><b2><Enter></b2><end segment>
<br1>
é uma tag única e não interfere no texto.
Tags em pares geralmente indicam informações de estilo que se aplica ao texto entre a tag de início e a tag de fim de um par. Sejam quais forem os códigos de um par, a tag de início deve sempre vir antes da tag de fim.
<segment 3167>Arquivo de registro (<f1>log.txt</f1>) para acompanhar as operações e erros.<end segment>
<f1>
e </f1>
estão em par e influenciam o log.txt
.
OmegaT cria suas tags antes de aplicar a segmentação de sentenças. Dependendo das regras de segmentação, pode ser que as tags pareçam desrespeitar as regras acima de numeração e grupos.
<segment 1554> <c0>Antes: \. Depois: \s</c0>
<b2>Observação:</b2>
"\." significa o caractere "."<br3> "\s" significa qualquer caractere de espaço em branco <end segment>
Parece que não há problemas aqui. Agora, se aplicarmos as regras de segmentação padrão neste segmento (o funcionamento padrão do OmegaT), iremos ter o seguinte resultado:
<segment 1990> <c0>Antes: \. <end segment> <segment 1991> Depois: \s</c0><br1> <end segment> <segment 1992> <b2>Observação:</b2> "\." significa o caractere "."<br3><end segment> <segment 1993> "\s" significa qualquer caractere de espaço em branco <end segment>
(As regras de segmentação que se aplicam são: segmentar após um ponto seguido por um espaço e segmentar após uma tag de quebra de linha.)
Aqui, vemos que os segmentos considerados um a um não respeitam as regras de pares e numeração: <c0>
e </c0>
deveriam estar em par no mesmo segmento, mas estão separados pelas regras de segmentação
Em alguns casos isso pode causar problemas na tradução, quando as tags devem ser exibidas no idioma destino para refletir a ordem das palavras naquele idioma (veja Trabalhar com tags abaixo).
Deve-se prestar muita atenção ao trabalhar com tags. Se elas forem modificadas por engano, a formatação final do arquivo pode ficar corrompida. Na pior das hipóteses, um arquivo poderá não abrir; isto poderá ocorrer principalmente com arquivos OpenOffice.org.
Para duplicar grupos de tags, basta copiá-los na nova posição desejada. Lembre-se de que em um grupo de pares a tag de início deve vir antes da tag de fim.
A formatação representada pelo grupo que você duplicou será aplicada à seção onde foi inserida.
Exemplo:
<segment 0001><f0>Esta formatação</f0> vai ser duplicada aqui.<end segment>
Após a duplicação:
<segment 0001><f0>Ce format</f0> a été <f0>copié ici</f0>.<end segment>
Para excluir grupos de tags, basta apagá-los do segmento. Lembre-se de que um grupo de pares deve ter sua tag de início bem como de fim excluídas para garantir que todos os vestígios de formatação foram apagados; caso contrário, o arquivo traduzido pode se corromper e não abrir.
Ao apagar um grupo de tags você exclui toda a formatação a elas relacionadas de um arquivo traduzido.
Exemplo:
<segment 0001><f0>Esta formatação</f0> será excluída.<end segment>
Após a exclusão:
<segment 0001>Ce format a été effacé.<end segment>
Para modificar a seqüência de um grupo de tags para refletir a estrutura diferente usada na tradução, basta colocar o grupo de tags no local correspondente na tradução.
A formatação será aplicada na parte onde foi inserida.
Exemplo:
<segment 0001><f0>A formatação daqui</f0> e <f1>e a formatação daqui</f1> será modificada.<end segment>
Após a modificação da ordem:
<segment 0001><f1>Ce format</f1> et <f0>ce format</f0> ont été inversés.<end segment>
Modificar a ordem de um grupo de tags pode resultar no aninhamento deste grupo em um outro grupo de tags. Isto não representa nenhum problema, desde que o grupo esteja totalmente aninhado dentro do outro. É necessário ter cautela com o aninhamento, especialmente se os pares de tags não forem movidos totalmente para dentro do outro grupo, pois o arquivo traduzido pode se corromper e não abrir.
A parte aninhada terá ambas as formatações aplicadas.
Exemplo:
<segment 0001><f0>A formatação</f0> <f1>daqui</f1> vai ser aninhada.<end segment>
Após o aninhamento:
<segment 0001><f0>Le format <f1>ici</f1></f0> a été emboité dans le premier format.<end segment>
A sobreposição é o resultado da manipulação incorreta de pares de tags e certamente resultará em problemas de formatação e pode acontecer do arquivo traduzido não abrir.
Exemplo:
<segment 0001><f0>a formatação</f0> <f1>daqui</f1> vai ser bagunçada.<end segment>
Após a manipulação incorreta:
<segment 0001><f0>a formatação <f1>daqui</f0> </f1>está muito bagunçada agora.<end segment>
A função de validação de tags ( Validação de tags) detecta as tags modificadas (deliberadamente ou por engano) e indica os segmentos afetados. O uso desta função abrirá uma caixa de diálogo com as tags danificadas ou suspeitas de estarem incorretas em um documento.
Esta função pode ser útil para controle de erros (bugs) em um texto traduzido com tags. Isto geralmente é um problema com arquivos OpenDocument ou OpenOffice.org que não abrirão devido a problemas de tags criadas no processo de tradução. Geralmente reparar as tags e recriar os documentos destino pode solucionar o problema.
As tags geralmente representam algum tipo de formatação no texto original. Simplificar a formatação do texto original ajuda bastante na redução do número de tags. Se possível, deve-se levar em conta unificar as fontes usadas, os tamanhos e cores, etc., para simplificar a tradução e reduzir o número de possíveis erros de tags.
Dê uma olhada na seção Trabalhar com tags para ver o que pode ser feito com tags.
Lembre-se de que se as tags dificultarem seu trabalho e a formatação não for extremamente importante para o trabalho a ser traduzido, remover a formatação do documento fonte facilitará bastante a tradução.
Se precisar ver as tags no OmegaT, mas não precisar reter a maioria do formato no documento traduzido, você pode optar por não acrescentar as tags na tradução. Neste caso preste atenção aos pares de tags pois se esquecer de apagar uma parte do par resultará em problemas na formatação do documento; isto corromperá um documento OpenOffice.org traduzido e ele não abrirá.
Já que há tags inseridas no próprio documento, é possível usar as regras de segmentação para criar segmentos que incluam menos tags. Esta é uma função avançada e não deve ser usada por usuários iniciantes.
O OmegaT ainda não faz a detecção total e automática de erros na formatação; portanto, não o alertará se você cometer erros ou mudar a formatação para melhor adaptá-la ao idioma destino. Algumas vezes, porém, o arquivo traduzido pode parecer distorcido e no caso do OpenDocument / OpenOffice.org os arquivos podem até não abrir.