Arquivos de texto simples (na maioria dos casos arquivos com uma extensão .txt) contêm somente informação textual e não oferecem nenhuma maneira claramente definida de informar ao computar que linguagem contêm. O máximo que o OmegaT pode fazer em tal caso é presumir que o texto está escrito na mesma linguagem que o computador usa. Não há problema para arquivos codificados em Unicod usando a configuração de codificação de caractere de 16 bits. Porém, se o texto for codificado em 8 bits, você poderá se deparar com uma situação inusitada: ao invés de ter o texto exibido com caracteres japoneses...
...o sistema exibirá, por exemplo:
O computador, executando o OmegaT, tem Russo como idioma padrão, e portanto exibe os caracteres no alfabeto Cirílico e não em Kanjii.
Existem basicamente três maneiras de fazer isso funcionar no OmegaT. They all involve the application of file filters in the Options menu.
open your source file in a text editor that correctly interprets its encoding and save the file in "UTF-8" encoding. Change the file extension from .txt
to .utf8.
OmegaT will automatically interpret the file as a UTF-8 file. Está é a alternativa mais óbvia, extinguindo o problema a longo prazo.
- i.e. files with a .txt
extension - : in
the Text files section of the file
filters dialog, change the Source File
Encoding from <auto> to the encoding that
corresponds to your source .txt
file, for
instance to .jp for the above example.
for instance from .txt
to
.jp
for Japanese plain texts: in the Text files section of the file filters
dialog, add new Source Filename
Pattern (*.jp
for this example) and
select the appropriate parameters for the source and target
encoding
OmegaT has by default the following short list available to make it easier for you to deal with some plain text files:
.txt
files are automatically (<auto>)
interpreted by OmegaT as being encoded in
the computer's default encoding.
Você pode verificar ao selecionar o item Filtros de arquivos no menu Opções. Por exemplo, quando você tem um arquivo de texto em checo (muito provavelmente gravado no código ISO-8859-2 ), você só precisa mudar a extensão .txt
para .txt2
e o OmegaT irá interpretar o seu conteúdo corretamente. E, claro, para se garantir, considere converter esse tipo de arquivo em Unicode,
ou seja, o formato de arquivo .utf8
.