Guia Completo para Corrigir Texto Corrompido no Ubuntu | Causas, Soluções e Alterações de Configuração

目次

1. Introdução

Ao usar o Ubuntu, você pode encontrar texto corrompido em certas situações. Isso pode acontecer na saída do terminal, ao exibir nomes de arquivos em japonês ou ao navegar em páginas da web japonesas, dependendo do seu ambiente. Em muitos casos, o japonês pode não ser exibido corretamente com as configurações padrão, exigindo configuração adequada.
Neste artigo, explicaremos as causas do texto corrompido no Ubuntu e forneceremos soluções concretas para corrigi‑lo. Este guia destina‑se a:

  • Iniciantes no Ubuntu que ainda não configuraram as opções de exibição em japonês
  • Usuários que desejam entender as causas raiz do texto corrompido e encontrar soluções fundamentais
  • Usuários que enfrentam texto corrompido no terminal ou em ambientes gráficos e querem saber como resolver

Vamos começar examinando as principais causas do texto corrompido no Ubuntu.

年収訴求

2. Principais Causas do Texto Corrompido

Configurações de Locale Incorretas

Os locales no Ubuntu definem o idioma do sistema e as configurações de formatação de data. Se eles não estiverem configurados corretamente, o texto em japonês pode não ser exibido adequadamente, resultando em caracteres corrompidos.
Por exemplo, se você executar o comando locale e vir “C” ou “POSIX” na saída, suas configurações de locale podem estar erradas:

$ locale
LANG=C
LC_ALL=

Idealmente, para um ambiente japonês, ele deve estar definido como LANG=ja_JP.UTF-8.

Falta ou Insuficiência de Fontes

Por padrão, o Ubuntu pode não ter fontes japonesas instaladas. Como consequência, o texto em japonês pode não ser renderizado corretamente e aparecer como caixas quadradas (□) ou símbolos aleatórios.
Problemas de fonte podem ser identificados nos seguintes casos:

  • Texto corrompido aparece em menus e botões de aplicativos gráficos
  • Texto em japonês em um editor de texto aparece corrompido

Incompatibilidade de Codificação de Caracteres

Embora o Ubuntu use principalmente UTF-8 como codificação padrão, abrir arquivos codificados em Shift_JIS ou EUC-JP provenientes de fontes externas pode causar texto corrompido.
Por exemplo, abrir um arquivo criado em um ambiente Windows no Ubuntu pode resultar em:

  • Caracteres ilegíveis ao abrir em um editor de texto
  • Texto distorcido ao usar o comando cat no terminal

Configurações de Terminal ou Editor Mal Configuradas

Mesmo que um arquivo esteja codificado em UTF-8, configurações inadequadas do terminal ou do editor podem impedir a renderização correta do texto.

  • A codificação do terminal está definida para algo diferente de UTF-8
  • Editores como Vim ou VSCode não detectam automaticamente a codificação correta
  • Caracteres japoneses aparecem como “?” ou “◇” ao serem exibidos com less ou cat

3. Verificando e Corrigindo as Configurações de Locale

Como Verificar Suas Configurações de Locale

Para verificar as configurações de locale atuais, execute o seguinte comando:

locale

Exemplo de saída:

LANG=C
LC_CTYPE="C"
LC_NUMERIC="C"
LC_TIME="C"
LC_COLLATE="C"
LC_MONETARY="C"
LC_MESSAGES="C"
LC_PAPER="C"
LC_NAME="C"
LC_ADDRESS="C"
LC_TELEPHONE="C"
LC_MEASUREMENT="C"
LC_IDENTIFICATION="C"
LC_ALL=

Se LANG=C for exibido, seu sistema não está configurado corretamente para o japonês. Um ambiente japonês configurado corretamente deve se parecer com isto:

LANG=ja_JP.UTF-8
LC_ALL=ja_JP.UTF-8

Instalando e Configurando o Locale Japonês

1. Verificar e Adicionar o Locale Japonês

Para verificar se o locale japonês está instalado, execute:

locale -a | grep ja_JP

Exemplo de saída:

ja_JP.eucJP
ja_JP.utf8

Se ja_JP.utf8 estiver ausente, instale o locale japonês com:

sudo apt update
sudo apt install -y language-pack-ja

Em seguida, gere o locale e atualize as configurações do sistema:

sudo locale-gen ja_JP.UTF-8
sudo update-locale LANG=ja_JP.UTF-8

2. Definir o Locale em Todo o Sistema

Para aplicar as alterações em todo o sistema, execute:

export LANG=ja_JP.UTF-8
export LC_ALL=ja_JP.UTF-8

Para tornar essas mudanças persistentes, adicione‑as ao ~/.bashrc ou ~/.profile:

echo 'export LANG=ja_JP.UTF-8' >> ~/.bashrc
echo 'export LC_ALL=ja_JP.UTF-8' >> ~/.bashrc
source ~/.bashrc

Para alterações em nível de sistema, edite:

sudo nano /etc/default/locale

E adicione ou modifique o seguinte:

LANG=ja_JP.UTF-8
LC_ALL=ja_JP.UTF-8

Para aplicar as configurações, faça logout e login novamente ou reinicie o seu sistema.

4. Instalando e Configurando Fontes

Por que Fontes Japonesas São Necessárias

Por padrão, o Ubuntu pode não ter fontes japonesas instaladas. Isso pode resultar em texto japonês exibido incorretamente, aparecendo como caixas quadradas (□) ou símbolos ilegíveis.
Problemas relacionados a fontes podem ser observados nos seguintes casos:

  • Menus e botões em aplicativos GUI aparecem corrompidos
  • Texto japonês em um editor de texto é exibido incorretamente

Fontes Japonesas Recomendadas

Aqui estão algumas fontes japonesas recomendadas para o Ubuntu:

Font Name

Recursos

Noto Sans CJK JP

Uma fonte japonesa de alta qualidade fornecida pelo Google (recomendada como padrão)

Takao Fonts

Anteriormente, a fonte padrão do Ubuntu (disponível nas versões fina e em negrito)

IPA Fonts

Fontes de alta qualidade fornecidas pela Agência de Promoção de Tecnologia da Informação (IPA)

VL Gothic

Altamente legível e otimizado para uso em terminal

Como Instalar Fontes

1. Instalar Noto Sans CJK JP (Fonte Padrão Recomendada)

sudo apt update
sudo apt install -y fonts-noto-cjk

2. Instalar Fontes Takao

sudo apt install -y fonts-takao

3. Instalar Fontes IPA (Agência de Promoção de Tecnologia da Informação)

sudo apt install -y fonts-ipafont

4. Instalar VL Gothic (Otimizado para Terminal)

sudo apt install -y fonts-vlgothic

Após instalar as fontes, reinicie o seu sistema ou atualize o cache de fontes com:

fc-cache -fv

Como Configurar Fontes

Configurando Fontes em Aplicativos GUI

  1. Abra o aplicativo “Configurações”
  2. Vá para a seção “Fontes”
  3. Altere a “Fonte Padrão”, “Fonte de Documento” e “Fonte Monoespaçada” para a fonte de sua preferência
  4. Faça logout e login novamente para aplicar as configurações

Configurando Fontes no Terminal

  1. Abra o terminal
  2. Vá para “Preferências” → “Preferências de Perfil”
  3. Marque a caixa “Usar fonte personalizada”
  4. Selecione uma fonte de sua preferência (por exemplo, Noto Sans Mono CJK JP)
  5. Salve as configurações e reinicie o terminal

Aplicando e Verificando as Configurações de Fonte

Para verificar se as configurações de fonte foram aplicadas corretamente, tente o seguinte:

  1. Verifique as fontes instaladas usando o comando fc-list
fc-list | grep "Noto"
  1. Teste a exibição de texto japonês no terminal
echo "こんにちは、Ubuntuの文字化け対策"
  1. Verifique se o texto japonês é exibido corretamente em aplicativos GUI (Firefox, LibreOffice, etc.)

5. Verificando e Convertendo Codificação de Caracteres

O que é Codificação de Caracteres?

Codificação de caracteres é um sistema que atribui códigos digitais aos caracteres. Algumas codificações comumente usadas incluem:

Codificação

Recursos

Uso Primário

UTF-8

Suporta vários idiomas, o padrão para Linux

Ubuntu, Desenvolvimento Web

Shift_JIS

Específico do japonês, comumente usado no Windows

Aplicações Windows, sistemas legados

EUC-JP

Usado em sistemas baseados em UNIX

Older Linux systems

ISO-2022-JP

Usado para e-mails e ambientes específicos

Comunicação por e-mail

Como o Ubuntu usa principalmente UTF-8, abrir arquivos em outras codificações (como Shift_JIS) pode causar texto corrompido.

Como Verificar a Codificação de Caracteres de um Arquivo

1. Use o comando file

file -i sample.txt

Exemplo de saída:

sample.txt: text/plain; charset=iso-8859-1

2. Use o comando nkf

sudo apt install -y nkf
nkf --guess sample.txt

Exemplo de saída:

Shift_JIS (CRLF)

Como Converter a Codificação de Caracteres

1. Converter Usando o Comando iconv

Converter Shift_JIS para UTF-8:

iconv -f SHIFT_JIS -t UTF-8 sample.txt -o sample_utf8.txt

Converter EUC-JP para UTF-8:

iconv -f EUC-JP -t UTF-8 sample.txt -o sample_utf8.txt

2. Converter Usando o Comando nkf

Converter Shift_JIS para UTF-8:

nkf -w sample.txt > sample_utf8.txt

Converter EUC-JP para UTF-8:

nkf -w --overwrite sample.txt

Prevenindo Texto Corrompido no Terminal e Editores

1. Use o Comando less para Exibir Corretamente

export LESSCHARSET=utf-8
less sample.txt

2. Especifique a Codificação de Caracteres no vim

vim -c "set encoding=utf-8" sample.txt

3. Alterar Codificação no gedit ou VSCode

  • gedit (editor padrão do GNOME)
  1. Abra o arquivo com gedit sample.txt
  2. Ao salvar, altere a codificação para UTF-8
  • VSCode (Visual Studio Code)
  1. Clique em “Encoding” na parte inferior da tela
  2. Selecione UTF-8

6. Verificando Configurações do Terminal e do Editor

Verificando e Corrigindo Configurações do Terminal

1. Verificar Configurações de Codificação do Terminal

Para verificar suas variáveis de ambiente atuais, execute os seguintes comandos:

echo $LANG
echo $LC_ALL

Exemplo de Saída (Configurações Corretas):

ja_JP.UTF-8
ja_JP.UTF-8

Se a saída for C ou POSIX, você precisa alterar as configurações de localidade para ja_JP.UTF-8.

2. Configurar Fontes do Terminal

GNOME Terminal (Terminal Padrão)

  1. Abra o terminal
  2. Vá para “Preferências”
  3. Abra “Preferências de Perfil” e vá para a aba “Texto”
  4. Ative “Usar fonte personalizada” e selecione uma das seguintes:
  • Noto Sans Mono CJK JP
  • VL Gothic
  • Takao Gothic
  1. Salve as configurações e reinicie o terminal

Definindo Codificação de Caracteres em Editores de Texto

1. Configurar Codificação do Vim

Para verificar suas configurações atuais, abra o Vim e execute:

:set encoding?
:set fileencoding?

Saída Esperada:

encoding=utf-8
fileencoding=utf-8

Se não estiver definido como utf-8, adicione o seguinte ao seu arquivo ~/.vimrc para tornar o UTF-8 o padrão:

set encoding=utf-8
set fileencodings=utf-8,sjis,euc-jp
set fileformats=unix,dos,mac

2. Configurar Codificação do Nano

Para alterar a configuração padrão, adicione a seguinte linha ao ~/.nanorc:

set encoding "utf-8"

3. Configurar Codificação no VSCode

  1. Clique em “Encoding” no canto inferior direito da janela do VSCode
  2. Selecione UTF-8
  3. Se necessário, use “Save with Encoding”

Para tornar UTF-8 a codificação padrão, adicione o seguinte ao seu arquivo settings.json:

"files.encoding": "utf8"

7. Solucionando Casos Específicos

Corrigindo Texto Corrompido em Aplicações GUI

1. Problemas de Exibição de Japonês no Firefox e Chrome

Solução:

  1. Instale as fontes necessárias
sudo apt install -y fonts-noto-cjk fonts-ipafont
  1. Verifique as configurações de fonte do navegador
  • Firefox:
    1. Vá para about:preferences, então abra “Fonts & Colors” → “Advanced”
    2. Altere “Proportional” e “Monospace Fonts” para Noto Sans CJK JP
  • Chrome:
    1. Vá para chrome://settings/fonts
    2. Altere “Standard Font” e “Monospace Font” para Noto Sans CJK JP

2. Corrigindo Texto Corrompido no LibreOffice

Solução:

  1. Instale fonts-noto-cjk e fonts-ipafont
  2. Altere as configurações de fonte do LibreOffice
  • Vá para “Tools” → “Options” → “LibreOffice” → “Fonts”
  • Altere a fonte padrão para Noto Sans CJK JP

Corrigindo Texto Corrompido em Ambientes CUI

1. Problemas de Texto Corrompido em Sessões SSH

Solução:

  1. Verifique as configurações de localidade no servidor
locale
  1. Se ja_JP.UTF-8 estiver ausente, execute:
sudo apt install -y language-pack-ja
sudo locale-gen ja_JP.UTF-8
sudo update-locale LANG=ja_JP.UTF-8

8. Perguntas Frequentes (FAQ)

Q1. Minha localidade está configurada corretamente, mas o texto corrompido persiste.

R: Mesmo que sua localidade esteja correta, verifique as configurações:

locale

Se LANG=ja_JP.UTF-8 não for exibido, redefina a localidade:

sudo update-locale LANG=ja_JP.UTF-8
sudo locale-gen ja_JP.UTF-8
sudo dpkg-reconfigure locales

Q2. Apenas arquivos específicos têm texto corrompido.

R: O arquivo pode ter uma codificação diferente. Verifique usando:

file -i sample.txt

Se o arquivo não estiver em UTF-8, converta-o:

iconv -f SHIFT_JIS -t UTF-8 sample.txt -o sample_utf8.txt

Ou usando nkf:

nkf -w --overwrite sample.txt

9. Conclusão

Neste artigo, abordamos os problemas de texto corrompido no Ubuntu, suas causas e como corrigi-los. As principais causas de texto corrompido incluem configurações de localidade incorretas, fontes ausentes, incompatibilidades de codificação de caracteres e configurações incorretas de terminal/editor.

Principais Pontos

  • Defina a localidade correta : Execute update-locale LANG=ja_JP.UTF-8
  • Instale fontes japonesas : Use sudo apt install -y fonts-noto-cjk fonts-ipafont
  • Verifique a codificação do arquivo : Use file -i e converta com iconv
  • Configure terminal e editores : Garanta que as configurações de codificação UTF-8 sejam aplicadas

Seguindo estas etapas, você pode resolver e prevenir problemas de texto corrompido no Ubuntu.

侍エンジニア塾