Como Corrigir Texto Corrompido no Ubuntu: Guia Completo de Configurações de Localidade, Fontes e Codificação

目次

1. Introdução

Ao usar o Ubuntu, você pode ocasionalmente encontrar caracteres corrompidos. Esses problemas podem aparecer em várias situações, como saída do terminal, exibição de nomes de arquivos japoneses ou visualização de páginas web japonesas em um navegador. Em muitos casos, o texto japonês pode não ser exibido corretamente com a configuração padrão, tornando a configuração adequada essencial.

Este artigo explica as causas do texto corrompido no Ubuntu e fornece soluções concretas para resolvê-las. Este guia é destinado aos seguintes usuários:

  • Iniciantes que estão usando o Ubuntu sem configurar o suporte ao idioma japonês
  • Usuários que desejam entender a causa raiz dos caracteres corrompidos e buscam soluções fundamentais
  • Usuários que experimentam texto corrompido em ambientes de terminal ou GUI e querem saber como corrigi-lo

Vamos começar revisando as principais causas do texto corrompido no Ubuntu.

2. Principais Causas do Texto Corrompido

Configurações de Locale Incorretas

O locale no Ubuntu define configurações do sistema relacionadas a idioma, formato de data e outros comportamentos regionais. Quando essas configurações estão incorretas, o texto japonês pode não ser exibido adequadamente, resultando em caracteres corrompidos.

Por exemplo, se ao executar o comando locale mostrar valores como “C” ou “POSIX”, o locale do sistema não está configurado corretamente:

$ locale
LANG=C
LC_ALL=

Idealmente, um ambiente japonês deve mostrar configurações como LANG=ja_JP.UTF-8.

Fontes Ausentes ou Não Configuradas

Em algumas instalações padrão do Ubuntu, as fontes japonesas podem não estar disponíveis, fazendo com que o texto japonês seja exibido como quadrados vazios (□) ou símbolos ilegíveis.

Esse problema geralmente ocorre nos seguintes cenários:

  • Itens de menu e botões em aplicativos GUI aparecem corrompidos
  • Ao abrir texto japonês em um editor de texto, os caracteres aparecem corrompidos

Codificação de Caracteres Incompatível

O Ubuntu usa principalmente a codificação UTF-8. Ao abrir arquivos codificados em Shift_JIS ou EUC-JP — comuns em sistemas Windows ou UNIX legados —, pode ocorrer corrupção de texto.

Problemas típicos incluem:

  • Editores de texto exibem símbolos estranhos ao abrir arquivos japoneses
  • A saída do comando cat aparece quebrada no terminal

Configuração Incorreta do Terminal ou Editor

Mesmo se os arquivos estiverem corretamente codificados em UTF-8, configurações incorretas do terminal ou editor ainda podem causar problemas de exibição.

  • A codificação do terminal está definida para algo diferente de UTF-8
  • Editores como Vim ou VSCode falham em detectar automaticamente a codificação de caracteres
  • Caracteres japoneses aparecem como “?” ou “◇” ao visualizar via less ou cat

3. Verificando e Corrigindo Configurações de Locale

Como Verificar as Configurações de Locale

Para verificar a configuração atual de locale, execute o comando abaixo:

locale

Exemplo de saída:

LANG=C
LC_CTYPE="C"
LC_NUMERIC="C"
LC_TIME="C"
LC_COLLATE="C"
LC_MONETARY="C"
LC_MESSAGES="C"
LC_PAPER="C"
LC_NAME="C"
LC_ADDRESS="C"
LC_TELEPHONE="C"
LC_MEASUREMENT="C"
LC_IDENTIFICATION="C"
LC_ALL=

Nesse caso, LANG=C indica que o suporte ao japonês não está ativado. Para uma configuração japonesa adequada, você deve ver valores como:

LANG=ja_JP.UTF-8
LC_ALL=ja_JP.UTF-8

Instalando e Definindo o Locale Japonês

1. Verificar e Adicionar o Locale Japonês

Para confirmar se o locale japonês está disponível no seu sistema, execute o seguinte comando:

locale -a | grep ja_JP

Exemplo de saída:

ja_JP.eucJP
ja_JP.utf8

Se ja_JP.utf8 não estiver listado, você deve instalar o pacote de locale japonês.

Instale-o usando os seguintes comandos:

sudo apt update
sudo apt install -y language-pack-ja

Em seguida, ative o locale:

sudo locale-gen ja_JP.UTF-8
sudo update-locale LANG=ja_JP.UTF-8

2. Aplicar o Locale em Todo o Sistema

Para aplicar a alteração de locale em todo o sistema, execute os seguintes comandos:

export LANG=ja_JP.UTF-8
export LC_ALL=ja_JP.UTF-8

Para tornar essas alterações persistentes, adicione-as ao ~/.bashrc ou ~/.profile:

echo 'export LANG=ja_JP.UTF-8' >> ~/.bashrc
echo 'export LC_ALL=ja_JP.UTF-8' >> ~/.bashrc
source ~/.bashrc

Se você quiser aplicar as configurações a todos os usuários, edite o seguinte arquivo em vez disso:

sudo nano /etc/default/locale

Adicione ou atualize as seguintes entradas:

LANG=ja_JP.UTF-8
LC_ALL=ja_JP.UTF-8

Para aplicar as configurações, faça logout e login novamente, ou reinicie o sistema.

4. Instalando e Configurando Fontes Japonesas

Por que as Fontes Japonesas são Necessárias

Em um ambiente Ubuntu padrão, as fontes japonesas podem não estar instaladas. Sem elas, o texto em japonês aparece como quadrados vazios ou símbolos incompreensíveis.

Você pode confirmar a falta de fontes nas seguintes situações:

  • Rótulos de menus e botões da interface exibem caracteres corrompidos
  • Texto em japonês aparece corrompido ao ser aberto em um editor de texto

Fontes Japonesas Recomendadas

As seguintes fontes japonesas estão disponíveis para uso no Ubuntu:

Font NameDescription
Noto Sans CJK JPA high-quality Japanese font provided by Google (recommended as default)
Takao FontsThe former default fonts in Ubuntu, available in regular and bold styles
IPA FontsHigh-quality fonts provided by the Information-technology Promotion Agency (IPA)
VL Gothic (VLゴシック)Highly readable, ideal for terminal environments

Como Instalar Fontes Japonesas

1. Noto Sans CJK JP (Padrão Recomendado)

sudo apt update
sudo apt install -y fonts-noto-cjk

2. Fontes Takao

sudo apt install -y fonts-takao

3. Fontes IPA

sudo apt install -y fonts-ipafont

4. VL Gothic (para Uso no Terminal)

sudo apt install -y fonts-vlgothic

Quando a instalação estiver concluída, reinicie o sistema ou atualize o cache de fontes:

fc-cache -fv

Como Configurar Fontes

Configurando Fontes em Aplicativos GUI

  1. Abra o aplicativo “Configurações”
  2. Navegue até a seção “Fontes”
  3. Altere “Fonte Padrão”, “Fonte de Documentos” e “Fonte Monoespaçada” para as fontes de sua preferência
  4. Faça logout e login novamente para aplicar as alterações

Configurando Fontes no Terminal

  1. Abra o terminal
  2. Selecione “Preferências” no menu
  3. Abra as configurações do “Perfil” e habilite “Usar fonte personalizada”
  4. Selecione a fonte de sua preferência (por exemplo, Noto Sans Mono CJK JP)
  5. Salve as configurações e reinicie o terminal

Verificar a Configuração de Fontes

Para confirmar que as fontes foram aplicadas corretamente, siga os passos abaixo:

  1. Verifique as fontes instaladas usando fc-list
    fc-list | grep "Noto"
    
  1. Verifique a exibição de japonês no terminal
    echo "こんにちは、Ubuntuの文字化け対策"
    
  1. Confirme a renderização de texto japonês em aplicativos GUI como Firefox ou LibreOffice

5. Verificando e Convertendo Codificação de Caracteres

O que é Codificação de Caracteres?

A codificação de caracteres define como os caracteres são representados digitalmente. Codificações comuns incluem:

EncodingCharacteristicsMain Usage
UTF-8Multi-language support; standard in LinuxUbuntu and web development
Shift_JISJapanese-focused; standard in Windows environmentsWindows apps and legacy systems
EUC-JPPreviously used in UNIX-based systemsOlder Linux distributions
ISO-2022-JPUsed in some mail systemsEmail communication

Como o Ubuntu usa UTF-8 como codificação padrão, abrir arquivos codificados em outros formatos pode gerar texto corrompido.

Como Verificar a Codificação de Caracteres de um Arquivo

1. Usando o Comando file

file -i sample.txt

Saída de exemplo:

sample.txt: text/plain; charset=iso-8859-1

2. Usando o Comando nkf

sudo apt install -y nkf
nkf --guess sample.txt

Saída de exemplo:

Shift_JIS (CRLF)

Como Converter Codificação de Caracteres

1. Usando o Comando iconv

Exemplo: Converter Shift_JIS para UTF-8

iconv -f SHIFT_JIS -t UTF-8 sample.txt -o sample_utf8.txt

Exemplo: Converter EUC-JP para UTF-8

iconv -f EUC-JP -t UTF-8 sample.txt -o sample_utf8.txt

2. Usando o Comando nkf

Exemplo: Converter Shift_JIS para UTF-8

nkf -w sample.txt > sample_utf8.txt

Exemplo: Converter EUC-JP para UTF-8

nkf -w --overwrite sample.txt

Evitando Texto Corrompido em Terminais e Editores

1. Exibir Codificação Correta com less

export LESSCHARSET=utf-8
less sample.txt

2. Abrir Arquivos com Codificação Especificada no vim

vim -c "set encoding=utf-8" sample.txt

3. Modificar Codificação de Caracteres no gedit ou no VSCode

  • gedit (editor padrão do GNOME)
  1. Abra o arquivo usando gedit sample.txt
  2. Ao salvar, selecione UTF-8 no menu suspenso “Codificação”
  • VSCode (Visual Studio Code)

.

  1. Clique no indicador “Encoding” na parte inferior da janela
  2. Selecione UTF-8 para converter o arquivo

6. Verificando Configurações do Terminal e do Editor

Verificar e Ajustar Configurações do Terminal

1. Verificar Codificação do Terminal

Para confirmar suas configurações de locale, execute os comandos abaixo:

echo $LANG
echo $LC_ALL

Exemplo de saída (configuração correta)

ja_JP.UTF-8
ja_JP.UTF-8

Se a saída mostrar C ou POSIX, altere o locale para ja_JP.UTF-8.

2. Configurar Fontes do Terminal

GNOME Terminal (terminal padrão do Ubuntu)

  1. Abra o terminal
  2. Selecione “Preferences”
  3. Abra o “Profile” e navegue até a aba “Text”
  4. Ative “Use custom font” e selecione uma das seguintes:
  • Noto Sans Mono CJK JP
  • VL Gothic
  • Takao Gothic
  1. Salve suas configurações e reinicie o terminal

Configurando Codificação do Editor

1. Configurações de Codificação do Vim

Abra o Vim e execute os seguintes comandos para verificar a codificação atual:

:set encoding?
:set fileencoding?

Exemplo de saída:

encoding=utf-8
fileencoding=utf-8

Se as configurações diferirem de utf-8, atualize o ~/.vimrc com:

set encoding=utf-8
set fileencodings=utf-8,sjis,euc-jp
set fileformats=unix,dos,mac

2. Configurações de Codificação do Nano

Para mudar a codificação padrão, adicione o seguinte ao ~/.nanorc:

set encoding "utf-8"

3. Configurações de Codificação do VSCode

  1. Clique no indicador “Encoding” no canto inferior direito
  2. Selecione “Reopen with Encoding” e escolha UTF-8
  3. Se necessário, selecione “Save with Encoding”

Para definir UTF-8 como padrão, adicione o seguinte ao settings.json:

"files.encoding": "utf8"

7. Soluções para Casos Específicos

Prevenindo Texto Corrompido em Aplicações GUI

1. Caracteres Japoneses são exibidos incorretamente no Firefox ou Chrome

Solução:

  1. Instale as fontes japonesas necessárias
    sudo apt install -y fonts-noto-cjk fonts-ipafont
    
  1. Verifique e atualize as configurações de fonte do navegador
  • Firefox: wp:list {“ordered”:true} /wp:list

    1. Visite about:preferences
    2. Abra “Fonts & Colors” → “Advanced”
    3. Defina as fontes “Proportional” e “Monospace” para Noto Sans CJK JP
      Google Chrome:* wp:list {“ordered”:true} /wp:list

    4. Acesse chrome://settings/fonts

    5. Altere “Standard font” e “Fixed-width font” para Noto Sans CJK JP

2. Texto Corrompido no LibreOffice

Solução:

  1. Instale fontes japonesas como fonts-noto-cjk ou fonts-ipafont
  2. Altere as configurações de fonte do LibreOffice
  • Vá para “Tools” → “Options” → “LibreOffice” → “Fonts”
  • Defina a fonte padrão para Noto Sans CJK JP

Prevenindo Texto Corrompido em Ambientes CUI

1. Sessão SSH Exibe Caracteres Corrompidos

Solução:

  1. Verifique o locale no servidor remoto
    locale
    
  1. Se não estiver definido como ja_JP.UTF-8, execute os seguintes comandos:
    sudo apt install -y language-pack-ja
    sudo locale-gen ja_JP.UTF-8
    sudo update-locale LANG=ja_JP.UTF-8
    

Prevenindo Texto Corrompido em Aplicações Específicas

1. WSL (Windows Subsystem for Linux) Exibe Texto Japonês Corrompido

Solução:

  1. Configure o WSL para usar ja_JP.UTF-8
    echo 'export LANG=ja_JP.UTF-8' >> ~/.bashrc
    echo 'export LC_ALL=ja_JP.UTF-8' >> ~/.bashrc
    source ~/.bashrc
    
  1. Defina a fonte do Windows Terminal para Noto Sans Mono CJK JP

2. Texto Japonês Corrompido Dentro de Contêineres Docker

Solução:

  1. Entre no contêiner e verifique o locale
    docker exec -it container_name bash
    locale
    
  1. Adicione o locale japonês se estiver ausente
    apt update && apt install -y locales
    locale-gen ja_JP.UTF-8
    export LANG=ja_JP.UTF-8
    export LC_ALL=ja_JP.UTF-8
    

8. FAQ (Perguntas Frequentes)

Q1. Eu configurei o locale corretamente, mas o texto corrompido ainda aparece.

A: Verifique as configurações de locale novamente:

locale

Se LANG=ja_JP.UTF-8 não estiver definido, reconfigure usando:

.“` sudo update-locale LANG=ja_JP.UTF-8 sudo locale-gen ja_JP.UTF-8 sudo dpkg-reconfigure locales

### **Q2. Apenas certos arquivos exibem texto corrompido.**



**R:** Arquivos diferentes podem ter codificações de caracteres diferentes. Verifique a codificação:

file -i sample.txt

Se o arquivo não for UTF-8, converta‑o:

iconv -f SHIFT_JIS -t UTF-8 sample.txt -o sample_utf8.txt

Ou, usando `nkf`:

nkf -w –overwrite sample.txt

### **Q3. Não consigo inserir caracteres japoneses no terminal.**



**R:** Certifique‑se de que um método de entrada japonês (Fcitx ou IBus) esteja instalado.

sudo apt update sudo apt install -y fcitx-mozc im-config -n fcitx

### **Q4. Texto japonês aparece corrompido no WSL.**



**R:** Defina a localidade no WSL:

echo ‘export LANG=ja_JP.UTF-8’ >> ~/.bashrc echo ‘export LC_ALL=ja_JP.UTF-8’ >> ~/.bashrc source ~/.bashrc

### **Q5. Texto japonês aparece corrompido dentro de um contêiner Docker.**



**R:** Se a localidade for `C.UTF-8`, o texto japonês não será exibido corretamente.

apt update && apt install -y locales locale-gen ja_JP.UTF-8 export LANG=ja_JP.UTF-8 export LC_ALL=ja_JP.UTF-8

### **Q6. Menus e diálogos da GUI exibem texto japonês corrompido.**



**R:** Instale fontes e altere as configurações de fonte:

sudo apt install -y fonts-noto-cjk fonts-ipafont

## 9. Resumo



Este artigo forneceu uma explicação detalhada das causas e soluções para **problemas de texto corrompido no Ubuntu**. Caracteres corrompidos geralmente ocorrem devido a configurações de localidade incorretas, fontes ausentes, incompatibilidade de codificação de caracteres ou configurações inadequadas de terminal/editor. Contudo, com os ajustes corretos, esses problemas podem ser resolvidos de forma eficaz.



### **1. Principais Causas de Texto Corrompido**



* **Configuração de localidade incorreta**: Se a localidade do sistema estiver definida como `C` ou `POSIX`, o texto japonês não pode ser exibido corretamente
* **Fontes não instaladas**: Sem fontes japonesas, aplicativos GUI e terminais não conseguem renderizar corretamente os caracteres japoneses
* **Incompatibilidade de codificação**: Abrir arquivos salvos em codificações diferentes (por exemplo, Shift_JIS) pode causar corrupção
* **Configurações inadequadas de terminal/editor**: Se a codificação não estiver definida como UTF-8, o texto japonês pode não ser exibido corretamente



### **2. Soluções para Prevenir Texto Corrompido**


ItemSolution
Locale configurationCheck with locale and run update-locale LANG=ja_JP.UTF-8
Font installationsudo apt install -y fonts-noto-cjk fonts-ipafont
Check file encodingUse file -i or nkf --guess
Convert encodingiconv -f SHIFT_JIS -t UTF-8 filename -o newfile
Terminal configurationSet LESSCHARSET=utf-8 and change fonts to Noto Sans Mono CJK JP
Fix GUI garbled textSet fonts to Noto Sans CJK JP and use gnome-tweaks if needed
Fix WSL garbled textSet ja_JP.UTF-8 and configure fonts
Fix Docker garbled textRun locale-gen ja_JP.UTF-8 and configure locale in Dockerfile
### **3. Recomendações Adicionais** * **Mantenha seu sistema atualizado**: Pacotes desatualizados podem causar problemas no ambiente japonês

sudo apt update && sudo apt upgrade -y “`

  • Persistir configurações: Adicione as configurações de localidade ao ~/.bashrc ou ~/.profile para aplicá‑las automaticamente ao fazer login
  • Faça backup dos arquivos de configuração: Antes de editar arquivos como /etc/default/locale, faça um backup

Conclusão

O problema de texto corrompido no Ubuntu pode ser resolvido configurando corretamente os quatro componentes chave: localidade, fontes, codificação de caracteres e configurações de terminal/editor. Seguindo os métodos apresentados neste guia, você pode eliminar quase todos os problemas de texto corrompido em ambientes Ubuntu, seja em sessões de terminal, aplicativos GUI, WSL ou contêineres Docker.

侍エンジニア塾