- 1 1. Introdução
- 2 2. Principais Causas do Texto Corrompido
- 3 3. Verificando e Corrigindo Configurações de Locale
- 4 4. Instalando e Configurando Fontes Japonesas
- 5 5. Verificando e Convertendo Codificação de Caracteres
- 6 6. Verificando Configurações do Terminal e do Editor
- 7 7. Soluções para Casos Específicos
- 8 8. FAQ (Perguntas Frequentes)
- 9 Conclusão
1. Introdução
Ao usar o Ubuntu, você pode ocasionalmente encontrar caracteres corrompidos. Esses problemas podem aparecer em várias situações, como saída do terminal, exibição de nomes de arquivos japoneses ou visualização de páginas web japonesas em um navegador. Em muitos casos, o texto japonês pode não ser exibido corretamente com a configuração padrão, tornando a configuração adequada essencial.
Este artigo explica as causas do texto corrompido no Ubuntu e fornece soluções concretas para resolvê-las. Este guia é destinado aos seguintes usuários:
- Iniciantes que estão usando o Ubuntu sem configurar o suporte ao idioma japonês
- Usuários que desejam entender a causa raiz dos caracteres corrompidos e buscam soluções fundamentais
- Usuários que experimentam texto corrompido em ambientes de terminal ou GUI e querem saber como corrigi-lo
Vamos começar revisando as principais causas do texto corrompido no Ubuntu.
2. Principais Causas do Texto Corrompido
Configurações de Locale Incorretas
O locale no Ubuntu define configurações do sistema relacionadas a idioma, formato de data e outros comportamentos regionais. Quando essas configurações estão incorretas, o texto japonês pode não ser exibido adequadamente, resultando em caracteres corrompidos.
Por exemplo, se ao executar o comando locale mostrar valores como “C” ou “POSIX”, o locale do sistema não está configurado corretamente:
$ locale
LANG=C
LC_ALL=
Idealmente, um ambiente japonês deve mostrar configurações como LANG=ja_JP.UTF-8.
Fontes Ausentes ou Não Configuradas
Em algumas instalações padrão do Ubuntu, as fontes japonesas podem não estar disponíveis, fazendo com que o texto japonês seja exibido como quadrados vazios (□) ou símbolos ilegíveis.
Esse problema geralmente ocorre nos seguintes cenários:
- Itens de menu e botões em aplicativos GUI aparecem corrompidos
- Ao abrir texto japonês em um editor de texto, os caracteres aparecem corrompidos
Codificação de Caracteres Incompatível
O Ubuntu usa principalmente a codificação UTF-8. Ao abrir arquivos codificados em Shift_JIS ou EUC-JP — comuns em sistemas Windows ou UNIX legados —, pode ocorrer corrupção de texto.
Problemas típicos incluem:
- Editores de texto exibem símbolos estranhos ao abrir arquivos japoneses
- A saída do comando
cataparece quebrada no terminal
Configuração Incorreta do Terminal ou Editor
Mesmo se os arquivos estiverem corretamente codificados em UTF-8, configurações incorretas do terminal ou editor ainda podem causar problemas de exibição.
- A codificação do terminal está definida para algo diferente de
UTF-8 - Editores como Vim ou VSCode falham em detectar automaticamente a codificação de caracteres
- Caracteres japoneses aparecem como “?” ou “◇” ao visualizar via
lessoucat
3. Verificando e Corrigindo Configurações de Locale
Como Verificar as Configurações de Locale
Para verificar a configuração atual de locale, execute o comando abaixo:
locale
Exemplo de saída:
LANG=C
LC_CTYPE="C"
LC_NUMERIC="C"
LC_TIME="C"
LC_COLLATE="C"
LC_MONETARY="C"
LC_MESSAGES="C"
LC_PAPER="C"
LC_NAME="C"
LC_ADDRESS="C"
LC_TELEPHONE="C"
LC_MEASUREMENT="C"
LC_IDENTIFICATION="C"
LC_ALL=
Nesse caso, LANG=C indica que o suporte ao japonês não está ativado. Para uma configuração japonesa adequada, você deve ver valores como:
LANG=ja_JP.UTF-8
LC_ALL=ja_JP.UTF-8
Instalando e Definindo o Locale Japonês
1. Verificar e Adicionar o Locale Japonês
Para confirmar se o locale japonês está disponível no seu sistema, execute o seguinte comando:
locale -a | grep ja_JP
Exemplo de saída:
ja_JP.eucJP
ja_JP.utf8
Se ja_JP.utf8 não estiver listado, você deve instalar o pacote de locale japonês.
Instale-o usando os seguintes comandos:
sudo apt update
sudo apt install -y language-pack-ja
Em seguida, ative o locale:
sudo locale-gen ja_JP.UTF-8
sudo update-locale LANG=ja_JP.UTF-8
2. Aplicar o Locale em Todo o Sistema
Para aplicar a alteração de locale em todo o sistema, execute os seguintes comandos:
export LANG=ja_JP.UTF-8
export LC_ALL=ja_JP.UTF-8
Para tornar essas alterações persistentes, adicione-as ao ~/.bashrc ou ~/.profile:
echo 'export LANG=ja_JP.UTF-8' >> ~/.bashrc
echo 'export LC_ALL=ja_JP.UTF-8' >> ~/.bashrc
source ~/.bashrc
Se você quiser aplicar as configurações a todos os usuários, edite o seguinte arquivo em vez disso:
sudo nano /etc/default/locale
Adicione ou atualize as seguintes entradas:
LANG=ja_JP.UTF-8
LC_ALL=ja_JP.UTF-8
Para aplicar as configurações, faça logout e login novamente, ou reinicie o sistema.
4. Instalando e Configurando Fontes Japonesas
Por que as Fontes Japonesas são Necessárias
Em um ambiente Ubuntu padrão, as fontes japonesas podem não estar instaladas. Sem elas, o texto em japonês aparece como quadrados vazios ou símbolos incompreensíveis.
Você pode confirmar a falta de fontes nas seguintes situações:
- Rótulos de menus e botões da interface exibem caracteres corrompidos
- Texto em japonês aparece corrompido ao ser aberto em um editor de texto
Fontes Japonesas Recomendadas
As seguintes fontes japonesas estão disponíveis para uso no Ubuntu:
| Font Name | Description |
|---|---|
| Noto Sans CJK JP | A high-quality Japanese font provided by Google (recommended as default) |
| Takao Fonts | The former default fonts in Ubuntu, available in regular and bold styles |
| IPA Fonts | High-quality fonts provided by the Information-technology Promotion Agency (IPA) |
| VL Gothic (VLゴシック) | Highly readable, ideal for terminal environments |
Como Instalar Fontes Japonesas
1. Noto Sans CJK JP (Padrão Recomendado)
sudo apt update
sudo apt install -y fonts-noto-cjk
2. Fontes Takao
sudo apt install -y fonts-takao
3. Fontes IPA
sudo apt install -y fonts-ipafont
4. VL Gothic (para Uso no Terminal)
sudo apt install -y fonts-vlgothic
Quando a instalação estiver concluída, reinicie o sistema ou atualize o cache de fontes:
fc-cache -fv
Como Configurar Fontes
Configurando Fontes em Aplicativos GUI
- Abra o aplicativo “Configurações”
- Navegue até a seção “Fontes”
- Altere “Fonte Padrão”, “Fonte de Documentos” e “Fonte Monoespaçada” para as fontes de sua preferência
- Faça logout e login novamente para aplicar as alterações
Configurando Fontes no Terminal
- Abra o terminal
- Selecione “Preferências” no menu
- Abra as configurações do “Perfil” e habilite “Usar fonte personalizada”
- Selecione a fonte de sua preferência (por exemplo, Noto Sans Mono CJK JP)
- Salve as configurações e reinicie o terminal
Verificar a Configuração de Fontes
Para confirmar que as fontes foram aplicadas corretamente, siga os passos abaixo:
- Verifique as fontes instaladas usando
fc-listfc-list | grep "Noto"
- Verifique a exibição de japonês no terminal
echo "こんにちは、Ubuntuの文字化け対策"
- Confirme a renderização de texto japonês em aplicativos GUI como Firefox ou LibreOffice
5. Verificando e Convertendo Codificação de Caracteres
O que é Codificação de Caracteres?
A codificação de caracteres define como os caracteres são representados digitalmente. Codificações comuns incluem:
| Encoding | Characteristics | Main Usage |
|---|---|---|
| UTF-8 | Multi-language support; standard in Linux | Ubuntu and web development |
| Shift_JIS | Japanese-focused; standard in Windows environments | Windows apps and legacy systems |
| EUC-JP | Previously used in UNIX-based systems | Older Linux distributions |
| ISO-2022-JP | Used in some mail systems | Email communication |
Como o Ubuntu usa UTF-8 como codificação padrão, abrir arquivos codificados em outros formatos pode gerar texto corrompido.
Como Verificar a Codificação de Caracteres de um Arquivo
1. Usando o Comando file
file -i sample.txt
Saída de exemplo:
sample.txt: text/plain; charset=iso-8859-1
2. Usando o Comando nkf
sudo apt install -y nkf
nkf --guess sample.txt
Saída de exemplo:
Shift_JIS (CRLF)
Como Converter Codificação de Caracteres
1. Usando o Comando iconv
Exemplo: Converter Shift_JIS para UTF-8
iconv -f SHIFT_JIS -t UTF-8 sample.txt -o sample_utf8.txt
Exemplo: Converter EUC-JP para UTF-8
iconv -f EUC-JP -t UTF-8 sample.txt -o sample_utf8.txt
2. Usando o Comando nkf
Exemplo: Converter Shift_JIS para UTF-8
nkf -w sample.txt > sample_utf8.txt
Exemplo: Converter EUC-JP para UTF-8
nkf -w --overwrite sample.txt
Evitando Texto Corrompido em Terminais e Editores
1. Exibir Codificação Correta com less
export LESSCHARSET=utf-8
less sample.txt
2. Abrir Arquivos com Codificação Especificada no vim
vim -c "set encoding=utf-8" sample.txt
3. Modificar Codificação de Caracteres no gedit ou no VSCode
- gedit (editor padrão do GNOME)
- Abra o arquivo usando
gedit sample.txt - Ao salvar, selecione
UTF-8no menu suspenso “Codificação”
- VSCode (Visual Studio Code)
.
- Clique no indicador “Encoding” na parte inferior da janela
- Selecione
UTF-8para converter o arquivo

6. Verificando Configurações do Terminal e do Editor
Verificar e Ajustar Configurações do Terminal
1. Verificar Codificação do Terminal
Para confirmar suas configurações de locale, execute os comandos abaixo:
echo $LANG
echo $LC_ALL
Exemplo de saída (configuração correta)
ja_JP.UTF-8
ja_JP.UTF-8
Se a saída mostrar C ou POSIX, altere o locale para ja_JP.UTF-8.
2. Configurar Fontes do Terminal
GNOME Terminal (terminal padrão do Ubuntu)
- Abra o terminal
- Selecione “Preferences”
- Abra o “Profile” e navegue até a aba “Text”
- Ative “Use custom font” e selecione uma das seguintes:
- Noto Sans Mono CJK JP
- VL Gothic
- Takao Gothic
- Salve suas configurações e reinicie o terminal
Configurando Codificação do Editor
1. Configurações de Codificação do Vim
Abra o Vim e execute os seguintes comandos para verificar a codificação atual:
:set encoding?
:set fileencoding?
Exemplo de saída:
encoding=utf-8
fileencoding=utf-8
Se as configurações diferirem de utf-8, atualize o ~/.vimrc com:
set encoding=utf-8
set fileencodings=utf-8,sjis,euc-jp
set fileformats=unix,dos,mac
2. Configurações de Codificação do Nano
Para mudar a codificação padrão, adicione o seguinte ao ~/.nanorc:
set encoding "utf-8"
3. Configurações de Codificação do VSCode
- Clique no indicador “Encoding” no canto inferior direito
- Selecione “Reopen with Encoding” e escolha
UTF-8 - Se necessário, selecione “Save with Encoding”
Para definir UTF-8 como padrão, adicione o seguinte ao settings.json:
"files.encoding": "utf8"
7. Soluções para Casos Específicos
Prevenindo Texto Corrompido em Aplicações GUI
1. Caracteres Japoneses são exibidos incorretamente no Firefox ou Chrome
Solução:
- Instale as fontes japonesas necessárias
sudo apt install -y fonts-noto-cjk fonts-ipafont
- Verifique e atualize as configurações de fonte do navegador
Firefox: wp:list {“ordered”:true} /wp:list
- Visite
about:preferences - Abra “Fonts & Colors” → “Advanced”
Defina as fontes “Proportional” e “Monospace” para
Noto Sans CJK JP
Google Chrome:* wp:list {“ordered”:true} /wp:listAcesse
chrome://settings/fonts- Altere “Standard font” e “Fixed-width font” para
Noto Sans CJK JP
- Visite
2. Texto Corrompido no LibreOffice
Solução:
- Instale fontes japonesas como
fonts-noto-cjkoufonts-ipafont - Altere as configurações de fonte do LibreOffice
- Vá para “Tools” → “Options” → “LibreOffice” → “Fonts”
- Defina a fonte padrão para
Noto Sans CJK JP
Prevenindo Texto Corrompido em Ambientes CUI
1. Sessão SSH Exibe Caracteres Corrompidos
Solução:
- Verifique o locale no servidor remoto
locale
- Se não estiver definido como
ja_JP.UTF-8, execute os seguintes comandos:sudo apt install -y language-pack-ja sudo locale-gen ja_JP.UTF-8 sudo update-locale LANG=ja_JP.UTF-8
Prevenindo Texto Corrompido em Aplicações Específicas
1. WSL (Windows Subsystem for Linux) Exibe Texto Japonês Corrompido
Solução:
- Configure o WSL para usar
ja_JP.UTF-8echo 'export LANG=ja_JP.UTF-8' >> ~/.bashrc echo 'export LC_ALL=ja_JP.UTF-8' >> ~/.bashrc source ~/.bashrc
- Defina a fonte do Windows Terminal para
Noto Sans Mono CJK JP
2. Texto Japonês Corrompido Dentro de Contêineres Docker
Solução:
- Entre no contêiner e verifique o locale
docker exec -it container_name bash locale
- Adicione o locale japonês se estiver ausente
apt update && apt install -y locales locale-gen ja_JP.UTF-8 export LANG=ja_JP.UTF-8 export LC_ALL=ja_JP.UTF-8
8. FAQ (Perguntas Frequentes)
Q1. Eu configurei o locale corretamente, mas o texto corrompido ainda aparece.
A: Verifique as configurações de locale novamente:
locale
Se LANG=ja_JP.UTF-8 não estiver definido, reconfigure usando:
.“` sudo update-locale LANG=ja_JP.UTF-8 sudo locale-gen ja_JP.UTF-8 sudo dpkg-reconfigure locales
### **Q2. Apenas certos arquivos exibem texto corrompido.**
**R:** Arquivos diferentes podem ter codificações de caracteres diferentes. Verifique a codificação:
file -i sample.txt
Se o arquivo não for UTF-8, converta‑o:
iconv -f SHIFT_JIS -t UTF-8 sample.txt -o sample_utf8.txt
Ou, usando `nkf`:
nkf -w –overwrite sample.txt
### **Q3. Não consigo inserir caracteres japoneses no terminal.**
**R:** Certifique‑se de que um método de entrada japonês (Fcitx ou IBus) esteja instalado.
sudo apt update sudo apt install -y fcitx-mozc im-config -n fcitx
### **Q4. Texto japonês aparece corrompido no WSL.**
**R:** Defina a localidade no WSL:
echo ‘export LANG=ja_JP.UTF-8’ >> ~/.bashrc echo ‘export LC_ALL=ja_JP.UTF-8’ >> ~/.bashrc source ~/.bashrc
### **Q5. Texto japonês aparece corrompido dentro de um contêiner Docker.**
**R:** Se a localidade for `C.UTF-8`, o texto japonês não será exibido corretamente.
apt update && apt install -y locales locale-gen ja_JP.UTF-8 export LANG=ja_JP.UTF-8 export LC_ALL=ja_JP.UTF-8
### **Q6. Menus e diálogos da GUI exibem texto japonês corrompido.**
**R:** Instale fontes e altere as configurações de fonte:
sudo apt install -y fonts-noto-cjk fonts-ipafont
## 9. Resumo
Este artigo forneceu uma explicação detalhada das causas e soluções para **problemas de texto corrompido no Ubuntu**. Caracteres corrompidos geralmente ocorrem devido a configurações de localidade incorretas, fontes ausentes, incompatibilidade de codificação de caracteres ou configurações inadequadas de terminal/editor. Contudo, com os ajustes corretos, esses problemas podem ser resolvidos de forma eficaz.
### **1. Principais Causas de Texto Corrompido**
* **Configuração de localidade incorreta**: Se a localidade do sistema estiver definida como `C` ou `POSIX`, o texto japonês não pode ser exibido corretamente
* **Fontes não instaladas**: Sem fontes japonesas, aplicativos GUI e terminais não conseguem renderizar corretamente os caracteres japoneses
* **Incompatibilidade de codificação**: Abrir arquivos salvos em codificações diferentes (por exemplo, Shift_JIS) pode causar corrupção
* **Configurações inadequadas de terminal/editor**: Se a codificação não estiver definida como UTF-8, o texto japonês pode não ser exibido corretamente
### **2. Soluções para Prevenir Texto Corrompido**
Item Solution Locale configuration Check with locale and run update-locale LANG=ja_JP.UTF-8 Font installation sudo apt install -y fonts-noto-cjk fonts-ipafontCheck file encoding Use file -i or nkf --guess Convert encoding iconv -f SHIFT_JIS -t UTF-8 filename -o newfileTerminal configuration Set LESSCHARSET=utf-8 and change fonts to Noto Sans Mono CJK JP Fix GUI garbled text Set fonts to Noto Sans CJK JP and use gnome-tweaks if needed Fix WSL garbled text Set ja_JP.UTF-8 and configure fonts Fix Docker garbled text Run locale-gen ja_JP.UTF-8 and configure locale in Dockerfile
### **3. Recomendações Adicionais**
* **Mantenha seu sistema atualizado**: Pacotes desatualizados podem causar problemas no ambiente japonês
sudo apt update && sudo apt upgrade -y “`
- Persistir configurações: Adicione as configurações de localidade ao
~/.bashrcou~/.profilepara aplicá‑las automaticamente ao fazer login - Faça backup dos arquivos de configuração: Antes de editar arquivos como
/etc/default/locale, faça um backup
Conclusão
O problema de texto corrompido no Ubuntu pode ser resolvido configurando corretamente os quatro componentes chave: localidade, fontes, codificação de caracteres e configurações de terminal/editor. Seguindo os métodos apresentados neste guia, você pode eliminar quase todos os problemas de texto corrompido em ambientes Ubuntu, seja em sessões de terminal, aplicativos GUI, WSL ou contêineres Docker.



