Complete gids voor het oplossen van vervormde tekst in Ubuntu | Oorzaken, oplossingen en configuratiewijzigingen

目次

1. Inleiding

Bij het gebruik van Ubuntu kunt u in bepaalde situaties te maken krijgen met vervormde tekst. Dit kan gebeuren in terminaluitvoer, bij het weergeven van Japanse bestandsnamen, of tijdens het browsen van Japanse webpagina’s, afhankelijk van uw omgeving. In veel gevallen wordt Japans niet correct weergegeven met de standaardinstellingen, wat een juiste configuratie vereist. In dit artikel leggen we de oorzaken van vervormde tekst in Ubuntu uit en bieden we concrete oplossingen om dit op te lossen. Deze handleiding is bedoeld voor:

  • Ubuntu-beginners die nog geen Japanse weergave-instellingen hebben ingesteld
  • Gebruikers die de worteloorzaken van vervormde tekst willen begrijpen en fundamentele oplossingen willen vinden
  • Gebruikers die vervormde tekst ervaren in terminal- of GUI-omgevingen en willen weten hoe ze dit kunnen repareren

Laten we beginnen met het onderzoeken van de belangrijkste oorzaken van vervormde tekst in Ubuntu.

2. Hoofdredenen voor Vervormde Tekst

Onjuiste Locale-instellingen

Locales in Ubuntu definiëren systeemmaal en datumopmaakinstellingen. Als deze niet correct zijn geconfigureerd, kan Japanse tekst niet correct worden weergegeven, wat leidt tot vervormde karakters. Bijvoorbeeld, als u het locale-commando uitvoert en “C” of “POSIX” in de uitvoer ziet, zijn uw locale-instellingen mogelijk onjuist:

$ locale
LANG=C
LC_ALL=

Ideaal gezien moet voor een Japanse omgeving LANG=ja_JP.UTF-8 worden ingesteld.

Ontbrekende of Onvoldoende Lettertypen

Standaard heeft Ubuntu mogelijk geen Japanse lettertypen geïnstalleerd. Hierdoor kan Japanse tekst niet correct worden weergegeven en in plaats daarvan verschijnen als vierkante vakjes (□) of willekeurige symbolen. Lettertypeproblemen kunnen worden geïdentificeerd in de volgende gevallen:

  • Vervormde tekst verschijnt in menu’s en knoppen van GUI-toepassingen
  • Japanse tekst in een teksteditor verschijnt vervormd

Ongelijke Karaktercodering

Hoewel Ubuntu voornamelijk UTF-8 als standaardcodering gebruikt, kan het openen van bestanden die zijn gecodeerd in Shift_JIS of EUC-JP van externe bronnen leiden tot vervormde tekst. Bijvoorbeeld, het openen van een bestand dat is gemaakt in een Windows-omgeving op Ubuntu kan het volgende tot gevolg hebben:

  • Onleesbare karakters bij het openen in een teksteditor
  • Verwrongen tekst bij het gebruik van het cat-commando in de terminal

Verkeerd Geconfigureerde Terminal- of Editorinstellingen

Zelfs als een bestand is gecodeerd in UTF-8, kunnen onjuiste terminal- of editorinstellingen een correcte tekstweergave voorkomen.

  • De terminalcodering is ingesteld op iets anders dan UTF-8
  • Teksteditors zoals Vim of VSCode detecteren de juiste codering niet automatisch
  • Japanse karakters verschijnen als “?” of “◇” bij weergave met less of cat

3. Controleren en Repareren van Locale-instellingen

Hoe u Uw Locale-instellingen Kunt Controleren

Om uw huidige locale-instellingen te controleren, voert u het volgende commando uit:

locale

Voorbeeld van uitvoer:

LANG=C
LC_CTYPE="C"
LC_NUMERIC="C"
LC_TIME="C"
LC_COLLATE="C"
LC_MONETARY="C"
LC_MESSAGES="C"
LC_PAPER="C"
LC_NAME="C"
LC_ADDRESS="C"
LC_TELEPHONE="C"
LC_MEASUREMENT="C"
LC_IDENTIFICATION="C"
LC_ALL=

Als LANG=C wordt weergegeven, is uw systeem niet correct ingesteld voor Japans. Een correct geconfigureerde Japanse omgeving zou er zo uit moeten zien:

LANG=ja_JP.UTF-8
LC_ALL=ja_JP.UTF-8

Installeren en Configureren van Japanse Locale

1. Controleren en Toevoegen van Japanse Locale

Om te controleren of de Japanse locale is geïnstalleerd, voert u het volgende uit:

locale -a | grep ja_JP

Voorbeeld van uitvoer:

ja_JP.eucJP
ja_JP.utf8

Als ja_JP.utf8 ontbreekt, installeert u de Japanse locale met:

sudo apt update
sudo apt install -y language-pack-ja

Genereer vervolgens de locale en werk de systeeminstellingen bij:

sudo locale-gen ja_JP.UTF-8
sudo update-locale LANG=ja_JP.UTF-8

2. Systeemwijde Locale Instellen

Om de wijzigingen systeemwijd toe te passen, voert u het volgende uit:

export LANG=ja_JP.UTF-8
export LC_ALL=ja_JP.UTF-8

Om deze wijzigingen permanent te maken, voegt u ze toe aan ~/.bashrc of ~/.profile:

echo 'export LANG=ja_JP.UTF-8' >> ~/.bashrc
echo 'export LC_ALL=ja_JP.UTF-8' >> ~/.bashrc
source ~/.bashrc

Voor systeemwijde wijzigingen, bewerk:

sudo nano /etc/default/locale

En voeg het volgende toe of wijzig het:

LANG=ja_JP.UTF-8
LC_ALL=ja_JP.UTF-8

Om de instellingen toe te passen, log uit en log opnieuw in of herstart je systeem.

4. Lettertypen installeren en configureren

Waarom Japanse lettertypen nodig zijn

Standaard heeft Ubuntu mogelijk geen Japanse lettertypen geïnstalleerd. Dit kan leiden tot onjuist weergegeven Japanse tekst, die verschijnt als vierkante vakjes (□) of onleesbare symbolen.
Lettertypegerelateerde problemen kunnen in de volgende gevallen worden waargenomen:

  • Menu’s en knoppen in GUI-toepassingen verschijnen onsamenhangend
  • Japanse tekst in een teksteditor wordt onjuist weergegeven

Aanbevolen Japanse lettertypen

Hier zijn enkele aanbevolen Japanse lettertypen voor Ubuntu:

Font Name

Functies

Noto Sans CJK JP

Een hoogwaardige Japanse lettertype geleverd door Google (aanbevolen als standaard)

Takao Fonts

Eerder was het standaardlettertype voor Ubuntu (beschikbaar in dun en vet).

IPA Fonts

Hoogwaardige lettertypen geleverd door de Information-technology Promotion Agency (IPA)

VL Gothic

Zeer leesbaar en geoptimaliseerd voor terminalgebruik

Hoe lettertypen te installeren

1. Installeer Noto Sans CJK JP (aanbevolen standaardlettertype)

sudo apt update
sudo apt install -y fonts-noto-cjk

2. Installeer Takao-lettertypen

sudo apt install -y fonts-takao

3. Installeer IPA-lettertypen (Information-technology Promotion Agency)

sudo apt install -y fonts-ipafont

4. Installeer VL Gothic (geoptimaliseerd voor terminal)

sudo apt install -y fonts-vlgothic

Na het installeren van de lettertypen, herstart je systeem of ververs je de lettertypecache met:

fc-cache -fv

Hoe lettertypen te configureren

Lettertypen instellen in GUI-toepassingen

  1. Open de applicatie “Instellingen”
  2. Ga naar de sectie “Lettertypen”
  3. Wijzig het “Standaardlettertype”, “Documentlettertype” en “Monospace-lettertype” naar je gewenste lettertype
  4. Log uit en log opnieuw in om de instellingen toe te passen

Lettertypen instellen in de terminal

  1. Open de terminal
  2. Ga naar “Voorkeuren” → “Profielvoorkeuren”
  3. Vink het vakje “Aangepast lettertype gebruiken” aan
  4. Selecteer een gewenst lettertype (bijv. Noto Sans Mono CJK JP)
  5. Sla de instellingen op en herstart de terminal

Toepassen en verifiëren van lettertype‑instellingen

Om te verifiëren of de lettertype‑instellingen correct zijn toegepast, probeer het volgende:

  1. Controleer de geïnstalleerde lettertypen met het fc-list‑commando

“` fc-list | grep “Noto”

2. Test de weergave van Japanse tekst in de terminal  

   ```
echo "こんにちは、Ubuntuの文字化け対策"
  1. Controleer of Japanse tekst correct wordt weergegeven in GUI-toepassingen (Firefox, LibreOffice, enz.)

5. Controle en conversie van tekencodering

Wat is tekencodering?

Tekencodering is een systeem dat digitale codes toekent aan tekens. Enkele veelgebruikte coderingen zijn:

Encoding

Features

Primary Usage

UTF-8

Supports multiple languages, the standard for Linux

Ubuntu, Web development

Shift_JIS

Japanese-specific, commonly used in Windows

Windows applications, legacy systems

EUC-JP

Used in UNIX-based systems

Older Linux systems

ISO-2022-JP

Used for emails and specific environments

Email communication

Aangezien Ubuntu voornamelijk UTF-8 gebruikt, kan het openen van bestanden in andere coderingen (zoals Shift_JIS) leiden tot onsamenhangende tekst.

Hoe de tekencodering van een bestand te controleren

1. Gebruik het file‑commando

“` file -i sample.txt

   Voorbeeldoutput:  

   ```
sample.txt: text/plain; charset=iso-8859-1

2. Gebruik het nkf‑commando

“` sudo apt install -y nkf nkf –guess sample.txt

   Voorbeeldoutput:  

   ```
Shift_JIS (CRLF)

Hoe tekencodering te converteren

1. Converteren met het iconv‑commando

Converteer Shift_JIS naar UTF-8:

iconv -f SHIFT_JIS -t UTF-8 sample.txt -o sample_utf8.txt

Converteer EUC-JP naar UTF-8:

iconv -f EUC-JP -t UTF-8 sample.txt -o sample_utf8.txt

2. Converteren met het nkf‑commando

Converteer Shift_JIS naar UTF-8:

nkf -w sample.txt > sample_utf8.txt

Converteer EUC-JP naar UTF-8:

nkf -w --overwrite sample.txt

Het voorkomen van onsamenhangende tekst in terminal en editors

1. Gebruik het less‑commando voor correcte weergave

export LESSCHARSET=utf-8
less sample.txt

2. Specificeer tekencodering in vim

vim -c "set encoding=utf-8" sample.txt

3. Wijzig codering in gedit of VSCode

  • gedit (standaardeditor van GNOME)
  1. Open het bestand met gedit sample.txt
  2. Verander bij het opslaan de codering naar UTF-8
  • VSCode (Visual Studio Code)
  1. Klik op “Encoding” onderaan het scherm
  2. Selecteer UTF-8

6. Terminal- en editorinstellingen controleren

Terminalinstellingen controleren en corrigeren

1. Controleer terminalcoderinginstellingen

Om je huidige omgevingsvariabelen te controleren, voer je de volgende commando’s uit:

echo $LANG
echo $LC_ALL

Voorbeeldoutput (juiste instellingen):

ja_JP.UTF-8
ja_JP.UTF-8

Als de output C of POSIX is, moet je de locale‑instellingen wijzigen naar ja_JP.UTF-8.

2. Terminallettertypen configureren

GNOME Terminal (Standaardterminal)

  1. Open de terminal
  2. Ga naar “Voorkeuren”
  3. Open “Profielvoorkeuren” en ga naar het tabblad “Tekst”
  4. Schakel “Aangepast lettertype gebruiken” in en selecteer een van de volgende:
  • Noto Sans Mono CJK JP
  • VL Gothic
  • Takao Gothic
  1. Sla de instellingen op en herstart de terminal

Tekencodering instellen in teksteditors

1. Vim-codering configureren

Om je huidige instellingen te controleren, open Vim en voer uit:

:set encoding?
:set fileencoding?

Verwachte uitvoer:

encoding=utf-8
fileencoding=utf-8

Als het niet ingesteld is op utf-8, voeg dan het volgende toe aan je ~/.vimrc‑bestand om UTF-8 als standaard in te stellen:

set encoding=utf-8
set fileencodings=utf-8,sjis,euc-jp
set fileformats=unix,dos,mac

2. Nano-codering configureren

Om de standaardinstelling te wijzigen, voeg de volgende regel toe aan ~/.nanorc:

set encoding "utf-8"

3. VSCode-codering configureren

  1. Klik op “Encoding” rechtsonder in het VSCode‑venster
  2. Selecteer UTF-8
  3. Gebruik indien nodig “Save with Encoding”

Om UTF-8 als standaardcodering in te stellen, voeg het volgende toe aan je settings.json‑bestand:

"files.encoding": "utf8"

7. Specifieke gevallen oplossen

Vervormde tekst in GUI-toepassingen repareren

1. Japanse weergaveproblemen in Firefox en Chrome

Oplossing:

  1. Installeer de benodigde lettertypen
sudo apt install -y fonts-noto-cjk fonts-ipafont
  1. Controleer de lettertype‑instellingen van de browser
  • Firefox:
    1. Ga naar about:preferences, open vervolgens “Fonts & Colors” → “Advanced”
    2. Verander “Proportional” en “Monospace Fonts” naar Noto Sans CJK JP
  • Chrome:
    1. Ga naar chrome://settings/fonts
    2. Verander “Standard Font” en “Monospace Font” naar Noto Sans CJK JP

2. Vervormde tekst in LibreOffice repareren

Oplossing:

  1. Installeer fonts-noto-cjk en fonts-ipafont
  2. Verander de lettertype‑instellingen van LibreOffice
  • Ga naar “Tools” → “Options” → “LibreOffice” → “Fonts”
  • Verander het standaardlettertype naar Noto Sans CJK JP

Vervormde tekst in CUI-omgevingen repareren

1. SSH‑sessie vervormde tekstproblemen

Oplossing:

  1. Controleer de locale‑instellingen op de server
locale
  1. Als ja_JP.UTF-8 ontbreekt, voer dan uit:
sudo apt install -y language-pack-ja
sudo locale-gen ja_JP.UTF-8
sudo update-locale LANG=ja_JP.UTF-8

8. Veelgestelde vragen (FAQ)

Q1. Mijn locale is correct ingesteld, maar vervormde tekst blijft bestaan.

A: Zelfs als je locale correct is, controleer dan de instellingen:

locale

Als LANG=ja_JP.UTF-8 niet wordt weergegeven, reset dan de locale:

sudo update-locale LANG=ja_JP.UTF-8
sudo locale-gen ja_JP.UTF-8
sudo dpkg-reconfigure locales

Q2. Alleen specifieke bestanden hebben vervormde tekst.

A: Het bestand kan een andere codering hebben. Controleer met:

file -i sample.txt

Als het bestand niet in UTF-8 is, converteer het:

iconv -f SHIFT_JIS -t UTF-8 sample.txt -o sample_utf8.txt

Of met nkf:

nkf -w --overwrite sample.txt

9. Conclusie

In dit artikel hebben we Ubuntu’s vervormde‑tekstproblemen behandeld, hun oorzaken en hoe ze op te lossen. De belangrijkste oorzaken van vervormde tekst zijn onjuiste locale‑instellingen, ontbrekende lettertypen, mismatches in tekencodering en verkeerd geconfigureerde terminal‑/editorinstellingen.

Belangrijkste punten

  • Stel de juiste locale iner update-locale LANG=ja_JP.UTF-8 uit
  • Installeer Japanse lettertypen : Gebruik sudo apt install -y fonts-noto-cjk fonts-ipafont
  • Controleer bestandscodering : Gebruik file -i en converteer met iconv
  • Configureer terminal en editors : Zorg ervoor dat UTF-8‑coderinginstellingen worden toegepast

Door deze stappen te volgen, kun je vervormde‑tekstproblemen in Ubuntu oplossen en voorkomen.

侍エンジニア塾