Ubuntu NVIDIA GPU haldamine: nvidia-smi juhend ja jõudluse optimeerimine

1. Sissejuhatus

GPU tõhusal kasutamisel Ubuntus on oluline selle olekut täpselt kontrollida. Eriti süvaõppe ja graafika renderdamise tööde puhul on GPU kasutusastme ja draiveri versiooni teadmine hädavajalik. Selles artiklis selgitatakse NVIDIA GPU haldustööriista `nvidia-smi` kasutamist ja tutvustatakse GPU kontrollimise meetodeid Ubuntu süsteemis.

2. GPU info kontrollimine `nvidia-smi` abil

`nvidia-smi` on käsurea tööriist NVIDIA GPU-de kasutusastme ja mälukasutuse jälgimiseks. See on eriti mugav GPU tööoleku reaalajas kontrollimiseks ja üksikasjaliku kasutusinfo saamiseks.

Põhiline kasutus

Järgneva käsu abil saate kontrollida GPU kasutusastet ja mälukasutust reaalajas:

nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1

See käsk hangib üksikasjalikku teavet, sealhulgas GPU kasutusaste, mälukasutus ja vaba mälu hulk. Samuti on võimalik määrata värskendamise intervall sekundites `-l` valiku abil.

Kuvaformaat ja faili väljund

Vaikimisi kuvatakse teave tabeliformaadis, kuid töötlemise hõlbustamiseks on võimalik väljastada ka CSV-vormingus. Kui soovite teavet faili salvestada, saate väljundfaili tee määrata `-f` valiku abil.

nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /path/to/output.csv

Selle meetodiga saate salvestada GPU kasutusandmed logina ja hiljem neid analüüsida.

3. Protsesside info hankimine `nvidia-smi` abil

`nvidia-smi` abil saate hankida infot praegu GPU-d kasutavate protsesside kohta. See võimaldab teil kontrollida, millised protsessid ja mil määral GPU ressursse kasutavad.

Protsessiinfo hankimine

Järgneva käsu abil saate kontrollida GPU-d kasutavate protsesside PID-e ja mälukasutust:

nvidia-smi --query-compute-apps=pid,process_name,used_memory --format=csv,noheader

See käsk tagastab nimekirja praegu töötavatest GPU protsessidest ja näitab iga protsessi mälukasutust.

`nvidia-smi pmon` alamkäsk

`nvidia-smi` sisaldab ka `pmon` alamkäsku, mis võimaldab hankida üksikasjalikku teavet GPU-d kasutavate protsesside kohta.

nvidia-smi pmon --delay 10 -s u -o DT

See käsk kuvab GPU protsesside teavet määratud intervalliga ja `-delay` valiku abil saate määrata värskendamise intervalli sekundites. Samuti on võimalik valida kuvatavate andmete tüüpi.

4. NVIDIA draiveri paigaldamine ja toimivuse kontroll

NVIDIA GPU kasutamiseks Ubuntus tuleb paigaldada sobiv NVIDIA draiver. Allpool on toodud draiveri paigaldamise ja toimivuse kontrollimise sammud.

Draiveri paigaldamine

Esmalt paigaldage süsteemile sobiv NVIDIA draiver. Soovitatavate draiverite paigaldamiseks saate kasutada järgnevat käsku:

sudo apt install nvidia-driver-510

Pärast paigaldamise lõppemist taaskäivitage süsteem.

Paigalduse kontroll

Pärast taaskäivitust kontrollige järgneva käsu abil, kas draiver on õigesti paigaldatud:

nvidia-smi

Kui see käsk kuvab draiveri versiooni ja CUDA versiooni, on see õigesti paigaldatud.

5. GPU toimivuse kontroll TensorFlow’ga

Et kontrollida, kas GPU töötab korralikult, saate seda testida masinõppe raamistiku TensorFlow abil.

Anaconda paigaldamine

Kõigepealt paigaldage Anaconda ja seadistage keskkond.

bash ./Anaconda3-2022.05-Linux-x86_64.sh
conda update -n base conda
conda update anaconda
conda update -y --all
conda install tensorflow-gpu==2.4.1

Toimivuse kontroll TensorFlow’ga

Järgmiseks kontrollige, kas TensorFlow tunneb GPU-d ära.

from tensorflow.python.client import device_lib
device_lib.list_local_devices()

Kui GPU seade ilmub selle käsu väljundis, tunneb TensorFlow GPU-d edukalt ära.

6. GPU jälgimine ja logimine

`nvidia-smi` abil on võimalik reaalajas GPU-d jälgida ja logida. See võimaldab teil jälgida GPU pikaajalist kasutust ja aidata optimeerida jõudlust.

Regulaarne jälgimine

Regulaarse jälgimise seadistamisel määrake värskendamise intervall `nvidia-smi` `-l` valikuga. Samuti on võimalik logida faili.

nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /var/log/gpu.log

Programmeeritav toimimine Pythoni sidumistega

`nvidia-smi` sisaldab Pythoni sidumisi (`nvidia-ml-py`), mis võimaldavad programmi abil Pythonist GPU infot hankida. See võimaldab kohandatud jälgimist ja juhtimist.

7. Kokkuvõte

`nvidia-smi` on võimas tööriist NVIDIA GPU kasutusastme kontrollimiseks ja tõhusaks haldamiseks Ubuntus. Selles artiklis selgitati `nvidia-smi` põhilist kasutust, protsesside info hankimist, draiveri paigaldamist ja toimivuse kontrollimist TensorFlow’ga. Kasutage seda GPU jõudluse maksimeerimiseks ja süsteemi optimeerimiseks.

Seotud artiklid