Mwongozo wa Kukagua GPU kwenye Ubuntu: Jinsi ya Kutumia na Kusanidi nvidia-smi

1. Utangulizi

Unapotumia GPU kwenye Ubuntu, ni muhimu kufuatilia hali yake kwa usahihi. Hii ni muhimu hasa kwa kazi kama vile kujifunza kwa kina na uchoraji wa picha, ambapo kuelewa matumizi ya GPU na matoleo ya madereva ni muhimu. Makala hii inaelezea jinsi ya kutumia nvidia-smi, chombo cha usimamizi wa GPU cha NVIDIA, na inatoa mwongozo wa kukagua hali ya GPU kwenye Ubuntu.

2. Kukagua Taarifa za GPU kwa nvidia-smi

nvidia-smi ni chombo cha mstari wa amri kinachokuruhusu kufuatilia matumizi ya GPU ya NVIDIA, matumizi ya kumbukumbu, na maelezo mengine. Ni muhimu hasa kwa ufuatiliaji wa wakati halisi wa shughuli za GPU na kupata taarifa za kina za matumizi.

Matumizi ya Msingi

Amri ifuatayo inaonyesha matumizi ya GPU na matumizi ya kumbukumbu kwa wakati halisi:

nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1

Amri hii inatoa taarifa za kina, ikijumuisha matumizi ya GPU, matumizi ya kumbukumbu, na kumbukumbu inayopatikana. Unaweza pia kuweka muda wa sasisho kwa sekunde kwa kutumia chaguo la -l.

Muundo wa Matokeo na Kurekodi kwenye Faili

Kwa chaguo-msingi, matokeo yanaonyeshwa katika muundo wa jedwali, lakini pia unaweza kuyatoa katika muundo wa CSV kwa usindikaji rahisi. Ikiwa unataka kuhifadhi taarifa kwenye faili, tumia chaguo la -f kuweka njia ya faili la pato.

nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /path/to/output.csv

Njia hii inakuwezesha kurekodi matumizi ya GPU kwa uchambuzi baadaye.

3. Kupata Taarifa za Mchakato kwa nvidia-smi

Kwa kutumia nvidia-smi, unaweza kupata taarifa kuhusu michakato inayotumia GPU kwa sasa. Hii inasaidia kutambua michakato gani inatumia rasilimali za GPU na kwa kiasi gani.

Kupata Taarifa za Mchakato

Endesha amri ifuatayo ili kuangalia PID na matumizi ya kumbukumbu ya michakato inayotumia GPU:

nvidia-smi --query-compute-apps=pid,process_name,used_memory --format=csv,noheader

Amri hii inarudisha orodha ya michakato ya GPU inayotumika kwa sasa pamoja na matumizi yao ya kumbukumbu.

Amri ndogo ya nvidia-smi pmon

Chombo cha nvidia-smi kinajumuisha amri ndogo iitwayo pmon, ambayo inatoa taarifa za kina zaidi kuhusu michakato ya GPU.

nvidia-smi pmon --delay 10 -s u -o DT

Amri hii inaonyesha taarifa za michakato ya GPU kwa vipindi vilivyobainishwa. Chaguo la --delay linaweka muda wa sasisho kwa sekunde, na unaweza kubinafsisha taarifa zinazoonyeshwa.

4. Kusanidi na Kuthibitisha Madereva ya NVIDIA

Ili kutumia GPU ya NVIDIA kwenye Ubuntu, lazima usanishe dereva sahihi la NVIDIA. Hapa chini kuna hatua za kusanidi na kuthibitisha dereva.

Kusanidi Dereva

Kwanza, sanidi dereva la NVIDIA lililopendekezwa kwa mfumo wako kwa kutumia amri ifuatayo:

sudo apt install nvidia-driver-510

Mara usakinishaji ukamilika, anzisha upya mfumo wako.

Kuthibitisha Usakinishaji

Baada ya kuanzisha upya, angalia kama dereva umewekwa kwa usahihi kwa kutumia amri ifuatayo:

nvidia-smi

Kama amri inaonyesha toleo la dereva na toleo la CUDA, usakinishaji umekamilika kwa mafanikio.

5. Kuthibitisha Uendeshaji wa GPU kwa TensorFlow

Ili kuthibitisha kuwa GPU inafanya kazi kwa usahihi, unaweza kutumia TensorFlow, mfumo wa kujifunza kwa mashine, kwa ajili ya majaribio.

Kusanidi Anaconda

Kwanza, sanidi Anaconda ili kuweka mazingira.

bash ./Anaconda3-2022.05-Linux-x86_64.sh
conda update -n base conda
conda update anaconda
conda update -y --all
conda install tensorflow-gpu==2.4.1

Kukagua Utambuzi wa GPU na TensorFlow

Halafu, thibitisha kama TensorFlow inatambua GPU kwa kuendesha amri ifuatayo:

from tensorflow.python.client import device_lib
device_lib.list_local_devices()

Kama kifaa cha GPU kinatokea kwenye orodha, TensorFlow imegundua GPU kwa mafanikio.

6. Kufuatilia Matumizi ya GPU na Kurekodi

Kwa kutumia nvidia-smi, unaweza kufuatilia matumizi ya GPU kwa wakati halisi na kurekodi data. Hii husaidia kufuatilia matumizi ya GPU kwa muda mrefu na kuboresha utendaji.

Kuweka Ufuatiliaji wa Mara kwa Mara

Ili kuweka ufuatiliaji wa mara kwa mara, tumia chaguo -l katika nvidia-smi ili kubainisha muda wa sasisho. Unaweza pia kurekodi matokeo kwenye faili.

nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /var/log/gpu.log

Udhibiti wa Kiprogramu kwa Kutumia Bindings za Python

nvidia-smi hutoa bindings za Python (nvidia-ml-py), zikikuruhusu kupata taarifa za GPU kwa njia ya programu. Hii inaruhusu ufuatiliaji na udhibiti uliobinafsishwa.

7. Hitimisho

nvidia-smi ni chombo chenye nguvu kwa kufuatilia na kudhibiti matumizi ya GPU za NVIDIA kwenye Ubuntu. Makala hii ilijifunza matumizi yake ya msingi, kupata taarifa za mchakato, kusakinisha madereva, na kuthibitisha uendeshaji wa GPU kwa kutumia TensorFlow. Tumia mbinu hizi ili kuongeza utendaji wa GPU na kuboresha mfumo wako.

侍エンジニア塾