Ubuntu मा GPU जाँच गाइड: nvidia-smi को प्रयोग र सेटिङ

1. परिचय

Ubuntu मा GPU को उपयोग गर्दा, यसको अवस्थालाई सही रूपमा जाँच गर्नु महत्वपूर्ण छ। विशेष गरी, डिप लर्निङ वा ग्राफिक्स रेन्डरिङ कार्यहरूमा, GPU को उपयोग स्थिति र ड्राइभर संस्करणलाई बुझ्नु आवश्यक छ। यो लेखले NVIDIA GPU को व्यवस्थापन उपकरण nvidia-smi को प्रयोग विधि व्याख्या गर्दछ र Ubuntu मा GPU जाँच गर्ने विधिहरू प्रस्तुत गर्दछ।
年収訴求

2. nvidia-smi बाट GPU जानकारी जाँच गर्नुहोस्

nvidia-smi NVIDIA निर्मित GPU को उपयोग स्थिति, मेमोरी प्रयोग आदिलाई निगरानी गर्न सक्ने कमान्ड लाइन उपकरण हो। विशेष गरी, GPU को सञ्चालन स्थितिलाई रीयल टाइममा जाँच गर्न वा विस्तृत उपयोग जानकारी प्राप्त गर्न उपयुक्त छ।

आधारभूत प्रयोग विधि

निम्न कमान्डबाट GPU को उपयोग स्थिति र मेमोरी प्रयोगलाई रीयल टाइममा जाँच गर्न सकिन्छ।
nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1
यो कमान्डबाट GPU को उपयोग दर, मेमोरी प्रयोग, उपलब्ध मेमोरी समावेश गरेर विस्तृत जानकारी प्राप्त गर्न सकिन्छ। साथै, -l विकल्पबाट अपडेट अन्तराललाई सेकेन्डमा निर्दिष्ट गर्न पनि सकिन्छ।

प्रदर्शन ढाँचा र फाइल आउटपुट

डिफल्ट रूपमा तालिका ढाँचामा प्रदर्शित हुन्छ तर प्रोसेस गर्न सजिलो बनाउन CSV ढाँचामा आउटपुट पनि सम्भव छ। साथै, जानकारी फाइलमा रेकर्ड गर्न चाहनुहुन्छ भने -f विकल्पबाट आउटपुट फाइल पथ निर्दिष्ट गर्न सकिन्छ।
nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /path/to/output.csv
यो विधिबाट GPU को उपयोग स्थितिलाई लगको रूपमा बचत गरी पछि विश्लेषण गर्न सकिन्छ।

3. nvidia-smi बाट प्रक्रिया जानकारी प्राप्त गर्ने

nvidia-smi प्रयोग गर्दा, हाल GPU प्रयोग गरिरहेका प्रक्रियाहरूको जानकारी प्राप्त गर्न सकिन्छ। यसबाट, कुन प्रक्रियाले GPU स्रोतहरू कति प्रयोग गरिरहेको छ भनेर जाँच गर्न सकिन्छ।

प्रक्रिया जानकारीको प्राप्ति

निम्न कमान्डबाट, GPU प्रयोग गरिरहेका प्रक्रियाहरूको PID र मेमोरी प्रयोग जाँच गर्न सकिन्छ।
nvidia-smi --query-compute-apps=pid,process_name,used_memory --format=csv,noheader
यो कमान्डले हाल चलिरहेका GPU प्रक्रियाहरूको सूची फर्काउँछ र प्रत्येक प्रक्रियाको मेमोरी प्रयोग देखाउँछ।

nvidia-smi pmon उपकमान्ड

nvidia-smi मा pmon नामक उपकमान्ड पनि छ, जसबाट GPU प्रयोग गरिरहेका प्रक्रियाहरूको विस्तृत जानकारी प्राप्त गर्न सकिन्छ।
nvidia-smi pmon --delay 10 -s u -o DT
यो कमान्डले निर्दिष्ट अन्तरालमा GPU को प्रक्रिया जानकारी देखाउँछ, र --delay विकल्पबाट अपडेट अन्तराल सेकेन्डमा निर्दिष्ट गर्दछ। साथै, देखाउने जानकारीको प्रकार छान्न पनि सकिन्छ।

4. NVIDIA ड्राइभरको स्थापना र सञ्चालन जाँच

Ubuntu मा NVIDIA GPU प्रयोग गर्नको लागि, उपयुक्त NVIDIA ड्राइभर स्थापना गर्न आवश्यक छ। तल ड्राइभरको स्थापना र सञ्चालन जाँचका चरणहरू छन्।

ड्राइभरको स्थापना

पहिले, प्रणालीको लागि उपयुक्त NVIDIA ड्राइभर स्थापना गर्नुहोस्। निम्न कमान्ड प्रयोग गरेर, सिफारिस गरिएको ड्राइभर स्थापना गर्न सकिन्छ।
sudo apt install nvidia-driver-510
स्थापना सम्पन्न भएपछि, प्रणालीलाई पुन: सुरु गर्नुहोस्।

स्थापनाको जाँच

पुन: सुरु पछि, निम्न कमान्डले ड्राइभर सही रूपमा स्थापित छ वा छैन जाँच गर्नुहोस्।
nvidia-smi
यो कमान्डले ड्राइभर संस्करण र CUDA संस्करण देखाउँछ भने, यो सही रूपमा स्थापित छ।

5. TensorFlow मा GPU को कार्य सत्यापन

GPU ले सही रूपमा काम गरिरहेको छ वा छैन भनेर जाँच गर्न, मेसिन लर्निङ फ्रेमवर्क TensorFlow प्रयोग गरेर परीक्षण गर्न सकिन्छ।

Anaconda को स्थापना

पहिले, Anaconda स्थापना गरेर वातावरण सेटअप गर्नुहोस्।
bash ./Anaconda3-2022.05-Linux-x86_64.sh
conda update -n base conda
conda update anaconda
conda update -y --all
conda install tensorflow-gpu==2.4.1

TensorFlow मा कार्य सत्यापन

अर्को, TensorFlow मा GPU पहिचान भएको छ वा छैन भनेर जाँच गर्नुहोस्।
from tensorflow.python.client import device_lib
device_lib.list_local_devices()
यो कमान्डले GPU डिभाइस सूचीमा देखाइएको छ भने, TensorFlow ले GPU लाई सामान्य रूपमा पहिचान गरेको छ।

6. GPU को निगरानी र लग अभिलेखण

nvidia-smi प्रयोग गरेर, रीयल-टाइम GPU निगरानी र लग अभिलेखण सम्भव छ। यसले लामो अवधिको GPU को प्रयोग स्थिति ट्र्याक गर्न र प्रदर्शन अनुकूलनमा उपयोग गर्न सकिन्छ।

नियमित निगरानी

नियमित निगरानी सेटअप गर्दा, nvidia-smi को -l विकल्पले अपडेट अन्तराल निर्दिष्ट गर्नुहोस्। साथै, फाइलमा लग अभिलेखण पनि सम्भव छ।
nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /var/log/gpu.log

Python बाइन्डिङ मार्फत प्रोग्रामेबल सञ्चालन

nvidia-smi मा Python बाइन्डिङ (nvidia-ml-py) छ, र Python बाट प्रोग्रामेटिक रूपमा GPU को जानकारी प्राप्त गर्न पनि सम्भव छ। यसको प्रयोगले थप कस्टमाइज्ड निगरानी वा नियन्त्रण सम्भव छ।

7. सारांश

nvidia-smi Ubuntu मा NVIDIA GPU को प्रयोग स्थिति जाँच गर्न र प्रभावकारी रूपमा व्यवस्थापन गर्नका लागि एक शक्तिशाली उपकरण हो। यो लेखमा, nvidia-smi को आधारभूत प्रयोगदेखि प्रक्रिया जानकारी प्राप्त गर्न, ड्राइभर स्थापना, TensorFlow मा सञ्चालन जाँच सम्म व्याख्या गरियो। GPU को प्रदर्शनलाई अधिकतम रूपमा उपयोग गर्नुहोस् र प्रणालीको अनुकूलनमा सहयोग गर्नुहोस्।

सम्बन्धित लेखहरू

侍エンジニア塾