目次
1. परिचय
Ubuntu मा GPU को उपयोग गर्दा, यसको अवस्थालाई सही रूपमा जाँच गर्नु महत्वपूर्ण छ। विशेष गरी, डिप लर्निङ वा ग्राफिक्स रेन्डरिङ कार्यहरूमा, GPU को उपयोग स्थिति र ड्राइभर संस्करणलाई बुझ्नु आवश्यक छ। यो लेखले NVIDIA GPU को व्यवस्थापन उपकरणnvidia-smi
को प्रयोग विधि व्याख्या गर्दछ र Ubuntu मा GPU जाँच गर्ने विधिहरू प्रस्तुत गर्दछ।2. nvidia-smi बाट GPU जानकारी जाँच गर्नुहोस्
nvidia-smi
NVIDIA निर्मित GPU को उपयोग स्थिति, मेमोरी प्रयोग आदिलाई निगरानी गर्न सक्ने कमान्ड लाइन उपकरण हो। विशेष गरी, GPU को सञ्चालन स्थितिलाई रीयल टाइममा जाँच गर्न वा विस्तृत उपयोग जानकारी प्राप्त गर्न उपयुक्त छ।आधारभूत प्रयोग विधि
निम्न कमान्डबाट GPU को उपयोग स्थिति र मेमोरी प्रयोगलाई रीयल टाइममा जाँच गर्न सकिन्छ।nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1
यो कमान्डबाट GPU को उपयोग दर, मेमोरी प्रयोग, उपलब्ध मेमोरी समावेश गरेर विस्तृत जानकारी प्राप्त गर्न सकिन्छ। साथै, -l
विकल्पबाट अपडेट अन्तराललाई सेकेन्डमा निर्दिष्ट गर्न पनि सकिन्छ।प्रदर्शन ढाँचा र फाइल आउटपुट
डिफल्ट रूपमा तालिका ढाँचामा प्रदर्शित हुन्छ तर प्रोसेस गर्न सजिलो बनाउन CSV ढाँचामा आउटपुट पनि सम्भव छ। साथै, जानकारी फाइलमा रेकर्ड गर्न चाहनुहुन्छ भने-f
विकल्पबाट आउटपुट फाइल पथ निर्दिष्ट गर्न सकिन्छ।nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /path/to/output.csv
यो विधिबाट GPU को उपयोग स्थितिलाई लगको रूपमा बचत गरी पछि विश्लेषण गर्न सकिन्छ।3. nvidia-smi बाट प्रक्रिया जानकारी प्राप्त गर्ने
nvidia-smi
प्रयोग गर्दा, हाल GPU प्रयोग गरिरहेका प्रक्रियाहरूको जानकारी प्राप्त गर्न सकिन्छ। यसबाट, कुन प्रक्रियाले GPU स्रोतहरू कति प्रयोग गरिरहेको छ भनेर जाँच गर्न सकिन्छ।प्रक्रिया जानकारीको प्राप्ति
निम्न कमान्डबाट, GPU प्रयोग गरिरहेका प्रक्रियाहरूको PID र मेमोरी प्रयोग जाँच गर्न सकिन्छ।nvidia-smi --query-compute-apps=pid,process_name,used_memory --format=csv,noheader
यो कमान्डले हाल चलिरहेका GPU प्रक्रियाहरूको सूची फर्काउँछ र प्रत्येक प्रक्रियाको मेमोरी प्रयोग देखाउँछ।nvidia-smi pmon उपकमान्ड
nvidia-smi
मा pmon
नामक उपकमान्ड पनि छ, जसबाट GPU प्रयोग गरिरहेका प्रक्रियाहरूको विस्तृत जानकारी प्राप्त गर्न सकिन्छ।nvidia-smi pmon --delay 10 -s u -o DT
यो कमान्डले निर्दिष्ट अन्तरालमा GPU को प्रक्रिया जानकारी देखाउँछ, र --delay
विकल्पबाट अपडेट अन्तराल सेकेन्डमा निर्दिष्ट गर्दछ। साथै, देखाउने जानकारीको प्रकार छान्न पनि सकिन्छ।4. NVIDIA ड्राइभरको स्थापना र सञ्चालन जाँच
Ubuntu मा NVIDIA GPU प्रयोग गर्नको लागि, उपयुक्त NVIDIA ड्राइभर स्थापना गर्न आवश्यक छ। तल ड्राइभरको स्थापना र सञ्चालन जाँचका चरणहरू छन्।ड्राइभरको स्थापना
पहिले, प्रणालीको लागि उपयुक्त NVIDIA ड्राइभर स्थापना गर्नुहोस्। निम्न कमान्ड प्रयोग गरेर, सिफारिस गरिएको ड्राइभर स्थापना गर्न सकिन्छ।sudo apt install nvidia-driver-510
स्थापना सम्पन्न भएपछि, प्रणालीलाई पुन: सुरु गर्नुहोस्।स्थापनाको जाँच
पुन: सुरु पछि, निम्न कमान्डले ड्राइभर सही रूपमा स्थापित छ वा छैन जाँच गर्नुहोस्।nvidia-smi
यो कमान्डले ड्राइभर संस्करण र CUDA संस्करण देखाउँछ भने, यो सही रूपमा स्थापित छ।
5. TensorFlow मा GPU को कार्य सत्यापन
GPU ले सही रूपमा काम गरिरहेको छ वा छैन भनेर जाँच गर्न, मेसिन लर्निङ फ्रेमवर्क TensorFlow प्रयोग गरेर परीक्षण गर्न सकिन्छ।Anaconda को स्थापना
पहिले, Anaconda स्थापना गरेर वातावरण सेटअप गर्नुहोस्।bash ./Anaconda3-2022.05-Linux-x86_64.sh
conda update -n base conda
conda update anaconda
conda update -y --all
conda install tensorflow-gpu==2.4.1
TensorFlow मा कार्य सत्यापन
अर्को, TensorFlow मा GPU पहिचान भएको छ वा छैन भनेर जाँच गर्नुहोस्।from tensorflow.python.client import device_lib
device_lib.list_local_devices()
यो कमान्डले GPU डिभाइस सूचीमा देखाइएको छ भने, TensorFlow ले GPU लाई सामान्य रूपमा पहिचान गरेको छ।6. GPU को निगरानी र लग अभिलेखण
nvidia-smi
प्रयोग गरेर, रीयल-टाइम GPU निगरानी र लग अभिलेखण सम्भव छ। यसले लामो अवधिको GPU को प्रयोग स्थिति ट्र्याक गर्न र प्रदर्शन अनुकूलनमा उपयोग गर्न सकिन्छ।नियमित निगरानी
नियमित निगरानी सेटअप गर्दा,nvidia-smi
को -l
विकल्पले अपडेट अन्तराल निर्दिष्ट गर्नुहोस्। साथै, फाइलमा लग अभिलेखण पनि सम्भव छ।nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /var/log/gpu.log
Python बाइन्डिङ मार्फत प्रोग्रामेबल सञ्चालन
nvidia-smi
मा Python बाइन्डिङ (nvidia-ml-py
) छ, र Python बाट प्रोग्रामेटिक रूपमा GPU को जानकारी प्राप्त गर्न पनि सम्भव छ। यसको प्रयोगले थप कस्टमाइज्ड निगरानी वा नियन्त्रण सम्भव छ।7. सारांश
nvidia-smi
Ubuntu मा NVIDIA GPU को प्रयोग स्थिति जाँच गर्न र प्रभावकारी रूपमा व्यवस्थापन गर्नका लागि एक शक्तिशाली उपकरण हो। यो लेखमा, nvidia-smi
को आधारभूत प्रयोगदेखि प्रक्रिया जानकारी प्राप्त गर्न, ड्राइभर स्थापना, TensorFlow मा सञ्चालन जाँच सम्म व्याख्या गरियो। GPU को प्रदर्शनलाई अधिकतम रूपमा उपयोग गर्नुहोस् र प्रणालीको अनुकूलनमा सहयोग गर्नुहोस्।