উবুন্টুতে GPU পরীক্ষা করার গাইড: nvidia-smi কীভাবে ব্যবহার ও কনফিগার করবেন

১. ভূমিকা

উবুন্টুতে একটি GPU ব্যবহার করার সময়, এর অবস্থা সঠিকভাবে পর্যবেক্ষণ করা অত্যন্ত গুরুত্বপূর্ণ। এটি বিশেষ করে গভীর শিক্ষা এবং গ্রাফিক রেন্ডারিং-এর মতো কাজের জন্য গুরুত্বপূর্ণ, যেখানে GPU ব্যবহার এবং ড্রাইভার সংস্করণগুলি বোঝা অপরিহার্য। এই নিবন্ধটি nvidia-smi ব্যবহার করার পদ্ধতি ব্যাখ্যা করে, যা একটি NVIDIA GPU ব্যবস্থাপনা টুল, এবং উবুন্টুতে GPU অবস্থা পরীক্ষা করার একটি গাইড প্রদান করে।

২. nvidia-smi দিয়ে GPU তথ্য পরীক্ষা করা

nvidia-smi একটি কমান্ড-লাইন টুল যা আপনাকে NVIDIA GPU ব্যবহার, মেমরি খরচ এবং অন্যান্য বিবরণ পর্যবেক্ষণ করতে দেয়। এটি GPU কার্যকলাপের রিয়েল-টাইম পর্যবেক্ষণ এবং বিস্তারিত ব্যবহার তথ্য পুনরুদ্ধারের জন্য বিশেষভাবে উপযোগী।

মৌলিক ব্যবহার

নিম্নলিখিত কমান্ড রিয়েল-টাইম GPU ব্যবহার এবং মেমরি খরচ প্রদর্শন করে:

nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1

এই কমান্ডটি বিস্তারিত তথ্য প্রদান করে, যার মধ্যে GPU ব্যবহার, মেমরি ব্যবহার এবং উপলব্ধ মেমরি অন্তর্ভুক্ত। আপনি -l অপশন ব্যবহার করে সেকেন্ডে আপডেট ইন্টারভাল নির্দিষ্ট করতে পারেন।

আউটপুট ফরম্যাট এবং ফাইল লগিং

ডিফল্টভাবে, আউটপুটটি একটি টেবিল ফরম্যাটে প্রদর্শিত হয়, কিন্তু আপনি এটিকে সহজে প্রক্রিয়াকরণের জন্য CSV ফরম্যাটে আউটপুট করতে পারেন। যদি আপনি তথ্যটি একটি ফাইলে সংরক্ষণ করতে চান, তাহলে -f অপশন ব্যবহার করে আউটপুট ফাইল পাথ নির্দিষ্ট করুন।

nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /path/to/output.csv

এই পদ্ধতি আপনাকে পরবর্তী বিশ্লেষণের জন্য GPU ব্যবহার লগ করতে দেয়।

৩. nvidia-smi দিয়ে প্রক্রিয়া তথ্য পুনরুদ্ধার করা

nvidia-smi ব্যবহার করে, আপনি GPU ব্যবহারকারী বর্তমান প্রক্রিয়াগুলির তথ্য পুনরুদ্ধার করতে পারেন। এটি সাহায্য করে যে প্রক্রিয়াগুলি GPU সম্পদ খরচ করছে এবং কতটা পরিমাণে তা চিহ্নিত করতে।

প্রক্রিয়া তথ্য পাওয়া

GPU ব্যবহারকারী প্রক্রিয়াগুলির PID এবং মেমরি ব্যবহার পরীক্ষা করার জন্য নিম্নলিখিত কমান্ড চালান:

nvidia-smi --query-compute-apps=pid,process_name,used_memory --format=csv,noheader

এই কমান্ডটি বর্তমানে চলমান GPU প্রক্রিয়াগুলির তালিকা এবং তাদের মেমরি ব্যবহার সহ ফিরিয়ে দেয়।

nvidia-smi pmon সাবকমান্ড

nvidia-smi টুলের মধ্যে একটি সাবকমান্ড নামক pmon রয়েছে, যা GPU প্রক্রিয়াগুলির সম্পর্কে আরও বিস্তারিত তথ্য প্রদান করে।

nvidia-smi pmon --delay 10 -s u -o DT

এই কমান্ডটি নির্দিষ্ট ইন্টারভালে GPU প্রক্রিয়া তথ্য প্রদর্শন করে। --delay অপশন সেকেন্ডে আপডেট ইন্টারভাল নির্ধারণ করে, এবং আপনি প্রদর্শিত তথ্য কাস্টমাইজ করতে পারেন।

৪. NVIDIA ড্রাইভার ইনস্টল করা এবং যাচাই করা

উবুন্টুতে একটি NVIDIA GPU ব্যবহার করার জন্য, আপনাকে উপযুক্ত NVIDIA ড্রাইভার ইনস্টল করতে হবে। নীচে ড্রাইভার ইনস্টল এবং যাচাই করার ধাপগুলি দেওয়া হয়েছে।

ড্রাইভার ইনস্টল করা

প্রথমে, আপনার সিস্টেমের জন্য প্রস্তাবিত NVIDIA ড্রাইভার ইনস্টল করার জন্য নিম্নলিখিত কমান্ড ব্যবহার করুন:

sudo apt install nvidia-driver-510

ইনস্টলেশন সম্পূর্ণ হলে, আপনার সিস্টেম পুনরায় শুরু করুন।

ইনস্টলেশন যাচাই করা

পুনরায় শুরু করার পর, নিম্নলিখিত কমান্ড ব্যবহার করে ড্রাইভারটি সঠিকভাবে ইনস্টল হয়েছে কিনা তা পরীক্ষা করুন:

nvidia-smi

যদি কমান্ডটি ড্রাইভার সংস্করণ এবং CUDA সংস্করণ প্রদর্শন করে, তাহলে ইনস্টলেশন সফল হয়েছে।

৫. TensorFlow দিয়ে GPU অপারেশন যাচাই করা

GPU সঠিকভাবে কাজ করছে কিনা তা নিশ্চিত করার জন্য, আপনি TensorFlow, একটি মেশিন লার্নিং ফ্রেমওয়ার্ক, পরীক্ষার জন্য ব্যবহার করতে পারেন।

Anaconda ইনস্টল করা

প্রথমে, পরিবেশ সেটআপ করার জন্য Anaconda ইনস্টল করুন।

bash ./Anaconda3-2022.05-Linux-x86_64.sh
conda update -n base conda
conda update anaconda
conda update -y --all
conda install tensorflow-gpu==2.4.1

TensorFlow দিয়ে GPU স্বীকৃতি পরীক্ষা করা

পরবর্তীতে, নিম্নলিখিত কমান্ড চালিয়ে TensorFlow GPU স্বীকৃতি করে কিনা তা যাচাই করুন:

from tensorflow.python.client import device_lib
device_lib.list_local_devices()

যদি GPU ডিভাইসটি তালিকায় প্রদর্শিত হয়, তাহলে TensorFlow সফলভাবে GPU সনাক্ত করেছে।

৬. GPU ব্যবহার পর্যবেক্ষণ এবং লগিং

Using nvidia-smi, you can monitor GPU usage in real time and log the data. This helps track GPU utilization over long periods and optimize performance.

নিয়মিত পর্যবেক্ষণ সেটআপ করা

পিরিয়ডিক পর্যবেক্ষণ সেটআপ করতে, আপডেট ইন্টারভ্যাল নির্ধারণের জন্য nvidia-smi-তে -l অপশন ব্যবহার করুন। আপনি আউটপুটকে একটি ফাইলে লগও করতে পারেন।

nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /var/log/gpu.log

পাইথন বাইন্ডিংসের মাধ্যমে প্রোগ্রাম্যাটিক নিয়ন্ত্রণ

nvidia-smi পাইথন বাইন্ডিংস (nvidia-ml-py) প্রদান করে, যা আপনাকে প্রোগ্রাম্যাটিকভাবে GPU তথ্য পুনরুদ্ধার করতে দেয়। এটি কাস্টমাইজড পর্যবেক্ষণ এবং নিয়ন্ত্রণকে সম্ভব করে।

৭. উপসংহার

nvidia-smi উবুন্টুতে NVIDIA GPU ব্যবহার পর্যবেক্ষণ এবং পরিচালনার জন্য একটি শক্তিশালী টুল। এই প্রবন্ধে এর মৌলিক ব্যবহার, প্রক্রিয়া তথ্য পুনরুদ্ধার, ড্রাইভার ইনস্টলেশন, এবং টেনসরফ্লো দিয়ে GPU অপারেশন যাচাই করা হয়েছে। এই পদ্ধতিগুলি ব্যবহার করে GPU পারফরম্যান্স সর্বোচ্চ করুন এবং আপনার সিস্টেম অপ্টিমাইজ করুন।

年収訴求