Ubuntu හි GPU පරීක්ෂා කිරීමේ මාර්ගෝපදේශය: nvidia-smi භාවිතා කිරීම සහ වින්‍යාස කිරීමේ ක්‍රම

1. හැඳින්වීම

Ubuntu හි GPU එකක් භාවිතා කරන විට, එහි තත්ත්වය නිවැරදිව නිරීක්ෂණය කිරීම අත්‍යවශ්‍ය වේ. මෙය විශේෂයෙන්ම ඩීප් ලර්නින්ග් සහ ග්‍රැෆික් රෙන්ඩරින් වැනි කාර්යයන් සඳහා වැදගත් වන අතර, GPU භාවිතය සහ ධාවක (driver) අනුවාදයන් පිළිබඳ අවබෝධය අවශ්‍ය වේ. මෙම ලිපිය nvidia-smi නමින් හැඳින්වෙන NVIDIA GPU කළමනාකරණ මෙවලම භාවිතා කරන ආකාරය පැහැදිලි කරයි, සහ Ubuntu හි GPU තත්ත්වය පරීක්ෂා කිරීමේ මාර්ගෝපදේශයක් ලබා දෙයි.

2. nvidia-smi සමඟ GPU තොරතුරු පරීක්ෂා කිරීම

nvidia-smi යනු NVIDIA GPU භාවිතය, මතක පරිභෝජනය සහ අනෙකුත් විස්තර නිරීක්ෂණය කිරීමේ කමාන්ඩ්-ලයින් මෙවලමකි. එය GPU ක්‍රියාකාරිත්වය රියල්-ටයිම් නිරීක්ෂණය කිරීම සහ විස්තරාත්මක භාවිත තොරතුරු ලබා ගැනීමට විශේෂයෙන් ප්‍රයෝජනවත් වේ.

මූලික භාවිතය

පහත කමාන්ඩ් එක රියල්-ටයිම් GPU භාවිතය සහ මතක පරිභෝජනය පෙන්වයි:

nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1

මෙම කමාන්ඩ් එක GPU භාවිතය, මතක පරිභෝජනය, සහ ලබාගත හැකි මතකය ඇතුළත් විස්තරාත්මක තොරතුරු ලබා දෙයි. -l විකල්පය භාවිතා කර ඔබට නවීකරණ අන්තරය තත්පර වලින් නියම කළ හැක.

ප්‍රතිදාන ආකෘතිය සහ ගොනු ලොග් කිරීම

පෙරනිමිති ලෙස, ප්‍රතිදානය වගුවක් ආකාරයෙන් පෙන්වයි, නමුත් CSV ආකෘතියෙන්ද එය ලබා ගත හැක, එවිට සැකසීම පහසු වේ. තොරතුරු ගොනුවකට සුරැකීමට -f විකල්පය භාවිතා කර ප්‍රතිදාන ගොනු මාර්ගය නියම කරන්න.

nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /path/to/output.csv

මෙම ක්‍රමය GPU භාවිතය පසුකාලීන විශ්ලේෂණයක් සඳහා ලොග් කිරීමේ හැකියාව ලබා දෙයි.

3. nvidia-smi සමඟ ක්‍රියාවලි තොරතුරු ලබා ගැනීම

nvidia-smi භාවිතා කර, GPU භාවිතා කරන ක්‍රියාවලි පිළිබඳ තොරතුරු ලබා ගත හැක. මෙය කුමන ක්‍රියාවලි GPU සම්පත් භාවිතා කරයි, ඒවායේ පරිමාණය කුමක්ද යන්න හඳුනා ගැනීමට උපකාරී වේ.

ක්‍රියාවලි තොරතුරු ලබා ගැනීම

GPU භාවිතා කරන ක්‍රියාවලිවල PID සහ මතක පරිභෝජනය පරීක්ෂා කිරීමට පහත කමාන්ඩ් එක ක්‍රියාත්මක කරන්න:

nvidia-smi --query-compute-apps=pid,process_name,used_memory --format=csv,noheader

මෙම කමාන්ඩ් එක වත්මන් ධාවනය වන GPU ක්‍රියාවලි ලැයිස්තුව සහ ඒවායේ මතක පරිභෝජනය පෙන්වයි.

nvidia-smi pmon උපකමාන්ඩ්

nvidia-smi මෙවලමේ pmon නමැති උපකමාන්ඩ් එකක් ඇත, එය GPU ක්‍රියාවලි පිළිබඳ වැඩි විස්තර ලබා දෙයි.

nvidia-smi pmon --delay 10 -s u -o DT

මෙම කමාන්ඩ් එක නියමිත අන්තරයන්හි GPU ක්‍රියාවලි තොරතුරු පෙන්වයි. --delay විකල්පය තත්පර වල නවීකරණ අන්තරය සකස් කරයි, සහ ඔබට පෙන්විය යුතු තොරතුරු අභිරුචි කරගත හැක.

4. NVIDIA ධාවක (Driver) ස්ථාපනය සහ තහවුරු කිරීම

Ubuntu හි NVIDIA GPU එකක් භාවිතා කිරීමට, සුදුසු NVIDIA ධාවකය ස්ථාපනය කළ යුතුය. පහත පියවරවලින් ධාවකය ස්ථාපනය කිරීම සහ තහවුරු කිරීම සිදු කරයි.

ධාවකය ස්ථාපනය කිරීම

පළමුව, පහත කමාන්ඩ් එක භාවිතා කර ඔබේ පද්ධතිය සඳහා නිර්දේශිත NVIDIA ධාවකය ස්ථාපනය කරන්න:

sudo apt install nvidia-driver-510

ස්ථාපනය අවසන් වූ පසු, පද්ධතිය නැවත ආරම්භ කරන්න.

ස්ථාපනය තහවුරු කිරීම

නැවත ආරම්භ කිරීමෙන් පසු, පහත කමාන්ඩ් එක භාවිතා කර ධාවකය නිවැරදිව ස්ථාපනය වී ඇතිදැයි පරීක්ෂා කරන්න:

nvidia-smi

කමාන්ඩ් එක ධාවක අනුවාදය සහ CUDA අනුවාදය පෙන්වන්නේ නම්, ස්ථාපනය සාර්ථකයි.

5. TensorFlow සමඟ GPU ක්‍රියාකාරිත්වය තහවුරු කිරීම

GPU එක නිවැරදිව ක්‍රියා කරයිදැයි තහවුරු කිරීම සඳහා, ඔබට TensorFlow (යන්ත‍්‍ර ඉගෙනුම් රාමුව) භාවිතා කර පරීක්ෂා කළ හැක.

Anaconda ස්ථාපනය

පළමුව, පරිසරය සකස් කිරීම සඳහා Anaconda ස්ථාපනය කරන්න.

bash ./Anaconda3-2022.05-Linux-x86_64.sh
conda update -n base conda
conda update anaconda
conda update -y --all
conda install tensorflow-gpu==2.4.1

TensorFlow සමඟ GPU හඳුනා ගැනීම පරීක්ෂා කිරීම

ඊළඟට, පහත කමාන්ඩ් එක ක්‍රියාත්මක කර TensorFlow GPU හඳුනා ගත්දැයි පරීක්ෂා කරන්න:

from tensorflow.python.client import device_lib
device_lib.list_local_devices()

GPU උපාංගය ලැයිස්තුවේ පෙන්වෙනවා නම්, TensorFlow GPU හඳුනාගෙන ඇත.

6. GPU භාවිතය නිරීක්ෂණය සහ ලොග් කිරීම

nvidia-smi භාවිතා කරමින්, ඔබට GPU භාවිතය සමයකාලීනව නිරීක්ෂණය කර ගත හැකි අතර දත්ත ලොග් කර ගත හැකිය. මෙය දිගු කාලයක් පුරා GPU භාවිතය ලුහුබඳින්නට සහ කාර්ය සාධනය ඉඩම් වැඩිදියුණු කිරීමට උපකාරී වේ.

නිතිපතා නිරීක්ෂණය සකස් කිරීම

පරිච්ඡේදීය නිරීක්ෂණය සකස් කිරීම සඳහා, nvidia-smi හි -l විකල්පය භාවිතා කර අප්ඩේට් අන්තරය නිර්දේශ කරන්න. ඔබට ප්‍රතිදානයක් ගොනුවකට ලොග් කර ගත හැකිය.

nvidia-smi --query-gpu=timestamp,name,utilization.gpu,utilization.memory,memory.used,memory.free --format=csv -l 1 -f /var/log/gpu.log

Python බයින්ඩිංස් සමඟ වැඩසටහන්ගත පාලනය

nvidia-smi Python බයින්ඩිංස් (nvidia-ml-py) සපයයි, ඔබට GPU තොරතුරු වැඩසටහන්ගතව ලබා ගැනීමට ඉඩ සලසයි. මෙය අභිරුචිකරණය කළ නිරීක්ෂණය සහ පාලනය සක්‍රීය කරයි.

7. නිගමනය

nvidia-smi Ubuntu හි NVIDIA GPU භාවිතය නිරීක්ෂණය කිරීම සහ කළමනාකරණය කිරීම සඳහා බලවත් මෙවලමකි. මෙම ලිපිය එහි මූලික භාවිතය, ක්‍රියාවලියේ තොරතුරු ලබා ගැනීම, ඩ්‍රයිවර් ස්ථාපනය, සහ TensorFlow සමඟ GPU ක්‍රියාකාරිත්වය තහවුරු කිරීම ආවරණය කළේය. GPU කාර්ය සාධනය උපරිම කිරීම සහ ඔබේ පද්ධතිය ඉඩම් වැඩිදියුණු කිරීම සඳහා මෙම ක්‍රම භාවිතා කරන්න.