사용자 도구

사이트 도구


cuda

CUDA

환경변수로 CUDA device 설정

# CUDA 사용금지
os.environ['CUDA_VISIBLE_DEVICES'] = ""
# 또는 
os.environ['CUDA_VISIBLE_DEVICES'] = "-1"
 
# 첫 번째 디바이스만 보임
os.environ['CUDA_VISIBLE_DEVICES'] = "0"

Mixed precision

CUDA 관련 도구

nvidia-smi

nvidia 디바이스 정보 보여주는 도구 windows에서는 “C:\Program Files\NVIDIA Corporation\NVSMI”에 있음

nvidia-smi -l  # 주기적으로 디바이스 정보를 출력
nvidia-smi -lms T  # T ms 마다 디바이스 정보를 출력
nvidia-smi dmon  # 실시간으로 gpu, 메모리 사용, 온도 출력

nvidia driver 설치

드라이버 삭제

nvidia-installer --uninstall

최신 버전 드라이버 설치

nvidia-installer --update

팬 속도 조절

sudo nvidia-xconfig
sudo nvidia-xconfig --cool-bits=4

# command line에서 조절
## 읽기
nvidia-settings -q [gpu:0]/GPUCoreTemp -c :0.0
nvidia-settings -q [fan:0]/GPUCurrentFanSpeed -c :0.0
## 쓰기
nvidia-settings -a [gpu:0]/GPUFanControlState=1 -a [fan:0]/GPUTargetFanSpeed=75 -c :0.0

## 멀티 GPU
nvidia-settings -a "[gpu:0]/GPUFanControlState=1" -a "[fan:0]/GPUCurrentFanSpeed=n" \
              -a "[gpu:1]/GPUFanControlState=1" -a  [fan:1]/GPUCurrentFanSpeed=n" &

AWS + Docker + CUDA

Docker

Headless GPU의 fan 속도 조절

GPU 모니터링 및 작업할당

python

라이브러리

cuda.txt · 마지막으로 수정됨: 2024/03/23 02:38 저자 127.0.0.1