cuda
목차
CUDA
-
- AWS에 CUDA 6.5 설치
환경변수로 CUDA device 설정
# CUDA 사용금지 os.environ['CUDA_VISIBLE_DEVICES'] = "" # 또는 os.environ['CUDA_VISIBLE_DEVICES'] = "-1" # 첫 번째 디바이스만 보임 os.environ['CUDA_VISIBLE_DEVICES'] = "0"
Mixed precision
CUDA 관련 도구
nvidia-smi
nvidia 디바이스 정보 보여주는 도구 windows에서는 “C:\Program Files\NVIDIA Corporation\NVSMI”에 있음
nvidia-smi -l # 주기적으로 디바이스 정보를 출력 nvidia-smi -lms T # T ms 마다 디바이스 정보를 출력 nvidia-smi dmon # 실시간으로 gpu, 메모리 사용, 온도 출력
nvidia driver 설치
드라이버 삭제
nvidia-installer --uninstall
최신 버전 드라이버 설치
nvidia-installer --update
팬 속도 조절
sudo nvidia-xconfig sudo nvidia-xconfig --cool-bits=4 # command line에서 조절 ## 읽기 nvidia-settings -q [gpu:0]/GPUCoreTemp -c :0.0 nvidia-settings -q [fan:0]/GPUCurrentFanSpeed -c :0.0 ## 쓰기 nvidia-settings -a [gpu:0]/GPUFanControlState=1 -a [fan:0]/GPUTargetFanSpeed=75 -c :0.0 ## 멀티 GPU nvidia-settings -a "[gpu:0]/GPUFanControlState=1" -a "[fan:0]/GPUCurrentFanSpeed=n" \ -a "[gpu:1]/GPUFanControlState=1" -a [fan:1]/GPUCurrentFanSpeed=n" &
AWS + Docker + CUDA
Docker
Headless GPU의 fan 속도 조절
GPU 모니터링 및 작업할당
python
라이브러리
- cuDF: GPU DataFrames
- cuML: scikit-learn과 유사한 ML 라이브러리
- cuGraph: 그래프 라이브러리
- Rapids: https://rapids.ai/start.html
cuda.txt · 마지막으로 수정됨: 2024/03/23 02:38 저자 127.0.0.1