사용자 도구

사이트 도구


cuda

문서의 이전 판입니다!


CUDA

환경변수로 CUDA device 설정

# CUDA 사용금지
os.environ['CUDA_VISIBLE_DEVICES'] = ""
# 또는 
os.environ['CUDA_VISIBLE_DEVICES'] = "-1"
 
# 첫 번째 디바이스만 보임
os.environ['CUDA_VISIBLE_DEVICES'] = "0"

Mixed precision

CUDA 관련 도구

nvidia-smi

nvidia 디바이스 정보 보여주는 도구 windows에서는 “C:\Program Files\NVIDIA Corporation\NVSMI”에 있음

nvidia-smi -l  # 주기적으로 디바이스 정보를 출력
nvidia-smi -lms T  # T ms 마다 디바이스 정보를 출력
nvidia-smi dmon  # 실시간으로 gpu, 메모리 사용, 온도 출력

nvidia driver 설치

드라이버 삭제

nvidia-installer --uninstall

최신 버전 드라이버 설치

nvidia-installer --update

팬 속도 조절

sudo nvidia-xconfig
sudo nvidia-xconfig --cool-bits=4

# command line에서 조절
## 읽기
nvidia-settings -q [gpu:0]/GPUCoreTemp -c :0.0
nvidia-settings -q [fan:0]/GPUCurrentFanSpeed -c :0.0
## 쓰기
nvidia-settings -a [gpu:0]/GPUFanControlState=1 -a [fan:0]/GPUTargetFanSpeed=75 -c :0.0

## 멀티 GPU
nvidia-settings -a "[gpu:0]/GPUFanControlState=1" -a "[fan:0]/GPUCurrentFanSpeed=n" \
              -a "[gpu:1]/GPUFanControlState=1" -a  [fan:1]/GPUCurrentFanSpeed=n" &

AWS + Docker + CUDA

Docker

Headless GPU의 fan 속도 조절

GPU 모니터링 및 작업할당

Xvfb

# sudo apt mesa-utils
export DISPLAY=:1 & Xvfb :1 -screen 0 1024x768x16 & glxinfo

xvfb-run 사용

$ xvfb-run -s "-screen 0 1400x900x24" 명령어

xvfb-run -s “-screen 0 1400x900x24” glxinfo 가 정상적으로 작동하지 않을 때,

https://davidsanwald.github.io/2016/11/13/building-tensorflow-with-gpu-support.html

IMPORTANT: Be sure to use the –no-opengl-libs option 부분 참조

$ chmod +x cuda_8.0.44_linux-run
$ sudo sh cuda_8.0.44_linux-run --extract=~/Downloads/
$ sudo sh cuda_8.0.44_linux-run --override --no-opengl-libs

https://gist.github.com/wangruohui/df039f0dc434d6486f5d4d098aa52d07#install-dependencies

python

라이브러리

cuda.1581008699.txt.gz · 마지막으로 수정됨: 2024/03/23 02:37 (바깥 편집)