MJay
GPU 서버에 Nvidia Driver , CUDA, CUDNN , Docker , Nvidia-Docker를 다시 깔기 본문
GPU 서버에 Nvidia Driver , CUDA, CUDNN , Docker , Nvidia-Docker를 다시 깔기
학교 정전때문에 Docker도 실행이 안되고 nvidia-smi도 안되길래 다시 깔아봤다.
sudo apt update
일단 rabbitmq이랑 관련된 pakcage가 오류가 있다고 한다.
()NO_PUBKEY 6b~~~)Public key를 추가하면 된다.
PUBKEY에 해당하는 public key를 추가해준다.
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 6B73A36E6026DFCA
그럼 해결된다.
그 다음은 R-Studio 문제이다.
R-Studio랑 관련된 The repository 가 없다고 한다. 이전 R-Stuido을 지우고 그냥 새로운 r-studio을 깔았다.
sudo apt-get remove r-base-core
sudo vi /etc/apt/source.list 여기 들어가서
deb http://cran.rstudio.com/bin/linux/ubuntu precise/ 이걸 추가해준다
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E084DAB9
sudo add-apt-repository ppa:marutter/rdev //이건 안되는듯
sudo apt-get update
sudo apt-get upgrade
sudo apt-get install r-base
이렇게 해결된다.
마지막 문제점
이건 저 repository을 주석처리해버렸다.
여기 폴더에서
이 두파일에 들어가서 다 주석처리해버렸다.
에러에 나오는 PPA를 주석처리해버렸다. 그러니 해결이 됬다.
이렇게 apt-update 는 해결하고
OpenCL 을 해보려고 하다가 OpenCL.so 파일을 다 지워버렸다.
알고보면 libOpenCL.so은 cuda를 깔 때 같이 깔리는거라서
그냥 다시 다 깔기로했다.
ftp.daum.net 사용
vi /etc/apt/source.list를 보면
기존에는 ubuntu 저장소가 kr.ubuntu.com 뭐시기 뭐시기 되어있는데 그게 오류가 있다고 해서
ftp.daum.net 으로 바꿨다.
Cuda 삭제
이렇게 하면 사라질꺼같은디
폴더는 그냥 남아있다.
CUDA삭제하려면 그냥
rm -rf /usr/local/cuda
rm -rf /usr/local/cuda-8.0 하면 끝난다
cuDNN 삭제
cuDNN이랑 관련된 모든 파일도 /usr/local/cuda 폴더 안에 있기 떄문에 안해져도 된다.
sudo apt-get purge --auto-remove nvidia-cuda-toolkit
이렇게도 해준다고 한다.
Nvidia Driver도 지우기
sudo apt-get remove --purge nvidia-*
Nvidia Driver랑 Cuda-8.0 버전 설치
lspci | grep -i nvidia
uname -m && cat /etc/*release
gcc --version
uname -r
sudo apt-get install linux-headers-$(uname -r)
wget https://developer.nvidia.com/compute/cuda/8.0/Prod2/local_installers/cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64-deb
dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64-deb
sudo apt-get update
sudo apt-get install cuda
cuDNN 설치
cudNN 다운로드 홈페이지에가서 Linux 용 cuDNN Library를 다운받는다
압축을 풀고 /usr/local/cuda에 옮긴다.
curl -O https://developer.nvidia.com/compute/machine-learning/cudnn/secure/v7/prod/8.0_20170802/cudnn-8.0-linux-x64-v7-tgz
tar -xzvf cudnn-8.0-linux-x64-v7.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
// a+r 모든 사람이 읽기 가능
cuDNN 설치 확인
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
Docker Engine 다시 설치
sudo apt-get remove docker docker-engine docker.io
sudo apt-get install linux-image-extra-$(uname -r) linux-image-extra-virtual
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
sudo apt-key fingerprint 0EBFCD88
sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu \
$(lsb_release -cs) \
stable"
sudo apt-get update
1982 sudo apt-get install docker-ce
1983 apt-cache madison docker-ce
sudo apt-get install docker-ce=17.03.2~ce-0~ubuntu-xenial
sudo docker run hello-world
가끔식 apt-get -f install 하라는 명령이 나오면 하면 된다.
Nvidia-Docker
wget -P /tmp https://github.com/NVIDIA/nvidia-docker/releases/download/v1.0.1/nvidia-docker_1.0.1-1_amd64.deb
sudo dpkg -i /tmp/nvidia-docker*.deb && rm /tmp/nvidia-docker*.deb
nvidia-docker run --rm nvidia/cuda nvidia-smi
sudo nvidia-docker run --rm nvidia/cuda nvidia-smi
'Linux' 카테고리의 다른 글
P100 서버 설치 과정 (0) | 2017.09.13 |
---|---|
GPU Server import tensorflow as tf 오류 (0) | 2017.09.12 |
vim 꿀팁 (0) | 2017.07.19 |
C 프로그래밍 : C 컴파일러 [gcc](Scrap) (0) | 2017.07.16 |
Vim에 쓸만한 shortcut (0) | 2017.07.16 |