安裝nvidia驅動

  1. 查看可安裝的驅動
    1
    $ sudo ubuntu-drivers list     
  2. 安裝驅動(前者會自動安裝適合的驅動,後者可以指定驅動版本號)
    1
    2
    $ sudo ubuntu-drivers autoinstall
    $ sudo apt install nvidia-driver-版本號
  3. 安裝完後重啟
    1
    $ sudo reboot 
  4. 確認是否安裝成功
    1
    $ sudo nvidia-smi 

nvidia-smi

安裝NVIDIA Container Toolkit

  • 在docker container中使用gpu加速運算必須安裝container toolkit
  • Docker內都已經包含了CUDA和大量nvidia的配件,所以我們並不需要在主機上安裝CUDA、CuDNN,省去了安裝的麻煩及繁雜版本的適配問題。
  1. 設定repo以及GPG key
    1
    2
    3
    $ distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
    && curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \
    && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
  2. 安裝nvidia-docker2
    1
    2
    $ sudo apt-get update
    $ sudo apt-get install -y nvidia-docker2
  3. 重啟docker
    1
    $ sudo systemctl restart docker
  4. 測試是否安裝成功
    1
    $ sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi
    nvidia-smi

Reference