GPU カードドライバーのインストール

Tesla GPU サーバーをご利用いただくには、GPU カードドライバーをお客様ご自身でインストールしていただく必要があります。

NVIDIA ドライバーのダウンロード

まずはじめに GPU カードの製造元である NVIDIA社のページから GPU カードドライバーをダウンロードします。


  1. GPU カードドライバーのダウンロードページを開きます。

    ■配布元: NVIDIA > Download Drivers
        http://www.nvidia.com/Download/index.aspx?lang=en-us

  2.  

  3. NVIDIA ドライバーのダウンロードページが開きます。
    NVIDIA > Download Drivers
    次の項目を選択します。

    Product Type 「Tesla」を選択します。
    Product Series 「P-Series」を選択します。
    Product 「Tesla P40」または「Tesla P100」を選択します。
    • ご利用中の GPU タイプを選択してください。
    Operating System 「Linux 64-bit」を選択します。
    CUDA Toolkit 最新バージョンを選択します。
    • このマニュアルでは、2018年2月時点の最新バージョン「9.1」を選択します。
    • GPU カードドライバーのインストール後、選択したバージョンの CUDA Toolkit をインストールしてください。
      ⇒ CUDA Toolkit のインストール
    Language 「English (US)」を選択します。

    SEARCH」をクリックします。

  4.  

  5. GPU カードドライバーのダウンロード画面になります。
    NVIDIA > Download Drivers > Tesla Driver for Linux x64
    DOWNLOAD」をクリックします。

  6.  

  7. ダウンロード確認画面になります。
    NVIDIA > Download Drivers > Download Confirmation
    リンク先の「License For Customer Use of NVIDIA Software (NVIDIAソフトウェア使用許諾契約書)」に同意し、「AGREE & DOWNLOAD」をクリックします。

  8.  

  9. GPU カードドライバーを任意の場所にダウンロードします。

    • 2018年2月時点の最新バージョンは「NVIDIA-Linux-x86_64-390.12.run」です。

 

Ubuntu での GPU カードドライバーのインストール

  • Linux コマンドに関してはサポート対象外となります。
    ご不明な点や詳細についてはインターネットや書籍にてご確認ください。

  1. root アカウントでログインします。

    gpuadmin@gput-p40-0:~$ su - Password: root@gput-p40-0:~#

  2.  

  3. ユーザー:gpuadmin を sudo グループへ追加します。

    root@gput-p40-0:~# cd /home/gpuadmin root@gput-p40-0:/home/gpuadmin# gpasswd -a gpuadmin sudo Adding user gpuadmin to group sudo root@gput-p40-0:/home/gpuadmin# exit logout gpuadmin@gput-p40-0:~$

  4.  

  5. パッケージをアップデートします。

    gpuadmin@gput-p40-0:~$ sudo apt update

    gpuadmin@gput-p40-0:~$ sudo apt upgrade

  6.  

  7. 開発ツールをインストールします。

    gpuadmin@gput-p40-0:~$ sudo apt install build-essential

  8.  

  9. DKMS をインストールします。

    gpuadmin@gput-p40-0:~$ sudo apt install dkms

  10.  

  11. ダウンロードした NVIDIA ドライバーを SCP などでサーバーにコピーします。
    ⇒ NVIDIA ドライバーのダウンロード

    ここでは、SSHクライアント「Tera Term」の機能を使用します。
    [ ファイル > SSH SCP ]をクリックします。
    Tera Term > ファイル > SSH SCP
    ダウンロードした NVIDIA ドライバーを選択し「Send」をクリックします。
    send

  12.  

  13. サーバーにコピーした NVIDIA ドライバーに実行権限をつけます。

    gpuadmin@gput-p40-0:~$ chmod+x NVIDIA-Linux-x86_64-390.12.run

  14.  

  15. NVIDIA ドライバーをインストールします。

    gpuadmin@gput-p40-0:~$ sudo ./NVIDIA-Linux-x86_64-390.12.run --silent --no-opengl-files --no-libglx-indirect --dkms

    X.Orgがインストールされていないシステムの場合、インストール時に下記の警告が表示されることがありますが、無視しても問題ありません。

    WARNING: nvidia-installer was forced to guess the X library path '/usr/lib' and X module path '/usr/lib/xorg/modules'; these paths were not queryable from the system. If X fails to find the NVIDIA X driver module, please install the `pkg-config` utility and the X.Org SDK/development package for your distribution and reinstall the driver.

    32ビット互換ライブラリの適切なインストール先が見つからない場合、インストール時に下記の警告が表示されることがありますが、無視しても問題ありません。

    WARNING: Unable to find a suitable destination to install 32-bit compatibility libraries. Your system may not be set up for 32-bit compatibility. 32-bit compatibility files will not be installed; if you wish to install them, re-run the installation and set a valid directory with the --compat32-libdir option.
  16.  

  17. サーバーを再起動します。

    gpuadmin@gput-p40-0:~$ sudo reboot

  18.  

  19. インストールした NVDIA ドライバーを確認します。

    gpuadmin@gput-p40-0:~$ nvidia-smi Mon Feb 5 11:18:04 2018 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 390.12 Driver Version: 390.12 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | |===============================+======================+======================| | 0 Tesla P40 Off | 00000000:03:00.0 Off | 0 | | N/A 30C P0 48W / 250W | 0MiB / 22919MiB | 0% Default | +-------------------------------+----------------------+----------------------+ +-----------------------------------------------------------------------------+ | Processes: GPU Memory | | GPU PID Type Process name Usage | |=============================================================================| | No running processes found | +-----------------------------------------------------------------------------+

nvidia-smi 実行時に下記メッセージが表示される場合

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

NVIDIA ドライバーを再度インストールしなおすことで解決します。

  1. NVIDIA ドライバーをアンインストールします。

    gpuadmin@gput-p40-0:~$ sudo apt-get remove nvidia-*

  2. CUDA をアンインストールします。

    gpuadmin@gput-p40-0:~$ sudo apt-get remove cuda-*

  3. もう一度 NVIDIA ドライバーをインストールします。

    gpuadmin@gput-p40-0:~$ sudo ./NVIDIA-Linux-x86_64-390.12.run --silent --no-opengl-files --no-libglx-indirect --dkms

  4.  

  5. サーバーを再起動します。

    gpuadmin@gput-p40-0:~$ sudo reboot

  6.  

  7. インストールした NVDIA ドライバーを確認します。

    gpuadmin@gput-p40-0:~$ nvidia-smi