Tesla GPU サーバーをご利用いただくには、GPU カードドライバーをお客様ご自身でインストールしていただく必要があります。
NVIDIA ドライバーのダウンロード
まずはじめに GPU カードの製造元である NVIDIA社のページから GPU カードドライバーをダウンロードします。
GPU カードドライバーのダウンロードページを開きます。
■配布元: NVIDIA > Download Drivers
http://www.nvidia.com/Download/index.aspx?lang=en-usNVIDIA ドライバーのダウンロードページが開きます。
次の項目を選択します。Product Type 「Tesla」を選択します。 Product Series 「P-Series」を選択します。 Product 「Tesla P40」または「Tesla P100」を選択します。
- ※ ご利用中の GPU タイプを選択してください。
Operating System 「Linux 64-bit」を選択します。 CUDA Toolkit 最新バージョンを選択します。 - ※ このマニュアルでは、2018年2月時点の最新バージョン「9.1」を選択します。
- ※ GPU カードドライバーのインストール後、選択したバージョンの CUDA Toolkit をインストールしてください。
⇒ CUDA Toolkit のインストール
Language 「English (US)」を選択します。
「SEARCH」をクリックします。
GPU カードドライバーのダウンロード画面になります。
「DOWNLOAD」をクリックします。ダウンロード確認画面になります。
リンク先の「License For Customer Use of NVIDIA Software (NVIDIAソフトウェア使用許諾契約書)」に同意し、「AGREE & DOWNLOAD」をクリックします。GPU カードドライバーを任意の場所にダウンロードします。
- ※ 2018年2月時点の最新バージョンは「NVIDIA-Linux-x86_64-390.12.run」です。
Ubuntu での GPU カードドライバーのインストール
- ※ Linux コマンドに関してはサポート対象外となります。
ご不明な点や詳細についてはインターネットや書籍にてご確認ください。
root アカウントでログインします。
gpuadmin@gput-p40-0:~$ su - Password: root@gput-p40-0:~#
ユーザー:gpuadmin を sudo グループへ追加します。
root@gput-p40-0:~# cd /home/gpuadmin root@gput-p40-0:/home/gpuadmin# gpasswd -a gpuadmin sudo Adding user gpuadmin to group sudo root@gput-p40-0:/home/gpuadmin# exit logout gpuadmin@gput-p40-0:~$
パッケージをアップデートします。
gpuadmin@gput-p40-0:~$ sudo apt update
gpuadmin@gput-p40-0:~$ sudo apt upgrade
開発ツールをインストールします。
gpuadmin@gput-p40-0:~$ sudo apt install build-essential
DKMS をインストールします。
gpuadmin@gput-p40-0:~$ sudo apt install dkms
ダウンロードした NVIDIA ドライバーを SCP などでサーバーにコピーします。
⇒ NVIDIA ドライバーのダウンロードここでは、SSHクライアント「Tera Term」の機能を使用します。
[ ファイル > SSH SCP ]をクリックします。
ダウンロードした NVIDIA ドライバーを選択し「Send」をクリックします。
サーバーにコピーした NVIDIA ドライバーに実行権限をつけます。
gpuadmin@gput-p40-0:~$ chmod+x NVIDIA-Linux-x86_64-390.12.run
NVIDIA ドライバーをインストールします。
gpuadmin@gput-p40-0:~$ sudo ./NVIDIA-Linux-x86_64-390.12.run --silent --no-opengl-files --no-libglx-indirect --dkms
X.Orgがインストールされていないシステムの場合、インストール時に下記の警告が表示されることがありますが、無視しても問題ありません。
WARNING: nvidia-installer was forced to guess the X library path '/usr/lib' and X module path '/usr/lib/xorg/modules'; these paths were not queryable from the system. If X fails to find the NVIDIA X driver module, please install the `pkg-config` utility and the X.Org SDK/development package for your distribution and reinstall the driver.
32ビット互換ライブラリの適切なインストール先が見つからない場合、インストール時に下記の警告が表示されることがありますが、無視しても問題ありません。
WARNING: Unable to find a suitable destination to install 32-bit compatibility libraries. Your system may not be set up for 32-bit compatibility. 32-bit compatibility files will not be installed; if you wish to install them, re-run the installation and set a valid directory with the --compat32-libdir option.サーバーを再起動します。
gpuadmin@gput-p40-0:~$ sudo reboot
インストールした NVDIA ドライバーを確認します。
gpuadmin@gput-p40-0:~$ nvidia-smi Mon Feb 5 11:18:04 2018 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 390.12 Driver Version: 390.12 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | |===============================+======================+======================| | 0 Tesla P40 Off | 00000000:03:00.0 Off | 0 | | N/A 30C P0 48W / 250W | 0MiB / 22919MiB | 0% Default | +-------------------------------+----------------------+----------------------+ +-----------------------------------------------------------------------------+ | Processes: GPU Memory | | GPU PID Type Process name Usage | |=============================================================================| | No running processes found | +-----------------------------------------------------------------------------+
nvidia-smi 実行時に下記メッセージが表示される場合
NVIDIA ドライバーを再度インストールしなおすことで解決します。
NVIDIA ドライバーをアンインストールします。
gpuadmin@gput-p40-0:~$ sudo apt-get remove nvidia-*
CUDA をアンインストールします。
gpuadmin@gput-p40-0:~$ sudo apt-get remove cuda-*
もう一度 NVIDIA ドライバーをインストールします。
gpuadmin@gput-p40-0:~$ sudo ./NVIDIA-Linux-x86_64-390.12.run --silent --no-opengl-files --no-libglx-indirect --dkms
サーバーを再起動します。
gpuadmin@gput-p40-0:~$ sudo reboot
インストールした NVDIA ドライバーを確認します。
gpuadmin@gput-p40-0:~$ nvidia-smi