【深度学习】谷歌云GPU服务器创建与使用指南(三)

  • Post author:
  • Post category:其他


上一篇介绍了如何使用ssh。


http://blog.csdn.net/sinat_25838589/article/details/79012530

本篇主要介绍:在服务器中安装显卡驱动及配置深度学习框架。

服务器与本地主机的区别(待补充)

在配置本地Linux系统(比如ubuntu)主机的深度学习框架时,显卡驱动的安装按照提示一步一步进行即可。但是,在给服务器安装GPU驱动时,就要考虑到显卡驱动中的显示驱动不能安装,因为服务器预装的系统中没有X桌面(GUI),这点一定要注意。

配置环境

1)安装NVIDIA驱动

显卡驱动下载官网地址:http://www.nvidia.com/Download/index.aspx?lang=en-us
参考下图,


CUDA版本一定要选择“8.0”!!!



因为TensorFlow官网要求cuda版本为8.0,虽然有写支持9.0,但是实测暂时不支持


新建一个文件夹,存放需要下载的驱动文件
sudo mkdir /home/downloads


点search后点下载,按照下图操作复制链接






链接形式如下:

http://cn.download.nvidia.com/tesla/384.66/nvidia-diag-driver-local-repo-ubuntu1604-384.66_1.0-1_amd64.deb


输入如下命令下载并重命名驱动文件
sudo wget -O driver-384.deb http://cn.download.nvidia.com/tesla/384.66/nvidia-diag-driver-local-repo-ubuntu1604-384.66_1.0-1_amd64.deb

按照官网“其他”中介绍的安装方式安装

2)安装CUDA toolkit

这里就有小坑了,CUDA版本要在下面“legacy releases”中选择8.0版本

win 版本:https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_win10-exe

Linux ubuntu16.04版本:(可能会变动)https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64-deb


下面这两个用哪个都可以


然后按照下图选择类型,最后按照安装介绍安装。


在安装时,会遇到如下提示,我们不安装显示驱动,所以一定要选“n”

Install NVIDIAAccelerated Graphics Driver for Linux-x86_64 387.26?

(y)es/(n)o/(q)uit:n

最后显示如下内容,代表CUDA安装成功

3)安装CUDNN


在官网下载cudnn-8.0-linux-x64-v5.1.tgz


https://developer.nvidia.com/rdp/cudnn-download






需要注册登录才可以下载,下载完同样上传到自己home下面,解压:



tar -xvzf cudnn-8.0-linux-x64-v5.1.tgz


解压后是一个cuda文件夹



cd cuda
sudo cp include/cudnn.h /usr/local/cuda/include
sudo cp lib64/libcudnn.* /usr/local/cuda/lib64
sudo vi /etc/profile
export PATH=/usr/local/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
source /etc/profile 使更改生效。
nvcc -V 检查CUDA





下面 4)5)步可以参考TensorFlow官网安装教程:







https://www.tensorflow.org/install/install_linux#installing_with_anaconda








4)安装anaconda

5)安装TensorFlow



版权声明:本文为sinat_25838589原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。