欢迎访问 生活随笔!

ag凯发k8国际

当前位置: ag凯发k8国际 > 运维知识 > ubuntu >内容正文

ubuntu

完整的ubuntu18.04深度学习gpu环境配置,英伟达显卡驱动安装、cuda9.0安装、cudnn的安装、anaconda安装 -ag凯发k8国际

发布时间:2024/10/8 ubuntu 0 豆豆
ag凯发k8国际 收集整理的这篇文章主要介绍了 完整的ubuntu18.04深度学习gpu环境配置,英伟达显卡驱动安装、cuda9.0安装、cudnn的安装、anaconda安装 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

文章目录

  • 1、英伟达显卡驱动安装
  • 2、cuda9.0安装
  • 3、cudnn的安装
  • 4、anaconda安装
  • 5、安装tensorflow和keras 安装

参考:https://blog.csdn.net/weixin_41863685/article/details/80303963

第一步:如果不是重新装的系统,就要把旧的驱动删掉;如果是新装的系统,就不用管了。


第二步:禁止自带的nouveau nvidia驱动。我的电脑原本是没有这个文件的,所以需要先创建这个文件的。

在终端执行:

sudo touch /etc/modprobe.d/blacklist-nouveau.conf

上面的命令不行就输入下面这个:
sudo gedit /etc/modprobe.d/blacklist-nouveau.conf

反正会跳出一个文档:在里面输入下面的内容就好了(这一步不会操作要问森哥)

然后保存,关闭就好了。
然后更新配置文件,在命令行输入:

第一次装:这个时候最好不用重启,因为怕重启了会开不了机!!!
第二次装:这时候要重启的,如果不重启就无法更新,说不准自带驱动没有被禁用呢。

重启以后执行 lspci | grep nouveau查看是否有内容,没有内容说明禁用成功,继续下一步就行。 第三步,添加graphic drivers ppa


查看合适的驱动版本:

然后会出现下图中的情况,

然后选择驱动的版本,这里最好选择被推荐的396.
然后通过下面的命令进行安装:


安装完了后,会跳出一个协议,然后点击tab键,选择“ok”,然后跳出一个需要输密码的东西,输入“12345678”八位密码就好,然后二次确认密码。

然后重启:

这一步很重要很重要!!!在重启的时候会出现蓝屏,这时候不是等到自动开机,或者选择continue,而是按下按键,选择enroll mok,确认后再下一个选项中,选择continue,然后输入安装驱动时设置的密码(输入密码时候是不会显示出来的,输完直接按回车就好了),即“12345678”,然后开机(reboot)

安装完后,通过如下命令检测是否安装成功,如果成功会显示如下图所示。



出现这个样子的时候,显卡驱动就安装成功了。

第一步,在ag凯发k8国际官网上下载run 文件,如图所示,选择合适run文件
ag凯发k8国际官网链接:
https://developer.nvidia.com/cuda-90-download-archive?target_os=linux&target_arch=x86_64&target_distro=ubuntu&target_version=1704&target_type=runfilelocal

第二步,安装依赖库。在下载完成后在运行这个run文件之前先安装依赖库

第三步,gcc降低版本。cuda9.0要求gcc版本是5.x或者6.x,其他版本不可以,需要自己进行配置,通过以下命令才对gcc版本进行修改。(在ubuntu18.04里面,gcc应该是7.x的版本,所以要降低版本)



通过命令替换掉之前的版本:


然后通过下面命令检测一遍:


如果是下图这样的话就没问题了。


第四步,安装cuda。
运行run文件。会出现下面这个错误。

意思就是找不到这个文件,这时候就要注意了:这是因为没在一个路径里面,下载的run文件是在download下面,所以要在这个路径下安装cnda。要按照下图来操作(新建一个tab终端)。
下面教如何进入downloads这个目录:(如下图)

注意:ls是看当前目录下有哪些子目录;
pwd是查看当前的目录;
cd /home/deeplearning/downloads就可以进入downloads这个目录,就可以开始下面的操作了。

观察到上面的run文件变成了绿色,就可以安装了!!!
如果实在不行就再下载下面的这些依赖包。

然后再安装。实在不行就重启好了。
第五步,环境配置。
完成以上的步骤以后一定要进行环境的配置。按步骤输入一下命令:

会弹出一个可写的配置文件,在末尾把以下配置写入并保存。

下图就是环境配置时弹出来的窗口

然后点“save”保存,×掉就好了。
最后执行

然后重启!!!

注意:在下载cnda的时候有四个补丁没有下载,所以也没安装,如果后续出了bug,再下载安装。这个和cuda.run文件的安装路径一样。下图就是这四个补丁。对了,补丁也在cudaag凯发k8国际官网下载。

我是按照
https://blog.csdn.net/u014513863/article/details/82720866
上面这个链接的教程走的。
第一步,下载合适的cudnn。进下面这个ag凯发k8国际官网下载,要下载合适的安装包,因为我的cuda 是9.0的版本。
https://developer.nvidia.com/rdp/cudnn-archive
进上面这个网站,注册,下载!
注册好以后走下面的流程:




(注:我下的是7.3.1,毕竟他这个太老了)
下载好是保存在downloads这里的。

第二步,下载结束后,将压缩包进行解压缩。
然后,在downloads/文件夹内输入如下命令,将cudnn拷贝至cuda的目录中(注,cudnn无需安装):
执行下面的命令就好了:


如上所述,我的这里有四个文件的,具体的如下面两张图所示:


对前面两张图说明:就是先进入downloads这个目录,然后进入我下载的cudnn这个目录,然后接下来的命令就是将cudnn拷贝至cuda的目录中。

第三步,cuda测试。
进入samples文件夹,一般在home目录下


编译完成后,进入:


使用bandwidthtest测试:


在usr/local/cuda-9.0中输入nvcc -v
会出现:


我的实际操作如下图所示:





(注意:cd是回到主目录的意思)

从清华镜像下载ancaonda,我下载的是anaconda3-5.1.0-linux-x86_64.sh和anaconda2-4.4.3-linux-x86_64.sh
从下面这个网站下:
https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
将目录调整到downloads下,输入下面的命令进行安装。


安装过程中回车 和“yes”就完事了。
最后出来下面这个图。

看到这些信息说明已经安装完成。
根据信息“for this change to become active, you have to open a new terminal.”(要使这个更改生效,必须打开一个新的终端。)这句话提示,需要在新的终端窗口使用anaconda,打开新的终端,查看相应的版本信息


重启!!!
然后打开jupyter notebook
打开 notebook 的方法非常简单,只需在终端输入:



然后浏览器跳出下图这个:


这就说明好了。
5、下载pip、pip3和python3
sudo apt install python-pip
sudo apt install python3-pip


发现pip2和pip3都在系统里面,没在anaconda里面,所以取个别名:


alias pip2=/usr/local/bin/pip2.7
alias python2=/usr/bin/python2.7
alias pip3=/usr/local/bin/pip3.6
alias python3=/usr/bin/python3.6

首先确定要安装的tensorflow的版本,因为它和cuda是配套的。请看下面链接:
https://blog.csdn.net/qq_27825451/article/details/89082978

然后安装tensorflow:
https://blog.csdn.net/youngping/article/details/84207234
先根据上面这个链接把下载源改成aliyuan,要不然用国外的源太慢了

然后安装tensorflow:
pip install tensorflow-gpu==1.8.0(我是这个版本)

下面这些是第一次不成熟安装的坑

执行下图中的命令:


发现安装tensorflow的时候会报错,意思是安装超时了,那是因为没有用阿里云的源下载,所以很慢,所以会超时,这时候就要把下载格式改成阿里云源(上网搜索pip阿里云关键词)

然后下载了博客上推荐的tensorflow,发现运行会出错!!!那么这个问题很严重啊!!!就相当于没装啊,那现在怎么办呢????
哦哦哦,后来,我们后来终于发现了这个问题
原来是tensorflow和cuda的版本不兼容!!!你说傻逼不傻逼!!!
后来我们卸载了之前费了好大力气装的tensorflow
(用 pip install tensorflow-gpu 查当前安装的tensorflow的版本;;用pip uninstall tensorflow-gpu***卸载此版本的tf)
然后报错!!!???(吗卖批)
报错原因>>importerror:no module named cv2

这时候要解决这个烦人的问题!!!那么看我下面的手法:
pip install opencv-python

然后从python3转到python2就好了
vim ~/.bash
vim ~/.bashrc 注释python3就好了
好了,到这里大概就可以跑出程序了,如果再出错的话,就自行百度错误吧!!!毕竟老夫也不是很全能的。

亲,最后想不想自己写文件呀?我手把手教你呀!
vim sis.txt (自己要写的文件)
balabala开始自己写了
写完了以后
按esc停止编辑 按shift :wq(这个表示写入并退出)

与50位技术专家面对面20年技术见证,附赠技术全景图

总结

以上是ag凯发k8国际为你收集整理的完整的ubuntu18.04深度学习gpu环境配置,英伟达显卡驱动安装、cuda9.0安装、cudnn的安装、anaconda安装的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得ag凯发k8国际网站内容还不错,欢迎将ag凯发k8国际推荐给好友。

  • 上一篇:
  • 下一篇:
网站地图