为了账号安全,请及时绑定邮箱和手机立即绑定
手记 \ 机器学习实战Ubuntu环境搭建

机器学习实战Ubuntu环境搭建 原创

2017-05-22 11:42:16 6649浏览 7评论

秋名山车神

全栈工程师 我本微末凡尘,却也心向天空。

作者的热门手记

看了慕课网的机器学习实战启蒙课程,课程本身做的很不错。但是在搭建环境方面有一些坑,这里整理一份Ubuntu 17.04 64bit系统搭建开发环境的经验。

只适用于Linux 64位的。

安装anaconda

anaconda是Python的一个加强版,它本身并无任何特殊之处,只是整合了很多库和工具,广泛应用于科学计算领域。

GraphLab Create 官方的建议是安装anaconda,如果你非要跟官方对着干,那搭建环境会让你哀莫大于心死。据说官方只支持Python2,anaconda同样分为两个版本,一个是anaconda2一个是anaconda3,在anaconda2里面集成的就是Python2。

如果你原来安装了anaconda3或者是Python3,我建议你把它卸载了。如果不想卸载,也一定要在环境变量里,把anaconda2的放进去,并且把原来的去掉。

anaconda2下载地址

官方地址:https://www.continuum.io/downloads

百度云盘:https://pan.baidu.com/s/1hs1LF0K 密码: 1zx3

说明
百度云的链接,是我从官方下载以后放上去的,目前和官方版本一致,4.3.1。主要是出于下载速度的考虑,能够自己告诉翻墙或者有迅雷会员的可以直接从官方下载。我上传的下载包,并没有经过任何的修改,大家请放心下载,也可以自己去官方查看MD5值,来自行通过工具对比:
https://docs.continuum.io/anaconda/hashes/Anaconda2-4.3.1-Linux-x86_64.sh-hash

安装

下载完成以后,进入所在目录,输入下面的命令:

bash Anaconda2-4.3.1-Linux-x86_64.sh

然后会进入一个命令行的安装界面,这个没啥好说的,提示让你按ENTER你就按ENTER,提示让你输入yes/no你就输入yes,然后回车,接着就耐心的等待就行了,一定要注意看关键字,ENTER,英文不好的记住看这个关键字就好了,看到就按回车准没错,千万别傻傻的等,还有让输入yes或者no,一定要输入yes。输入完yes后,要切记,他会把anaconda2自动加到你的环境变量里,所以如果你之前有项目依赖Python3,一定要注意。而且如果anaconda提示你可以输入点别的啥东西的时候,也不要输入,直接回车就行了,除非出现yes/no,才输入yes然后回车,别的什么都不用输入,直接回车。

更换清华大学的官方源

如果你对自己的翻墙技术和速度非常有信心[比如各种干扰,各种网速慢,各种证书不合法,各种连接超时],可以忽略此步。但是我强烈的建议你,还是不要折腾,老实用清华的源。

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

conda config --set show_channel_urls yes

如果上面的命令,提醒你conda找不到,那说明你没有把anaconda2加到你的环境变量里面,是不是没有老老实实的听我话输入yes!

如果你出现conda命令找不到,请把这句话加到你的环境变量~/.bashrc里:

export PATH="/home/你当前登录用户的用户名/anaconda2/bin:$PATH"
删除默认的源

然后我们还需要做另一个操作,那就是删除anaconda2里面的默认源。

sudo vim ~/.condarc

然后你会看到很多的内容,啥!没看到?!

你肯定没有老老实实按照上面的要求去做,乱输什么东西,导致anaconda2没有安装到默认的路径。

图片描述

然后删除- defaults 这一行,记住是这一行。还有你要注意,我上面是不是比你的多了一行msys2的地址?这是个不良示范,这个地址不是给Linux用的,我在清华镜像源看到的,然后我也给加进去了,寻思着越多越好,结果就报错了,让我各种谷歌老半天,最后自己打开这个地址一看,懵逼了,没有Linux的文件夹。千万不要加那个多出来的地址!!!

更新conda
conda update conda

耐心等待一会,如果让你输入yes或者别的什么鬼东西,反正都是让你确认的意思,确认就可以了。不确认不给你更新,不更新接下来你就会出错。

创建虚拟环境

在Python中,我们每个项目都应该是一个独立的环境,这里我们采用官方的建议,新建如下虚拟环境。

记得先输入一个Python,然后会进入Python的命令行界面,并且你能够看到你的Python版本还有你的anaconda版本,下面的版本一定要输入你看到的你电脑上面的,切记。

然后记得退出你的python命令行交互界面,下面命令中的 > exit() 是提示你退出Python命令交互界面,那个>是代表python命令行交互界面的意思,你一定不会多打一个>而是直接打exit()退出,这是常识对吗?

python
> exit()

退出Python命令行以后,就输入下面的命令:[你会确认python和anaconda是你刚才看到的版本号的吧,而且如果跟你的不一致你会修改的吧]

这个命令执行需要下载很多东西,期间保证电脑,不关机,不断网。如果没有更换清华源的,祝你好运。

conda create -n gl-env python=2.7.13 anaconda=4.3.1

ps:不要觉得我太啰嗦

安装GraphLab-Create

终于正主来了!

在经过几十分钟的漫长等待,终于完成了上面的命令。

首先切换到刚才建的gl-env虚拟环境,如果自己随便改名,就用自己改的名字。

source activate gl-env

友情提示一下退出是:source deactivate

下面的命令,都是在gl-env虚拟环境下执行的,为了突出说明,我会在每个命令前面增加(gl-env)来说明,我们是在这个虚拟环境下的!

前面想展示你翻墙技术的小伙子,到你展示的时候了。下面这条命令,需要翻墙去下载,如果你翻不了墙也没太大关系,只是慢一点而已,命令执行过程中,会出现很多红色的醒目的信息,但是不要慌,翻译一番你会发现,都是提醒你那个玩意过时了,然后已经帮你卸载了,都是正常的提示信息。可能官方觉得,红色更好看。

下面的命令,不能直接使用,你要去官方申请一个密钥,反正随便填就行了,然后你就申请成功了,然后把下面命令里中文部分修改了就可以了,不要删了邮箱和密钥中间的斜线/

申请密钥的地址:https://turi.com/download/academic.html

记得选你是学习研究用的,不是商业用途,这样就可以免费使用。

(gl-env) pip install --upgrade --no-cache-dir https://get.graphlab.com/GraphLab-Create/2.1/注册的邮箱/你的秘钥/GraphLab-Create-License.tar.gz
安装ipython-notebook
(gl-env) conda install ipython-notebook

如果上面的命令报错:
ImportError: No module named shutil_get_terminal_size

网上有很多解决方案,大部分都是扯淡的,还去改源文件啥的。在GitHub的官方issue里面我找到了另一个靠谱的官方答案,那就是,少个包。

(gl-env) conda install backports.shutil_get_terminal_size

如果上面这句你还报错,那说明你没有按照上面说的添加和删除源,要么你就是,没看清我的话,添加了/msys2/ 这个源。

你的anaconda配置文件里channels下只应该有两个源,结尾如下:

前面这是中科大的镜像地址/pkgs/free/
前面这是中科大的镜像地址/conda-forge/

多出别的任何其他地址或者任何单词都是错误的。

安装完成以后,再执行:

(gl-env) conda install ipython-notebook

是不是安装成功了?

注意,以后启动ipython notebook 也是在虚拟环境下启动的,切记!!!
不然你会发现,怎么都找不到graphlab这个module。

# 进入ipython 交互界面
(gl-env) ipython
# 此处是ipython的交互界面,前面的`[1]`是ipython的输出,你可不要打。
[1] import graphlab
[2] graphlab.__VERSION__

好了,恭喜大家,完成了Ubuntu环境搭建,其他的Linux系统,也大同小异。

如果大家喜欢可以点赞,分享,评论。

by. 秋名山车神
END

相关标签: Python 云计算 大数据

本文原创发布于慕课网 ,转载请注明出处,谢谢合作!

40 推荐
    意见反馈 常见问题 APP下载
    官方微信