为了账号安全,请及时绑定邮箱和手机立即绑定

大数据

机器学习实战Ubuntu环境搭建 原创

看了慕课网的机器学习实战启蒙课程,课程本身做的很不错。但是在搭建环境方面有一些坑,这里整理一份Ubuntu 17.04 64bit系统搭建开发环境的经验。 只适用于Linux 64位的。 安装anaconda anaconda是Python的一个加强版,它本身并无任何特殊之处,只是整合了很多库和工具,广泛应用于科学计算领域。 GraphLab Create 官方的建议是安装anaconda,如果你...

1805浏览 29推荐 3评论

MySQL的坑:把Excel文件导入到Navicat for MySQ 原创

大家好,又跟大家见面了。最近因为发生了这样那样的事情,好久没有写手记了。 最近我玩了一下MySQL,但是却因为两个小问题浪费了我一天的时间。为了各位慕友们不再像我这样浪费较多的耗时间在小的问题上,所以我今天来总结一下遇到这两个小问题应该怎么办。 首先,是字符集的问题。这种问题很常见,在我们新建立的表的时候在表中插入数据,但是插入汉字的时候却总会出乱码。 解决问题方法如下:mysql> sho...

804浏览 18推荐 1评论

如何安装GraphLab Create

近期有很多同学反映在安装GraphLab Create时经常会出现一些错误。因为我在视频中讲的是MAC版本的安装,对于其他的操作系统我并没有提及,其实GraphLab Create的安装对于Windows,Linux和MAC系统的安装方法都是一样的。但是对于具体的系统配置有一些要求,我在这里解释如下: 对于Windows系统,需要windows 7以上的版本或windows server 2012...

224浏览 5推荐 0评论

如何成为机器学习工程师

你对机器学习感兴趣? 你不是一个人! 有好多的人每天都对机器学习感兴趣。但是,对机器学习感兴趣是一回事,实际上开始在现场工作是另一回事。 这篇文章将帮助您了解开始从事机器学习工程师工作的整体思维方式和具体技能。 首先,如果你正在考虑一个机器学习工程师的职业生涯,那么你应该明白两件非常重要的事情。 首先,这不是一个“纯粹的”学术角色。 你不一定要有研究或学术背景。 其次,只有...

3575浏览 46推荐 3评论

Linux的巧用:sed的用法总结(一)

最近本人遇到了一个的问题(话说是这样,我几乎是天天遇到问题/(ㄒoㄒ)/~~),那就是sed。 在这里要提醒各位,我就容易爱犯这样的毛病,总是把sed写成的set,真的是好悲伤啊(sad)! 咦?这样好像还是容易混啊~,反正大家一定要记住,千万不要打错了 估计也没有几个人像我这么蠢╮(╯╰)╭ 这个sed是一个功能十分强大的东西,他不仅仅限于查指定行数中的内容,还可以对文件进行操作:增加,删除,取...

163浏览 2推荐 0评论

hive的巧用:查询两个表中不一样的数据

上个星期我在前辈的项目中发现了一个有趣的事情: select a.* FROM A a left outer join B b on a.qq = b.qq WHERE b.qq is null; 恩,很好。 WHERE b.qq is null; ......... ?? 尼玛,你这不是查空得吗,查空的是干毛用啊?然后我就查前辈在数据库中存的sql语句,看看他是不是给我发错了。 查完之后我就嘿嘿...

314浏览 1推荐 0评论

机器学习基础理论(二)

数据分析与机器学习的区别: 1、数据特点: (1) * 数据分析处理交易数据(和钱有关系的); * 机器学习处理行为数据(搜索历史、点击历史、浏览历史、评论)。 (2)数据量 * 数据分析是少量数据 * 机器学习是海量数据 (3)分析方法: * 数据分析采用采样分析 * 机器学习采用全量分析 NOSQL:非关系型的数据库,只能用来处理行为数据,而不能处理交易数据。如MangoDB。 2、解决业务问...

515浏览 7推荐 0评论

机器学习基础理论(一)

什么是机器学习: 1、利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策。 2、对不确定场景的决策的两种方法: (1)机器学习 (2)数据分析:依赖于数据分析师,即人 从数据中寻找规律: 1、全部数据 2、量化、用模型刻画(拟合)规律 机器学习发展的原动力: 1、从历史数据中找出规律,把这些规律用到对未来自动做出决定。 2、用数据替代expert 3、经济驱动,数据变现 业务系...

832浏览 5推荐 0评论

RabbitMQ教程之一:安装及简介 原创

RabbitMQ到底是什么? RabbitMQ是一个程序与程序之间通信的方法,或者可以理解为一种专用的通道,专门用来负责消息的读取和写入。应用程序通过在RabbitMQ中读写消息来通信,程序与程序之间无需专门的链接,而是直接通过RabbitMQ来进行数据的读写。RabbitMQ将会采用异步的方式来分发消息,是一种经典的生产者与消费者的模式,多个消费者由RabbitMQ来负责协调,并且保证每一条消息...

3255浏览 25推荐 5评论

Docker学习笔记———Get Start 原创

做程序员最可怕的事情是不是自己学习的速度还不如这些工具产品版本号更新的快? 搁置了一个假期的docker学习计划,重新启动docker时候发现版本号已经跳到17.03。恍惚记得上一次用它还是1.12来着,版本号跳的恍如隔世。倒也给我提了醒,学习不能拖拉,不然总是被牵着鼻子跑。 <!-- more --> Docker 发布重大更新,宣布企业版到来 3 月 2 日,Docker 官方发布...

1394浏览 9推荐 1评论

Windows上redis的安装

1.介绍: Redis是一个开源的使用ANSI C语言编写,支持网络,科技与内存亦持久化的日志型,一个高性能的key-Value数据库,并提供多重语言的API。它支持存储的value类型很多,包括string(字符串)、list(链表)、set(集合)、zset(有序集合sorted set)和hash(哈希)。这些数据类型都支持push/pop、add/remove及取交集并集和差集等更丰富的操...

512浏览 5推荐 0评论

跟我学Redis(2)— Linux安装Redis

1、安装 $ wget http://download.redis.io/releases/redis-3.0.7.tar.gz $ tar xzf redis-3.0.7.tar.gz $ cd redis-3.0.7 $ make 2、run(在redis-3.0.7目录中) $ src/redis-server 或者 $ src/redis-server redis.conf 3、测试 $ ...

562浏览 6推荐 0评论

跟我学Redis(3)—配置文件redis.conf

redis.conf 配置项说明如下: Redis默认不是以守护进程的方式运行,可以通过该配置项修改,使用yes启用守护进程 daemonize no 当Redis以守护进程方式运行时,Redis默认会把pid写入/var/run/redis.pid文件,可以通过pidfile指定 pidfile /var/run/redis.pid 指定Redis监听端口,默认端口为6379,作者在自己的一篇博...

345浏览 4推荐 0评论

Python多线程----线程池 原创

Python多线程----线程池 需求:假设我们现在有一个多线程项目,每有一个用户连接进来,我们的服务器就会创建一个线程。而我们的服务器最多能够承载100个线程,再多就会崩溃。为了防止恶意用户伪装真实用户构建大量的访问来让我们的服务器崩溃,现在需要对线程数量进行限制,一共只有100个线程,并且当一个用户访问结束以后线程会自动归还,等待下一个用户访问。如果100个线程全部被占用则101个用户进入阻塞...

1555浏览 11推荐 1评论

Python多线程之threading.Thread实现 原创

Python多线程之threading.Thread 并行和串行 串行 所谓串行,就好比我们走路一样,一条马路,一次只能过一辆车,这样速度就会很受限制。 并行 理解了串行,并行就更好理解了,就是好多条路。路越多,车流量就越大。 多线程就是并行的一种。当然,实际发生在计算机内部的时候,并不能单纯的理解为多了一条路。因为我们的计算机一个CPU核心,同时只能处理一个任务。在CPU只有一个核心的情况下,多...

1845浏览 7推荐 1评论
首页上一页1234567下一页尾页

推荐作者

热门手记

意见反馈 常见问题 APP下载
官方微信