认识Hadoop--基础篇_学习笔记

首页免费课认识Hadoop--基础篇笔记

认识Hadoop--基础篇

最热最新

qq_戏子_6

1.编译java文件 javac -classpath /opt/hadoop-1.2.1/hadoop-core-1.2.1.jar:/opt/hadoop-1.2.1/lib/commons-cli-1.2.jar -d 编译后地址编译文件 2.打包指令 jar -cvf 打包后文件名.jar 某某.class 3.提交输入文件给hadoop hadoop fs -put 文件路径提交后的路径例：hadoop fs -put input/* input_wordcount/ 4.提交jar给hadoop执行 hadoop jar jar包路径执行的主函数名(主类名，main方法所在类名) 输入目录名输出目录名例：hadoop jar word_count_class/wordcount.jar WordCount input_wordcount output_wordcount

查看全部

0 采集收起来源：WordCount单词计数（下）
2017-01-06
明阳春秋 00:31

hadoop的组成

查看全部

0 采集收起来源：Hadoop的功能与优势
2017-01-05
Gem

1.LINUX常用命令

查看全部

0 采集收起来源：Hadoop大数据平台架构与实践课程简介
2017-01-04
BlusAnt

mapred-site.xml 配置任务调度器如何去访问

查看全部

0 采集收起来源：Hadoop安装-配置hadoop
2017-01-02
BlusAnt 03:51

hdfs-site.xml 配置数据的存放目录

查看全部

0 采集收起来源：Hadoop安装-配置hadoop
2017-01-02
BlusAnt 03:25

core-site.xml配置文件

查看全部

0 采集收起来源：Hadoop安装-配置hadoop
2017-01-02
无弦琴

HIVE将sql语句转换为Hadoop任务执行

查看全部

0 采集收起来源：Hadoop生态系统及版本
2017-01-01
慕姐4215566 04:35

流程图

查看全部

0 采集收起来源：MapReduce的原理
2016-12-29
慕粉1846561070

HDFS的特点： 1.数据冗余，硬件容错 2.流式的数据访问(一次写入，多次读取) 3.存储大文件(存储小文件，NameNode的压力会很大) 适用性和局限性： -适合数据批量读写，吞吐量高 -适合一次写入多次读取，顺序读写 -不适合交互式应用，低延迟很难满足 -不支持多用户并发写相同文件

查看全部

0 采集收起来源：HDFS特点
2016-12-26
慕粉1846561070 02:10

HDFS写入文件的流程： 1.客户端将文件拆分成块 2.客户端通知NameNode,NameNode返回可用的DataNode节点地址 3.客户端根据返回的DataNode将数据块写入到可用的DataNode中 4.因为数据块要有三份，所以会通过一个复制管道将每个数据块复制出另外两份并保存 5.更新元数据NameNode

查看全部

1 采集收起来源：HDFS中文件的读写操作
2016-12-26
慕粉1846561070 01:15

HDFS读取文件的流程： 1.客户端向NameNode发送文件读取请求 2.NameNode返回元数据给客户端 3.客户端读取数据块进行数据组装，得到想要的数据

查看全部

0 采集收起来源：HDFS中文件的读写操作
2016-12-26
慕粉1846561070

HDFS的架构： -块(存储处理单元，默认64MB) 节点： -NameNode(管理节点，存储文件元数据) ：1.文件与数据块的映射表。2.数据块与数据节点的映射表。 -DataNode(工作节点，存放数据块)：数据块里面可以包括多个DataNode(工作节点)

查看全部

1 采集收起来源：HDFS基本概念
2016-12-26
慕粉1846561070 01:05

HDFS的文件被分成块进行存储，HDFS块的默认大小64MB,且块是文件存储处理的逻辑单元

查看全部

0 采集收起来源：HDFS基本概念
2016-12-26
Spoonet 01:08

Hadoop作用

查看全部

0 采集收起来源：Hadoop的功能与优势
2016-12-25
慕粉2306334158 01:25

Hadoop xml配置修改

查看全部

0 采集收起来源：安装小结
2016-12-24