认识Hadoop--基础篇_学习笔记

首页免费课认识Hadoop--基础篇笔记

认识Hadoop--基础篇

最热最新

12344554 00:35

MapReduce：分而治之，一个大任务分成多个小的子任务（map）,多个节点并行执行后，合并结果（reduce）（合并的过程称为reduce）

查看全部

0 采集收起来源：MapReduce的原理
2018-11-27
12344554

适合数据批量读写，吞吐量高
不适合交互式应用，低延迟很难满足

适合一次写入多次读取，顺序读写
不支持多用户并发写相文件

查看全部

0 采集收起来源：HDFS特点
2018-11-27
12344554 01:08

1、数据冗余、硬件容错
2、流式的数据访问（一次写入，多次访问）
3、存储大文件

查看全部

0 采集收起来源：HDFS特点
2018-11-27
12344554 02:38

HDFS写入文件流程
1、文件拆分成块
2、通知NameNode,NameNode会找到一些可用的DataNode,并返回
3、根据返回的DataNode，进行块的写入
4、写入一个块之后，进行流水线复制，将这个块写入到其他的地方
5、更新元数据
6、重复上述步骤，写入其他块

查看全部

0 采集收起来源：HDFS中文件的读写操作
2018-11-27
12344554 01:13

HDFS读取文件流程
1、客户端发起文件读取请求
2、NameNode查询元数据
3、元数据包含那些块以及元数据分布在那些DataNode中
4、客户端直接找到DataNode读取block
5、下载完成之后进行组装

查看全部

0 采集收起来源：HDFS中文件的读写操作
2018-11-27
12344554 02:17

二级NameNode：二级NameNode定期同步元数据映像文件和修改日志，当NameNode发生鼓掌是，备胎转正

查看全部

0 采集收起来源：数据管理策略
2018-11-27
12344554 01:54

判断哪些节点挂了，哪些节点正常

查看全部

0 采集收起来源：数据管理策略
2018-11-27
12344554 01:34

心跳检测：DataNode定期向NameNode发送状况

查看全部

0 采集收起来源：数据管理策略
2018-11-27
12344554 00:48

硬件容错，所以保存多份数据，防止丢失

查看全部

0 采集收起来源：数据管理策略
2018-11-27
12344554 02:02

1、客户查询数据
2、在NameNode上查询元数据，返回文件存放在哪些节点上面
3、从节点总读取数据块
4、拼装数据

查看全部

0 采集收起来源：HDFS基本概念
2018-11-27
12344554 02:08

DataNode是HDFS的工作节点、存放数据块

查看全部

0 采集收起来源：HDFS基本概念
2018-11-27
12344554 01:22

NameNode是管理节点，存放文件元数据
1、文件与数据块的映射表
2、数据块与数据节点的映射表

查看全部

0 采集收起来源：HDFS基本概念
2018-11-27
12344554 01:16

HDFS中有两类节点
1、NameNode
2、DataNode

查看全部

0 采集收起来源：HDFS基本概念
2018-11-27
12344554 01:11

块
1、HDFS的文件被分成块进行存储
2、HDFS块的默认大小是64MB
3、块是文件存储处理的逻辑单元

查看全部

0 采集收起来源：HDFS基本概念
2018-11-27
12344554 00:32

hdfs基本概念

查看全部

0 采集收起来源：HDFS基本概念
2018-11-27

首页上一页 24 25 26 27 28 29 30 下一页尾页

0/150

提交

取消

开始学习

课程须知: 本课程需要童鞋们提前掌握Linux的操作以及Java开发的相关知识。对相关内容不熟悉的童鞋，可以先去《Linux达人养成计划Ⅰ》以及《Java入门第一季》进行修炼～～

老师告诉你能学到什么？: 1、Google的大数据技术 2、Hadoop的架构设计 3、Hadoop的使用 4、Hadoop的配置与管理

微信扫码，参与3人拼团

热搜

最近搜索清空

认识Hadoop--基础篇