快速入门Hadoop3.0大数据处理_学习笔记

首页免费课快速入门Hadoop3.0大数据处理笔记

快速入门Hadoop3.0大数据处理

                
                徐老师
            
                    查看讲师更多课程 
                    徐老师讲师的其他课程
                
徐老师带你新一代分布式调度工具-DolphinScheduler
中级·657
免费课程
                                
徐老师带你入门新一代流式数据湖新秀--Apache Paimon
中级·520
免费课程
                                
徐老师带你 2小时 Flink SQL快速上手
中级·469
免费课程
                                
《大数据开发2023》体验课
入门·1133
免费课程
                                
3小时开启大数据之门
慕课微课·初级·391

                                                                                                                                    ￥68.00
                                            
                难度初级
            
                时长 5小时30分
            
                学习人数
            
综合评分9.77
                            18人评价
                        查看评价
                                10.0
                                内容实用
                            
                                9.6
                                简洁易懂
                            
                                9.7
                                逻辑清晰

最热最新

时间的痕迹 05:36

开启yarn日志聚合功能，把散落的nodemanager日志统一收集管理，方便查看日志

查看全部

0 采集收起来源：MapReduce任务日志查看
2020-11-18
时间的痕迹 13:22

reduce阶段只需要迭代计数，reduce输入的参数是已经经过shuffer进行分组排序的，所以只需要累加求和即可

查看全部

0 采集收起来源：WordCount代码开发
2020-11-18
时间的痕迹 08:21

map阶段只需要按照规则把每一行数据进行切割即可

查看全部

0 采集收起来源：WordCount代码开发
2020-11-18
时间的痕迹 19:51

namenode存储的元数据：
1、文件与block的关系
2、block与datanode的关系

查看全部

0 采集收起来源：HDFS体系结构详解
2020-11-18
时间的痕迹 18:22

如果一个文件默认大小不足一个block，仍然会占用一个block，但是实际占用的存储空间是文件本身的大小，而不是block的大小

查看全部

0 采集收起来源：HDFS体系结构详解
2020-11-18
时间的痕迹 15:49

secondarynamenode:定期把edits文件内容同步到fsimage（某一时刻的文件系统快照）中，默认情况下是一小时同步一次或者修改次数达到100万次时同步一次

查看全部

0 采集收起来源：HDFS体系结构详解
2020-11-18
时间的痕迹 06:48

hostname:查看主机名，后面跟上主机名可以设置主机名（重启之后要重新设置，如要永久生效，则需要更改/etc/sysconfig/network）
关闭防火墙（centos6）：service iptables stop(可先用service iptables stop查看防火墙状态，要是防火墙永久关闭:chkconfig iptables off)
ssh-keygen -t rsa 一路回车,然后把生成的id_rsa.pub的值复制到家目录(~/)的.ssh/authorized_keys下面即可：cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
配置java环境变量：
export JAVA_HOME=/usr/local/jdk1.8.0_144 export PATH=.:$JAVA_HOME/bin:$PATH export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

查看全部

0 采集收起来源：Hadoop伪分布集群安装部署（上）
2020-11-17
时间的痕迹 01:16

大数据整个生态圈

查看全部

0 采集收起来源：大数据生态圈介绍
2020-11-15
时间的痕迹 02:42
1. X版本：namenode只能有一个节点
2. X版本namenode只能有两个节点
3. X版本namenode可以有两个以上节点
查看全部

0 采集收起来源：Hadoop核心架构发展历史
2020-11-15
时间的痕迹 07:57

Yarn架构：主节点最多可以有两个，从节点可以有N个

查看全部

0 采集收起来源：Hadoop三大核心组件分析
2020-11-15
时间的痕迹 06:23

mapreduce：map局部计算，reduce把map计算的结果汇总聚合

查看全部

0 采集收起来源：Hadoop三大核心组件分析
2020-11-15
时间的痕迹 04:34

hdfs分布式存储架构：
namenode维护系统目录，datanode负责存储数据

查看全部

0 采集收起来源：Hadoop三大核心组件分析
2020-11-15
扭转乾坤 00:46
- 限时免费领取资料：
- https://pan.baidu.com/s/1mUxNF5oicB6dXek7wvf-9Q提取码：8888
- 更多福利，欢迎关注微信公众号“大数据1024”
- 课程介绍：https://mp.weixin.qq.com/s/26fa9g6CHj-3jFz5oN-sxA
- 课程项目体验地址：https://mp.weixin.qq.com/s/ijdBFpwkiCb9qXxld-yJYQ
- 课程配套电子书限时体验地址：https://mp.weixin.qq.com/s/p7IXcdyKSczAg6RSgNS5nA
- 课程思维导图体验地址：https://mp.weixin.qq.com/s/WQcmymw_q6OkQ3gOduKJDg
查看全部

0 采集收起来源：分布式存储介绍
2020-08-26
慕后端3056740 01:12

记录一下，

查看全部

0 采集收起来源：大数据生态圈介绍
2020-08-12
笑傲江湖3955759 05:34

数据的获取

查看全部

0 采集收起来源：分布式存储介绍
2020-07-20

首页上一页 5 6 7 8 9 10 11 下一页尾页

0/150

提交

取消

开始学习

课程须知: 学习中需要用到这些工具： —Linux —IDEA —Hadoop —MySQL —Sqoop —Echarts(图表展示) 你需要有这些基础： —熟悉Java语言和IDEA开发工具 —有一定的Linux基础和Shell编程基础 —有一定的MySQL基础

老师告诉你能学到什么？: 1、Hadoop3.0集群安装部署 2、Hadoop三大核心组件(HDFS+MapReduce+Yarn)的核心原理和使用 3、使用Hadoop进行海量数据存储和分析

微信扫码，参与3人拼团

热搜

最近搜索清空

快速入门Hadoop3.0大数据处理