快速入门Hadoop3.0大数据处理_学习笔记

首页免费课快速入门Hadoop3.0大数据处理笔记

快速入门Hadoop3.0大数据处理

                
                徐老师
            
                    查看讲师更多课程 
                    徐老师讲师的其他课程
                
徐老师带你新一代分布式调度工具-DolphinScheduler
中级·1339
免费课程
                                
徐老师带你入门新一代流式数据湖新秀--Apache Paimon
中级·1047
免费课程
                                
徐老师带你 2小时 Flink SQL快速上手
中级·1310
免费课程
                                
《大数据开发2024》体验课
入门·1805
免费课程
                                
3小时开启大数据之门
慕课微课·初级·391

                                                                                                                                    ￥68.00
                                            
                难度初级
            
                时长 5小时30分
            
                学习人数
            
综合评分9.77
                            18人评价
                        查看评价
                                10.0
                                内容实用
                            
                                9.6
                                简洁易懂
                            
                                9.7
                                逻辑清晰

最热最新

射水鱼 13:14

NameNode介绍：

查看全部

0 采集收起来源：HDFS体系结构详解
2024-04-25
射水鱼 00:32

HDFS包含：

查看全部

0 采集收起来源：HDFS体系结构详解
2024-04-25
邪小见 14:50

防火墙状态查看
centos 6
service iptables status
临时关闭
service iptables stop
开机启动移除
chkconfig iptables off

查看全部

0 采集收起来源：Hadoop伪分布集群安装部署（上）
2024-01-03
慕盖茨7381329 03:39

Hadoop3中的三大组件的基本理论和实际操作
Hadoop3的使用，掌握企业实际开发流程
实际案例

查看全部

0 采集收起来源：课程介绍
2023-12-17
Fxiu_ 00:17

快入入门知识点

查看全部

0 采集收起来源：课程介绍
2023-03-13
潘宏声 03:30

<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<property>
<name>yarn.log.server.url</name>
<value>http://Hadoop:19888/jobhistory/logs/</value>
</property>

查看全部

0 采集收起来源：MapReduce任务日志查看
2022-10-28
慕后端949111110 01:48
hadoop三大部分：
1. 分布式存储
2. 分布式计算
3. 集群资源管理
Spark、Flink都会使用资源管理
查看全部

0 采集收起来源：课程介绍
2022-08-14
曾柔 03:02

使用第三个HDP

查看全部

0 采集收起来源：Hadoop常见发行版介绍
2022-04-24
曾柔 03:55

常见框架。

查看全部

0 采集收起来源：大数据生态圈介绍
2022-04-24
曾柔 02:52

先把计算和调度管理解耦。
HDFS的主节点可以支持两个以上。

查看全部

0 采集收起来源：Hadoop核心架构发展历史
2022-04-24
曾柔 08:06

分别是：分布式存储系统，分布式计算框架，集群管理和调度（给程序分配资源）。
Yarm的数据来源和去向都是HDFS.
在Yarm上运行很多的计算框架，例如mapreduce.
HDFS架构分析：
分布式存储：由HDFS决定数据存储在哪个从节点上。
支持主从架构：
Map Reduce架构：
map体现在代码中就是一个类。
reduce就是一个聚合统计程序。
Yarm架构：
总结：数据存储和资源调度都是分布式的主从结构。

查看全部

0 采集收起来源：Hadoop三大核心组件分析
2022-04-24
曾柔 06:18

分布式存储，单机的存储能力有限，运用到多台机器的存储能力。
如何设备一个分布式存储系统。
弊端：如何同时有很多请求同时过来，文件系统的请求会阻塞。
主从架构，你想要操作的数据到底在哪个从节点上，然后客户端直接操作从节点。
主要流程：

查看全部

1 采集收起来源：分布式存储介绍
2022-04-24
曾柔 02:37

大数据在linux上运行和操作，安装部署、排查、基本的命令。
linux里面的一门shell脚本，如何开发调试执行脚本就行了。
javaSE内容，大多数都是java开发，不需要javaweb内容，使用IDEA工具。
数据存储在mysql数据库中。

查看全部

0 采集收起来源：开发技术栈介绍
2022-04-24
曾柔 01:12

核心是数据清洗和计算的逻辑。前端用bi实现

查看全部

0 采集收起来源：项目效果预览
2022-04-24
weixin_慕粉1188581 20:23

11

查看全部

0 采集收起来源：HDFS体系结构详解
2022-04-10