为了账号安全,请及时绑定邮箱和手机立即绑定

快速入门Hadoop3.0大数据处理

难度初级
时长 5小时30分
学习人数
综合评分9.83
4人评价 查看评价
10.0 内容实用
10.0 简洁易懂
9.5 逻辑清晰
简介:本课程中内容涵盖 Hadoop安装、HDFS分布式存储详解、MapReduce分布式计算详解、Yarn资源调度详解等知识,并最终通过直播平台开播数据统计分析案例帮助大家进一步活学活用。希望通过本课程,帮助大家对Hadoop有一个初步认识,理解Hadoop的一些核心思想和适用场景,以及如何使用Hadoop来进行海量数据的存储和计算分析。

第1章 课程介绍

本章中会介绍学习内容,演示项目效果,梳理课程中使用到的工具,软件,以及本课涵盖的技术栈、重难点。

第2章 Hadoop整体概述

本章主要是从整体层面上对Hadoop中的核心组件进行了分析,以及Hadoop在整个大数据生态圈中的作用,这样可以帮助学员快速了解Hadoop的核心作用和功能,为后面的深入学习打下基础。

第3章 Hadoop集群部署

本章主要分析了目前企业中大数据集群的选型以及如何使用原生Apache Hadoop搭建集群,还会分析一下Hadoop客户端这个角色的作用,通过本章的学习,学员可以掌握实际企业中如何使用Hadoop集群。

第4章 分布式存储(HDFS)详解

本章主要针对Hadoop中的分布式存储(HDFS)模块进行详细分析,通过本章的学习,学员可以掌握HDFS的工作原理和常见的操作。

第5章 分布式计算(MapReduce)详解

本章针对Hadoop中的MapReduce计算框架进行了详细分析,结合具体案例一步一步分析Map阶段和Reduce阶段的执行流程以及数据变化。通过原理和案例的结合,可以加深学员对MapReduce执行原理的理解和认识。

第6章 资源调度器(Yarn)详解

本章主要介绍了Yarn的三种资源调度器,通过本章的学习,学员可以掌握实际生产环境下大数据集群中资源调度器的选择依据。

第7章 案例:直播平台开播数据统计分析

本章结合互联网公司中的直播平台相关业务数据进行分析统计,可以将前面学习到的理论性知识应用在具体的业务场景中,提高代码实战能力,通过一个完整的项目开发流程来实现,也增加了任务的外围监控、故障重启、失败预警等功能,使项目更加完整,通过本章的学习,可以让学员真正掌握实际企业中大数据任务的开发流程。

第8章 课程回顾与总结

结合思维导图,回顾课程中用到的技术,总结一下经验,提出项目中可以进一步完善的功能。
课程须知
1、熟悉Java语言和Idea开发工具 2、有一定的Linux基础和Shell编程基础 3、有一定的Mysql基础
老师告诉你能学到什么?
1、Hadoop3.0集群安装部署 2、Hadoop三大核心组件(HDFS+MapReduce+Yarn)的核心原理和使用 3、使用Hadoop进行海量数据存储和分析
意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!