-
分布式存储
查看全部 -
提前配置内容
查看全部 -
Yarn:资源调度
查看全部 -
MapReduce:数据计算
查看全部 -
HDFS:存储数据
查看全部 -
hadoop分布式计算
第一阶段:将计算程序放到各个数据节点上进行计算
第二阶段:将第一阶段的计算结果进行汇总
查看全部 -
主从分布式结构
查看全部 -
hadoop序列化
查看全部 -
mapreduce任务日志查看
查看全部 -
capacityScheduler: 队列内部先进先出,固定分配资源给每个队列
FairScheduler: 自动释放获得资源
查看全部 -
只要涉及到集群中的配置文件的,集群都需要重启
查看全部 -
排序和分组是针对同一个分区的
查看全部 -
shuffle过程详解
查看全部 -
多文件wordcount分析2
查看全部 -
多文件wordcount分析
查看全部
举报
0/150
提交
取消