-
什么是大数据
查看全部 -
Spark
查看全部 -
HBase
查看全部 -
Hadoop
查看全部 -
hdfs.
查看全部 -
HDFS Shell
查看全部 -
map reduce
查看全部 -
MapReduce
查看全部 -
HDFS 读流程
查看全部 -
HDFS 读流程
查看全部 -
HDFS 写流程
查看全部 -
HDFS 写流程
查看全部 -
Spark简介:
1、基于内存计算的大数据并行计算框架
2、Spark是Map Reduce的替代方案,兼容HDFS,HIVE等数据源
查看全部 -
HBase(Hadoop Database)
是一个分布式 NoSQL 列存储数据库;
利用 HDFS 作为其文件存储系统,支持MR程序读取数据;
存储非结构化和半结构化数据;
还可利用 Zookeeper 作为协同服务
hbase可以存小文件,结构,非结构数据,hdfs 适合储存大文件
查看全部 -
YARN:
负责整个集群的资源管理和调度
支持多种计算框架:离线批处理,内存计算,迭代计算等等
查看全部
举报
0/150
提交
取消