-
namenode:管理文件系统的命名空间,存储文件元数据;维护文件系统的所有目录和文件,文件和数据块的映射;记录每个文件各个块所在的数据节点的信息
查看全部 -
Spark: 基于内存的大数据并行计算框架。是MapReduce的替代方案,是现在的主流计算框架。兼容HDFS, Hive, MySQL, PosgreSQL等数据源。
Spark优势:1.基于内存分布式计算 2.分布式内存存储结构 —— RDD(弹性分布式数据集)3.基于事件驱动,通过复用线程提高性能
查看全部 -
HBase 支持MapReduce程序读取数据
查看全部 -
https://blog.csdn.net/yihuaiyan/article/details/84938661
搭建环境卡了两天,有需要可以参考下以上链接
查看全部 -
Hive:数据仓库,提供大量结构化数据检索的功能。
Spark:基于内存的分布式计算框架。
Sqoop:传统数据库与Hadoop之间导入导出的工具。
Ambari:Hadoop集群管理部署和监控的框架。
查看全部 -
2123123
查看全部 -
hadoop是一个开源的大数据框架。
hadoop是一个分布式计算的解决方案。
hadoop=HDFS(分布式文件系统)+MapReduce(分布式计算)
hadoop核心:HDFS分布式文件系统是大数据技术的基础。
MapReduce编程模型:分布式计算是大数据应用的解决方案。
查看全部 -
31421
查看全部 -
23131
查看全部 -
342432
查看全部 -
34243
查看全部 -
323223
查看全部 -
34234
查看全部 -
23231
查看全部 -
21312
查看全部
举报