-
jps查看全部
-
Hive(蜜蜂) Hadoop的开源工具 用SQL语句----hive----转化成-----Hadoop任务执行 HBase 存储结构化数据的分布式数据库 HBase和关系数据库的区别:放弃事务特性,追求高扩展。 HBase和HDFS区别: 提供数据的随机读写和实时访问,实现对表数据的读写功能。 ZooKeeper(动物管理员):监控Hadoop集群里的每个节点的状态,管理整个集群的配置,维护数据节点之间的一致性... ver1.2稳定版本,对于初学者来说更容易上手查看全部
-
hadoop=分布式存储(HDFS)+分布式计算(MapReduce) HDFS:分布式文件系统,存储海量数据 MapReduce:并行处理框架,实现任务分解和调度 Hadoop用途:搭建大型数据仓库,PB级数据存储、处理、分析、统计等业务(搜索引擎、日志分析、商业智能、数据挖掘)。 hadoop优势: 1.高扩展 2.低成本 3.成熟的生态圈查看全部
-
MapReduce的容错机制查看全部
-
MapReduce作业执行过程查看全部
-
Hadoop MapReduce体系结构查看全部
-
HDFS写入文件的流程查看全部
-
hadoop是什么? hadoop=分布式存储(HDFS)+分布式计算(MapReduce) HDFS:分布式文件系统,存储海量数据 MapReduce:并行处理框架,实现任务分解和调度查看全部
-
配置hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml四个文件 hadoop-env.sh:配置jdk路径 core-site.xml: <property> <name>hadoop.tmp.dir</name> <value>/hadoop</value> </property> <property> <name>dfs.name.dir</name> <value>/hadoop/name</value> </property> <property> <name>fs.default.name</name> <value>hdfs://imooc:9000</value> </property> hdfs-site.xml <property> <name>dfs.data.dir</name> <value>/hadoop/data</value> </property> mapred-site.xml <property> <name>mapred.job.tracker</name> <value>imooc:9001</value> </property>查看全部
-
MapReduce的容错机制查看全部
-
MapReduce作业执行过程查看全部
-
TaskTracker的角色查看全部
-
JobTracker的角色查看全部
-
Hadoop MapReduce体系结构查看全部
-
基本概念: Job和Task,其中Job就是一个任务,需要将其拆分成两个Task,分别为MapTask和ReduceTask查看全部
举报
0/150
提交
取消