-
检查是否有java开发环境: javac查看全部
-
租用云主机查看全部
-
开源工具: Hive:sql语句 ==> Hadoop任务,降低了使用Hadoop的门槛 HBASE:存储结构化数据的分布式数据库,提供数据的随机读写和实时访问,实现对表数据的读写功能 zookeeper:监控Hadoop集群里的每个节点的状态,管理整个集群的配置,维护数据节点之间的一致性查看全部
-
分而治之查看全部
-
1.hadoop是一个开源的分布式存储和分布式计算平台 2.hadoop两个核心组成: HDFS:分布式文件系统,存储海量的数据 MapReduce:并行处理框架,实现任务分解和调度 3.作用是: 搭建大型数据仓库,PB级数据的存储、处理、分析、统计等业务查看全部
-
心跳检测查看全部
-
软件 容错 常态查看全部
-
单机系统瓶颈查看全部
-
Hadoop 用Hadoop搭建一个大数据存储和分析的平台查看全部
-
见目录:hadoop fs -mkdir input_wordcount 上传要输入的样本文件:hadoop fs -put input/* input_wordcount 查看长传文件: hadoop fs -ls hadoop fs -ls input_wordcount hadoop fs -ls input_wordcount/* 提交:hadoop jar word_count_class/wordcount.jar WordCount input_wordcount output_wordcount 查看结果:hadoop fs -ls output_wordcount hadoop fs -ls output_wordcount/part-r-00000查看全部
-
map:切分 对每个词统计记1次 reduce:合并 相同的key放在同一个节点查看全部
-
解压完成后的目录结构查看全部
-
对/opt/下的hadoop进行解压缩查看全部
-
转移下载的hadoop程序的路径:mv hadoop-.... /opt/查看全部
-
hadoop安装包下载,wedget 网址查看全部
举报
0/150
提交
取消