认识Hadoop--基础篇_学习笔记

首页免费课认识Hadoop--基础篇笔记

认识Hadoop--基础篇

最热最新

Evan_Y

Hadoop的功能和优势： Apache开源的分布式存储+分布式计算平台。组成：两个核心： HDFS：分布式文件系统，存储海量的数据 MapReduce：并行处理框架，实现任务分解和调度用途：搭建大型数据仓库，PB级数据的存储、处理、分析、统计等业务优势：高扩展、低成本（普通PC）、成熟的生态圈（开源加快它的发展）

查看全部

0 采集收起来源：Hadoop的功能与优势
2015-06-22
Evan_Y

Hadoop： Google大数据技术，MapReduce、BigTable、GFS 革命性的变化： 1、成本降低，能用PC机，就不用大型机和高端存储。 2、软件容错硬件故障视为常态，通过软件保证可靠性。 3、简化并行分布式计算，无需控制节点同步和数据交换。 Hadoop是一个模仿Google大数据技术的开源软件。

查看全部

0 采集收起来源：Hadoop的前世今生
2015-06-22
我会回来的

1准备linux环境租用“云主机”，阿狸云，unitedStack等云主机不受本机性能影响 2安装JDK 3配置hadoop

查看全部

0 采集收起来源：Hadoop安装-获取linux操作系统
2015-06-22
我会回来的

hadoop=HDFS+MapReduce+开源工具（Hive，Hbase存储结构化数据的database，zookeeper） hadoop版本的选择，最新2.6 2.x和1.x差别比较大 1.2稳定易上手易理解，2.x不稳定

查看全部

0 采集收起来源：Hadoop生态系统及版本
2015-06-21
我会回来的

hadoop分布式储存和分布式计算 =HDFS分布式文件系统 +MapReduce并行处理框架搭建大型数据仓库，PB级数据的存储处理分析优势：高扩展、低成本、成熟的生态圈应用情况：很多业界大数据平台的首选，人才需求越来越大：开发+运维

查看全部

0 采集收起来源：Hadoop的功能与优势
2015-06-21
我会回来的

hadoop模仿google大数据技术的开源实现三个优点

查看全部

0 采集收起来源：Hadoop的前世今生
2015-06-21
姜小狼

vim /etc/profile 配置环境变量 export JAVA_HOME=/jdk路径 export JRE_HOME=$JAVA_HOME/jre export CLASSPATH=$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH export PATH=$JAVA_HOME/lib:$JRE_HOME/lib:$PATH 让配置生效 source /etc/profile

查看全部

0 采集收起来源：Hadoop安装-安装JDK
2015-06-21
紫境之巅

1，编写Wordcount.java，包含Mappper类和reducer类。 2，编译成class文件 3，打成jar包。 4，提交到Hadoop运行

查看全部

0 采集收起来源：WordCount单词计数（下）
2015-06-20
紫境之巅 00:44

客户端----job任务----jobtracker（作业调度）----拆分成maptask 和reducetask mapreduce 容错 -----重复执行----推测执行

查看全部

0 采集收起来源：MapReduce的运行流程
2015-06-20
紫境之巅 04:32

把大的任务分成许多子任务map，并行执行，合并结构reduce。如：100GB的日志，按时间分成7份，统计ip的次数，用hash映射，在规约，中间合并排序，最后得到访问最多的IP

查看全部

0 采集收起来源：MapReduce的原理
2015-06-20
fenghy0601 00:33

安装Hadoop

查看全部

0 采集收起来源：Hadoop安装-配置hadoop
2015-06-18
lrghktk

HDFS使用：它提供了 shell 接口，可以进行命令行操作 hadoop namenode -format #格式化namenode hadoop fs -ls / #打印 / 目录文件列表 hadoop fs -mkdir input #创建目录 input hadoop fs -put hadoop-env.sh input/ #上传文件 hadoop-env.sh 到 input 目录下 hadoop fs -get input/abc.sh hadoop-envcomp.sh #从 input 目录中下载文件 hadoop fs -cat input/hadoop-env.sh #查看文件 input/hadoop-env.sh hadoop dfsadmin -report #dfs报告

查看全部

5 采集收起来源：HDFS使用
2015-06-18
紫境之巅

$ hadoop namenode -format 节点块格式化 $ hadoop fs -ls 当前目录 $ hadoop fs -put 上传文件 $ hadoop fs -get 下载文件

查看全部

1 采集收起来源：HDFS使用
2015-06-18
紫境之巅

HDFS 的特点： 1，数据冗余，硬件容错 2，流水线式的数据访问（一次读写多次读取） 3，存储大文件 4）适用性和局限性：适合数据批量读写，吞吐量高不适合交互式应用，低延迟很难需求满足适合一次读写多次读取，顺序读写不支持多用户并发写相同的文件

查看全部

0 采集收起来源：HDFS特点
2015-06-18
紫境之巅

文件拆分块----namenode中空的节点---返回datanode----写入blocks----写三份备份------更新元数据

查看全部

0 采集收起来源：HDFS中文件的读写操作
2015-06-18

首页上一页 171 172 173 174 175 176 177 下一页尾页

0/150

提交

取消

开始学习

课程须知: 本课程需要童鞋们提前掌握Linux的操作以及Java开发的相关知识。对相关内容不熟悉的童鞋，可以先去《Linux达人养成计划Ⅰ》以及《Java入门第一季》进行修炼～～

老师告诉你能学到什么？: 1、Google的大数据技术 2、Hadoop的架构设计 3、Hadoop的使用 4、Hadoop的配置与管理

微信扫码，参与3人拼团

热搜

最近搜索清空

认识Hadoop--基础篇