-
Hadoop是解决大数据的分布式集成架构。当数据达到一定规模时,单机的存储和分析就变得非常困难,存储量和效率都无法达到用户的需求。所以,为了解决大数据的存储和处理,Google提出了三大技术MapReduce,BigTable,GFS,相比于Google之前的解决方案,它有如下优势(1)降低成本,能用PC机就不用大型机和高端存储;(2)因为用的是PC机,所以经常发生硬件错误,所以通过软件来保证高可靠性;(3)简化了并行分布式计算。Hadoop是模仿Google三大技术的开源实现。查看全部
-
hadoop-env.sh core-site.xml查看全部
-
1查看全部
-
修改hadoop配置文件查看全部
-
环境变量配置,hadoop_home HADOOP_HOME=/opt/hadoop-1.2.1查看全部
-
javac -classpath /opt/hadoop/hadoop-core-1.2.1.jar:/opt/hadoop/lib/commons-cli-1.2.jar -d word_count_class/ WordCount.java查看全部
-
没有连接成功的小伙伴可以看看这个博客 http://asyty.iteye.com/blog/1440141查看全部
-
NameNode查看全部
-
WordCount程序Reduce过程查看全部
-
WordCount程序Map过程查看全部
-
MapReduce作业执行过程查看全部
-
TaskTracker的角色查看全部
-
JobTracker的角色查看全部
-
MapReduce体系结构查看全部
-
MapReduce含义查看全部
举报
0/150
提交
取消