为了账号安全,请及时绑定邮箱和手机立即绑定

请问一下sudo shown -R hadoop:hadoop hadoop是什么意思?

请问一下sudo shown -R hadoop:hadoop hadoop是什么意思?

慕码人8056858 2019-09-10 14:06:53
sudo shown -R hadoop:hadoop hadoop是什么意思
查看完整描述

4 回答

?
繁华开满天机

TA贡献1816条经验 获得超4个赞

sudo : 以超级用户的身份来执行 接下来的操作
shown -R hadoop:hadoop hadoop : 是你打错了吧??
chown 用于修改文件/目录的owner/group
chown -R 递归执行
chown -R hadoop:hadoop hadoop : 把hadoop目录(以及其下的所有子目录/文件) 的 owner 改为 hadoop, 所属的group 改为hadoop

查看完整回答
反对 回复 2019-09-14
?
慕无忌1623718

TA贡献1744条经验 获得超4个赞

解决问题的层面不一样
首先,Hadoop和Apache Spark两者都是大数据框架,但是各自存在的目的不尽相同。Hadoop实质上更多是一个分布式数据基础设施: 它将巨大的数据集分派到一个由普通计算机组成的集群中的多个节点进行存储,意味着您不需要购买和维护昂贵的服务器硬件。
同时,Hadoop还会索引和跟踪这些数据,让大数据处理和分析效率达到前所未有的高度。Spark,则是那么一个专门用来对那些分布式存储的大数据进行处理的工具,它并不会进行分布式数据的存储。
两者可合可分
Hadoop除了提供为大家所共识的HDFS分布式数据存储功能之外,还提供了叫做MapReduce的数据处理功能。所以这里我们完全可以抛开Spark,使用Hadoop自身的MapReduce来完成数据的处理。
相反,Spark也不是非要依附在Hadoop身上才能生存。但如上所述,毕竟它没有提供文件管理系统,所以,它必须和其他的分布式文件系统进行集成才能运作。这里我们可以选择Hadoop的HDFS,也可以选择其他的基于云的数据系统平台。但Spark默认来说还是被用在Hadoop上面的,毕竟,大家都认为它们的结合是最好的。
希望能帮到你。




查看完整回答
反对 回复 2019-09-14
?
一只名叫tom的猫

TA贡献1906条经验 获得超2个赞

Spark:专为大规模数据处理而设计的快速通用的计算引擎,是一种与 Hadoop 相似的开源集群计算环境,拥有Hadoop MapReduce所具有的优点,Spark是MapReduce的替代方案,而且兼容HDFS、Hive,可融入Hadoop的生态系统,以弥补MapReduce的不足。

Spark主要用于大数据的计算,而Hadoop以后主要用于大数据的存储(比如HDFS、Hive、HBase等),以及资源调度(Yarn)。Spark+Hadoop,是目前大数据领域最热门的组合


查看完整回答
反对 回复 2019-09-14
  • 4 回答
  • 0 关注
  • 3400 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信