为了账号安全,请及时绑定邮箱和手机立即绑定

求大神指教,HBase 为什么会出现如下?

/ 猿问

求大神指教,HBase 为什么会出现如下?

撒科打诨 2019-10-21 15:10:20

HBase 为什么会出现如下


查看完整描述

4 回答

?
慕码人8056858

HBase本身的设计目标是支持稀疏表,而稀疏表通常会有很多列,但是每一行有值的列又比较少。如果不使用Column Family的概念,那么有两种设计方案:1.把所有列的数据放在一个文件中(也就是传统的按行存储)。那么当我们想要访问少数几个列的数据时,需要遍历每一行,读取整个表的数据,这样子是很低效的。2.把每个列的数据单独分开存在一个文件中(按列存储)。那么当我们想要访问少数几个列的数据时,只需要读取对应的文件,不用读取整个表的数据,读取效率很高。然而,由于稀疏表通常会有很多列,这会导致文件数量特别多,这本身会影响文件系统的效率。而Column Family的提出就是为了在上面两种方案中做一个折中。HBase中将一个Column Family中的列存在一起,而不同Column Family的数据则分开。由于在HBase中Column Family的数量通常很小,同时HBase建议把经常一起访问的比较类似的列放在同一个Column Family中,这样就可以在访问少数几个列时,只读取尽量少的数据。

查看完整回答
反对 回复 2019-10-26
?
繁花不似锦

hadoop的hdfs支持海量数据量存储 mapreduce支持对海量数据的分布式处理 oracle虽然可以搭建集群 但是当数据量达到一定限度之后查询处理速度会变得很慢 且对机器性能要求很高 其实这两个东西不是同类 hadoop是一个分布式云处理架构,倾向于数据计算 而oracle是一个关系型数据库,倾向于数据存储。要说比较可以比较hbase与oracle。 hbase是一种nosql数据库,列式数据库,支持海量数据存储,支持列的扩展,但是查询操作较复杂,不如oracle这类关系型数据库简单,且只支持一个索引,但是Hbase在表结构设置合理情况下,查询速度跟数据量大小没有太大关系,即数据量的大小不会影响到查询速度,顺便说句Hbase查询速度可以达到ms级

查看完整回答
反对 回复 2019-10-26
?
qq_花开花谢_0

对于一个曾经运维过几百个节点的HBase集群的运维人员,并且Request每秒在5w以上,一定遇到过如下类似的问题。 ZooKeeper服务在不停地报警指示在zookeeper的unassigned路径由一些节点在会一直存在,而且它的版本在不断增加。

查看完整回答
反对 回复 2019-10-26
?
三国纷争

hbase 0.98 安装必须安装hadoop
1、zookeeper是hbase必不可少的,它提供了分布式系统当中的高效协调服务。 2、hbase内置了zookeeper,但效果一般不好,一般都选择外置独立的zookeeper。 好长时间不整这个了,其实这些东西自己搭建一遍就能明白个八九了。 试试吧。
hbase查询主要靠内存和磁盘,而且是在子节点上进行的。不过多少会有影响,不是因为cpu,而是因为磁盘。hadoop写磁盘的量也很大

查看完整回答
反对 回复 2019-10-26
  • 4 回答
  • 0 关注
  • 57 浏览
我要回答

添加回答

回复

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信