首页猿问求大神指教，HBase...

求大神指教，HBase 为什么会出现如下？

Hbase Storm

撒科打诨 2019-10-21 15:10:20

HBase 为什么会出现如下

查看完整描述

4 回答

慕码人8056858

TA贡献1803条经验获得超6个赞

HBase本身的设计目标是支持稀疏表，而稀疏表通常会有很多列，但是每一行有值的列又比较少。如果不使用Column Family的概念，那么有两种设计方案：1.把所有列的数据放在一个文件中（也就是传统的按行存储）。那么当我们想要访问少数几个列的数据时，需要遍历每一行，读取整个表的数据，这样子是很低效的。2.把每个列的数据单独分开存在一个文件中（按列存储）。那么当我们想要访问少数几个列的数据时，只需要读取对应的文件，不用读取整个表的数据，读取效率很高。然而，由于稀疏表通常会有很多列，这会导致文件数量特别多，这本身会影响文件系统的效率。而Column Family的提出就是为了在上面两种方案中做一个折中。HBase中将一个Column Family中的列存在一起，而不同Column Family的数据则分开。由于在HBase中Column Family的数量通常很小，同时HBase建议把经常一起访问的比较类似的列放在同一个Column Family中，这样就可以在访问少数几个列时，只读取尽量少的数据。

反对回复 2019-10-26

繁花不似锦

TA贡献1851条经验获得超4个赞

hadoop的hdfs支持海量数据量存储 mapreduce支持对海量数据的分布式处理 oracle虽然可以搭建集群但是当数据量达到一定限度之后查询处理速度会变得很慢且对机器性能要求很高其实这两个东西不是同类 hadoop是一个分布式云处理架构，倾向于数据计算而oracle是一个关系型数据库，倾向于数据存储。要说比较可以比较hbase与oracle。 hbase是一种nosql数据库，列式数据库，支持海量数据存储，支持列的扩展，但是查询操作较复杂，不如oracle这类关系型数据库简单，且只支持一个索引，但是Hbase在表结构设置合理情况下，查询速度跟数据量大小没有太大关系，即数据量的大小不会影响到查询速度，顺便说句Hbase查询速度可以达到ms级

反对回复 2019-10-26

qq_花开花谢_0

TA贡献1835条经验获得超7个赞

对于一个曾经运维过几百个节点的HBase集群的运维人员，并且Request每秒在5w以上，一定遇到过如下类似的问题。 ZooKeeper服务在不停地报警指示在zookeeper的unassigned路径由一些节点在会一直存在，而且它的版本在不断增加。

反对回复 2019-10-26

4 回答
0 关注
1181 浏览

关注

添加回答

0/150

提交

取消

热搜

最近搜索清空

求大神指教，HBase 为什么会出现如下？

求大神指教，HBase 为什么会出现如下？

4 回答

添加回答