HBase入门_学习笔记

首页免费课 HBase入门笔记

HBase入门

最热最新

萧哥 04:23

HBase架构体系

查看全部

0 采集收起来源：Hbase架构体系
2019-03-30
muke牛奶

Hadoop2.X分布式安装配置

查看全部

0 采集收起来源：Hadoop2.x分布式安装配置
2019-03-27
muke牛奶

HBase安装说明
JDK1.7以上
Hadoop-2.5.0以上
Zookeeper-3.4.5

查看全部

0 采集收起来源：HBase安装说明
2019-03-27
muke牛奶 02:39

HBase架构体系

查看全部

0 采集收起来源：Hbase架构体系
2019-03-26
muke牛奶 00:44

HBase在Hadoop2.x生态系统中的定位

查看全部

0 采集收起来源：认识Hbase在Hadoop2.x生态系统中的定位
2019-03-26
muke牛奶

如何选择合适的HBase的版本
http://archive.cloudera.com/cdh5

查看全部

0 采集收起来源：如何选择合适Hbase的版本
2019-03-26
muke牛奶

HBase的特点
1、容量大
HBase单表可以有百亿行、百万列，数据矩阵横向和纵向两个纬度所支持的数据量级都非常具有弹性
2、面向列
HBase是面向列的存储和权限控制，并支持独立检索。列式存储，其数据在表中是按照某列存储的，这样在查询只需要少数几个字段的时候，能大大减少读取的数据量。
3、多版本
HBase每一个列的数据存储有多个Version
4、稀疏性
为空的列并不占用存储空间，表可以设计的非常稀疏
5、扩展性
底层依赖于HDFS
6、高可靠性
WAL机制保证了数据写入时不会因集群异常而导致写入数据丢失：Replication机制保证了在集群出现严重的问题时，数据不会发生丢失或损坏。而且HBase底层使用HDFS HDFS本身也有备份。
7、高性能
底层的LSM数据结构和Rowkey有序排列等结构上的独特设计，使得HBase具有非常高的写入性能。region切分、主键索引和缓存机制使得HBase在海量数据下具备一定的随机读取性能，该性能针对Rowkey的查询能够达到毫秒级别

查看全部

0 采集收起来源：Hbase的特点
2019-03-25
muke牛奶

HBase在实际业务场景中的应用
1、交通
2、金融
3、电商
4、移动

查看全部

0 采集收起来源：Hbase在实际业务场景中的应用
2019-03-25
霜花似雪 00:59

Hbase依赖于HDFS,Zookeep组件

查看全部

0 采集收起来源：HBase安装说明
2019-03-24
霜花似雪 07:36

Hbase表与关系型数据库表结构的对比

查看全部

0 采集收起来源：Hbase数据模型并举例说明
2019-03-24
霜花似雪 01:19

rowkey相当于表的行主键。timestamp是时间戳。Hbase是基于key-value形式的。所以在列簇内，每一列都有一个key和value。
    列簇的注意事项：
        1、一张表的列簇不会超过5个，超过5个会影响查询效率
        2、每个列簇中的列数没有限制
        3、列只有插入数据后才会存在，没插入数据不会占用磁盘空间

查看全部

0 采集收起来源：Hbase数据模型并举例说明
2019-03-24
霜花似雪 02:39

在创建Hbase表的时候，不需要创建列，只需要创建对应的列簇即可。列簇内的列的数量是可以设置超过上百万个的，列的个数不需要一开始就设定，可以后续动态增加。但是列簇建议不要多余5个。每个列簇，相当于一个分类。

查看全部

0 采集收起来源：Hbase表结构模型并举例说明
2019-03-24
霜花似雪 01:11

Hadoop生态图

查看全部

0 采集收起来源：认识Hbase在Hadoop2.x生态系统中的定位
2019-03-24
霜花似雪 01:37

选择合适的HBase版本：
官方版本：http://archive.apache.org/dist/hbase/
CDH版本：http://archive.cloudera.com/cdh5

查看全部

0 采集收起来源：如何选择合适Hbase的版本
2019-03-24
霜花似雪 07:44

Hbase的特点
1、容量大：Hbase单表可以有百亿行、百万列，数据矩阵横向和纵向两个维度所支持的数量级都非常有弹性
2、面向列：Hbase是面向列的存储和权限控制、并支持独立检索。列式存储，其数据在表中是按照某列存储的，这样在查询只需要少数几个字段的时候，能够大大减少读取的数据量（关系型数据库是，先将列定义好，然后写数据，hbase的列是可以动态增加的）
3、多版本：Hbase每一个列的数据存储有多个version
4、稀疏性：为空的列不占用存储空间、表可以设计的非常稀疏
5、扩展性：底层依赖于HDFS（分布式文件系统）
6、高可靠性： WAL机制保证了数据写入时不会因集群异常而导致写入数据丢失:Replication机制保证了在集群出现严重的问题时,数据不会发生丢失或损坏.而且HBase底层使用HDFS HDFS本身也有备份.
7、高性能:底层的LSM数据结构和Rowkey有序排列等架构上的独特设计,使得HBase具有非常高的写入性能.region切分、主键索引和缓存机制使得HBase在海量数据下具备一定的随机读取性能,改性能针对Rowkey的查询能够达到毫秒级别.

查看全部

0 采集收起来源：Hbase的特点
2019-03-24

首页上一页 5 6 7 8 9 10 11 下一页尾页

0/150

提交

取消

开始学习

课程须知: Hbase是现企业应用中非常流行的分布式数据库，不管是传统软件企业还是互联网企业，基本上HBase作为海量数据存储的首选。本课程由浅入深，从基础概念到安装部署、再到理论实战，一步一步引导式的全流程讲解，课程所设计的其他知识点也都包含其中。

老师告诉你能学到什么？: 从基础概念到实战操作，目标是让零基础的学习者或者是菜鸟级的初学者都能够快速的入门。

微信扫码，参与3人拼团

热搜

最近搜索清空

HBase入门