为了账号安全,请及时绑定邮箱和手机立即绑定

HBase入门

卡弗卡大数据 数据科学家
难度初级
时长 2小时13分
学习人数
综合评分9.57
58人评价 查看评价
9.9 内容实用
9.3 简洁易懂
9.5 逻辑清晰
## HBase 版本和历史


年份 | 事件
---|---
2006 | Google 发表 BigTable 论文
2007 | 随着 Hadoop 0.15.0,第一个可用的 HBase 也发布了。
2008 | HBase 成为 Hadoop 的子项目
2010 | HBase 成为 Apache 的顶级项目
2011 | HBase 0.9.0 发布
2015 | HBase 1.0.0 发布
2018 | HBase 2.0.0 发布
HBase 表数据模型:
表数据模型就是指数据在表中是如何进行填充的。HBase 表数据模型中,有以下几个核心概念:
- Row key:主键,数据的唯一标识,按字典排序
- Time Stamp:时间戳,支持多版本数据同时存在
- Cloumn Family:列簇,是多个列的集合,具有以下性质:
- 一张表的列簇不会超过5个;
- 每个列簇中的列数没有限制;
- 列动态伸缩,并且列只有插入数据后才存在;
- 列在列簇中是有序的。
HBase 表结构模型:
在经典的 RDBMS 中,我们设计表结构模型时,只需要确定有多少个列即可,然后就可以对这个表进行数据的操作。而对于 HBase 来说,设计表结构模型时不需要确定列,只需要确定列簇(column family)即可,列的数量根据列簇里面的数据进行动态伸缩,为空的列并不占用存储空间。
## HBase 周边生态
HBase 与 Hadoop 生态系统其他组件的关系非常紧密:
- HDFS 为 HBase 提供了高可靠性的底层存储支持。
- MapReduce 为 HBase 提供了高性能的计算能力。
- Zookeeper 为 HBase 提供了稳定性及 failover 机制的保障。
- Hive 可以与 HBase 相结合,使在 HBase 进行数据统计处理变得简单。
- Sqoop 为 HBase 提供了方便的 RDBMS 数据迁移功能
- Spark 等高性能的基于内存的分布式计算引擎也可能帮助我们更加快速的对 HBase 中的数据进行处理分析。
为什么看不了超清。。
这个表结构不对,name age ,tel 应该在一行上,时间戳是不同的版本。
1:28 官网描述行 billions of rows 应该是十亿级别的吧
讲的很好,ppt去哪里找,老师。
讲的很棒,能看的出来是大牛
http://hbase.apache.org/book.html#hbase_site
http://hbase.apache.org/book.html#config.files
留爪 。 。 。
老师讲解专业,明了,赞
好好好好好
课程须知
Hbase是现企业应用中非常流行的分布式数据库,不管是传统软件企业还是互联网企业,基本上HBase作为海量数据存储的首选。本课程由浅入深,从基础概念到安装部署、再到理论实战,一步一步引导式的全流程讲解,课程所设计的其他知识点也都包含其中。
老师告诉你能学到什么?
从基础概念到实战操作,目标是让零基础的学习者或者是菜鸟级的初学者都能够快速的入门。

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消