为了账号安全,请及时绑定邮箱和手机立即绑定

HBase入门

卡弗卡大数据 数据科学家
难度初级
时长 2小时13分
学习人数
综合评分9.57
58人评价 查看评价
9.9 内容实用
9.3 简洁易懂
9.5 逻辑清晰
  • 1. zookeeper/conf/zoo_sample.cfg

    ->zoo.cfg

    2. 数据存放目录 zoo.cfg中dataDir  -> 创建data/zkdata

    3. zoo.cfg中server.1 = hostname:2888:3888

    4. 数据节点根目录(zkdata)创建myid文件


    zoo.cfg文件

    "server.1=hmaster1:2888:3888"这一句中的server.1表示节点编号,"hmaster1"表示这台服务器的主机名,也可以直接指定ip地址,"2888"是ZooKeeper服务间通信的端口,"3888"是ZooKeeper服务与其他服务通信的端口

    dataDir指定ZooKeeper的数据目录

    autopurge.purgeInterval=1 表示开启日志和镜像文件自动清理功能

    查看全部
  • Hbase不支持条件查询!

    查看全部
  • rowkey行键:

    1)它是表(table)的主键,table中的记录按照rowkey的字典序进行排序

    Column Family列族:

    1)HBase表中的每个列,都归属于某个列族。

    2)列族是表的schema的一部分(而列不是),即建表时至少指定一个列族。

    3)比如我们创建user表,包含info、data两个列族,代码就为create 'user', 'info', 'data'。

    Column列:

    列肯定是表的某一个列族下的一个列,用列族名:列名表示,比如`info`列族下的`name`列,就表示为`info:name`。

    Timestamp时间戳:

    这个说的就是可以对表中的Cell多次赋值,每次赋值操作时的时间戳timestamp,可看成Cell值的版本号version number。

    查看全部
  • Zookeeper:

    ① 它实现了HMaster的高可用,多HMaster间进行主备选举。② 保存了HBase的元数据信息meta表。③ 对HMaster和HRegionServer各个节点进行监控。

    HRegionServer:

    HBase集群中从角色,是集群中的小弟。它主要负责响应客户端的读写数据请求,以及负责管理一系列的Region。

    Region:

    HBase集群中分布式存储的最小单元,一个Region对应一个Table表的部分数据。简单理解就是表存储在HBase中,并且都是以Region为单位进行存储。

    查看全部
    0 采集 收起 来源:Hbase架构体系

    2022-03-29

  • 容量大:百万列行

    面向列:列式存储,面向列权限控制,独立检索。实时动态增加列

    多版本:每一列数据存储有多个版本

    稀疏性:空的列不占用存储空间,表可以设计的很稀疏

    扩展性:底层依赖HDFS。动态增加datanode,不需要迁移

    高可靠性WAL机制保证数据写入不会因为集群异常导致丢失。HDFS本身也有备份

    高性能:底层LSM数据结构Rowkey有序排列架构设计。写入性能高。以树节点相互合并由下往上。region切分,索引和缓存机制使hbase具备随机读取性能

    查看全部
    0 采集 收起 来源:Hbase的特点

    2022-03-29

  • 总结:

    http://img1.sycdn.imooc.com//6042fb4d00010cc404280387.jpg

    查看全部
    0 采集 收起 来源:课程总结

    2021-03-06

  • HBase监控WEB页面介绍

    hbase-daemon.sh

    start-hbase.sh

    hbase-daemons.sh

    stop-hbase.sh

    HBase shell

    查看全部
  • 配置目录在cf中

    查看全部
  • HBase安装说明:

                                    JDK1.7以上

                                    Hadoop-2.5.0以上

                                    Zookeeper-3.4.5

    查看全部
    0 采集 收起 来源:HBase安装说明

    2021-03-05

  • 一个列簇有多个列

    一张表列簇不会超过5个

    每个列簇中的列数没有限制

    列只有插入数据后存在  

    列在列簇中是有序的

    HBase列是动态增加,数据自动切分,高并发读写,不支持条件查询

    关系数据库列动态增加吧,数据自动切分,高并发读写,复杂查询

    查看全部
  • Hbase的特点

    查看全部
    0 采集 收起 来源:Hbase的特点

    2021-02-20

  • HBase的高性能

    查看全部
    0 采集 收起 来源:Hbase的特点

    2021-02-20

  • 配置hdfs-site.xml

    配置单节点方式 dfs.replication:1

    不检查权限 dfs.permissions.enabled:false

    查看全部
  • Hadoop配置

    1. hadoop-env.sh

      配置java环境变量

    2. core-site.xml

      配置hdfs访问地址,创建hadoop的namenode存放目录,

      不配置又默认目录

    查看全部
  • 安装需求

    JDK1.7以上

    Hadoop-2.5.0以上

    Zookepper-3.4.5

    查看全部
    0 采集 收起 来源:HBase安装说明

    2020-08-24

举报

0/150
提交
取消
课程须知
Hbase是现企业应用中非常流行的分布式数据库,不管是传统软件企业还是互联网企业,基本上HBase作为海量数据存储的首选。本课程由浅入深,从基础概念到安装部署、再到理论实战,一步一步引导式的全流程讲解,课程所设计的其他知识点也都包含其中。
老师告诉你能学到什么?
从基础概念到实战操作,目标是让零基础的学习者或者是菜鸟级的初学者都能够快速的入门。

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!