-
1. zookeeper/conf/zoo_sample.cfg
->zoo.cfg
2. 数据存放目录 zoo.cfg中dataDir -> 创建data/zkdata
3. zoo.cfg中server.1 = hostname:2888:3888
4. 数据节点根目录(zkdata)创建myid文件
zoo.cfg文件
"server.1=hmaster1:2888:3888"这一句中的server.1表示节点编号,"hmaster1"表示这台服务器的主机名,也可以直接指定ip地址,"2888"是ZooKeeper服务间通信的端口,"3888"是ZooKeeper服务与其他服务通信的端口
dataDir指定ZooKeeper的数据目录
autopurge.purgeInterval=1 表示开启日志和镜像文件自动清理功能
查看全部 -
!Hbase不支持条件查询!
查看全部 -
rowkey行键:
1)它是表(table)的主键,table中的记录按照rowkey的字典序进行排序
Column Family列族:
1)HBase表中的每个列,都归属于某个列族。
2)列族是表的schema的一部分(而列不是),即建表时至少指定一个列族。
3)比如我们创建user表,包含info、data两个列族,代码就为create 'user', 'info', 'data'。
Column列:
列肯定是表的某一个列族下的一个列,用列族名:列名表示,比如`info`列族下的`name`列,就表示为`info:name`。
Timestamp时间戳:
这个说的就是可以对表中的Cell多次赋值,每次赋值操作时的时间戳timestamp,可看成Cell值的版本号version number。
查看全部 -
Zookeeper:
① 它实现了HMaster的高可用,多HMaster间进行主备选举。② 保存了HBase的元数据信息meta表。③ 对HMaster和HRegionServer各个节点进行监控。
HRegionServer:
HBase集群中从角色,是集群中的小弟。它主要负责响应客户端的读写数据请求,以及负责管理一系列的Region。
Region:
HBase集群中分布式存储的最小单元,一个Region对应一个Table表的部分数据。简单理解就是表存储在HBase中,并且都是以Region为单位进行存储。
查看全部 -
容量大:百万列行
面向列:列式存储,面向列权限控制,独立检索。实时动态增加列
多版本:每一列数据存储有多个版本
稀疏性:空的列不占用存储空间,表可以设计的很稀疏
扩展性:底层依赖HDFS。动态增加datanode,不需要迁移
高可靠性:WAL机制保证数据写入不会因为集群异常导致丢失。HDFS本身也有备份
高性能:底层LSM数据结构和Rowkey有序排列架构设计。写入性能高。以树节点相互合并由下往上。region切分,索引和缓存机制使hbase具备随机读取性能
查看全部 -
总结:
查看全部 -
HBase监控WEB页面介绍
hbase-daemon.sh
start-hbase.sh
hbase-daemons.sh
stop-hbase.sh
HBase shell
查看全部 -
配置目录在cf中
查看全部 -
HBase安装说明:
JDK1.7以上
Hadoop-2.5.0以上
Zookeeper-3.4.5
查看全部 -
一个列簇有多个列
一张表列簇不会超过5个
每个列簇中的列数没有限制
列只有插入数据后存在
列在列簇中是有序的
HBase列是动态增加,数据自动切分,高并发读写,不支持条件查询
关系数据库列动态增加吧,数据自动切分,高并发读写,复杂查询
查看全部 -
Hbase的特点
查看全部 -
HBase的高性能
查看全部 -
配置hdfs-site.xml
配置单节点方式 dfs.replication:1
不检查权限 dfs.permissions.enabled:false
查看全部 -
Hadoop配置
hadoop-env.sh
配置java环境变量
core-site.xml
配置hdfs访问地址,创建hadoop的namenode存放目录,
不配置又默认目录
查看全部 -
安装需求
JDK1.7以上
Hadoop-2.5.0以上
Zookepper-3.4.5
查看全部
举报