
HBase
那记忆微凉
大数据+云计算+区块链+微服务+机器视觉
展开
-
Hbase报错:org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet
输入这个指令:bin/hdfs dfsadmin -safemode leave即可解决。(退出hadoop的安全模式)原创 2018-06-13 15:31:12 · 3123 阅读 · 1 评论 -
HBase的预分区设计(很实用的一篇文章)
如果知道hbase数据表的key的分布情况,就可以在建表的时候对hbase进行region的预分区。这样做的好处是防止大数据量插入的热点问题,提高数据插入的效率。背景:HBase默认建表时有一个region,这个region的rowkey是没有边界的,即没有startkey和endkey,在数据写入时,所有数据都会写入这个默认的region,随着数据量的不断 增加,此region已经不...转载 2018-06-29 23:08:42 · 11182 阅读 · 4 评论 -
预期数据下HBase的预分区的实现
根据hbase的建表手册, 创建hbase表时预分regions有俩种方式: 1、如果整个导入的数据集是已知的,并且也知道所有Hbase表的Rowkey的分布情况,通过Region的startkey和endkey的方式预分区,此种方式完全可以满足存储在每个regions上的数据均衡分布, 这种方式有2种建表方式, 如果分割点比较少,可以在建表语句中直接指定, 1.1、例如: cre...原创 2018-06-29 23:15:24 · 958 阅读 · 0 评论 -
HBase之MinorCompact全程解析——讲解的比较透彻的文章
Compact作用 当MemStore超过阀值的时候,就要flush到HDFS上生成一个HFile。因此随着不断写入,HFile的数量将会越来越多,根据前面所述,HFile数量过多会降低读性能。为了避免对读性能的影响,可以对这些HFile进行compact操作,把多个HFile合并成一个HFile。compact操作需要对HBase的数据进行多次的重新读写,因此这个过程会产生大量的...转载 2018-08-24 21:23:25 · 1101 阅读 · 0 评论 -
HBase二级索引的设计与应用(详解)
最近面试,涉及到了HBase的多条件组合查询,数据存储用的是HBase,恰恰HBase对于这种场景的查询特别不给力,一般HBase的查询都是通过RowKey(要把多条件组合查询的字段都拼接在RowKey中显然不太可能),或者全表扫描再结合过滤器筛选出目标数据(太低效),所以通过设计HBase的二级索引来解决这个问题。查询需求多个查询条件构成了多维度的组合查询,需要根据不同组合查询出符合...原创 2018-09-04 11:47:15 · 12264 阅读 · 2 评论 -
hbase热点问题(数据倾斜)解决方案---rowkey散列和预分区设计
Hbase的表会被划分为1....n个Region,被托管在RegionServer中。Region二个重要的属性:Startkey与EndKey表示这个Region维护的rowkey的范围,当我们要读写数据时,如果rowkey落在某个start-end key范围内,那么就会定位到目标region并且读写到相关的数据。 默认情况下,当我们通过hbaseAdmin指定TableD...转载 2018-09-04 14:34:07 · 948 阅读 · 1 评论