HBase key设置加快查询速度小谈

现在的位置: 首页 > 综合 > 正文

RSS

HBase key设置加快查询速度小谈

2018年04月08日 ⁄ 综合 ⁄ 共 951字 ⁄ 字号小中大 ⁄ 评论关闭

最近做一个基于HBase 的大日志存储，分析系统。在key的设置上有一些心得，拿出来大家共享。

我们这个日志系统有个需求，就是根据某个操作找出整个会话的所有操作，按一般的做法就是根据SID（会话Id）字段来扫描全表，返回所有该会话SID的记录。代码如下：

Scan scan = new Scan();

FilterList filterList = new FilterList();

filterList.addFilter(new SingleColumnValueFilter(Bytes.toBytes("CF"),

Bytes.toBytes("SID"), op, Bytes.toBytes("10000000")));

scan.setFilter(filterList);

ResultScanner rs = currentTable.getScanner(scan);

由于hbase 是key ，value存储系统，因此对基于V的条件查询都是全表扫描，对于小数据量没问题，但是一旦数据量大到百万，千万级（我们这里是一天就千万级）那就会无法接受，会非常非常非常慢。。
但是我们知道Key是是顺序排列的，基于key的访问就会非常快。因此我们在设计Key的时候加点小小技巧就可以让你轻松快速查找到相同SID的操作。