什么情况下使用HBase
发布网友
发布时间:2022-04-29 20:25
我来回答
共1个回答
热心网友
时间:2022-04-13 08:58
1.数据查询模式已经确定,且不易改变,就是说hbase使用在某种种特定的情况下,且不能变动。
2.告诉插入,大量读取。因为分布式系统对大量数据的存取更具优势。
3.尽量少的有数据修改。因为hbase中的数据修改知识在后面添加一行新数据,表示覆盖前一条,大量修改浪费大量空间。(hbase基于hdfs存储不支持修改)
以淘宝网为例:
淘宝网有一项最近浏览商品的功能,用传统的关系型数据库有以下困难:
orderby'耗费性能大;
大量数据处理,而且无法分布处理;
需要实时看到足迹,无法满足要求,因为数据量太大。而且不能使用缓存技巧(即把一天或者一小时前的数据处理得到结果,写入缓存表,然后给客户,没有时效性)。
hbase的优势:
有时间戳,适合告诉时间查询;
基于行健的查询异常快(行健可参考后面hbase的表结构),特别是最近的数据可能还在memstore里,没有io开销;
分布式处理。