发布网友 发布时间:2022-04-23 08:49
共2个回答
热心网友 时间:2022-04-05 05:33
1. Hive中的表是纯逻辑表,就只是表的定义等,即表的元数据。Hive本身不存储数据,它完全依赖HDFS和MapRece。这样就可以将结构化的数据文件映射为为一张数据库表,并提供完整的SQL查询功能,并将SQL语句最终转换为MapRece任务进行运行。 而HBase表是物理表,适合存放非结构化的数据。热心网友 时间:2022-04-05 06:51
hbase和hive的差别对比:
1、hbase当前noSql数据库的一种,hive是hdfs分布式文件系统的一种,二者对数据的存储方式是不同的。
2、使用场景:
hbase最常见的应用场景就是采集的网页数据的存储,由于是key-value型数据库,可以再扩展到各种key-value应用场景,如日志信息的存储,对于内容信息不需要完全结构化出来的类CMS应用等。注意hbase针对的仍然是OLTP应用为主。
hive主要针对的是OLAP应用,其底层是hdfs分布式文件系统,重点是基于一个统一的查询分析层,支撑OLAP应用中的各种关联,分组,聚合类SQL语句。hive一般只用于查询分析统计,而不能是常见的CUD操作,要知道HIVE是需要从已有的数据库或日志进行同步最终入到hdfs文件系统中,当前要做到增量实时同步都相当困难。