Apache Hive的工作原理是什么?
发布网友
发布时间:2022-04-23 06:28
我来回答
共1个回答
热心网友
时间:2022-04-10 17:28
Hadoop处理完全依赖于MapRece框架,这要求用户了解Java编程的高级样式,以便成功查询数据。Apache Hive背后的动机是简化查询,并将Hadoop非结构化数据开放给公司中更广泛的用户群。
Hive有三个主要功能:数据汇总,查询和分析。它支持名为HiveQL或HQL的语言表达的查询,HQL是一种声明性的类SQL语言,在其第一个版本中,它自动将SQL样式的查询转换为在Hadoop平台上执行的MapRece。此外,HiveQL支持自定义MapRece脚本,以便查询。
当通过Hive提交SQL查询时,它们最初由创建会话句柄的驱动程序组件接收,通过Java数据库连接/开放数据库连接接口将请求转发给编译器,随后转发作业以供执行。Hive支持数据序列化/反序列化,并通过包含名为Hive-Metastore的系统目录来提高模式设计的灵活性。