本文主要是介绍Impala:基于内存的MPP查询引擎,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Impala查询引擎
- 1、Impala概述
1、Impala概述
Impala是Cloudera公司主导研发的高性能、低延迟的交互式SQL查询引擎,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。Impala是CDH平台首选的PB级大数据实时交互式查询分析引擎
2015年11月,Cloudera将Impala捐赠给了Apache,2017年11月,Impala从Apache孵化器毕业。以前在文档中称为Cloudera Impala的地方,现在已经正式更名为Apache Impala
Impala是一个基于Hive、分布式、大规模并行处理(Massively Parallel Processing,MPP)的数据库引擎。除了使用相同的统一存储平台外,Impala还使用与Apache Hive相同的元数据、SQL语法(Hive SQL)、ODBC驱动程序和用户界面(Hue)
Impala直接针对存储在HDFS、HBase或S3中的Apache Hadoop数据提供快速的交互式SQL查询
Impala是一个可用于大数据查询的工具补充。Impala不会替代基于MapReduce构建的批处理框架Hive,Hive和基于Spark框架查询的Hive最适合长时间运行的批处理作业。例如,涉及提取、转换和加载(ETL)类型作业的批处理
这篇关于Impala:基于内存的MPP查询引擎的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!