相关介绍
Impala是一个架构于hadoop之上的全新、开源MPP查询引擎,提供低延迟、高并发的以读为主的查询。通过Impala,你可以使用SELECT、JOIN和聚集函数等语法,实时地查询储存在HDFS或HBase上的数据。
Impala使用Hive的元数据库、SQL语法、ODBC驱动及用户界面。在使用impala的时候,必须保证hive服务是正常可靠的,至少metastore开启。
Impala跟Hive最大的区别在于:没有使用 MapReduce进行并行计算,Impala把整个查询分成执行计划树,在分发执行计划后,Impala使用拉式获取数据的方式获取结果,把结果数据组成按执行树流式传递汇集,减少的了把中间结果写入磁盘的步骤,再从磁盘读取数据的开销。
官方测试性能比hive快10到100倍,是当前大数据生态圈中执行效率最高的SQL类软件。
关键词:Apache Impala
网址预览
预览图片
数据评估
关于Apache Impala特别声明
本站萌导航网提供的Apache Impala都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由萌导航网实际控制,在2023年1月2日 下午1:45收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,萌导航网不承担任何责任。
相关导航
暂无评论...